glm/glm-5.2

- contexto · $0.8400 / M tokens de entrada · $2.6400 / M tokens de saída

GLM 5.2 é uma rota de modelo GLM na OurToken para desenvolvedores que avaliam API hospedada, workflows de coding, tarefas de contexto longo, preço e assistentes em produção.

Preços

Pay-per-use

Sem custo inicial; pague apenas pelo que usar

60% of official price

Entrada$1.40 / M$0.8400 / M Tokens

Saída$4.40 / M$2.6400 / M Tokens

Uso da API

Guia de acesso à API

Base URLhttps://api.ourtoken.ai/v1

Endpoint da APIchat/completions

URL completahttps://api.ourtoken.ai/v1/chat/completions

Model IDglm-5.2

Obter chave de API

Exemplos de código

Use o endpoint da API OurToken para este modelo. Os exemplos abaixo usam requisições HTTP diretas e o endpoint recomendado para a família do modelo.

curl https://api.ourtoken.ai/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -d '{
    "model": "glm-5.2",
    "messages": [
      {
        "role": "user",
        "content": "Hello!"
      }
    ],
    "max_tokens": 256
  }'

Referência da API Chat Completions

Crie uma resposta de chat com o endpoint compatível com OpenAI Chat Completions. Use https://api.ourtoken.ai/v1 como SDK Base URL e POST /chat/completions como endpoint.

Autorização

Content-Type	application/json
Authorization	Bearer YOUR_API_KEY

Corpo da requisição

Campo	Tipo	Obrigatório	Descrição
model	string	Obrigatório	Model ID a chamar.
messages	array<object>	Obrigatório	Mensagens da conversa enviadas ao modelo.
max_tokens	integer	Opcional	Número máximo de tokens de saída.
temperature	number	Opcional	Temperatura de amostragem.
top_p	number	Opcional	Parâmetro de nucleus sampling.
stream	boolean	Opcional	Define se a resposta será retornada em streaming.
stream_options	object	Opcional	Opções adicionais para respostas em streaming.
tools	array<object>	Opcional	Tools disponíveis para o modelo.
tool_choice	string \| object	Opcional	Controla como o modelo seleciona tools.
response_format	object	Opcional	Controla saída estruturada, como respostas em objeto JSON.

Corpo da resposta

Campo	Tipo	Obrigatório	Descrição
id	string	Obrigatório	Identificador único da chat completion.
object	"chat.completion"	Obrigatório	Tipo de objeto retornado pela API Chat Completions.
created	integer	Obrigatório	Timestamp Unix de criação da resposta.
model	string	Obrigatório	Modelo que gerou a resposta.
choices	array<object>	Obrigatório	Respostas candidatas retornadas pelo modelo.
choices[].message.role	string	Obrigatório	Role da mensagem de chat retornada.
choices[].message.content	string	Opcional	Conteúdo de texto na mensagem de chat retornada.
choices[].finish_reason	string	Opcional	Motivo pelo qual a geração parou.
usage	object	Opcional	Informações de uso de tokens da chat completion.
usage.prompt_tokens	integer	Opcional	Contagem de tokens de entrada.
usage.completion_tokens	integer	Opcional	Contagem de tokens de saída.
usage.total_tokens	integer	Opcional	Contagem total de tokens.
usage.prompt_tokens_details	object	Opcional	Detalhamento do uso de tokens de entrada.
usage.prompt_tokens_details.cached_tokens	integer	Opcional	Tokens servidos a partir de cache.

Introdução ao modelo

GLM glm-5.2

GLM 5.2 é uma rota de modelo GLM na OurToken para desenvolvedores que avaliam API hospedada, workflows de coding, tarefas de contexto longo, preço e assistentes em produção.

GLM 5.2 evolui a linha GLM 5.1 com foco em coding, tarefas longas e avaliação de contexto 1M segundo o material de lançamento fornecido. Use glm 5.2 api pela OurToken quando quiser um endpoint para teste de modelo, revisão de preço, API keys, logs de uso e integração em produção.

Por que ele se destaca

60% do preço oficial de referência do GLM 5.2 para tokens de input, output e cache read.
Setup de API compatível com OpenAI pelo mesmo endpoint da OurToken usado por outros modelos suportados.
Útil para avaliar coding com GLM, workflows de agent, sessões de contexto longo e tarefas de desenvolvimento no estilo OpenCode.
O material de lançamento fornecido menciona suporte a contexto 1M e disponibilidade no GLM Coding Plan, enquanto benchmarks independentes devem ser revisados separadamente.
Logs do painel e visibilidade de uso ajudam equipes a comparar custo de requisições após o lançamento.

Principais recursos

Model ID: glm-5.2
Preço de input: $0.8400 por 1M tokens na OurToken
Preço de output: $2.6400 por 1M tokens na OurToken
Preço de cache read: $0.1560 por 1M tokens na OurToken
Preço de cache write: $0 por 1M tokens na OurToken
Provider: GLM

Especificações

ProviderGLM

Tipo de modeloLarge Language Model (LLM)

Model IDglm-5.2

Preço de input OurToken$0.8400 / 1M tokens

Preço de output OurToken$2.6400 / 1M tokens

Preço de cache read OurToken$0.1560 / 1M tokens

Preço de cache write OurToken$0 / 1M tokens

Referência oficial de input$1.40 / 1M tokens

Referência oficial de output$4.40 / 1M tokens

Referência oficial de cache read$0.26 / 1M tokens

Recursos de glm 5.2 api para desenvolvedores

Use glm 5.2 api para acesso GLM unificado, visibilidade de glm 5.2 pricing, avaliação de coding, planejamento de contexto longo e testes de produção.

Acesso Unificado

Chame glm 5.2 api pelo endpoint unificado da OurToken em vez de criar uma integração GLM separada. Desenvolvedores podem criar uma API key, usar glm-5.2 como model ID e manter padrões de requisição compatíveis com OpenAI em teste e produção.

Preço Visível

Revise glm 5.2 pricing antes de rotear tráfego. A OurToken lista $0.8400 de input, $2.6400 de output e $0.1560 de cache read por 1M tokens, com cache write listado como $0 para estimativas de prompts e agents.

Workflows Coding

Avalie o comportamento do GLM 5.2 model em tarefas de repositório, coding agents, loops com ferramentas e prompts de desenvolvimento com muito planejamento. O material de lançamento posiciona o modelo para coding longo, mas valide qualidade com seus próprios critérios.

Contexto Benchmark

Use buscas por glm 5.2 benchmark como sinais de descoberta, não como prova final de compra. As notas fornecidas incluem avaliações de Pac-Man e coding-plan, enquanto a cobertura de lançamento diz que resultados independentes ainda podem precisar de verificação.

Teste OpenCode

Teste workflows opencode glm 5.2 enviando prompts reais de coding em múltiplas etapas pela OurToken e revisando comportamento de ferramentas, latência, uso de tokens e qualidade. Mantenha prompts, model ID e orçamento consistentes nas comparações.

Comparação Provider

Compare acesso hospedado pela OurToken com buscas como glm 5.2 openrouter ao avaliar providers. A OurToken foca em API keys, logs de uso, visibilidade de preço e endpoint unificado, em vez de configuração separada por provider.

Como usar glm 5.2 api na OurToken

Crie uma API key, copie glm-5.2, compare glm 5.2 pricing, chame o endpoint unificado e teste workflows de coding.

Crie API Key

Crie uma API key da OurToken no painel e armazene-a em uma variável de ambiente segura no servidor. Isso dá ao backend acesso a glm 5.2 api sem expor credenciais em código de navegador, notebooks ou repositórios públicos.

Copie Model ID

Use glm-5.2 como valor de model no corpo da requisição. Manter o GLM 5.2 model ID exato na configuração ajuda a evitar erros de nome ao comparar testes locais, staging e rotas de produção.

Chame Endpoint

Envie requisições de chat completions ao endpoint unificado da OurToken com API key, model ID e prompt payload. Padrões compatíveis com OpenAI geralmente podem ser reutilizados após mudar base URL, credencial e model.

Compare Preços

Compare glm 5.2 pricing antes de escalar tráfego: a OurToken lista $0.8400 de input, $2.6400 de output e $0.1560 de cache read por 1M tokens. Cache write está listado como $0, então separe prompts em cache de input e output normais.

Teste Coding

Execute seu próprio glm 5.2 coding plan com tarefas de repositório, builds one-shot, sessões de agent estilo OpenCode e prompts de regressão. Casos públicos podem inspirar testes, mas roteamento de produção deve depender de seus dados de latência, qualidade e custo.

Monitore Uso

Após o lançamento, revise contagens de requisições, tokens de input, tokens de output, cache read e gasto nos logs de histórico. Isso ajuda equipes a comparar o GLM 5.2 model contra tráfego real, não apenas posts de benchmark ou listas de providers.

FAQ de glm 5.2 api

Respostas sobre acesso glm 5.2 api, model ID glm-5.2, pricing, interpretação de benchmark, testes OpenCode e comparações OpenRouter.

O que é glm 5.2 api?

glm 5.2 api é a rota do modelo GLM 5.2 disponível pela OurToken para desenvolvedores que querem acesso hospedado a workflows de GLM para coding, chat, contexto longo e agents. Use o model ID glm-5.2 com uma API key da OurToken e chame pelo fluxo de API unificada.

Qual é o glm 5.2 pricing na OurToken?

glm 5.2 pricing na OurToken é $0.8400 por 1M tokens de input e $2.6400 por 1M tokens de output. O catálogo também lista cache read a $0.1560 por 1M tokens e cache write a $0, com referências oficiais de $1.40 input, $4.40 output e $0.26 cache read.

Qual model ID devo usar para GLM 5.2?

Use glm-5.2 como valor exato de model nas requisições de API. Manter o model ID igual em desenvolvimento, staging e produção evita incompatibilidades de rota quando equipes comparam comportamento, preço, latência e qualidade de coding do GLM 5.2 model.

Existe um glm 5.2 benchmark oficial?

A cobertura de lançamento fornecida diz que resultados independentes de benchmark não foram publicados no lançamento, enquanto testes da comunidade incluem Pac-Man one-shot e experimentos de coding. Trate material de glm 5.2 benchmark como entrada de avaliação e rode suas próprias tarefas antes de definir produção.

Posso testar opencode glm 5.2 pela OurToken?

Sim. Você pode testar workflows opencode glm 5.2 chamando glm-5.2 pela OurToken com prompts reais de repositório, tarefas com ferramentas e sessões de coding-plan. Compare qualidade, latência, tokens e falhas com seus próprios critérios, não apenas com relatos públicos.

Como glm 5.2 openrouter se compara à OurToken?

Buscas por glm 5.2 openrouter normalmente indicam intenção de comparar providers. A OurToken oferece rota de API hospedada com model IDs, visibilidade de preço, logs de uso e endpoint unificado. Compare disponibilidade, latência, preço, logs e esforço de integração antes de migrar produção.