GLM

glm/glm-5.2

- contexto · $0.8400 / M tokens de entrada · $2.6400 / M tokens de saída

GLM 5.2 é uma rota de modelo GLM na OurToken para desenvolvedores que avaliam API hospedada, workflows de coding, tarefas de contexto longo, preço e assistentes em produção.

Preços

Pay-per-use

Sem custo inicial; pague apenas pelo que usar

60% of official price
Entrada$1.40 / M$0.8400 / M Tokens
Saída$4.40 / M$2.6400 / M Tokens

Uso da API

Guia de acesso à API

Base URLhttps://api.ourtoken.ai/v1
Endpoint da APIchat/completions
URL completahttps://api.ourtoken.ai/v1/chat/completions
Model IDglm-5.2
Obter chave de API

Exemplos de código

Use o endpoint da API OurToken para este modelo. Os exemplos abaixo usam requisições HTTP diretas e o endpoint recomendado para a família do modelo.

curl https://api.ourtoken.ai/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -d '{
    "model": "glm-5.2",
    "messages": [
      {
        "role": "user",
        "content": "Hello!"
      }
    ],
    "max_tokens": 256
  }'

Referência da API Chat Completions

Crie uma resposta de chat com o endpoint compatível com OpenAI Chat Completions. Use https://api.ourtoken.ai/v1 como SDK Base URL e POST /chat/completions como endpoint.

Autorização

Content-Typeapplication/json
AuthorizationBearer YOUR_API_KEY

Corpo da requisição

CampoTipoObrigatórioDescrição
modelstringObrigatórioModel ID a chamar.
messagesarray<object>ObrigatórioMensagens da conversa enviadas ao modelo.
max_tokensintegerOpcionalNúmero máximo de tokens de saída.
temperaturenumberOpcionalTemperatura de amostragem.
top_pnumberOpcionalParâmetro de nucleus sampling.
streambooleanOpcionalDefine se a resposta será retornada em streaming.
stream_optionsobjectOpcionalOpções adicionais para respostas em streaming.
toolsarray<object>OpcionalTools disponíveis para o modelo.
tool_choicestring | objectOpcionalControla como o modelo seleciona tools.
response_formatobjectOpcionalControla saída estruturada, como respostas em objeto JSON.

Corpo da resposta

CampoTipoObrigatórioDescrição
idstringObrigatórioIdentificador único da chat completion.
object"chat.completion"ObrigatórioTipo de objeto retornado pela API Chat Completions.
createdintegerObrigatórioTimestamp Unix de criação da resposta.
modelstringObrigatórioModelo que gerou a resposta.
choicesarray<object>ObrigatórioRespostas candidatas retornadas pelo modelo.
choices[].message.rolestringObrigatórioRole da mensagem de chat retornada.
choices[].message.contentstringOpcionalConteúdo de texto na mensagem de chat retornada.
choices[].finish_reasonstringOpcionalMotivo pelo qual a geração parou.
usageobjectOpcionalInformações de uso de tokens da chat completion.
usage.prompt_tokensintegerOpcionalContagem de tokens de entrada.
usage.completion_tokensintegerOpcionalContagem de tokens de saída.
usage.total_tokensintegerOpcionalContagem total de tokens.
usage.prompt_tokens_detailsobjectOpcionalDetalhamento do uso de tokens de entrada.
usage.prompt_tokens_details.cached_tokensintegerOpcionalTokens servidos a partir de cache.

Introdução ao modelo

GLM glm-5.2

GLM 5.2 é uma rota de modelo GLM na OurToken para desenvolvedores que avaliam API hospedada, workflows de coding, tarefas de contexto longo, preço e assistentes em produção.

GLM 5.2 evolui a linha GLM 5.1 com foco em coding, tarefas longas e avaliação de contexto 1M segundo o material de lançamento fornecido. Use glm 5.2 api pela OurToken quando quiser um endpoint para teste de modelo, revisão de preço, API keys, logs de uso e integração em produção.

Por que ele se destaca

  • 60% do preço oficial de referência do GLM 5.2 para tokens de input, output e cache read.
  • Setup de API compatível com OpenAI pelo mesmo endpoint da OurToken usado por outros modelos suportados.
  • Útil para avaliar coding com GLM, workflows de agent, sessões de contexto longo e tarefas de desenvolvimento no estilo OpenCode.
  • O material de lançamento fornecido menciona suporte a contexto 1M e disponibilidade no GLM Coding Plan, enquanto benchmarks independentes devem ser revisados separadamente.
  • Logs do painel e visibilidade de uso ajudam equipes a comparar custo de requisições após o lançamento.

Principais recursos

  • Model ID: glm-5.2
  • Preço de input: $0.8400 por 1M tokens na OurToken
  • Preço de output: $2.6400 por 1M tokens na OurToken
  • Preço de cache read: $0.1560 por 1M tokens na OurToken
  • Preço de cache write: $0 por 1M tokens na OurToken
  • Provider: GLM

Especificações

ProviderGLM
Tipo de modeloLarge Language Model (LLM)
Model IDglm-5.2
Preço de input OurToken$0.8400 / 1M tokens
Preço de output OurToken$2.6400 / 1M tokens
Preço de cache read OurToken$0.1560 / 1M tokens
Preço de cache write OurToken$0 / 1M tokens
Referência oficial de input$1.40 / 1M tokens
Referência oficial de output$4.40 / 1M tokens
Referência oficial de cache read$0.26 / 1M tokens

Recursos de glm 5.2 api para desenvolvedores

Use glm 5.2 api para acesso GLM unificado, visibilidade de glm 5.2 pricing, avaliação de coding, planejamento de contexto longo e testes de produção.

Acesso Unificado

Chame glm 5.2 api pelo endpoint unificado da OurToken em vez de criar uma integração GLM separada. Desenvolvedores podem criar uma API key, usar glm-5.2 como model ID e manter padrões de requisição compatíveis com OpenAI em teste e produção.

Preço Visível

Revise glm 5.2 pricing antes de rotear tráfego. A OurToken lista $0.8400 de input, $2.6400 de output e $0.1560 de cache read por 1M tokens, com cache write listado como $0 para estimativas de prompts e agents.

Workflows Coding

Avalie o comportamento do GLM 5.2 model em tarefas de repositório, coding agents, loops com ferramentas e prompts de desenvolvimento com muito planejamento. O material de lançamento posiciona o modelo para coding longo, mas valide qualidade com seus próprios critérios.

Contexto Benchmark

Use buscas por glm 5.2 benchmark como sinais de descoberta, não como prova final de compra. As notas fornecidas incluem avaliações de Pac-Man e coding-plan, enquanto a cobertura de lançamento diz que resultados independentes ainda podem precisar de verificação.

Teste OpenCode

Teste workflows opencode glm 5.2 enviando prompts reais de coding em múltiplas etapas pela OurToken e revisando comportamento de ferramentas, latência, uso de tokens e qualidade. Mantenha prompts, model ID e orçamento consistentes nas comparações.

Comparação Provider

Compare acesso hospedado pela OurToken com buscas como glm 5.2 openrouter ao avaliar providers. A OurToken foca em API keys, logs de uso, visibilidade de preço e endpoint unificado, em vez de configuração separada por provider.

Como usar glm 5.2 api na OurToken

Crie uma API key, copie glm-5.2, compare glm 5.2 pricing, chame o endpoint unificado e teste workflows de coding.

Crie API Key

Crie uma API key da OurToken no painel e armazene-a em uma variável de ambiente segura no servidor. Isso dá ao backend acesso a glm 5.2 api sem expor credenciais em código de navegador, notebooks ou repositórios públicos.

01

Copie Model ID

Use glm-5.2 como valor de model no corpo da requisição. Manter o GLM 5.2 model ID exato na configuração ajuda a evitar erros de nome ao comparar testes locais, staging e rotas de produção.

02

Chame Endpoint

Envie requisições de chat completions ao endpoint unificado da OurToken com API key, model ID e prompt payload. Padrões compatíveis com OpenAI geralmente podem ser reutilizados após mudar base URL, credencial e model.

03

Compare Preços

Compare glm 5.2 pricing antes de escalar tráfego: a OurToken lista $0.8400 de input, $2.6400 de output e $0.1560 de cache read por 1M tokens. Cache write está listado como $0, então separe prompts em cache de input e output normais.

04

Teste Coding

Execute seu próprio glm 5.2 coding plan com tarefas de repositório, builds one-shot, sessões de agent estilo OpenCode e prompts de regressão. Casos públicos podem inspirar testes, mas roteamento de produção deve depender de seus dados de latência, qualidade e custo.

05

Monitore Uso

Após o lançamento, revise contagens de requisições, tokens de input, tokens de output, cache read e gasto nos logs de histórico. Isso ajuda equipes a comparar o GLM 5.2 model contra tráfego real, não apenas posts de benchmark ou listas de providers.

06

FAQ de glm 5.2 api

Respostas sobre acesso glm 5.2 api, model ID glm-5.2, pricing, interpretação de benchmark, testes OpenCode e comparações OpenRouter.

01

O que é glm 5.2 api?

glm 5.2 api é a rota do modelo GLM 5.2 disponível pela OurToken para desenvolvedores que querem acesso hospedado a workflows de GLM para coding, chat, contexto longo e agents. Use o model ID glm-5.2 com uma API key da OurToken e chame pelo fluxo de API unificada.
02

Qual é o glm 5.2 pricing na OurToken?

glm 5.2 pricing na OurToken é $0.8400 por 1M tokens de input e $2.6400 por 1M tokens de output. O catálogo também lista cache read a $0.1560 por 1M tokens e cache write a $0, com referências oficiais de $1.40 input, $4.40 output e $0.26 cache read.
03

Qual model ID devo usar para GLM 5.2?

Use glm-5.2 como valor exato de model nas requisições de API. Manter o model ID igual em desenvolvimento, staging e produção evita incompatibilidades de rota quando equipes comparam comportamento, preço, latência e qualidade de coding do GLM 5.2 model.
04

Existe um glm 5.2 benchmark oficial?

A cobertura de lançamento fornecida diz que resultados independentes de benchmark não foram publicados no lançamento, enquanto testes da comunidade incluem Pac-Man one-shot e experimentos de coding. Trate material de glm 5.2 benchmark como entrada de avaliação e rode suas próprias tarefas antes de definir produção.
05

Posso testar opencode glm 5.2 pela OurToken?

Sim. Você pode testar workflows opencode glm 5.2 chamando glm-5.2 pela OurToken com prompts reais de repositório, tarefas com ferramentas e sessões de coding-plan. Compare qualidade, latência, tokens e falhas com seus próprios critérios, não apenas com relatos públicos.
06

Como glm 5.2 openrouter se compara à OurToken?

Buscas por glm 5.2 openrouter normalmente indicam intenção de comparar providers. A OurToken oferece rota de API hospedada com model IDs, visibilidade de preço, logs de uso e endpoint unificado. Compare disponibilidade, latência, preço, logs e esforço de integração antes de migrar produção.