GLM

glm/glm-5.2

- контекст · $0.8400 / M входные токены · $2.6400 / M выходные токены

GLM 5.2 — это маршрут модели GLM на OurToken для разработчиков, которые оценивают hosted API access, coding workflows, long-context tasks, pricing и production assistant workloads.

Цены

Оплата по мере использования

Без предварительных платежей — платите только за то, что используете

60% of official price
Ввод$1.40 / M$0.8400 / M Токены
Вывод$4.40 / M$2.6400 / M Токены

Использование API

Руководство по доступу к API

Base URLhttps://api.ourtoken.ai/v1
API Endpointchat/completions
Полный URLhttps://api.ourtoken.ai/v1/chat/completions
Model IDglm-5.2
Получить API-ключ

Примеры кода

Используйте API endpoint OurToken для этой модели. Примеры ниже используют прямые HTTP-запросы и рекомендуемый endpoint для семейства модели.

curl https://api.ourtoken.ai/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -d '{
    "model": "glm-5.2",
    "messages": [
      {
        "role": "user",
        "content": "Hello!"
      }
    ],
    "max_tokens": 256
  }'

Справочник Chat Completions API

Создайте ответ чата через endpoint, совместимый с OpenAI Chat Completions. Используйте https://api.ourtoken.ai/v1 как SDK Base URL и POST /chat/completions как endpoint.

Авторизация

Content-Typeapplication/json
AuthorizationBearer YOUR_API_KEY

Тело запроса

ПолеТипОбязательноОписание
modelstringОбязательноModel ID для вызова.
messagesarray<object>ОбязательноСообщения диалога, отправленные модели.
max_tokensintegerНеобязательноМаксимальное число выходных токенов.
temperaturenumberНеобязательноТемпература семплирования.
top_pnumberНеобязательноПараметр nucleus sampling.
streambooleanНеобязательноВозвращать ли потоковый ответ.
stream_optionsobjectНеобязательноДополнительные параметры для потоковых ответов.
toolsarray<object>НеобязательноTools, доступные модели.
tool_choicestring | objectНеобязательноУправляет тем, как модель выбирает tools.
response_formatobjectНеобязательноУправляет структурированным выводом, например ответами в виде JSON object.

Тело ответа

ПолеТипОбязательноОписание
idstringОбязательноУникальный идентификатор chat completion.
object"chat.completion"ОбязательноТип объекта, возвращаемого Chat Completions API.
createdintegerОбязательноUnix timestamp создания ответа.
modelstringОбязательноМодель, создавшая ответ.
choicesarray<object>ОбязательноВарианты ответов, возвращаемые моделью.
choices[].message.rolestringОбязательноРоль возвращенного chat message.
choices[].message.contentstringНеобязательноТекстовое содержимое возвращенного chat message.
choices[].finish_reasonstringНеобязательноПричина остановки генерации.
usageobjectНеобязательноИнформация об использовании токенов для chat completion.
usage.prompt_tokensintegerНеобязательноКоличество входных токенов.
usage.completion_tokensintegerНеобязательноКоличество выходных токенов.
usage.total_tokensintegerНеобязательноОбщее количество токенов.
usage.prompt_tokens_detailsobjectНеобязательноДетализация использования входных токенов.
usage.prompt_tokens_details.cached_tokensintegerНеобязательноТокены, обслуженные из кеша.

Введение в модель

GLM glm-5.2

GLM 5.2 — это маршрут модели GLM на OurToken для разработчиков, которые оценивают hosted API access, coding workflows, long-context tasks, pricing и production assistant workloads.

GLM 5.2 развивает линию GLM 5.1 с фокусом на coding capability, long-horizon work и 1M-context evaluation согласно предоставленным launch materials. Используйте glm 5.2 api через OurToken, когда нужен один endpoint для model testing, pricing review, API keys, usage logs и production integration.

Почему это выглядит отлично

  • 60% от официальной reference price GLM 5.2 для input, output и cache read tokens.
  • OpenAI-compatible API setup через тот же endpoint OurToken, который используется другими supported models.
  • Полезно для оценки GLM coding, agent workflows, long-context sessions и OpenCode-style development tasks.
  • Предоставленные launch materials упоминают 1M-context support и GLM Coding Plan availability, но independent benchmark coverage следует проверять отдельно.
  • Dashboard logs и usage visibility помогают командам сравнивать request cost после запуска.

Ключевые возможности

  • Model ID: glm-5.2
  • Input price: $0.8400 за 1M tokens на OurToken
  • Output price: $2.6400 за 1M tokens на OurToken
  • Cache read price: $0.1560 за 1M tokens на OurToken
  • Cache write price: $0 за 1M tokens на OurToken
  • Provider: GLM

Спецификации

ProviderGLM
Тип моделиLarge Language Model (LLM)
Model IDglm-5.2
OurToken Input Price$0.8400 / 1M tokens
OurToken Output Price$2.6400 / 1M tokens
OurToken Cache Read Price$0.1560 / 1M tokens
OurToken Cache Write Price$0 / 1M tokens
Official Input Reference$1.40 / 1M tokens
Official Output Reference$4.40 / 1M tokens
Official Cache Read Reference$0.26 / 1M tokens

Возможности glm 5.2 api для разработчиков

Используйте glm 5.2 api для unified GLM access, glm 5.2 pricing visibility, coding evaluation, long-context planning и production workflow testing.

Unified Access

Вызывайте glm 5.2 api через unified endpoint OurToken вместо отдельной GLM provider integration. Разработчики могут создать один API key, использовать glm-5.2 как model ID и сохранять OpenAI-compatible request patterns в testing и production.

Pricing Visibility

Проверьте glm 5.2 pricing перед маршрутизацией traffic. OurToken указывает $0.8400 input, $2.6400 output и $0.1560 cache read за 1M tokens, а cache write указан как $0 для оценки prompt и agent workload costs.

Coding Workflows

Оценивайте поведение GLM 5.2 model на repository tasks, coding agents, tool-use loops и planning-heavy development prompts. Launch material позиционирует модель для long-horizon coding, но качество следует подтверждать собственными acceptance tests.

Benchmark Context

Используйте поиски glm 5.2 benchmark как discovery signals, а не как финальное procurement proof. Предоставленные заметки включают Pac-Man и coding-plan evaluations, а launch coverage указывает, что independent benchmark results могут требовать third-party verification.

OpenCode Testing

Тестируйте opencode glm 5.2 workflows, отправляя realistic multi-step coding prompts через OurToken и проверяя tool behavior, latency, token usage и output quality. Для comparison runs сохраняйте prompts, model ID и budget assumptions одинаковыми.

Provider Comparison

Сравнивайте hosted OurToken access с запросами вроде glm 5.2 openrouter при выборе provider. OurToken фокусируется на API keys, usage logs, pricing visibility и unified endpoint, а не на separate provider-specific setup.

Как использовать glm 5.2 api на OurToken

Создайте API key, скопируйте glm-5.2, сравните glm 5.2 pricing, вызовите unified endpoint и протестируйте coding workflows.

Create API Key

Создайте OurToken API key в dashboard и храните его в безопасной server-side environment variable. Это дает backend доступ к glm 5.2 api без раскрытия credentials в browser code, notebooks или public repositories.

01

Copy Model ID

Используйте glm-5.2 как значение model в request body. Хранение точного GLM 5.2 model ID в configuration помогает избежать naming mistakes при сравнении local tests, staging traffic и production routes.

02

Call Endpoint

Отправляйте chat completions requests на unified API endpoint OurToken с API key, model ID и prompt payload. Existing OpenAI-compatible request patterns обычно можно переиспользовать после изменения base URL, credential и model value.

03

Compare Pricing

Сравните glm 5.2 pricing перед масштабированием traffic: OurToken указывает $0.8400 input, $2.6400 output и $0.1560 cache read за 1M tokens. Cache write указан как $0, поэтому отделяйте cached prompts от обычных input и output.

04

Test Coding

Запустите собственный glm 5.2 coding plan с repository tasks, one-shot application builds, OpenCode-style agent sessions и regression prompts. Public anecdotes могут вдохновлять test cases, но production routing должен опираться на ваши latency, quality и cost data.

05

Monitor Usage

После запуска проверяйте request counts, input tokens, output tokens, cache read tokens и spend в history logs. Это помогает командам сравнивать GLM 5.2 model performance по actual traffic, а не только по benchmark posts или provider listings.

06

glm 5.2 api FAQ

Ответы про glm 5.2 api access, glm-5.2 model ID, pricing, benchmark interpretation, OpenCode testing и OpenRouter comparisons.

01

Что такое glm 5.2 api?

glm 5.2 api — это маршрут модели GLM 5.2 через OurToken для разработчиков, которым нужен hosted access к GLM coding, chat, long-context и agent-style workflows. Используйте model ID glm-5.2 с OurToken API key и вызывайте его через unified API flow.
02

Какой glm 5.2 pricing на OurToken?

glm 5.2 pricing на OurToken составляет $0.8400 за 1M input tokens и $2.6400 за 1M output tokens. Catalog также указывает cache read $0.1560 за 1M tokens и cache write $0, с official references $1.40 input, $4.40 output и $0.26 cache read.
03

Какой model ID использовать для GLM 5.2?

Используйте glm-5.2 как точное значение model в API requests. Одинаковый model ID в development, staging и production помогает избежать route mismatches, когда команды сравнивают GLM 5.2 model behavior, pricing, latency и coding quality.
04

Есть ли официальный glm 5.2 benchmark?

Предоставленная launch coverage говорит, что independent benchmark results не были опубликованы при запуске, а community tests включают one-shot Pac-Man и coding workflow experiments. Рассматривайте glm 5.2 benchmark material как evaluation input и запускайте собственные tasks перед production default.
05

Можно ли тестировать opencode glm 5.2 через OurToken?

Да. Вы можете тестировать opencode glm 5.2 workflows, вызывая glm-5.2 через OurToken с realistic repository prompts, tool-use tasks и coding-plan sessions. Сравнивайте output quality, latency, token usage и failure modes со своими acceptance criteria, а не только с public anecdotes.
06

Как glm 5.2 openrouter comparison связан с OurToken?

Запросы glm 5.2 openrouter обычно отражают provider comparison intent. OurToken — это hosted API route с model IDs, pricing visibility, usage logs и unified endpoint. Перед миграцией production workloads сравните availability, latency, price, logging needs и integration effort.