glm/glm-5.2

- контекст · $0.8400 / M входные токены · $2.6400 / M выходные токены

GLM 5.2 — это маршрут модели GLM на OurToken для разработчиков, которые оценивают hosted API access, coding workflows, long-context tasks, pricing и production assistant workloads.

Цены

Оплата по мере использования

Без предварительных платежей — платите только за то, что используете

60% of official price

Ввод$1.40 / M$0.8400 / M Токены

Вывод$4.40 / M$2.6400 / M Токены

Использование API

Руководство по доступу к API

Base URLhttps://api.ourtoken.ai/v1

API Endpointchat/completions

Полный URLhttps://api.ourtoken.ai/v1/chat/completions

Model IDglm-5.2

Получить API-ключ

Примеры кода

Используйте API endpoint OurToken для этой модели. Примеры ниже используют прямые HTTP-запросы и рекомендуемый endpoint для семейства модели.

curl https://api.ourtoken.ai/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -d '{
    "model": "glm-5.2",
    "messages": [
      {
        "role": "user",
        "content": "Hello!"
      }
    ],
    "max_tokens": 256
  }'

Справочник Chat Completions API

Создайте ответ чата через endpoint, совместимый с OpenAI Chat Completions. Используйте https://api.ourtoken.ai/v1 как SDK Base URL и POST /chat/completions как endpoint.

Авторизация

Content-Type	application/json
Authorization	Bearer YOUR_API_KEY

Тело запроса

Поле	Тип	Обязательно	Описание
model	string	Обязательно	Model ID для вызова.
messages	array<object>	Обязательно	Сообщения диалога, отправленные модели.
max_tokens	integer	Необязательно	Максимальное число выходных токенов.
temperature	number	Необязательно	Температура семплирования.
top_p	number	Необязательно	Параметр nucleus sampling.
stream	boolean	Необязательно	Возвращать ли потоковый ответ.
stream_options	object	Необязательно	Дополнительные параметры для потоковых ответов.
tools	array<object>	Необязательно	Tools, доступные модели.
tool_choice	string \| object	Необязательно	Управляет тем, как модель выбирает tools.
response_format	object	Необязательно	Управляет структурированным выводом, например ответами в виде JSON object.

Тело ответа

Поле	Тип	Обязательно	Описание
id	string	Обязательно	Уникальный идентификатор chat completion.
object	"chat.completion"	Обязательно	Тип объекта, возвращаемого Chat Completions API.
created	integer	Обязательно	Unix timestamp создания ответа.
model	string	Обязательно	Модель, создавшая ответ.
choices	array<object>	Обязательно	Варианты ответов, возвращаемые моделью.
choices[].message.role	string	Обязательно	Роль возвращенного chat message.
choices[].message.content	string	Необязательно	Текстовое содержимое возвращенного chat message.
choices[].finish_reason	string	Необязательно	Причина остановки генерации.
usage	object	Необязательно	Информация об использовании токенов для chat completion.
usage.prompt_tokens	integer	Необязательно	Количество входных токенов.
usage.completion_tokens	integer	Необязательно	Количество выходных токенов.
usage.total_tokens	integer	Необязательно	Общее количество токенов.
usage.prompt_tokens_details	object	Необязательно	Детализация использования входных токенов.
usage.prompt_tokens_details.cached_tokens	integer	Необязательно	Токены, обслуженные из кеша.

Введение в модель

GLM glm-5.2

GLM 5.2 развивает линию GLM 5.1 с фокусом на coding capability, long-horizon work и 1M-context evaluation согласно предоставленным launch materials. Используйте glm 5.2 api через OurToken, когда нужен один endpoint для model testing, pricing review, API keys, usage logs и production integration.

Почему это выглядит отлично

60% от официальной reference price GLM 5.2 для input, output и cache read tokens.
OpenAI-compatible API setup через тот же endpoint OurToken, который используется другими supported models.
Полезно для оценки GLM coding, agent workflows, long-context sessions и OpenCode-style development tasks.
Предоставленные launch materials упоминают 1M-context support и GLM Coding Plan availability, но independent benchmark coverage следует проверять отдельно.
Dashboard logs и usage visibility помогают командам сравнивать request cost после запуска.

Ключевые возможности

Model ID: glm-5.2
Input price: $0.8400 за 1M tokens на OurToken
Output price: $2.6400 за 1M tokens на OurToken
Cache read price: $0.1560 за 1M tokens на OurToken
Cache write price: $0 за 1M tokens на OurToken
Provider: GLM

Спецификации

ProviderGLM

Тип моделиLarge Language Model (LLM)

Model IDglm-5.2

OurToken Input Price$0.8400 / 1M tokens

OurToken Output Price$2.6400 / 1M tokens

OurToken Cache Read Price$0.1560 / 1M tokens

OurToken Cache Write Price$0 / 1M tokens

Official Input Reference$1.40 / 1M tokens

Official Output Reference$4.40 / 1M tokens

Official Cache Read Reference$0.26 / 1M tokens

Возможности glm 5.2 api для разработчиков

Используйте glm 5.2 api для unified GLM access, glm 5.2 pricing visibility, coding evaluation, long-context planning и production workflow testing.

Unified Access

Вызывайте glm 5.2 api через unified endpoint OurToken вместо отдельной GLM provider integration. Разработчики могут создать один API key, использовать glm-5.2 как model ID и сохранять OpenAI-compatible request patterns в testing и production.

Pricing Visibility

Проверьте glm 5.2 pricing перед маршрутизацией traffic. OurToken указывает $0.8400 input, $2.6400 output и $0.1560 cache read за 1M tokens, а cache write указан как $0 для оценки prompt и agent workload costs.

Coding Workflows

Оценивайте поведение GLM 5.2 model на repository tasks, coding agents, tool-use loops и planning-heavy development prompts. Launch material позиционирует модель для long-horizon coding, но качество следует подтверждать собственными acceptance tests.

Benchmark Context

Используйте поиски glm 5.2 benchmark как discovery signals, а не как финальное procurement proof. Предоставленные заметки включают Pac-Man и coding-plan evaluations, а launch coverage указывает, что independent benchmark results могут требовать third-party verification.

OpenCode Testing

Тестируйте opencode glm 5.2 workflows, отправляя realistic multi-step coding prompts через OurToken и проверяя tool behavior, latency, token usage и output quality. Для comparison runs сохраняйте prompts, model ID и budget assumptions одинаковыми.

Provider Comparison

Сравнивайте hosted OurToken access с запросами вроде glm 5.2 openrouter при выборе provider. OurToken фокусируется на API keys, usage logs, pricing visibility и unified endpoint, а не на separate provider-specific setup.

Как использовать glm 5.2 api на OurToken

Создайте API key, скопируйте glm-5.2, сравните glm 5.2 pricing, вызовите unified endpoint и протестируйте coding workflows.

Create API Key

Создайте OurToken API key в dashboard и храните его в безопасной server-side environment variable. Это дает backend доступ к glm 5.2 api без раскрытия credentials в browser code, notebooks или public repositories.

Copy Model ID

Используйте glm-5.2 как значение model в request body. Хранение точного GLM 5.2 model ID в configuration помогает избежать naming mistakes при сравнении local tests, staging traffic и production routes.

Call Endpoint

Отправляйте chat completions requests на unified API endpoint OurToken с API key, model ID и prompt payload. Existing OpenAI-compatible request patterns обычно можно переиспользовать после изменения base URL, credential и model value.

Compare Pricing

Сравните glm 5.2 pricing перед масштабированием traffic: OurToken указывает $0.8400 input, $2.6400 output и $0.1560 cache read за 1M tokens. Cache write указан как $0, поэтому отделяйте cached prompts от обычных input и output.

Test Coding

Запустите собственный glm 5.2 coding plan с repository tasks, one-shot application builds, OpenCode-style agent sessions и regression prompts. Public anecdotes могут вдохновлять test cases, но production routing должен опираться на ваши latency, quality и cost data.

Monitor Usage

После запуска проверяйте request counts, input tokens, output tokens, cache read tokens и spend в history logs. Это помогает командам сравнивать GLM 5.2 model performance по actual traffic, а не только по benchmark posts или provider listings.

glm 5.2 api FAQ

Ответы про glm 5.2 api access, glm-5.2 model ID, pricing, benchmark interpretation, OpenCode testing и OpenRouter comparisons.

Что такое glm 5.2 api?

glm 5.2 api — это маршрут модели GLM 5.2 через OurToken для разработчиков, которым нужен hosted access к GLM coding, chat, long-context и agent-style workflows. Используйте model ID glm-5.2 с OurToken API key и вызывайте его через unified API flow.

Какой glm 5.2 pricing на OurToken?

glm 5.2 pricing на OurToken составляет $0.8400 за 1M input tokens и $2.6400 за 1M output tokens. Catalog также указывает cache read $0.1560 за 1M tokens и cache write $0, с official references $1.40 input, $4.40 output и $0.26 cache read.

Какой model ID использовать для GLM 5.2?

Используйте glm-5.2 как точное значение model в API requests. Одинаковый model ID в development, staging и production помогает избежать route mismatches, когда команды сравнивают GLM 5.2 model behavior, pricing, latency и coding quality.

Есть ли официальный glm 5.2 benchmark?

Предоставленная launch coverage говорит, что independent benchmark results не были опубликованы при запуске, а community tests включают one-shot Pac-Man и coding workflow experiments. Рассматривайте glm 5.2 benchmark material как evaluation input и запускайте собственные tasks перед production default.

Можно ли тестировать opencode glm 5.2 через OurToken?

Да. Вы можете тестировать opencode glm 5.2 workflows, вызывая glm-5.2 через OurToken с realistic repository prompts, tool-use tasks и coding-plan sessions. Сравнивайте output quality, latency, token usage и failure modes со своими acceptance criteria, а не только с public anecdotes.

Как glm 5.2 openrouter comparison связан с OurToken?

Запросы glm 5.2 openrouter обычно отражают provider comparison intent. OurToken — это hosted API route с model IDs, pricing visibility, usage logs и unified endpoint. Перед миграцией production workloads сравните availability, latency, price, logging needs и integration effort.