glm/glm-5.2

- 上下文 · $0.8400 / M 输入 Token · $2.6400 / M 输出 Token

GLM 5.2 是 OurToken 上的 GLM 模型路由，适合正在评估托管 API 接入、编程工作流、长上下文任务、价格和生产助手负载的开发者。

价格

按量计费

无需预付，仅按实际使用量收费

60% of official price

输入$1.40 / M$0.8400 / M Token

输出$4.40 / M$2.6400 / M Token

API 使用

API 接入指南

基础地址https://api.ourtoken.ai/v1

API 端点chat/completions

完整地址https://api.ourtoken.ai/v1/chat/completions

模型 IDglm-5.2

获取 API Key

代码示例

使用 OurToken API 端点调用该模型。下面的示例使用原生 HTTP 请求，并采用该模型家族推荐的接口格式。

curl https://api.ourtoken.ai/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -d '{
    "model": "glm-5.2",
    "messages": [
      {
        "role": "user",
        "content": "Hello!"
      }
    ],
    "max_tokens": 256
  }'

Chat Completions API 参考

通过 OpenAI Chat Completions 兼容接口创建聊天响应。SDK 的 Base URL 使用 https://api.ourtoken.ai/v1，接口路径使用 POST /chat/completions。

认证方式

Content-Type	application/json
Authorization	Bearer YOUR_API_KEY

Request Body

字段	类型	是否必填	说明
model	string	必填	要调用的模型 ID。
messages	array<object>	必填	发送给模型的对话消息列表。
max_tokens	integer	可选	最大输出 Token 数。
temperature	number	可选	采样温度。
top_p	number	可选	核采样参数。
stream	boolean	可选	是否返回流式响应。
stream_options	object	可选	流式响应的附加选项。
tools	array<object>	可选	提供给模型使用的工具列表。
tool_choice	string \| object	可选	控制模型如何选择工具。
response_format	object	可选	控制结构化输出，例如 JSON object 响应。

Response Body

字段	类型	是否必填	说明
id	string	必填	唯一的聊天补全响应标识。
object	"chat.completion"	必填	Chat Completions API 返回的对象类型。
created	integer	必填	响应创建时的 Unix 时间戳。
model	string	必填	生成响应的模型。
choices	array<object>	必填	模型返回的候选响应列表。
choices[].message.role	string	必填	返回聊天消息的角色。
choices[].message.content	string	可选	返回聊天消息中的文本内容。
choices[].finish_reason	string	可选	生成停止的原因。
usage	object	可选	该聊天补全响应的 Token 用量信息。
usage.prompt_tokens	integer	可选	输入 Token 数。
usage.completion_tokens	integer	可选	输出 Token 数。
usage.total_tokens	integer	可选	总 Token 数。
usage.prompt_tokens_details	object	可选	输入 Token 用量明细。
usage.prompt_tokens_details.cached_tokens	integer	可选	从缓存命中的 Token 数。

模型介绍

GLM glm-5.2

GLM 5.2 是 OurToken 上的 GLM 模型路由，适合正在评估托管 API 接入、编程工作流、长上下文任务、价格和生产助手负载的开发者。

根据你提供的发布资料，GLM 5.2 延续 GLM 5.1 系列，重点面向编程能力、长周期任务和 1M 上下文评估。当你希望通过一个端点完成模型测试、价格复核、API key、用量日志和生产集成时，可以通过 OurToken 使用 glm 5.2 api。

亮点说明

输入、输出和缓存读取 token 价格为 GLM 5.2 官方参考价的 60%。
通过与其它支持模型相同的 OurToken 端点完成 OpenAI 兼容 API 接入。
适合评估 GLM 编程、agent 工作流、长上下文会话和 OpenCode 风格开发任务。
你提供的发布资料提到 1M 上下文支持和 GLM Coding Plan 可用性，独立 benchmark 仍应单独核验。
控制台日志和用量可见性可帮助团队上线后比较请求成本。

关键特性

模型 ID：glm-5.2
OurToken 输入价格：每 1M token $0.8400
OurToken 输出价格：每 1M token $2.6400
OurToken 缓存读取价格：每 1M token $0.1560
OurToken 缓存写入价格：每 1M token $0
提供商：GLM

规格参数

提供商GLM

模型类型大语言模型（LLM）

模型 IDglm-5.2

OurToken 输入价格$0.8400 / 1M tokens

OurToken 输出价格$2.6400 / 1M tokens

OurToken 缓存读取价格$0.1560 / 1M tokens

OurToken 缓存写入价格$0 / 1M tokens

官方输入参考价$1.40 / 1M tokens

官方输出参考价$4.40 / 1M tokens

官方缓存读取参考价$0.26 / 1M tokens

面向开发者的 glm 5.2 api 功能

使用 glm 5.2 api 获得统一 GLM 接入、glm 5.2 pricing 可见性、编程评估、长上下文规划和生产工作流测试。

统一接入

通过 OurToken 统一端点调用 glm 5.2 api，无需单独维护 GLM provider 集成。开发者可以创建一个 API key，使用 glm-5.2 作为模型 ID，并在测试和生产中复用 OpenAI 兼容请求模式。

价格清晰

在路由流量前查看 glm 5.2 pricing。OurToken 列出每 1M token 输入 $0.8400、输出 $2.6400、缓存读取 $0.1560，缓存写入为 $0，便于估算 prompt 和 agent 工作负载成本。

编程工作流

用仓库任务、编程 agent、工具调用循环和偏规划的开发提示词评估 GLM 5.2 model 表现。发布资料将它定位于长周期 coding，但团队仍应使用自己的验收测试确认质量。

基准语境

将 glm 5.2 benchmark 搜索结果视作发现信号，而不是最终采购证据。你提供的资料包含 Pac-Man 和 coding-plan 评估，同时发布报道也提示独立 benchmark 仍需要第三方验证。

OpenCode 测试

通过 OurToken 发送真实多步骤编程提示词来测试 opencode glm 5.2 工作流，并复核工具行为、延迟、token 用量和输出质量。比较时请保持 prompt、模型 ID 和预算假设一致。

Provider 对比

评估 provider 选择时，可以把托管 OurToken 接入与 glm 5.2 openrouter 等搜索意图对比。OurToken 侧重 API key、用量日志、价格可见性和统一端点，而不是分散的 provider 配置。

如何在 OurToken 使用 glm 5.2 api

创建 API key，复制 glm-5.2，比较 glm 5.2 pricing，调用统一端点，并测试编程工作流。

创建 API Key

在 OurToken 控制台创建 API key，并存放在安全的服务端环境变量中。这样后端可以访问 glm 5.2 api，同时避免凭据暴露在浏览器代码、notebook 或公开仓库里。

复制模型 ID

在请求体中使用 glm-5.2 作为 model 值。把精确的 GLM 5.2 模型 ID 放进配置，有助于开发者在本地测试、预发布流量和生产路由之间避免命名错误。

调用端点

携带 API key、模型 ID 和 prompt payload，向 OurToken 统一 API 端点发送 chat completions 请求。通常只需更改 base URL、凭据和模型值，就能复用 OpenAI 兼容请求模式。

比较价格

扩量前比较 glm 5.2 pricing：OurToken 列出每 1M token 输入 $0.8400、输出 $2.6400、缓存读取 $0.1560。缓存写入为 $0，因此请区分缓存 prompt 与普通输入输出。

测试编程

用仓库任务、一次性应用构建、OpenCode 风格 agent 会话和回归提示词运行自己的 glm 5.2 coding plan。公开案例可以启发测试，但生产路由应依赖你的延迟、质量和成本数据。

监控用量

上线后在历史日志中查看请求数、输入 token、输出 token、缓存读取 token 和花费。这能帮助团队基于真实流量比较 glm 5.2 model 表现，而不是只依赖 benchmark 帖或 provider 列表。

glm 5.2 api 常见问题

解答 glm 5.2 api 接入、glm-5.2 模型 ID、价格、benchmark 解读、OpenCode 测试和 OpenRouter 对比问题。

glm 5.2 api 是什么？

glm 5.2 api 是 OurToken 上可用的 GLM 5.2 模型路由，面向希望托管访问 GLM 编程、对话、长上下文和 agent 风格工作流的开发者。你可以用 glm-5.2 模型 ID 和 OurToken API key，通过统一 API 流程调用。

OurToken 上的 glm 5.2 pricing 是多少？

OurToken 上的 glm 5.2 pricing 为每 1M 输入 token $0.8400、每 1M 输出 token $2.6400。目录还列出缓存读取每 1M token $0.1560、缓存写入 $0；官方参考价为输入 $1.40、输出 $4.40、缓存读取 $0.26。

GLM 5.2 应该使用哪个模型 ID？

API 请求中请使用 glm-5.2 作为精确 model 值。在开发、预发布和生产环境保持模型 ID 不变，可以避免团队比较 GLM 5.2 model 行为、价格、延迟和编程质量时出现路由不一致。

glm 5.2 benchmark 是否已有官方结果？

你提供的发布报道显示，发布时独立 benchmark 结果尚未公布；社区测试包括一次性 Pac-Man 和编程工作流实验。可以把 glm 5.2 benchmark 内容作为评估输入，但上线默认路由前仍应跑自己的任务。

可以通过 OurToken 测试 opencode glm 5.2 工作流吗？

可以。你可以通过 OurToken 调用 glm-5.2，并使用真实仓库提示词、工具调用任务和 coding-plan 会话测试 opencode glm 5.2 工作流。请按自己的验收标准比较输出质量、延迟、token 用量和失败模式。

glm 5.2 openrouter 对比与 OurToken 有什么关系？

glm 5.2 openrouter 搜索通常代表 provider 对比意图。OurToken 提供托管 API 路由、模型 ID、价格可见性、用量日志和统一端点。迁移生产负载前，建议按可用性、延迟、价格、日志需求和集成成本比较。