- minimax/minimax-m3
minimax/minimax-m3
- 上下文 · $0.2400 / M 输入 Token · $0.9600 / M 输出 Token
MiniMax M3 是 OurToken 上的 MiniMax 模型路由,适合需要托管 API 来处理编程、agent 工作流、长上下文任务、多模态评估和生产助手的开发者。
价格
按量计费
无需预付,仅按实际使用量收费
API 使用
API 接入指南
代码示例
使用 OurToken API 端点调用该模型。下面的示例使用原生 HTTP 请求,并采用该模型家族推荐的接口格式。
curl https://api.ourtoken.ai/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer YOUR_API_KEY" \
-d '{
"model": "minimax-m3",
"messages": [
{
"role": "user",
"content": "Hello!"
}
],
"max_tokens": 256
}'Chat Completions API 参考
通过 OpenAI Chat Completions 兼容接口创建聊天响应。SDK 的 Base URL 使用 https://api.ourtoken.ai/v1,接口路径使用 POST /chat/completions。
认证方式
| Content-Type | application/json |
| Authorization | Bearer YOUR_API_KEY |
Request Body
| 字段 | 类型 | 是否必填 | 说明 |
|---|---|---|---|
| model | string | 必填 | 要调用的模型 ID。 |
| messages | array<object> | 必填 | 发送给模型的对话消息列表。 |
| max_tokens | integer | 可选 | 最大输出 Token 数。 |
| temperature | number | 可选 | 采样温度。 |
| top_p | number | 可选 | 核采样参数。 |
| stream | boolean | 可选 | 是否返回流式响应。 |
| stream_options | object | 可选 | 流式响应的附加选项。 |
| tools | array<object> | 可选 | 提供给模型使用的工具列表。 |
| tool_choice | string | object | 可选 | 控制模型如何选择工具。 |
| response_format | object | 可选 | 控制结构化输出,例如 JSON object 响应。 |
Response Body
| 字段 | 类型 | 是否必填 | 说明 |
|---|---|---|---|
| id | string | 必填 | 唯一的聊天补全响应标识。 |
| object | "chat.completion" | 必填 | Chat Completions API 返回的对象类型。 |
| created | integer | 必填 | 响应创建时的 Unix 时间戳。 |
| model | string | 必填 | 生成响应的模型。 |
| choices | array<object> | 必填 | 模型返回的候选响应列表。 |
| choices[].message.role | string | 必填 | 返回聊天消息的角色。 |
| choices[].message.content | string | 可选 | 返回聊天消息中的文本内容。 |
| choices[].finish_reason | string | 可选 | 生成停止的原因。 |
| usage | object | 可选 | 该聊天补全响应的 Token 用量信息。 |
| usage.prompt_tokens | integer | 可选 | 输入 Token 数。 |
| usage.completion_tokens | integer | 可选 | 输出 Token 数。 |
| usage.total_tokens | integer | 可选 | 总 Token 数。 |
| usage.prompt_tokens_details | object | 可选 | 输入 Token 用量明细。 |
| usage.prompt_tokens_details.cached_tokens | integer | 可选 | 从缓存命中的 Token 数。 |
模型介绍
MiniMax minimax-m3
MiniMax M3 是 OurToken 上的 MiniMax 模型路由,适合需要托管 API 来处理编程、agent 工作流、长上下文任务、多模态评估和生产助手的开发者。
MiniMax M3 为团队提供 MiniMax 路由,适合重视长上下文、编程工作流、多模态提示词和可预测 API 价格的应用工作。 当你希望通过 OurToken 统一 API 测试 MiniMax 工作流,同时在一个控制台中管理模型 ID、用量日志、缓存成本和价格评估时,可以使用 MiniMax M3 API。
亮点说明
- 输入、输出和缓存读取 Token 为 MiniMax M3 官方参考价格的 40%。
- 可通过与其它支持模型相同的 OurToken 端点完成 OpenAI 兼容 API 接入。
- 缓存写入标记为 $0,但标准输入、输出和缓存读取 Token 仍然是付费类别。
- 无需维护单独的 provider 集成,即可评估 coding agents、长上下文任务、工具使用实验和多模态工作流。
- 控制台日志和用量可见性帮助团队在上线后复盘请求成本。
关键特性
- 模型 ID:minimax-m3
- OurToken 输入价格:每 1M Token $0.2400
- OurToken 输出价格:每 1M Token $0.9600
- OurToken 缓存读取价格:每 1M Token $0.0480
- OurToken 缓存写入价格:每 1M Token $0
- 提供商:MiniMax
规格参数
MiniMax M3 API 功能
使用 MiniMax M3 API 获得统一 MiniMax API 接入、透明 MiniMax M3 pricing、缓存可见性、多模态评估和生产 agent 工作流。
统一接入
通过 OurToken 统一端点调用 MiniMax M3 API,同时把模型接入、API key 管理和用量历史保留在同一处。开发者可以使用 minimax-m3 模型 ID,并复用 OpenAI 兼容请求模式来处理 coding agents、聊天系统和长上下文工作流。
价格清晰
上线前查看 MiniMax M3 pricing。OurToken 标价为每 1M Token 输入 $0.2400、输出 $0.9600,团队可以据此估算编程、多模态提示词和高流量助手工作负载下的 MiniMax M3 price。
缓存成本
通过明确的缓存价格,把缓存行为与普通提示词成本分开评估。MiniMax M3 API 在 OurToken 的缓存读取为每 1M Token $0.0480,缓存写入为 $0,这也是用户需要明确理解的 MiniMax M3 free 场景。
Agent 工作流
使用 MiniMax M3 model 评估 coding agents、工具使用实验和多步骤自动化。竞品资料强调 agentic 能力和 OpenCode 风格工作流,但团队仍应结合自己的提示词和验收标准验证 Opencode MiniMax M3 表现。
多模态上下文
评估长上下文和多模态任务,例如文档审阅、仓库分析、视觉输入、视频相关提示词和多轮协作。竞品资料描述了 1M context 和原生多模态能力,但这些仍应在你的生产类工作负载中测试。
部署选择
比较托管 API 接入与 MiniMax M3 HuggingFace、MiniMax M3 Ollama 等搜索路径。OurToken 聚焦托管 API key、用量日志、价格可见性和简单集成,而不是本地模型托管。
如何在 OurToken 使用 MiniMax M3 API
创建 API key,复制 minimax-m3,比较 MiniMax M3 pricing,调用统一端点,并监控真实用量。
创建 API Key
在控制台创建 OurToken API key,并保存到安全的服务端环境变量中。这样后端即可访问 MiniMax M3 API,同时避免把凭证暴露在客户端代码、notebook 或公开仓库里。
01复制模型 ID
在请求体中使用 minimax-m3 作为 model 值。把准确的 MiniMax M3 model ID 写入配置,可以帮助开发者在本地测试、预发流量和生产部署之间比较 MiniMax API 路由时避免命名错误。
02调用端点
携带 API key、模型 ID 和提示词 payload,向 OurToken 统一 API 端点发送请求。通常只需要调整 base URL、凭证和 model 值,就可以复用 OpenAI 兼容聊天请求模式。
03比较价格
上线前比较 MiniMax M3 API pricing:OurToken 当前为每 1M Token 输入 $0.2400、输出 $0.9600、缓存读取 $0.0480。缓存写入为 $0,这是需要与付费输入输出分开看的 MiniMax M3 free Token 类别。
04测试工作流
放量前运行代表性的编程、agent、长上下文、图像和视频输入提示词。如果你正在评估 Opencode MiniMax M3 工作流,请根据生产验收标准比较工具行为、回复质量、延迟和 Token 使用。
05监控成本
上线后查看 history 日志中的请求数、输入 Token、输出 Token、缓存读取 Token 和消费金额。真实用量数据可以帮助团队用实际流量比较 MiniMax M3 price,而不是只依赖 benchmark 页面或 provider listing。
06MiniMax M3 API FAQ
解答 MiniMax M3 API pricing、MiniMax API 接入、免费缓存写入、模型设置、OpenCode 工作流和部署方式对比问题。