deepseek/deepseek-v4-flash

$0.1120 / M 输入 Token · $0.2240 / M 输出 Token

DeepSeek V4 Flash 是 OurToken 上的 DeepSeek 模型路由，适合需要低成本聊天、编程、摘要、长上下文提示词和高流量助手工作负载的开发者。

获取 API Key

24H 状态监控

100% 正常运行时间

8小时前现在

可用

2026-07-23 15:28:32 UTC

价格

按量计费

无需预付，仅按实际使用量收费

80% of official price

输入$0.14 / M$0.1120 / M Token

输出$0.28 / M$0.2240 / M Token

缓存输入$0.0028 / M$0.0020 / M Token

缓存写入$0 / M$0 / M Token

API 使用

API 接入指南

基础地址https://api.ourtoken.ai/v1

API 端点chat/completions

完整地址https://api.ourtoken.ai/v1/chat/completions

模型 IDdeepseek-v4-flash

获取 API Key

代码示例

使用 OurToken API 端点调用该模型。下面的示例使用原生 HTTP 请求，并采用该模型家族推荐的接口格式。

curl https://api.ourtoken.ai/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -d '{
    "model": "deepseek-v4-flash",
    "messages": [
      {
        "role": "user",
        "content": "Hello!"
      }
    ],
    "max_tokens": 256
  }'

Chat Completions API 参考

通过 OpenAI Chat Completions 兼容接口创建聊天响应。SDK 的 Base URL 使用 https://api.ourtoken.ai/v1，接口路径使用 POST /chat/completions。

认证方式

Content-Type	application/json
Authorization	Bearer YOUR_API_KEY

请求体

字段	类型	是否必填	说明
model	string	必填	要调用的模型 ID。
messages	array<object>	必填	发送给模型的对话消息列表。
max_tokens	integer	可选	最大输出 Token 数。
temperature	number	可选	采样温度。
top_p	number	可选	核采样参数。
stream	boolean	可选	是否返回流式响应。
stream_options	object	可选	流式响应的附加选项。
tools	array<object>	可选	提供给模型使用的工具列表。
tool_choice	string \| object	可选	控制模型如何选择工具。
response_format	object	可选	控制结构化输出，例如 JSON object 响应。

响应体

字段	类型	是否必填	说明
id	string	必填	唯一的聊天补全响应标识。
object	"chat.completion"	必填	Chat Completions API 返回的对象类型。
created	integer	必填	响应创建时的 Unix 时间戳。
model	string	必填	生成响应的模型。
choices	array<object>	必填	模型返回的候选响应列表。
choices[].message.role	string	必填	返回聊天消息的角色。
choices[].message.content	string	可选	返回聊天消息中的文本内容。
choices[].finish_reason	string	可选	生成停止的原因。
usage	object	可选	该聊天补全响应的 Token 用量信息。
usage.prompt_tokens	integer	可选	输入 Token 数。
usage.completion_tokens	integer	可选	输出 Token 数。
usage.total_tokens	integer	可选	总 Token 数。
usage.prompt_tokens_details	object	可选	输入 Token 用量明细。
usage.prompt_tokens_details.cached_tokens	integer	可选	从缓存命中的 Token 数。

模型介绍

DeepSeek deepseek-v4-flash

DeepSeek V4 Flash 是 OurToken 上的 DeepSeek 模型路由，适合需要低成本聊天、编程、摘要、长上下文提示词和高流量助手工作负载的开发者。

DeepSeek V4 Flash 为团队提供更低成本的 DeepSeek V4 路由，适合重视响应速度、可预测价格和简单 API 集成的应用工作。当你希望通过 OurToken 统一 API 测试 DeepSeek 工作流，同时在一个控制台中管理模型 ID、用量日志、缓存成本和价格评估时，可以使用 DeepSeek V4 Flash API。

亮点说明

输入和输出 Token 为 DeepSeek V4 Flash 官方参考价格的 80%。
可通过与其它支持模型相同的 OurToken 端点完成 OpenAI 兼容 API 接入。
提供明确的缓存读取和缓存写入价格，适合重复上下文提示词和长对话工作负载规划。
无需维护单独的 provider 集成，即可评估成本敏感的聊天、编程、摘要和助手工作流。
控制台日志和用量可见性帮助团队在上线后复盘请求成本。

关键特性

模型 ID：deepseek-v4-flash
OurToken 输入价格：每 1M Token $0.1120
OurToken 输出价格：每 1M Token $0.2240
OurToken 缓存读取价格：每 1M Token $0.0020
OurToken 缓存写入价格：每 1M Token $0
提供商：DeepSeek

规格参数

提供商DeepSeek

模型类型大语言模型（LLM）

模型 IDdeepseek-v4-flash

上下文长度1M tokens

最大输出384K tokens

OurToken 输入价格$0.1120 / 1M tokens

OurToken 输出价格$0.2240 / 1M tokens

OurToken 缓存读取价格$0.0020 / 1M tokens

OurToken 缓存写入价格$0 / 1M tokens

官方输入参考价$0.14 / 1M tokens

官方输出参考价$0.28 / 1M tokens

官方缓存读取参考价$0.0028 / 1M tokens

DeepSeek V4 Flash API 功能

使用 DeepSeek V4 Flash API 获得统一 DeepSeek V4 API 接入、透明 DeepSeek V4 Flash API pricing、缓存可见性和生产评估能力。

统一接入

通过 OurToken 统一端点调用 DeepSeek V4 Flash API，同时把模型接入、API key 管理和用量历史保留在同一处。开发者可以使用 deepseek-v4-flash 模型 ID，并复用 OpenAI 兼容请求模式来处理聊天、编程和 agent 工作流。

价格清晰

上线前查看 DeepSeek V4 Flash pricing。OurToken 标价为每 1M Token 输入 $0.1120、输出 $0.2240，团队可以据此估算聊天、编程和高流量助手请求下的 DeepSeek V4 Flash price。

缓存成本

通过明确的缓存价格，把缓存行为与普通提示词成本分开评估。DeepSeek V4 Flash API 在 OurToken 的缓存读取为每 1M Token $0.0020，缓存写入为 $0，适合重复上下文和长提示词复用。

Flash 工作负载

当生产聊天、摘要、编程说明和轻量 agent 任务重视响应速度与成本控制时，可以评估 Flash 路由。竞品资料将该模型定位为快速推理和高吞吐工作负载，但团队仍应结合自己的提示词验证。

长上下文

评估需要长上下文的 DeepSeek V4 API 工作负载，例如文档审阅、仓库说明、支持日志和多轮会话。将 Flash 作为大提示词默认路由前，请测试延迟、输出质量和缓存行为。

Benchmark 复盘

把 DeepSeek V4 Flash benchmark 声明作为评估起点，而不是生产保证。请根据自己的验收标准比较编程、推理、延迟、工具使用和 Token 消耗，再决定是否扩大到面向客户的流量。

如何在 OurToken 使用 DeepSeek V4 Flash API

创建 API key，复制 deepseek-v4-flash，比较 DeepSeek V4 pricing，调用统一端点，并监控真实用量。

创建 API Key

在控制台创建 OurToken API key，并保存到安全的服务端环境变量中。这样后端即可访问 DeepSeek V4 Flash API，同时避免把凭证暴露在客户端代码或公开仓库里。

复制模型 ID

在请求体中使用 deepseek-v4-flash 作为 model 值。把精确模型 ID 写入配置，可以帮助开发者在本地测试、预发流量和生产部署之间比较 DeepSeek V4 API 路由时避免命名错误。

调用端点

携带 API key、模型 ID 和提示词 payload，向 OurToken 统一 API 端点发送请求。通常只需要调整 base URL、凭证和 model 值，就可以复用 OpenAI 兼容聊天请求模式。

比较价格

上线前比较 DeepSeek V4 pricing：OurToken 当前为每 1M Token 输入 $0.1120、输出 $0.2240、缓存读取 $0.0020。可用这些数值估算预期提示词、输出和缓存 Token 量下的 DeepSeek V4 Flash price。

测试 Benchmark

把每个 DeepSeek V4 Flash benchmark 声明当作自测提示。运行代表性的编程、推理、摘要和 agent 任务，再比较回复质量、延迟、工具行为、Token 使用和错误处理。

监控成本

上线后查看 history 日志中的请求数、输入 Token、输出 Token、缓存读取 Token 和消费金额。真实用量数据可以帮助团队用实际流量比较 DeepSeek V4 Flash pricing，而不是只依赖 provider listing 假设。

DeepSeek V4 Flash API FAQ

解答 DeepSeek V4 Flash API pricing、DeepSeek V4 API 接入、缓存成本、模型 ID 设置、benchmark 以及 Flash 与 Pro 评估问题。

什么是 DeepSeek V4 Flash API？

DeepSeek V4 Flash API 是 OurToken 上可用的 Flash 版 DeepSeek V4 模型路由，适合需要较低成本聊天、编程说明、摘要和助手工作流的团队。开发者可以使用 deepseek-v4-flash 模型 ID，创建 OurToken API key，并通过与其它支持模型相同的统一 API 流程调用。

OurToken 上 DeepSeek V4 Flash API pricing 是多少？

OurToken 上 DeepSeek V4 Flash API pricing 为每 1M 输入 Token $0.1120、每 1M 输出 Token $0.2240。DeepSeek V4 Flash 的官方参考价为输入 $0.14、输出 $0.28，因此输入和输出价格为官方价格的 80%。

DeepSeek V4 Flash price 中缓存读取和缓存写入是多少？

OurToken 上 DeepSeek V4 Flash price 的缓存读取为每 1M 缓存读取 Token $0.0020，官方参考价为 $0.0028。缓存写入标记为每 1M Token $0。由于缓存读取有自己的比例，不要假设所有 Token 类型都使用和输入输出相同的折扣。

DeepSeek V4 pricing 中 Flash 和 Pro 如何比较？

当前 OurToken catalog 中 Flash 路由的 DeepSeek V4 pricing 更低：Flash 为每 1M Token 输入 $0.1120、输出 $0.2240，而 Pro 为输入 $0.3480、输出 $0.6960。成本敏感或高流量工作负载可先评估 Flash，质量要求更高时再测试 Pro。

DeepSeek V4 API 接入应该使用哪个模型 ID？

在 OurToken 上调用这个 DeepSeek V4 API 路由时，请使用 deepseek-v4-flash 作为模型 ID。API Keys 页面和 model gallery 会展示可调用模型值，开发者可以复制准确 ID，避免因显示名称、provider 前缀或大小写差异导致错误。

如何评估 DeepSeek V4 Flash benchmark 和能力声明？

把 DeepSeek V4 Flash benchmark 声明作为测试起点，而不是生产保证。竞品资料提到 JSON output、tool calls、coding、reasoning 和长上下文任务，但团队仍应根据自己的需求验证回复质量、延迟、缓存行为和总 Token 成本。