- deepseek/deepseek-v4-flash
deepseek/deepseek-v4-flash
- コンテキスト · $0.1120 / M 入力トークン · $0.2240 / M 出力トークン
DeepSeek V4 Flash は、チャット、コーディング、要約、ロングコンテキストプロンプト、大量アシスタントワークロード向けの費用対効果の高い選択肢を必要とする開発者向けの OurToken 上の DeepSeek モデルルートです。
価格
従量課金
初期費用なし。使った分だけお支払いください
API使用方法
APIアクセスガイド
コード例
このモデルにはOurToken APIエンドポイントを使用します。以下の例では、直接HTTPリクエストとモデルファミリーに推奨されるエンドポイントを使用しています。
curl https://api.ourtoken.ai/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer YOUR_API_KEY" \
-d '{
"model": "deepseek-v4-flash",
"messages": [
{
"role": "user",
"content": "Hello!"
}
],
"max_tokens": 256
}'Chat Completions APIリファレンス
OpenAI Chat Completions互換エンドポイントでチャットレスポンスを作成します。SDK Base URLにはhttps://api.ourtoken.ai/v1を、エンドポイントにはPOST /chat/completionsを使用します。
Authorization
| Content-Type | application/json |
| Authorization | Bearer YOUR_API_KEY |
リクエスト本文
| フィールド | 型 | 必須 | 説明 |
|---|---|---|---|
| model | string | 必須 | 呼び出すモデルID。 |
| messages | array<object> | 必須 | モデルに送信される会話メッセージ。 |
| max_tokens | integer | 任意 | 最大出力トークン数。 |
| temperature | number | 任意 | サンプリング温度。 |
| top_p | number | 任意 | Nucleusサンプリングパラメータ。 |
| stream | boolean | 任意 | ストリーミングレスポンスを返すかどうか。 |
| stream_options | object | 任意 | ストリーミングレスポンスの追加オプション。 |
| tools | array<object> | 任意 | モデルが使用できるツール。 |
| tool_choice | string | object | 任意 | モデルがツールを選択する方法を制御します。 |
| response_format | object | 任意 | JSONオブジェクトレスポンスなどの構造化出力を制御します。 |
レスポンス本文
| フィールド | 型 | 必須 | 説明 |
|---|---|---|---|
| id | string | 必須 | 一意のチャット補完識別子。 |
| object | "chat.completion" | 必須 | Chat Completions APIによって返されるオブジェクトタイプ。 |
| created | integer | 必須 | レスポンスが作成されたUnixタイムスタンプ。 |
| model | string | 必須 | レスポンスを生成したモデル。 |
| choices | array<object> | 必須 | モデルによって返される候補レスポンス。 |
| choices[].message.role | string | 必須 | 返されたチャットメッセージのロール。 |
| choices[].message.content | string | 任意 | 返されたチャットメッセージ内のテキスト内容。 |
| choices[].finish_reason | string | 任意 | 生成が停止した理由。 |
| usage | object | 任意 | チャット補完のトークン使用量情報。 |
| usage.prompt_tokens | integer | 任意 | 入力トークン数。 |
| usage.completion_tokens | integer | 任意 | 出力トークン数。 |
| usage.total_tokens | integer | 任意 | 合計トークン数。 |
| usage.prompt_tokens_details | object | 任意 | 入力トークン使用量の内訳。 |
| usage.prompt_tokens_details.cached_tokens | integer | 任意 | キャッシュから提供されたトークン。 |
モデル紹介
DeepSeek deepseek-v4-flash
DeepSeek V4 Flash は、チャット、コーディング、要約、ロングコンテキストプロンプト、大量アシスタントワークロード向けの費用対効果の高い選択肢を必要とする開発者向けの OurToken 上の DeepSeek モデルルートです。
DeepSeek V4 Flash は、応答性、予測可能な価格、シンプルな API 統合が重要なアプリケーション作業向けに、低コストの DeepSeek V4 ルートをチームへ提供します。 モデル ID、使用量ログ、キャッシュコスト、価格レビューを 1つのダッシュボードに保ちながら、OurToken 統合 API 経由で DeepSeek ワークフローをテストしたい場合に DeepSeek V4 Flash API を使用してください。
優れて見える理由
- 入力・出力トークンについて公式 DeepSeek V4 Flash 参照価格の 80%。
- 他の対応モデルと同じ OurToken エンドポイントを通じた OpenAI 互換 API 設定。
- 繰り返しコンテキストプロンプトや長い会話ワークロード向けの明確なキャッシュ読み取り・書き込み価格。
- プロバイダー専用の別統合なしで、コスト重視のチャット、コーディング、要約、アシスタントワークフローを評価するのに有用。
- ダッシュボードのログと使用量表示により、ローンチ後のリクエストコストを確認できます。
主な機能
- モデル ID: deepseek-v4-flash
- 入力価格: OurToken で $0.1120 per 1M tokens
- 出力価格: OurToken で $0.2240 per 1M tokens
- キャッシュ読み取り価格: OurToken で $0.0020 per 1M tokens
- キャッシュ書き込み価格: OurToken で $0 per 1M tokens
- プロバイダー: DeepSeek
仕様
DeepSeek V4 Flash API 機能
DeepSeek V4 Flash API を、統合 DeepSeek V4 API アクセス、透明な DeepSeek V4 Flash API 価格、キャッシュ可視化、本番評価に活用できます。
統合アクセス
モデルアクセス、API キー管理、使用履歴を 1か所に保ちながら、OurToken 統合エンドポイントから DeepSeek V4 Flash API を呼び出せます。deepseek-v4-flash をモデル ID として使用し、チャット、コーディング、エージェントワークフローで OpenAI 互換リクエストパターンを再利用できます。
価格の明確化
展開前に DeepSeek V4 Flash pricing を確認できます。OurToken は 1M tokens あたり $0.1120 input と $0.2240 output を表示するため、チームは本番使用を拡張する前に、チャット、コーディング、大量アシスタントトラフィック向けの DeepSeek V4 Flash price を見積もれます。
キャッシュコスト
明示的なキャッシュ価格により、通常のプロンプト支出からキャッシュ挙動を分離できます。OurToken では DeepSeek V4 Flash API のキャッシュ読み取りが 1M tokens あたり $0.0020、キャッシュ書き込みが $0 と表示され、繰り返しコンテキストワークロードや長いプロンプト再利用に役立ちます。
Flash ワークロード
本番チャット、要約、コーディングメモ、軽量エージェントタスクで応答性とコスト管理が重要な場合に Flash ルートを使用できます。競合資料では高速推論と高スループットワークロード向けと位置づけられており、チームは自分のプロンプトで検証すべきです。
ロングコンテキスト
文書レビュー、リポジトリメモ、サポートログ、マルチターン会話など、長いコンテキストを必要とする DeepSeek V4 API ワークロードを評価できます。大きなプロンプトのデフォルトルートに Flash を設定する前に、レイテンシ、出力品質、キャッシュ挙動をテストしてください。
ベンチマークレビュー
DeepSeek V4 Flash benchmark の主張は、本番保証ではなく出発点として使用してください。顧客向けワークフローへトラフィックを拡張する前に、コーディング、推論、レイテンシ、ツール使用、トークン消費を自分の受け入れ条件と比較してください。
OurToken で DeepSeek V4 Flash API を使う方法
API キーを作成し、deepseek-v4-flash をコピーし、DeepSeek V4 pricing を比較し、統合エンドポイントを呼び出し、実使用量を監視します。
API キーを作成
ダッシュボードから OurToken API キーを作成し、安全なサーバーサイド環境変数に保存します。これにより、クライアントコードや公開リポジトリに認証情報を置かずに、バックエンドから DeepSeek V4 Flash API にアクセスできます。
01モデル ID をコピー
リクエスト本文のモデル値として deepseek-v4-flash を使用します。正確なモデル ID を設定に保持することで、ローカルテスト、ステージングトラフィック、本番デプロイで DeepSeek V4 API ルートを比較する際に、命名ミスを避けられます。
02エンドポイントを呼び出す
API キー、モデル ID、プロンプトペイロードを使って OurToken 統合 API エンドポイントへリクエストを送信します。base URL、認証情報、モデル値を変更すれば、既存の OpenAI 互換チャットリクエストパターンを通常は再利用できます。
03価格を比較
展開前に DeepSeek V4 pricing を比較してください: OurToken は 1M tokens あたり $0.1120 input、$0.2240 output、$0.0020 cache read を表示しています。これらの値を使って、想定プロンプト、出力、キャッシュ量に対する DeepSeek V4 Flash price を見積もれます。
04ベンチマークをテスト
DeepSeek V4 Flash benchmark の主張はすべて、自分の評価のためのプロンプトとして扱ってください。代表的なコーディング、推論、要約、エージェントタスクを実行し、レスポンス品質、レイテンシ、ツール挙動、トークン使用量、エラー処理を比較します。
05コストを監視
ローンチ後は、履歴ログでリクエスト数、入力トークン、出力トークン、キャッシュ読み取りトークン、支出を確認します。実使用量データにより、プロバイダー掲載情報の前提だけに頼らず、実トラフィックに対して DeepSeek V4 Flash pricing を比較できます。
06DeepSeek V4 Flash API FAQ
DeepSeek V4 Flash API 価格、DeepSeek V4 API アクセス、キャッシュコスト、モデル ID 設定、ベンチマーク、Flash と Pro の評価に関する回答です。