- deepseek/deepseek-v4-flash
deepseek/deepseek-v4-flash
- konteks · $0.1120 / M token input · $0.2240 / M token output
DeepSeek V4 Flash adalah rute model DeepSeek di OurToken untuk developer yang membutuhkan opsi hemat biaya untuk chat, coding, summarization, prompt konteks panjang, dan workload assistant volume tinggi.
Harga
Pay-per-use
Tanpa biaya di awal; bayar hanya untuk yang Anda gunakan
Penggunaan API
Panduan akses API
Contoh kode
Gunakan endpoint API OurToken untuk model ini. Contoh di bawah memakai request HTTP langsung dan endpoint yang direkomendasikan untuk keluarga model ini.
curl https://api.ourtoken.ai/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer YOUR_API_KEY" \
-d '{
"model": "deepseek-v4-flash",
"messages": [
{
"role": "user",
"content": "Hello!"
}
],
"max_tokens": 256
}'Referensi API Chat Completions
Buat respons chat dengan endpoint yang kompatibel dengan OpenAI Chat Completions. Gunakan https://api.ourtoken.ai/v1 sebagai SDK Base URL dan POST /chat/completions sebagai endpoint.
Authorization
| Content-Type | application/json |
| Authorization | Bearer YOUR_API_KEY |
Request Body
| Field | Type | Wajib | Deskripsi |
|---|---|---|---|
| model | string | Wajib | Model ID yang akan dipanggil. |
| messages | array<object> | Wajib | Pesan percakapan yang dikirim ke model. |
| max_tokens | integer | Opsional | Jumlah maksimum token output. |
| temperature | number | Opsional | Temperature sampling. |
| top_p | number | Opsional | Parameter nucleus sampling. |
| stream | boolean | Opsional | Apakah respons dikembalikan sebagai streaming. |
| stream_options | object | Opsional | Opsi tambahan untuk respons streaming. |
| tools | array<object> | Opsional | Tools yang tersedia untuk model. |
| tool_choice | string | object | Opsional | Mengontrol cara model memilih tools. |
| response_format | object | Opsional | Mengontrol output terstruktur, seperti respons objek JSON. |
Response Body
| Field | Type | Wajib | Deskripsi |
|---|---|---|---|
| id | string | Wajib | Identifier unik chat completion. |
| object | "chat.completion" | Wajib | Tipe objek yang dikembalikan oleh API Chat Completions. |
| created | integer | Wajib | Timestamp Unix saat respons dibuat. |
| model | string | Wajib | Model yang menghasilkan respons. |
| choices | array<object> | Wajib | Kandidat respons yang dikembalikan oleh model. |
| choices[].message.role | string | Wajib | Role dari pesan chat yang dikembalikan. |
| choices[].message.content | string | Opsional | Konten teks dalam pesan chat yang dikembalikan. |
| choices[].finish_reason | string | Opsional | Alasan generasi berhenti. |
| usage | object | Opsional | Informasi penggunaan token untuk chat completion. |
| usage.prompt_tokens | integer | Opsional | Jumlah token input. |
| usage.completion_tokens | integer | Opsional | Jumlah token output. |
| usage.total_tokens | integer | Opsional | Jumlah token total. |
| usage.prompt_tokens_details | object | Opsional | Rincian penggunaan token input. |
| usage.prompt_tokens_details.cached_tokens | integer | Opsional | Token yang dilayani dari cache. |
Pengenalan model
DeepSeek deepseek-v4-flash
DeepSeek V4 Flash adalah rute model DeepSeek di OurToken untuk developer yang membutuhkan opsi hemat biaya untuk chat, coding, summarization, prompt konteks panjang, dan workload assistant volume tinggi.
DeepSeek V4 Flash memberi tim rute DeepSeek V4 biaya lebih rendah untuk pekerjaan aplikasi saat responsivitas, harga yang dapat diprediksi, dan integrasi API sederhana menjadi penting. Gunakan API DeepSeek V4 Flash saat ingin menguji workflow DeepSeek melalui API terpadu OurToken sambil menjaga model ID, log penggunaan, biaya cache, dan review harga dalam satu dashboard.
Mengapa model ini menonjol
- 80% dari harga referensi resmi DeepSeek V4 Flash untuk token input dan output.
- Setup API kompatibel OpenAI melalui endpoint OurToken yang sama dengan model lain yang didukung.
- Harga cache read dan cache write yang jelas untuk prompt konteks berulang dan workload percakapan panjang.
- Berguna untuk mengevaluasi workflow chat, coding, summarization, dan assistant yang sensitif biaya tanpa integrasi khusus provider yang terpisah.
- Log Dashboard dan visibilitas penggunaan membantu tim meninjau biaya request setelah launch.
Fitur utama
- Model ID: deepseek-v4-flash
- Harga input: $0.1120 per 1M tokens di OurToken
- Harga output: $0.2240 per 1M tokens di OurToken
- Harga cache read: $0.0020 per 1M tokens di OurToken
- Harga cache write: $0 per 1M tokens di OurToken
- Provider: DeepSeek
Spesifikasi
Fitur API DeepSeek V4 Flash
Gunakan API DeepSeek V4 Flash untuk akses API DeepSeek V4 terpadu, harga API DeepSeek V4 Flash yang transparan, visibilitas cache, dan evaluasi produksi.
Akses terpadu
Panggil API DeepSeek V4 Flash melalui endpoint terpadu OurToken sambil menjaga akses model, manajemen API key, dan riwayat penggunaan di satu tempat. Gunakan deepseek-v4-flash sebagai model ID dan pakai ulang pola request kompatibel OpenAI untuk chat, coding, dan workflow agent.
Kejelasan harga
Tinjau harga DeepSeek V4 Flash sebelum rollout. OurToken mencantumkan $0.1120 input dan $0.2240 output per 1M tokens, sehingga tim dapat memperkirakan harga DeepSeek V4 Flash untuk chat, coding, dan traffic assistant volume tinggi sebelum menaikkan penggunaan produksi.
Biaya cache
Pisahkan perilaku cache dari spend prompt normal dengan harga cache eksplisit. Cache read API DeepSeek V4 Flash tercantum $0.0020 per 1M tokens di OurToken, sedangkan cache write adalah $0 untuk workload konteks berulang dan reuse prompt panjang.
Workload Flash
Gunakan rute Flash saat responsivitas dan kontrol biaya penting untuk chat produksi, summarization, catatan coding, dan tugas agent ringan. Materi kompetitor memosisikan model untuk inferensi cepat dan workload throughput tinggi, yang sebaiknya divalidasi tim dengan prompt sendiri.
Konteks panjang
Evaluasi workload API DeepSeek V4 yang membutuhkan konteks panjang, seperti review dokumen, catatan repository, log support, dan percakapan multi-turn. Uji latensi, kualitas output, dan perilaku cache sebelum menjadikan Flash rute default untuk prompt besar.
Review benchmark
Gunakan klaim benchmark DeepSeek V4 Flash sebagai titik awal, bukan garansi produksi. Bandingkan coding, reasoning, latensi, penggunaan tool, dan konsumsi token dengan acceptance criteria sendiri sebelum menaikkan traffic ke workflow customer-facing.
Cara menggunakan API DeepSeek V4 Flash di OurToken
Buat API key, salin deepseek-v4-flash, bandingkan harga DeepSeek V4, panggil endpoint terpadu, dan pantau penggunaan nyata.
Buat API key
Buat API key OurToken dari dashboard dan simpan di environment variable server-side yang aman. Ini memberi backend akses ke API DeepSeek V4 Flash sambil menjaga kredensial keluar dari kode client dan repository publik.
01Salin Model ID
Gunakan deepseek-v4-flash sebagai nilai model di body request. Menjaga model ID persis di konfigurasi membantu developer menghindari kesalahan nama saat membandingkan rute API DeepSeek V4 di test lokal, traffic staging, dan deployment produksi.
02Panggil endpoint
Kirim request ke endpoint API terpadu OurToken dengan API key, model ID, dan payload prompt. Pola request chat kompatibel OpenAI yang sudah ada biasanya bisa digunakan ulang setelah mengganti base URL, kredensial, dan nilai model.
03Bandingkan harga
Bandingkan harga DeepSeek V4 sebelum rollout: OurToken mencantumkan $0.1120 input, $0.2240 output, dan $0.0020 cache read per 1M tokens. Gunakan nilai ini untuk memperkirakan harga DeepSeek V4 Flash bagi volume prompt, output, dan cache yang diharapkan.
04Uji benchmark
Perlakukan setiap klaim benchmark DeepSeek V4 Flash sebagai prompt untuk evaluasi sendiri. Jalankan tugas coding, reasoning, summarization, dan agent yang representatif, lalu bandingkan kualitas respons, latensi, perilaku tool, penggunaan token, dan error handling.
05Pantau biaya
Setelah launch, tinjau log riwayat untuk jumlah request, token input, token output, token cache read, dan spend. Data penggunaan nyata membantu tim membandingkan harga DeepSeek V4 Flash dengan traffic aktual, bukan hanya asumsi listing provider.
06FAQ API DeepSeek V4 Flash
Jawaban tentang harga API DeepSeek V4 Flash, akses API DeepSeek V4, biaya cache, setup model ID, benchmark, dan evaluasi Flash versus Pro.