deepseek/deepseek-v4-flash

$0.1120 / M token input · $0.2240 / M token output

DeepSeek V4 Flash adalah rute model DeepSeek di OurToken untuk developer yang membutuhkan opsi hemat biaya untuk chat, coding, summarization, prompt konteks panjang, dan workload assistant volume tinggi.

Dapatkan API key

Monitor Status 24H

Waktu aktif 100%

8 jam yang lalusekarang

Tersedia

2026-07-23 15:38:33 UTC

Harga

Bayar sesuai pemakaian

Tanpa biaya di awal; bayar hanya untuk yang Anda gunakan

80% of official price

Masukan$0.14 / M$0.1120 / M Token

Keluaran$0.28 / M$0.2240 / M Token

Input tersimpan$0.0028 / M$0.0020 / M Token

Penulisan cache$0 / M$0 / M Token

Penggunaan API

Panduan akses API

URL dasarhttps://api.ourtoken.ai/v1

Endpoint APIchat/completions

URL lengkaphttps://api.ourtoken.ai/v1/chat/completions

ID modeldeepseek-v4-flash

Dapatkan API key

Contoh kode

Gunakan endpoint API OurToken untuk model ini. Contoh di bawah memakai request HTTP langsung dan endpoint yang direkomendasikan untuk keluarga model ini.

curl https://api.ourtoken.ai/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -d '{
    "model": "deepseek-v4-flash",
    "messages": [
      {
        "role": "user",
        "content": "Hello!"
      }
    ],
    "max_tokens": 256
  }'

Referensi API Chat Completions

Buat respons chat dengan endpoint yang kompatibel dengan OpenAI Chat Completions. Gunakan https://api.ourtoken.ai/v1 sebagai SDK Base URL dan POST /chat/completions sebagai endpoint.

Otorisasi

Content-Type	application/json
Authorization	Bearer YOUR_API_KEY

Isi permintaan

Kolom	Tipe	Wajib	Deskripsi
model	string	Wajib	Model ID yang akan dipanggil.
messages	array<object>	Wajib	Pesan percakapan yang dikirim ke model.
max_tokens	integer	Opsional	Jumlah maksimum token output.
temperature	number	Opsional	Temperature sampling.
top_p	number	Opsional	Parameter nucleus sampling.
stream	boolean	Opsional	Apakah respons dikembalikan sebagai streaming.
stream_options	object	Opsional	Opsi tambahan untuk respons streaming.
tools	array<object>	Opsional	Tools yang tersedia untuk model.
tool_choice	string \| object	Opsional	Mengontrol cara model memilih tools.
response_format	object	Opsional	Mengontrol output terstruktur, seperti respons objek JSON.

Isi respons

Kolom	Tipe	Wajib	Deskripsi
id	string	Wajib	Identifier unik chat completion.
object	"chat.completion"	Wajib	Tipe objek yang dikembalikan oleh API Chat Completions.
created	integer	Wajib	Timestamp Unix saat respons dibuat.
model	string	Wajib	Model yang menghasilkan respons.
choices	array<object>	Wajib	Kandidat respons yang dikembalikan oleh model.
choices[].message.role	string	Wajib	Role dari pesan chat yang dikembalikan.
choices[].message.content	string	Opsional	Konten teks dalam pesan chat yang dikembalikan.
choices[].finish_reason	string	Opsional	Alasan generasi berhenti.
usage	object	Opsional	Informasi penggunaan token untuk chat completion.
usage.prompt_tokens	integer	Opsional	Jumlah token input.
usage.completion_tokens	integer	Opsional	Jumlah token output.
usage.total_tokens	integer	Opsional	Jumlah token total.
usage.prompt_tokens_details	object	Opsional	Rincian penggunaan token input.
usage.prompt_tokens_details.cached_tokens	integer	Opsional	Token yang dilayani dari cache.

Pengenalan model

DeepSeek deepseek-v4-flash

DeepSeek V4 Flash memberi tim rute DeepSeek V4 biaya lebih rendah untuk pekerjaan aplikasi saat responsivitas, harga yang dapat diprediksi, dan integrasi API sederhana menjadi penting. Gunakan API DeepSeek V4 Flash saat ingin menguji workflow DeepSeek melalui API terpadu OurToken sambil menjaga model ID, log penggunaan, biaya cache, dan review harga dalam satu dashboard.

Mengapa model ini menonjol

80% dari harga referensi resmi DeepSeek V4 Flash untuk token input dan output.
Setup API kompatibel OpenAI melalui endpoint OurToken yang sama dengan model lain yang didukung.
Harga cache read dan cache write yang jelas untuk prompt konteks berulang dan workload percakapan panjang.
Berguna untuk mengevaluasi workflow chat, coding, summarization, dan assistant yang sensitif biaya tanpa integrasi khusus provider yang terpisah.
Log Dashboard dan visibilitas penggunaan membantu tim meninjau biaya request setelah launch.

Fitur utama

Model ID: deepseek-v4-flash
Harga input: $0.1120 per 1M tokens di OurToken
Harga output: $0.2240 per 1M tokens di OurToken
Harga cache read: $0.0020 per 1M tokens di OurToken
Harga cache write: $0 per 1M tokens di OurToken
Provider: DeepSeek

Spesifikasi

ProviderDeepSeek

Tipe modelLarge Language Model (LLM)

Model IDdeepseek-v4-flash

Panjang konteks1M tokens

Max Output384K tokens

Harga input OurToken$0.1120 / 1M tokens

Harga output OurToken$0.2240 / 1M tokens

Harga cache read OurToken$0.0020 / 1M tokens

Harga cache write OurToken$0 / 1M tokens

Referensi input resmi$0.14 / 1M tokens

Referensi output resmi$0.28 / 1M tokens

Referensi cache read resmi$0.0028 / 1M tokens

Fitur API DeepSeek V4 Flash

Gunakan API DeepSeek V4 Flash untuk akses API DeepSeek V4 terpadu, harga API DeepSeek V4 Flash yang transparan, visibilitas cache, dan evaluasi produksi.

Akses terpadu

Panggil API DeepSeek V4 Flash melalui endpoint terpadu OurToken sambil menjaga akses model, manajemen API key, dan riwayat penggunaan di satu tempat. Gunakan deepseek-v4-flash sebagai model ID dan pakai ulang pola request kompatibel OpenAI untuk chat, coding, dan workflow agent.

Kejelasan harga

Tinjau harga DeepSeek V4 Flash sebelum rollout. OurToken mencantumkan $0.1120 input dan $0.2240 output per 1M tokens, sehingga tim dapat memperkirakan harga DeepSeek V4 Flash untuk chat, coding, dan traffic assistant volume tinggi sebelum menaikkan penggunaan produksi.

Biaya cache

Pisahkan perilaku cache dari spend prompt normal dengan harga cache eksplisit. Cache read API DeepSeek V4 Flash tercantum $0.0020 per 1M tokens di OurToken, sedangkan cache write adalah $0 untuk workload konteks berulang dan reuse prompt panjang.

Workload Flash

Gunakan rute Flash saat responsivitas dan kontrol biaya penting untuk chat produksi, summarization, catatan coding, dan tugas agent ringan. Materi kompetitor memosisikan model untuk inferensi cepat dan workload throughput tinggi, yang sebaiknya divalidasi tim dengan prompt sendiri.

Konteks panjang

Evaluasi workload API DeepSeek V4 yang membutuhkan konteks panjang, seperti review dokumen, catatan repository, log support, dan percakapan multi-turn. Uji latensi, kualitas output, dan perilaku cache sebelum menjadikan Flash rute default untuk prompt besar.

Review benchmark

Gunakan klaim benchmark DeepSeek V4 Flash sebagai titik awal, bukan garansi produksi. Bandingkan coding, reasoning, latensi, penggunaan tool, dan konsumsi token dengan acceptance criteria sendiri sebelum menaikkan traffic ke workflow customer-facing.

Cara menggunakan API DeepSeek V4 Flash di OurToken

Buat API key, salin deepseek-v4-flash, bandingkan harga DeepSeek V4, panggil endpoint terpadu, dan pantau penggunaan nyata.

Buat API key

Buat API key OurToken dari dashboard dan simpan di environment variable server-side yang aman. Ini memberi backend akses ke API DeepSeek V4 Flash sambil menjaga kredensial keluar dari kode client dan repository publik.

Salin Model ID

Gunakan deepseek-v4-flash sebagai nilai model di body request. Menjaga model ID persis di konfigurasi membantu developer menghindari kesalahan nama saat membandingkan rute API DeepSeek V4 di test lokal, traffic staging, dan deployment produksi.

Panggil endpoint

Kirim request ke endpoint API terpadu OurToken dengan API key, model ID, dan payload prompt. Pola request chat kompatibel OpenAI yang sudah ada biasanya bisa digunakan ulang setelah mengganti base URL, kredensial, dan nilai model.

Bandingkan harga

Bandingkan harga DeepSeek V4 sebelum rollout: OurToken mencantumkan $0.1120 input, $0.2240 output, dan $0.0020 cache read per 1M tokens. Gunakan nilai ini untuk memperkirakan harga DeepSeek V4 Flash bagi volume prompt, output, dan cache yang diharapkan.

Uji benchmark

Perlakukan setiap klaim benchmark DeepSeek V4 Flash sebagai prompt untuk evaluasi sendiri. Jalankan tugas coding, reasoning, summarization, dan agent yang representatif, lalu bandingkan kualitas respons, latensi, perilaku tool, penggunaan token, dan error handling.

Pantau biaya

Setelah launch, tinjau log riwayat untuk jumlah request, token input, token output, token cache read, dan spend. Data penggunaan nyata membantu tim membandingkan harga DeepSeek V4 Flash dengan traffic aktual, bukan hanya asumsi listing provider.

FAQ API DeepSeek V4 Flash

Jawaban tentang harga API DeepSeek V4 Flash, akses API DeepSeek V4, biaya cache, setup model ID, benchmark, dan evaluasi Flash versus Pro.

Apa itu API DeepSeek V4 Flash?

API DeepSeek V4 Flash adalah rute model Flash DeepSeek V4 yang tersedia melalui OurToken untuk tim yang menginginkan opsi biaya lebih rendah untuk chat, catatan coding, summarization, dan workflow assistant. Developer dapat memakai model ID deepseek-v4-flash, membuat API key OurToken, dan memanggilnya melalui alur API terpadu yang sama dengan model lain yang didukung.

Berapa harga API DeepSeek V4 Flash di OurToken?

Harga API DeepSeek V4 Flash di OurToken adalah $0.1120 per 1M token input dan $0.2240 per 1M token output. Referensi resmi yang diberikan untuk DeepSeek V4 Flash adalah $0.14 input dan $0.28 output per 1M tokens, jadi harga input dan output adalah 80% dari harga resmi.

Berapa harga DeepSeek V4 Flash untuk cache read dan cache write?

Harga DeepSeek V4 Flash untuk cache read adalah $0.0020 per 1M token cache read di OurToken, dibandingkan referensi resmi $0.0028. Cache write tercantum sebagai $0 per 1M tokens. Karena cache read memiliki rasio sendiri, jangan menganggap setiap kategori token memakai diskon yang sama seperti input dan output.

Bagaimana perbandingan harga DeepSeek V4 antara Flash dan Pro?

Harga DeepSeek V4 lebih rendah pada rute Flash di katalog OurToken saat ini: Flash mencantumkan $0.1120 input dan $0.2240 output per 1M tokens, sedangkan Pro mencantumkan $0.3480 input dan $0.6960 output. Pilih Flash untuk workload sensitif biaya atau volume tinggi, lalu uji Pro saat kebutuhan kualitas membenarkan rute yang lebih kuat.

Model ID apa yang harus dipakai untuk akses API DeepSeek V4?

Gunakan deepseek-v4-flash sebagai model ID untuk rute API DeepSeek V4 ini di OurToken. Halaman API Keys dan galeri model seharusnya menampilkan nilai model yang dapat dipanggil, sehingga developer bisa menyalin ID persisnya dan menghindari kesalahan akibat display name, prefix provider, atau perbedaan casing.

Bagaimana mengevaluasi benchmark dan klaim kapabilitas DeepSeek V4 Flash?

Perlakukan setiap klaim benchmark DeepSeek V4 Flash sebagai titik awal testing, bukan garansi produksi. Materi kompetitor menyebut output JSON, tool calls, coding, reasoning, dan tugas konteks panjang, tetapi tim sebaiknya memverifikasi kualitas respons, latensi, perilaku cache, dan total biaya token terhadap kebutuhan sendiri.