DeepSeek

deepseek/deepseek-v4-flash

- konteks · $0.1120 / M token input · $0.2240 / M token output

DeepSeek V4 Flash adalah rute model DeepSeek di OurToken untuk developer yang membutuhkan opsi hemat biaya untuk chat, coding, summarization, prompt konteks panjang, dan workload assistant volume tinggi.

Harga

Pay-per-use

Tanpa biaya di awal; bayar hanya untuk yang Anda gunakan

80% of official price
Input$0.14 / M$0.1120 / M Token
Output$0.28 / M$0.2240 / M Token

Penggunaan API

Panduan akses API

Base URLhttps://api.ourtoken.ai/v1
Endpoint APIchat/completions
Full URLhttps://api.ourtoken.ai/v1/chat/completions
Model IDdeepseek-v4-flash
Dapatkan API key

Contoh kode

Gunakan endpoint API OurToken untuk model ini. Contoh di bawah memakai request HTTP langsung dan endpoint yang direkomendasikan untuk keluarga model ini.

curl https://api.ourtoken.ai/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -d '{
    "model": "deepseek-v4-flash",
    "messages": [
      {
        "role": "user",
        "content": "Hello!"
      }
    ],
    "max_tokens": 256
  }'

Referensi API Chat Completions

Buat respons chat dengan endpoint yang kompatibel dengan OpenAI Chat Completions. Gunakan https://api.ourtoken.ai/v1 sebagai SDK Base URL dan POST /chat/completions sebagai endpoint.

Authorization

Content-Typeapplication/json
AuthorizationBearer YOUR_API_KEY

Request Body

FieldTypeWajibDeskripsi
modelstringWajibModel ID yang akan dipanggil.
messagesarray<object>WajibPesan percakapan yang dikirim ke model.
max_tokensintegerOpsionalJumlah maksimum token output.
temperaturenumberOpsionalTemperature sampling.
top_pnumberOpsionalParameter nucleus sampling.
streambooleanOpsionalApakah respons dikembalikan sebagai streaming.
stream_optionsobjectOpsionalOpsi tambahan untuk respons streaming.
toolsarray<object>OpsionalTools yang tersedia untuk model.
tool_choicestring | objectOpsionalMengontrol cara model memilih tools.
response_formatobjectOpsionalMengontrol output terstruktur, seperti respons objek JSON.

Response Body

FieldTypeWajibDeskripsi
idstringWajibIdentifier unik chat completion.
object"chat.completion"WajibTipe objek yang dikembalikan oleh API Chat Completions.
createdintegerWajibTimestamp Unix saat respons dibuat.
modelstringWajibModel yang menghasilkan respons.
choicesarray<object>WajibKandidat respons yang dikembalikan oleh model.
choices[].message.rolestringWajibRole dari pesan chat yang dikembalikan.
choices[].message.contentstringOpsionalKonten teks dalam pesan chat yang dikembalikan.
choices[].finish_reasonstringOpsionalAlasan generasi berhenti.
usageobjectOpsionalInformasi penggunaan token untuk chat completion.
usage.prompt_tokensintegerOpsionalJumlah token input.
usage.completion_tokensintegerOpsionalJumlah token output.
usage.total_tokensintegerOpsionalJumlah token total.
usage.prompt_tokens_detailsobjectOpsionalRincian penggunaan token input.
usage.prompt_tokens_details.cached_tokensintegerOpsionalToken yang dilayani dari cache.

Pengenalan model

DeepSeek deepseek-v4-flash

DeepSeek V4 Flash adalah rute model DeepSeek di OurToken untuk developer yang membutuhkan opsi hemat biaya untuk chat, coding, summarization, prompt konteks panjang, dan workload assistant volume tinggi.

DeepSeek V4 Flash memberi tim rute DeepSeek V4 biaya lebih rendah untuk pekerjaan aplikasi saat responsivitas, harga yang dapat diprediksi, dan integrasi API sederhana menjadi penting. Gunakan API DeepSeek V4 Flash saat ingin menguji workflow DeepSeek melalui API terpadu OurToken sambil menjaga model ID, log penggunaan, biaya cache, dan review harga dalam satu dashboard.

Mengapa model ini menonjol

  • 80% dari harga referensi resmi DeepSeek V4 Flash untuk token input dan output.
  • Setup API kompatibel OpenAI melalui endpoint OurToken yang sama dengan model lain yang didukung.
  • Harga cache read dan cache write yang jelas untuk prompt konteks berulang dan workload percakapan panjang.
  • Berguna untuk mengevaluasi workflow chat, coding, summarization, dan assistant yang sensitif biaya tanpa integrasi khusus provider yang terpisah.
  • Log Dashboard dan visibilitas penggunaan membantu tim meninjau biaya request setelah launch.

Fitur utama

  • Model ID: deepseek-v4-flash
  • Harga input: $0.1120 per 1M tokens di OurToken
  • Harga output: $0.2240 per 1M tokens di OurToken
  • Harga cache read: $0.0020 per 1M tokens di OurToken
  • Harga cache write: $0 per 1M tokens di OurToken
  • Provider: DeepSeek

Spesifikasi

ProviderDeepSeek
Tipe modelLarge Language Model (LLM)
Model IDdeepseek-v4-flash
Panjang konteks1M tokens
Max Output384K tokens
Harga input OurToken$0.1120 / 1M tokens
Harga output OurToken$0.2240 / 1M tokens
Harga cache read OurToken$0.0020 / 1M tokens
Harga cache write OurToken$0 / 1M tokens
Referensi input resmi$0.14 / 1M tokens
Referensi output resmi$0.28 / 1M tokens
Referensi cache read resmi$0.0028 / 1M tokens

Fitur API DeepSeek V4 Flash

Gunakan API DeepSeek V4 Flash untuk akses API DeepSeek V4 terpadu, harga API DeepSeek V4 Flash yang transparan, visibilitas cache, dan evaluasi produksi.

Akses terpadu

Panggil API DeepSeek V4 Flash melalui endpoint terpadu OurToken sambil menjaga akses model, manajemen API key, dan riwayat penggunaan di satu tempat. Gunakan deepseek-v4-flash sebagai model ID dan pakai ulang pola request kompatibel OpenAI untuk chat, coding, dan workflow agent.

Kejelasan harga

Tinjau harga DeepSeek V4 Flash sebelum rollout. OurToken mencantumkan $0.1120 input dan $0.2240 output per 1M tokens, sehingga tim dapat memperkirakan harga DeepSeek V4 Flash untuk chat, coding, dan traffic assistant volume tinggi sebelum menaikkan penggunaan produksi.

Biaya cache

Pisahkan perilaku cache dari spend prompt normal dengan harga cache eksplisit. Cache read API DeepSeek V4 Flash tercantum $0.0020 per 1M tokens di OurToken, sedangkan cache write adalah $0 untuk workload konteks berulang dan reuse prompt panjang.

Workload Flash

Gunakan rute Flash saat responsivitas dan kontrol biaya penting untuk chat produksi, summarization, catatan coding, dan tugas agent ringan. Materi kompetitor memosisikan model untuk inferensi cepat dan workload throughput tinggi, yang sebaiknya divalidasi tim dengan prompt sendiri.

Konteks panjang

Evaluasi workload API DeepSeek V4 yang membutuhkan konteks panjang, seperti review dokumen, catatan repository, log support, dan percakapan multi-turn. Uji latensi, kualitas output, dan perilaku cache sebelum menjadikan Flash rute default untuk prompt besar.

Review benchmark

Gunakan klaim benchmark DeepSeek V4 Flash sebagai titik awal, bukan garansi produksi. Bandingkan coding, reasoning, latensi, penggunaan tool, dan konsumsi token dengan acceptance criteria sendiri sebelum menaikkan traffic ke workflow customer-facing.

Cara menggunakan API DeepSeek V4 Flash di OurToken

Buat API key, salin deepseek-v4-flash, bandingkan harga DeepSeek V4, panggil endpoint terpadu, dan pantau penggunaan nyata.

Buat API key

Buat API key OurToken dari dashboard dan simpan di environment variable server-side yang aman. Ini memberi backend akses ke API DeepSeek V4 Flash sambil menjaga kredensial keluar dari kode client dan repository publik.

01

Salin Model ID

Gunakan deepseek-v4-flash sebagai nilai model di body request. Menjaga model ID persis di konfigurasi membantu developer menghindari kesalahan nama saat membandingkan rute API DeepSeek V4 di test lokal, traffic staging, dan deployment produksi.

02

Panggil endpoint

Kirim request ke endpoint API terpadu OurToken dengan API key, model ID, dan payload prompt. Pola request chat kompatibel OpenAI yang sudah ada biasanya bisa digunakan ulang setelah mengganti base URL, kredensial, dan nilai model.

03

Bandingkan harga

Bandingkan harga DeepSeek V4 sebelum rollout: OurToken mencantumkan $0.1120 input, $0.2240 output, dan $0.0020 cache read per 1M tokens. Gunakan nilai ini untuk memperkirakan harga DeepSeek V4 Flash bagi volume prompt, output, dan cache yang diharapkan.

04

Uji benchmark

Perlakukan setiap klaim benchmark DeepSeek V4 Flash sebagai prompt untuk evaluasi sendiri. Jalankan tugas coding, reasoning, summarization, dan agent yang representatif, lalu bandingkan kualitas respons, latensi, perilaku tool, penggunaan token, dan error handling.

05

Pantau biaya

Setelah launch, tinjau log riwayat untuk jumlah request, token input, token output, token cache read, dan spend. Data penggunaan nyata membantu tim membandingkan harga DeepSeek V4 Flash dengan traffic aktual, bukan hanya asumsi listing provider.

06

FAQ API DeepSeek V4 Flash

Jawaban tentang harga API DeepSeek V4 Flash, akses API DeepSeek V4, biaya cache, setup model ID, benchmark, dan evaluasi Flash versus Pro.

01

Apa itu API DeepSeek V4 Flash?

API DeepSeek V4 Flash adalah rute model Flash DeepSeek V4 yang tersedia melalui OurToken untuk tim yang menginginkan opsi biaya lebih rendah untuk chat, catatan coding, summarization, dan workflow assistant. Developer dapat memakai model ID deepseek-v4-flash, membuat API key OurToken, dan memanggilnya melalui alur API terpadu yang sama dengan model lain yang didukung.
02

Berapa harga API DeepSeek V4 Flash di OurToken?

Harga API DeepSeek V4 Flash di OurToken adalah $0.1120 per 1M token input dan $0.2240 per 1M token output. Referensi resmi yang diberikan untuk DeepSeek V4 Flash adalah $0.14 input dan $0.28 output per 1M tokens, jadi harga input dan output adalah 80% dari harga resmi.
03

Berapa harga DeepSeek V4 Flash untuk cache read dan cache write?

Harga DeepSeek V4 Flash untuk cache read adalah $0.0020 per 1M token cache read di OurToken, dibandingkan referensi resmi $0.0028. Cache write tercantum sebagai $0 per 1M tokens. Karena cache read memiliki rasio sendiri, jangan menganggap setiap kategori token memakai diskon yang sama seperti input dan output.
04

Bagaimana perbandingan harga DeepSeek V4 antara Flash dan Pro?

Harga DeepSeek V4 lebih rendah pada rute Flash di katalog OurToken saat ini: Flash mencantumkan $0.1120 input dan $0.2240 output per 1M tokens, sedangkan Pro mencantumkan $0.3480 input dan $0.6960 output. Pilih Flash untuk workload sensitif biaya atau volume tinggi, lalu uji Pro saat kebutuhan kualitas membenarkan rute yang lebih kuat.
05

Model ID apa yang harus dipakai untuk akses API DeepSeek V4?

Gunakan deepseek-v4-flash sebagai model ID untuk rute API DeepSeek V4 ini di OurToken. Halaman API Keys dan galeri model seharusnya menampilkan nilai model yang dapat dipanggil, sehingga developer bisa menyalin ID persisnya dan menghindari kesalahan akibat display name, prefix provider, atau perbedaan casing.
06

Bagaimana mengevaluasi benchmark dan klaim kapabilitas DeepSeek V4 Flash?

Perlakukan setiap klaim benchmark DeepSeek V4 Flash sebagai titik awal testing, bukan garansi produksi. Materi kompetitor menyebut output JSON, tool calls, coding, reasoning, dan tugas konteks panjang, tetapi tim sebaiknya memverifikasi kualitas respons, latensi, perilaku cache, dan total biaya token terhadap kebutuhan sendiri.