- deepseek/deepseek-v4-flash
deepseek/deepseek-v4-flash
- contexto · $0.1120 / M tokens de entrada · $0.2240 / M tokens de saída
DeepSeek V4 Flash é uma rota de modelo DeepSeek na OurToken para desenvolvedores que precisam de uma opção econômica para chat, coding, sumarização, prompts de contexto longo e workloads de assistente em alto volume.
Preços
Pay-per-use
Sem custo inicial; pague apenas pelo que usar
Uso da API
Guia de acesso à API
Exemplos de código
Use o endpoint da API OurToken para este modelo. Os exemplos abaixo usam requisições HTTP diretas e o endpoint recomendado para a família do modelo.
curl https://api.ourtoken.ai/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer YOUR_API_KEY" \
-d '{
"model": "deepseek-v4-flash",
"messages": [
{
"role": "user",
"content": "Hello!"
}
],
"max_tokens": 256
}'Referência da API Chat Completions
Crie uma resposta de chat com o endpoint compatível com OpenAI Chat Completions. Use https://api.ourtoken.ai/v1 como SDK Base URL e POST /chat/completions como endpoint.
Autorização
| Content-Type | application/json |
| Authorization | Bearer YOUR_API_KEY |
Corpo da requisição
| Campo | Tipo | Obrigatório | Descrição |
|---|---|---|---|
| model | string | Obrigatório | Model ID a chamar. |
| messages | array<object> | Obrigatório | Mensagens da conversa enviadas ao modelo. |
| max_tokens | integer | Opcional | Número máximo de tokens de saída. |
| temperature | number | Opcional | Temperatura de amostragem. |
| top_p | number | Opcional | Parâmetro de nucleus sampling. |
| stream | boolean | Opcional | Define se a resposta será retornada em streaming. |
| stream_options | object | Opcional | Opções adicionais para respostas em streaming. |
| tools | array<object> | Opcional | Tools disponíveis para o modelo. |
| tool_choice | string | object | Opcional | Controla como o modelo seleciona tools. |
| response_format | object | Opcional | Controla saída estruturada, como respostas em objeto JSON. |
Corpo da resposta
| Campo | Tipo | Obrigatório | Descrição |
|---|---|---|---|
| id | string | Obrigatório | Identificador único da chat completion. |
| object | "chat.completion" | Obrigatório | Tipo de objeto retornado pela API Chat Completions. |
| created | integer | Obrigatório | Timestamp Unix de criação da resposta. |
| model | string | Obrigatório | Modelo que gerou a resposta. |
| choices | array<object> | Obrigatório | Respostas candidatas retornadas pelo modelo. |
| choices[].message.role | string | Obrigatório | Role da mensagem de chat retornada. |
| choices[].message.content | string | Opcional | Conteúdo de texto na mensagem de chat retornada. |
| choices[].finish_reason | string | Opcional | Motivo pelo qual a geração parou. |
| usage | object | Opcional | Informações de uso de tokens da chat completion. |
| usage.prompt_tokens | integer | Opcional | Contagem de tokens de entrada. |
| usage.completion_tokens | integer | Opcional | Contagem de tokens de saída. |
| usage.total_tokens | integer | Opcional | Contagem total de tokens. |
| usage.prompt_tokens_details | object | Opcional | Detalhamento do uso de tokens de entrada. |
| usage.prompt_tokens_details.cached_tokens | integer | Opcional | Tokens servidos a partir de cache. |
Introdução ao modelo
DeepSeek deepseek-v4-flash
DeepSeek V4 Flash é uma rota de modelo DeepSeek na OurToken para desenvolvedores que precisam de uma opção econômica para chat, coding, sumarização, prompts de contexto longo e workloads de assistente em alto volume.
DeepSeek V4 Flash dá aos times uma rota DeepSeek V4 de menor custo para aplicações em que responsividade, preços previsíveis e integração simples via API importam. Use a API DeepSeek V4 Flash quando quiser testar workflows DeepSeek pela API unificada da OurToken, mantendo model IDs, logs de uso, custos de cache e revisão de preços em um só dashboard.
Por que ele se destaca
- 80% do preço oficial de referência do DeepSeek V4 Flash para tokens de entrada e saída.
- Setup de API compatível com OpenAI pelo mesmo endpoint da OurToken usado por outros modelos suportados.
- Preços claros de cache read e cache write para prompts com contexto repetido e workloads de conversas longas.
- Útil para avaliar workflows sensíveis a custo em chat, coding, sumarização e assistentes sem integração separada específica do provedor.
- Logs no Dashboard e visibilidade de uso ajudam times a revisar o custo de requests após o lançamento.
Principais recursos
- Model ID: deepseek-v4-flash
- Preço de entrada: $0.1120 por 1M tokens na OurToken
- Preço de saída: $0.2240 por 1M tokens na OurToken
- Preço de cache read: $0.0020 por 1M tokens na OurToken
- Preço de cache write: $0 por 1M tokens na OurToken
- Provedor: DeepSeek
Especificações
Recursos da API DeepSeek V4 Flash
Use a API DeepSeek V4 Flash para acesso unificado à API DeepSeek V4, preços transparentes da API DeepSeek V4 Flash, visibilidade de cache e avaliação de produção.
Acesso unificado
Chame a API DeepSeek V4 Flash pelo endpoint unificado da OurToken, mantendo acesso a modelos, gestão de chaves de API e histórico de uso em um só lugar. Use deepseek-v4-flash como model ID e reaproveite padrões de request compatíveis com OpenAI para chat, coding e workflows de agentes.
Clareza de preços
Revise os preços do DeepSeek V4 Flash antes do rollout. A OurToken lista $0.1120 entrada e $0.2240 saída por 1M tokens, para que times estimem o preço do DeepSeek V4 Flash para chat, coding e tráfego de assistentes em alto volume antes de escalar o uso em produção.
Custos de cache
Separe comportamento de cache do gasto normal de prompt com preços explícitos. O cache read da API DeepSeek V4 Flash está listado a $0.0020 por 1M tokens na OurToken, enquanto cache write é $0 para workloads de contexto repetido e reuso de prompts longos.
Workloads Flash
Use a rota Flash quando responsividade e controle de custo forem importantes para chat em produção, sumarização, notas de coding e tarefas leves de agentes. Materiais concorrentes posicionam o modelo para inferência rápida e alto throughput, algo que times devem validar com seus próprios prompts.
Contexto longo
Avalie workloads da API DeepSeek V4 que precisam de contexto longo, como review de documentos, notas de repositório, logs de suporte e conversas multi-turno. Teste latência, qualidade de saída e comportamento de cache antes de tornar Flash a rota padrão para prompts grandes.
Review de benchmarks
Use claims de benchmark do DeepSeek V4 Flash como ponto de partida, não como garantia de produção. Compare coding, raciocínio, latência, uso de ferramentas e consumo de tokens com seus próprios critérios de aceite antes de escalar tráfego para workflows voltados ao cliente.
Como usar a API DeepSeek V4 Flash na OurToken
Crie uma chave de API, copie deepseek-v4-flash, compare preços do DeepSeek V4, chame o endpoint unificado e monitore o uso real.
Criar chave de API
Crie uma chave de API da OurToken pelo dashboard e armazene-a em uma variável de ambiente segura no servidor. Isso dá ao backend acesso à API DeepSeek V4 Flash mantendo credenciais fora do código do cliente e de repositórios públicos.
01Copiar Model ID
Use deepseek-v4-flash como valor do modelo no corpo da request. Manter o model ID exato na configuração ajuda desenvolvedores a evitar erros de nome ao comparar rotas da API DeepSeek V4 entre testes locais, tráfego de staging e deployments de produção.
02Chamar endpoint
Envie requests ao endpoint de API unificada da OurToken com sua chave de API, model ID e payload do prompt. Padrões existentes de chat compatíveis com OpenAI geralmente podem ser reaproveitados após trocar base URL, credencial e valor do modelo.
03Comparar preços
Compare os preços do DeepSeek V4 antes do rollout: a OurToken lista $0.1120 entrada, $0.2240 saída e $0.0020 cache read por 1M tokens. Use esses valores para estimar o preço do DeepSeek V4 Flash para volumes esperados de prompt, saída e cache.
04Testar benchmarks
Trate todo claim de benchmark do DeepSeek V4 Flash como um prompt para sua própria avaliação. Rode tarefas representativas de coding, raciocínio, sumarização e agentes, depois compare qualidade de resposta, latência, comportamento de ferramentas, uso de tokens e tratamento de erros.
05Monitorar custo
Após o lançamento, revise logs de histórico para contagem de requests, tokens de entrada, tokens de saída, tokens de cache read e gastos. Dados reais de uso ajudam times a comparar preços do DeepSeek V4 Flash com tráfego efetivo, em vez de depender apenas de suposições de catálogo de provedores.
06FAQ da API DeepSeek V4 Flash
Respostas sobre preços da API DeepSeek V4 Flash, acesso à API DeepSeek V4, custos de cache, configuração de model ID, benchmarks e avaliação Flash versus Pro.