deepseek/deepseek-v4-flash

$0.1120 / M tokens de entrada · $0.2240 / M tokens de saída

DeepSeek V4 Flash é uma rota de modelo DeepSeek na OurToken para desenvolvedores que precisam de uma opção econômica para chat, coding, sumarização, prompts de contexto longo e workloads de assistente em alto volume.

Obter chave de API

Monitor de Status 24H

100% de uptime

há 8 horasagora

Disponível

2026-07-23 17:21:47 UTC

Preços

Pagamento por uso

Sem custo inicial; pague apenas pelo que usar

80% of official price

Entrada$0.14 / M$0.1120 / M Tokens

Saída$0.28 / M$0.2240 / M Tokens

Entrada em cache$0.0028 / M$0.0020 / M Tokens

Gravação de cache$0 / M$0 / M Tokens

Uso da API

Guia de acesso à API

URL basehttps://api.ourtoken.ai/v1

Endpoint da APIchat/completions

URL completahttps://api.ourtoken.ai/v1/chat/completions

ID do modelodeepseek-v4-flash

Obter chave de API

Exemplos de código

Use o endpoint da API OurToken para este modelo. Os exemplos abaixo usam requisições HTTP diretas e o endpoint recomendado para a família do modelo.

curl https://api.ourtoken.ai/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -d '{
    "model": "deepseek-v4-flash",
    "messages": [
      {
        "role": "user",
        "content": "Hello!"
      }
    ],
    "max_tokens": 256
  }'

Referência da API Chat Completions

Crie uma resposta de chat com o endpoint compatível com OpenAI Chat Completions. Use https://api.ourtoken.ai/v1 como SDK Base URL e POST /chat/completions como endpoint.

Autorização

Content-Type	application/json
Authorization	Bearer YOUR_API_KEY

Corpo da requisição

Campo	Tipo	Obrigatório	Descrição
model	string	Obrigatório	Model ID a chamar.
messages	array<object>	Obrigatório	Mensagens da conversa enviadas ao modelo.
max_tokens	integer	Opcional	Número máximo de tokens de saída.
temperature	number	Opcional	Temperatura de amostragem.
top_p	number	Opcional	Parâmetro de nucleus sampling.
stream	boolean	Opcional	Define se a resposta será retornada em streaming.
stream_options	object	Opcional	Opções adicionais para respostas em streaming.
tools	array<object>	Opcional	Tools disponíveis para o modelo.
tool_choice	string \| object	Opcional	Controla como o modelo seleciona tools.
response_format	object	Opcional	Controla saída estruturada, como respostas em objeto JSON.

Corpo da resposta

Campo	Tipo	Obrigatório	Descrição
id	string	Obrigatório	Identificador único da chat completion.
object	"chat.completion"	Obrigatório	Tipo de objeto retornado pela API Chat Completions.
created	integer	Obrigatório	Timestamp Unix de criação da resposta.
model	string	Obrigatório	Modelo que gerou a resposta.
choices	array<object>	Obrigatório	Respostas candidatas retornadas pelo modelo.
choices[].message.role	string	Obrigatório	Role da mensagem de chat retornada.
choices[].message.content	string	Opcional	Conteúdo de texto na mensagem de chat retornada.
choices[].finish_reason	string	Opcional	Motivo pelo qual a geração parou.
usage	object	Opcional	Informações de uso de tokens da chat completion.
usage.prompt_tokens	integer	Opcional	Contagem de tokens de entrada.
usage.completion_tokens	integer	Opcional	Contagem de tokens de saída.
usage.total_tokens	integer	Opcional	Contagem total de tokens.
usage.prompt_tokens_details	object	Opcional	Detalhamento do uso de tokens de entrada.
usage.prompt_tokens_details.cached_tokens	integer	Opcional	Tokens servidos a partir de cache.

Introdução ao modelo

DeepSeek deepseek-v4-flash

DeepSeek V4 Flash dá aos times uma rota DeepSeek V4 de menor custo para aplicações em que responsividade, preços previsíveis e integração simples via API importam. Use a API DeepSeek V4 Flash quando quiser testar workflows DeepSeek pela API unificada da OurToken, mantendo model IDs, logs de uso, custos de cache e revisão de preços em um só dashboard.

Por que ele se destaca

80% do preço oficial de referência do DeepSeek V4 Flash para tokens de entrada e saída.
Setup de API compatível com OpenAI pelo mesmo endpoint da OurToken usado por outros modelos suportados.
Preços claros de cache read e cache write para prompts com contexto repetido e workloads de conversas longas.
Útil para avaliar workflows sensíveis a custo em chat, coding, sumarização e assistentes sem integração separada específica do provedor.
Logs no Dashboard e visibilidade de uso ajudam times a revisar o custo de requests após o lançamento.

Principais recursos

Model ID: deepseek-v4-flash
Preço de entrada: $0.1120 por 1M tokens na OurToken
Preço de saída: $0.2240 por 1M tokens na OurToken
Preço de cache read: $0.0020 por 1M tokens na OurToken
Preço de cache write: $0 por 1M tokens na OurToken
Provedor: DeepSeek

Especificações

ProvedorDeepSeek

Tipo de modeloLarge Language Model (LLM)

Model IDdeepseek-v4-flash

Comprimento de contexto1M tokens

Saída máxima384K tokens

Preço de entrada OurToken$0.1120 / 1M tokens

Preço de saída OurToken$0.2240 / 1M tokens

Preço de cache read OurToken$0.0020 / 1M tokens

Preço de cache write OurToken$0 / 1M tokens

Referência oficial de entrada$0.14 / 1M tokens

Referência oficial de saída$0.28 / 1M tokens

Referência oficial de cache read$0.0028 / 1M tokens

Recursos da API DeepSeek V4 Flash

Use a API DeepSeek V4 Flash para acesso unificado à API DeepSeek V4, preços transparentes da API DeepSeek V4 Flash, visibilidade de cache e avaliação de produção.

Acesso unificado

Chame a API DeepSeek V4 Flash pelo endpoint unificado da OurToken, mantendo acesso a modelos, gestão de chaves de API e histórico de uso em um só lugar. Use deepseek-v4-flash como model ID e reaproveite padrões de request compatíveis com OpenAI para chat, coding e workflows de agentes.

Clareza de preços

Revise os preços do DeepSeek V4 Flash antes do rollout. A OurToken lista $0.1120 entrada e $0.2240 saída por 1M tokens, para que times estimem o preço do DeepSeek V4 Flash para chat, coding e tráfego de assistentes em alto volume antes de escalar o uso em produção.

Custos de cache

Separe comportamento de cache do gasto normal de prompt com preços explícitos. O cache read da API DeepSeek V4 Flash está listado a $0.0020 por 1M tokens na OurToken, enquanto cache write é $0 para workloads de contexto repetido e reuso de prompts longos.

Workloads Flash

Use a rota Flash quando responsividade e controle de custo forem importantes para chat em produção, sumarização, notas de coding e tarefas leves de agentes. Materiais concorrentes posicionam o modelo para inferência rápida e alto throughput, algo que times devem validar com seus próprios prompts.

Contexto longo

Avalie workloads da API DeepSeek V4 que precisam de contexto longo, como review de documentos, notas de repositório, logs de suporte e conversas multi-turno. Teste latência, qualidade de saída e comportamento de cache antes de tornar Flash a rota padrão para prompts grandes.

Review de benchmarks

Use claims de benchmark do DeepSeek V4 Flash como ponto de partida, não como garantia de produção. Compare coding, raciocínio, latência, uso de ferramentas e consumo de tokens com seus próprios critérios de aceite antes de escalar tráfego para workflows voltados ao cliente.

Como usar a API DeepSeek V4 Flash na OurToken

Crie uma chave de API, copie deepseek-v4-flash, compare preços do DeepSeek V4, chame o endpoint unificado e monitore o uso real.

Criar chave de API

Crie uma chave de API da OurToken pelo dashboard e armazene-a em uma variável de ambiente segura no servidor. Isso dá ao backend acesso à API DeepSeek V4 Flash mantendo credenciais fora do código do cliente e de repositórios públicos.

Copiar Model ID

Use deepseek-v4-flash como valor do modelo no corpo da request. Manter o model ID exato na configuração ajuda desenvolvedores a evitar erros de nome ao comparar rotas da API DeepSeek V4 entre testes locais, tráfego de staging e deployments de produção.

Chamar endpoint

Envie requests ao endpoint de API unificada da OurToken com sua chave de API, model ID e payload do prompt. Padrões existentes de chat compatíveis com OpenAI geralmente podem ser reaproveitados após trocar base URL, credencial e valor do modelo.

Comparar preços

Compare os preços do DeepSeek V4 antes do rollout: a OurToken lista $0.1120 entrada, $0.2240 saída e $0.0020 cache read por 1M tokens. Use esses valores para estimar o preço do DeepSeek V4 Flash para volumes esperados de prompt, saída e cache.

Testar benchmarks

Trate todo claim de benchmark do DeepSeek V4 Flash como um prompt para sua própria avaliação. Rode tarefas representativas de coding, raciocínio, sumarização e agentes, depois compare qualidade de resposta, latência, comportamento de ferramentas, uso de tokens e tratamento de erros.

Monitorar custo

Após o lançamento, revise logs de histórico para contagem de requests, tokens de entrada, tokens de saída, tokens de cache read e gastos. Dados reais de uso ajudam times a comparar preços do DeepSeek V4 Flash com tráfego efetivo, em vez de depender apenas de suposições de catálogo de provedores.

FAQ da API DeepSeek V4 Flash

Respostas sobre preços da API DeepSeek V4 Flash, acesso à API DeepSeek V4, custos de cache, configuração de model ID, benchmarks e avaliação Flash versus Pro.

O que é a API DeepSeek V4 Flash?

A API DeepSeek V4 Flash é a rota Flash do modelo DeepSeek V4 disponível pela OurToken para times que querem uma opção de menor custo para chat, notas de coding, sumarização e workflows de assistente. Desenvolvedores podem usar o model ID deepseek-v4-flash, criar uma chave de API da OurToken e chamá-la pelo mesmo fluxo de API unificada usado por outros modelos suportados.

Quais são os preços da API DeepSeek V4 Flash na OurToken?

Os preços da API DeepSeek V4 Flash na OurToken são $0.1120 por 1M tokens de entrada e $0.2240 por 1M tokens de saída. As referências oficiais fornecidas para DeepSeek V4 Flash são $0.14 entrada e $0.28 saída por 1M tokens, então os preços de entrada e saída são 80% do preço oficial.

Qual é o preço do DeepSeek V4 Flash para cache read e cache write?

O preço do DeepSeek V4 Flash para cache read é $0.0020 por 1M tokens de cache read na OurToken, em comparação com a referência oficial de $0.0028. Cache write está listado como $0 por 1M tokens. Como cache read tem sua própria proporção, não assuma que toda categoria de token usa o mesmo desconto de entrada e saída.

Como os preços do DeepSeek V4 comparam Flash e Pro?

Os preços do DeepSeek V4 são menores na rota Flash no catálogo atual da OurToken: Flash lista $0.1120 entrada e $0.2240 saída por 1M tokens, enquanto Pro lista $0.3480 entrada e $0.6960 saída. Escolha Flash para workloads sensíveis a custo ou alto volume e teste Pro quando requisitos de qualidade justificarem uma rota mais forte.

Qual model ID devo usar para acesso à API DeepSeek V4?

Use deepseek-v4-flash como model ID para esta rota da API DeepSeek V4 na OurToken. A página de chaves de API e a galeria de modelos devem mostrar o valor chamável, para que desenvolvedores copiem o ID exato e evitem erros causados por nomes de exibição, prefixos de provedor ou diferenças de maiúsculas/minúsculas.

Como devo avaliar benchmarks e claims de capacidade do DeepSeek V4 Flash?

Trate todo claim de benchmark do DeepSeek V4 Flash como ponto de partida para testes, não como garantia de produção. Materiais concorrentes mencionam saída JSON, tool calls, coding, raciocínio e tarefas de contexto longo, mas times devem verificar qualidade de resposta, latência, comportamento de cache e custo total de tokens contra seus próprios requisitos.