DeepSeek

deepseek/deepseek-v4-flash

- contexto · $0.1120 / M tokens de entrada · $0.2240 / M tokens de saída

DeepSeek V4 Flash é uma rota de modelo DeepSeek na OurToken para desenvolvedores que precisam de uma opção econômica para chat, coding, sumarização, prompts de contexto longo e workloads de assistente em alto volume.

Preços

Pay-per-use

Sem custo inicial; pague apenas pelo que usar

80% of official price
Entrada$0.14 / M$0.1120 / M Tokens
Saída$0.28 / M$0.2240 / M Tokens

Uso da API

Guia de acesso à API

Base URLhttps://api.ourtoken.ai/v1
Endpoint da APIchat/completions
URL completahttps://api.ourtoken.ai/v1/chat/completions
Model IDdeepseek-v4-flash
Obter chave de API

Exemplos de código

Use o endpoint da API OurToken para este modelo. Os exemplos abaixo usam requisições HTTP diretas e o endpoint recomendado para a família do modelo.

curl https://api.ourtoken.ai/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -d '{
    "model": "deepseek-v4-flash",
    "messages": [
      {
        "role": "user",
        "content": "Hello!"
      }
    ],
    "max_tokens": 256
  }'

Referência da API Chat Completions

Crie uma resposta de chat com o endpoint compatível com OpenAI Chat Completions. Use https://api.ourtoken.ai/v1 como SDK Base URL e POST /chat/completions como endpoint.

Autorização

Content-Typeapplication/json
AuthorizationBearer YOUR_API_KEY

Corpo da requisição

CampoTipoObrigatórioDescrição
modelstringObrigatórioModel ID a chamar.
messagesarray<object>ObrigatórioMensagens da conversa enviadas ao modelo.
max_tokensintegerOpcionalNúmero máximo de tokens de saída.
temperaturenumberOpcionalTemperatura de amostragem.
top_pnumberOpcionalParâmetro de nucleus sampling.
streambooleanOpcionalDefine se a resposta será retornada em streaming.
stream_optionsobjectOpcionalOpções adicionais para respostas em streaming.
toolsarray<object>OpcionalTools disponíveis para o modelo.
tool_choicestring | objectOpcionalControla como o modelo seleciona tools.
response_formatobjectOpcionalControla saída estruturada, como respostas em objeto JSON.

Corpo da resposta

CampoTipoObrigatórioDescrição
idstringObrigatórioIdentificador único da chat completion.
object"chat.completion"ObrigatórioTipo de objeto retornado pela API Chat Completions.
createdintegerObrigatórioTimestamp Unix de criação da resposta.
modelstringObrigatórioModelo que gerou a resposta.
choicesarray<object>ObrigatórioRespostas candidatas retornadas pelo modelo.
choices[].message.rolestringObrigatórioRole da mensagem de chat retornada.
choices[].message.contentstringOpcionalConteúdo de texto na mensagem de chat retornada.
choices[].finish_reasonstringOpcionalMotivo pelo qual a geração parou.
usageobjectOpcionalInformações de uso de tokens da chat completion.
usage.prompt_tokensintegerOpcionalContagem de tokens de entrada.
usage.completion_tokensintegerOpcionalContagem de tokens de saída.
usage.total_tokensintegerOpcionalContagem total de tokens.
usage.prompt_tokens_detailsobjectOpcionalDetalhamento do uso de tokens de entrada.
usage.prompt_tokens_details.cached_tokensintegerOpcionalTokens servidos a partir de cache.

Introdução ao modelo

DeepSeek deepseek-v4-flash

DeepSeek V4 Flash é uma rota de modelo DeepSeek na OurToken para desenvolvedores que precisam de uma opção econômica para chat, coding, sumarização, prompts de contexto longo e workloads de assistente em alto volume.

DeepSeek V4 Flash dá aos times uma rota DeepSeek V4 de menor custo para aplicações em que responsividade, preços previsíveis e integração simples via API importam. Use a API DeepSeek V4 Flash quando quiser testar workflows DeepSeek pela API unificada da OurToken, mantendo model IDs, logs de uso, custos de cache e revisão de preços em um só dashboard.

Por que ele se destaca

  • 80% do preço oficial de referência do DeepSeek V4 Flash para tokens de entrada e saída.
  • Setup de API compatível com OpenAI pelo mesmo endpoint da OurToken usado por outros modelos suportados.
  • Preços claros de cache read e cache write para prompts com contexto repetido e workloads de conversas longas.
  • Útil para avaliar workflows sensíveis a custo em chat, coding, sumarização e assistentes sem integração separada específica do provedor.
  • Logs no Dashboard e visibilidade de uso ajudam times a revisar o custo de requests após o lançamento.

Principais recursos

  • Model ID: deepseek-v4-flash
  • Preço de entrada: $0.1120 por 1M tokens na OurToken
  • Preço de saída: $0.2240 por 1M tokens na OurToken
  • Preço de cache read: $0.0020 por 1M tokens na OurToken
  • Preço de cache write: $0 por 1M tokens na OurToken
  • Provedor: DeepSeek

Especificações

ProvedorDeepSeek
Tipo de modeloLarge Language Model (LLM)
Model IDdeepseek-v4-flash
Comprimento de contexto1M tokens
Saída máxima384K tokens
Preço de entrada OurToken$0.1120 / 1M tokens
Preço de saída OurToken$0.2240 / 1M tokens
Preço de cache read OurToken$0.0020 / 1M tokens
Preço de cache write OurToken$0 / 1M tokens
Referência oficial de entrada$0.14 / 1M tokens
Referência oficial de saída$0.28 / 1M tokens
Referência oficial de cache read$0.0028 / 1M tokens

Recursos da API DeepSeek V4 Flash

Use a API DeepSeek V4 Flash para acesso unificado à API DeepSeek V4, preços transparentes da API DeepSeek V4 Flash, visibilidade de cache e avaliação de produção.

Acesso unificado

Chame a API DeepSeek V4 Flash pelo endpoint unificado da OurToken, mantendo acesso a modelos, gestão de chaves de API e histórico de uso em um só lugar. Use deepseek-v4-flash como model ID e reaproveite padrões de request compatíveis com OpenAI para chat, coding e workflows de agentes.

Clareza de preços

Revise os preços do DeepSeek V4 Flash antes do rollout. A OurToken lista $0.1120 entrada e $0.2240 saída por 1M tokens, para que times estimem o preço do DeepSeek V4 Flash para chat, coding e tráfego de assistentes em alto volume antes de escalar o uso em produção.

Custos de cache

Separe comportamento de cache do gasto normal de prompt com preços explícitos. O cache read da API DeepSeek V4 Flash está listado a $0.0020 por 1M tokens na OurToken, enquanto cache write é $0 para workloads de contexto repetido e reuso de prompts longos.

Workloads Flash

Use a rota Flash quando responsividade e controle de custo forem importantes para chat em produção, sumarização, notas de coding e tarefas leves de agentes. Materiais concorrentes posicionam o modelo para inferência rápida e alto throughput, algo que times devem validar com seus próprios prompts.

Contexto longo

Avalie workloads da API DeepSeek V4 que precisam de contexto longo, como review de documentos, notas de repositório, logs de suporte e conversas multi-turno. Teste latência, qualidade de saída e comportamento de cache antes de tornar Flash a rota padrão para prompts grandes.

Review de benchmarks

Use claims de benchmark do DeepSeek V4 Flash como ponto de partida, não como garantia de produção. Compare coding, raciocínio, latência, uso de ferramentas e consumo de tokens com seus próprios critérios de aceite antes de escalar tráfego para workflows voltados ao cliente.

Como usar a API DeepSeek V4 Flash na OurToken

Crie uma chave de API, copie deepseek-v4-flash, compare preços do DeepSeek V4, chame o endpoint unificado e monitore o uso real.

Criar chave de API

Crie uma chave de API da OurToken pelo dashboard e armazene-a em uma variável de ambiente segura no servidor. Isso dá ao backend acesso à API DeepSeek V4 Flash mantendo credenciais fora do código do cliente e de repositórios públicos.

01

Copiar Model ID

Use deepseek-v4-flash como valor do modelo no corpo da request. Manter o model ID exato na configuração ajuda desenvolvedores a evitar erros de nome ao comparar rotas da API DeepSeek V4 entre testes locais, tráfego de staging e deployments de produção.

02

Chamar endpoint

Envie requests ao endpoint de API unificada da OurToken com sua chave de API, model ID e payload do prompt. Padrões existentes de chat compatíveis com OpenAI geralmente podem ser reaproveitados após trocar base URL, credencial e valor do modelo.

03

Comparar preços

Compare os preços do DeepSeek V4 antes do rollout: a OurToken lista $0.1120 entrada, $0.2240 saída e $0.0020 cache read por 1M tokens. Use esses valores para estimar o preço do DeepSeek V4 Flash para volumes esperados de prompt, saída e cache.

04

Testar benchmarks

Trate todo claim de benchmark do DeepSeek V4 Flash como um prompt para sua própria avaliação. Rode tarefas representativas de coding, raciocínio, sumarização e agentes, depois compare qualidade de resposta, latência, comportamento de ferramentas, uso de tokens e tratamento de erros.

05

Monitorar custo

Após o lançamento, revise logs de histórico para contagem de requests, tokens de entrada, tokens de saída, tokens de cache read e gastos. Dados reais de uso ajudam times a comparar preços do DeepSeek V4 Flash com tráfego efetivo, em vez de depender apenas de suposições de catálogo de provedores.

06

FAQ da API DeepSeek V4 Flash

Respostas sobre preços da API DeepSeek V4 Flash, acesso à API DeepSeek V4, custos de cache, configuração de model ID, benchmarks e avaliação Flash versus Pro.

01

O que é a API DeepSeek V4 Flash?

A API DeepSeek V4 Flash é a rota Flash do modelo DeepSeek V4 disponível pela OurToken para times que querem uma opção de menor custo para chat, notas de coding, sumarização e workflows de assistente. Desenvolvedores podem usar o model ID deepseek-v4-flash, criar uma chave de API da OurToken e chamá-la pelo mesmo fluxo de API unificada usado por outros modelos suportados.
02

Quais são os preços da API DeepSeek V4 Flash na OurToken?

Os preços da API DeepSeek V4 Flash na OurToken são $0.1120 por 1M tokens de entrada e $0.2240 por 1M tokens de saída. As referências oficiais fornecidas para DeepSeek V4 Flash são $0.14 entrada e $0.28 saída por 1M tokens, então os preços de entrada e saída são 80% do preço oficial.
03

Qual é o preço do DeepSeek V4 Flash para cache read e cache write?

O preço do DeepSeek V4 Flash para cache read é $0.0020 por 1M tokens de cache read na OurToken, em comparação com a referência oficial de $0.0028. Cache write está listado como $0 por 1M tokens. Como cache read tem sua própria proporção, não assuma que toda categoria de token usa o mesmo desconto de entrada e saída.
04

Como os preços do DeepSeek V4 comparam Flash e Pro?

Os preços do DeepSeek V4 são menores na rota Flash no catálogo atual da OurToken: Flash lista $0.1120 entrada e $0.2240 saída por 1M tokens, enquanto Pro lista $0.3480 entrada e $0.6960 saída. Escolha Flash para workloads sensíveis a custo ou alto volume e teste Pro quando requisitos de qualidade justificarem uma rota mais forte.
05

Qual model ID devo usar para acesso à API DeepSeek V4?

Use deepseek-v4-flash como model ID para esta rota da API DeepSeek V4 na OurToken. A página de chaves de API e a galeria de modelos devem mostrar o valor chamável, para que desenvolvedores copiem o ID exato e evitem erros causados por nomes de exibição, prefixos de provedor ou diferenças de maiúsculas/minúsculas.
06

Como devo avaliar benchmarks e claims de capacidade do DeepSeek V4 Flash?

Trate todo claim de benchmark do DeepSeek V4 Flash como ponto de partida para testes, não como garantia de produção. Materiais concorrentes mencionam saída JSON, tool calls, coding, raciocínio e tarefas de contexto longo, mas times devem verificar qualidade de resposta, latência, comportamento de cache e custo total de tokens contra seus próprios requisitos.