deepseek/deepseek-v4-flash

$0.1120 / M входные токены · $0.2240 / M выходные токены

DeepSeek V4 Flash — маршрут модели DeepSeek на OurToken для разработчиков, которым нужен экономичный вариант для chat, программирования, summarization, промптов с длинным контекстом и высокообъемных assistant workloads.

Получить API-ключ

Монитор статуса 24H

99.3% аптайм

8 часов назадсейчас

Работает

2026-07-24 10:36:04 UTC

Цены

Оплата по мере использования

Без предварительных платежей — платите только за то, что используете

80% of official price

Ввод$0.14 / M$0.1120 / M Токены

Вывод$0.28 / M$0.2240 / M Токены

Кэшированный ввод$0.0028 / M$0.0020 / M Токены

Запись в кэш$0 / M$0 / M Токены

Использование API

Руководство по доступу к API

Базовый URLhttps://api.ourtoken.ai/v1

Конечная точка APIchat/completions

Полный URLhttps://api.ourtoken.ai/v1/chat/completions

ID моделиdeepseek-v4-flash

Получить API-ключ

Примеры кода

Используйте API endpoint OurToken для этой модели. Примеры ниже используют прямые HTTP-запросы и рекомендуемый endpoint для семейства модели.

curl https://api.ourtoken.ai/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -d '{
    "model": "deepseek-v4-flash",
    "messages": [
      {
        "role": "user",
        "content": "Hello!"
      }
    ],
    "max_tokens": 256
  }'

Справочник Chat Completions API

Создайте ответ чата через endpoint, совместимый с OpenAI Chat Completions. Используйте https://api.ourtoken.ai/v1 как SDK Base URL и POST /chat/completions как endpoint.

Авторизация

Content-Type	application/json
Authorization	Bearer YOUR_API_KEY

Тело запроса

Поле	Тип	Обязательно	Описание
model	string	Обязательно	Model ID для вызова.
messages	array<object>	Обязательно	Сообщения диалога, отправленные модели.
max_tokens	integer	Необязательно	Максимальное число выходных токенов.
temperature	number	Необязательно	Температура семплирования.
top_p	number	Необязательно	Параметр nucleus sampling.
stream	boolean	Необязательно	Возвращать ли потоковый ответ.
stream_options	object	Необязательно	Дополнительные параметры для потоковых ответов.
tools	array<object>	Необязательно	Tools, доступные модели.
tool_choice	string \| object	Необязательно	Управляет тем, как модель выбирает tools.
response_format	object	Необязательно	Управляет структурированным выводом, например ответами в виде JSON object.

Тело ответа

Поле	Тип	Обязательно	Описание
id	string	Обязательно	Уникальный идентификатор chat completion.
object	"chat.completion"	Обязательно	Тип объекта, возвращаемого Chat Completions API.
created	integer	Обязательно	Unix timestamp создания ответа.
model	string	Обязательно	Модель, создавшая ответ.
choices	array<object>	Обязательно	Варианты ответов, возвращаемые моделью.
choices[].message.role	string	Обязательно	Роль возвращенного chat message.
choices[].message.content	string	Необязательно	Текстовое содержимое возвращенного chat message.
choices[].finish_reason	string	Необязательно	Причина остановки генерации.
usage	object	Необязательно	Информация об использовании токенов для chat completion.
usage.prompt_tokens	integer	Необязательно	Количество входных токенов.
usage.completion_tokens	integer	Необязательно	Количество выходных токенов.
usage.total_tokens	integer	Необязательно	Общее количество токенов.
usage.prompt_tokens_details	object	Необязательно	Детализация использования входных токенов.
usage.prompt_tokens_details.cached_tokens	integer	Необязательно	Токены, обслуженные из кеша.

Введение в модель

DeepSeek deepseek-v4-flash

DeepSeek V4 Flash дает командам более дешевый маршрут DeepSeek V4 для прикладной работы, где важны отзывчивость, предсказуемые цены и простая API-интеграция. Используйте DeepSeek V4 Flash API, когда хотите тестировать рабочие процессы DeepSeek через единый API OurToken, сохраняя model IDs, логи использования, стоимость cache и проверку цен в одной панели управления.

Почему это выглядит отлично

80% от официальной справочной цены DeepSeek V4 Flash для входных и выходных токенов.
OpenAI-совместимая настройка API через тот же endpoint OurToken, который используется другими поддерживаемыми моделями.
Понятные цены cache read и cache write для промптов с повторяющимся контекстом и long conversation workloads.
Полезно для оценки cost-sensitive chat, программирования, summarization и assistant workflows без отдельной provider-specific integration.
Логи панели управления и видимость использования помогают командам проверять стоимость запросов после запуска.

Ключевые возможности

Model ID: deepseek-v4-flash
Цена ввода: $0.1120 за 1M токенов на OurToken
Цена вывода: $0.2240 за 1M токенов на OurToken
Цена cache read: $0.0020 за 1M токенов на OurToken
Цена cache write: $0 за 1M токенов на OurToken
Поставщик: DeepSeek

Спецификации

ПоставщикDeepSeek

Тип моделиБольшая языковая модель (LLM)

Model IDdeepseek-v4-flash

Длина контекста1M токенов

Максимальный вывод384K токенов

Цена ввода OurToken$0.1120 / 1M токенов

Цена вывода OurToken$0.2240 / 1M токенов

Цена cache read OurToken$0.0020 / 1M токенов

Цена cache write OurToken$0 / 1M токенов

Официальный ориентир ввода$0.14 / 1M токенов

Официальный ориентир вывода$0.28 / 1M токенов

Официальный ориентир cache read$0.0028 / 1M токенов

Возможности DeepSeek V4 Flash API

Используйте DeepSeek V4 Flash API для единого доступа DeepSeek V4 API, прозрачных цен DeepSeek V4 Flash API, видимости cache и production-оценки.

Единый доступ

Вызывайте DeepSeek V4 Flash API через единый endpoint OurToken, сохраняя доступ к модели, управление API key и историю использования в одном месте. Используйте deepseek-v4-flash как model ID и переиспользуйте OpenAI-совместимые паттерны запросов для chat, программирования и agent workflows.

Понятное ценообразование

Изучайте цены DeepSeek V4 Flash перед запуском. OurToken указывает $0.1120 за ввод и $0.2240 за вывод на 1M токенов, чтобы команды могли оценить цену DeepSeek V4 Flash для chat, программирования и высокообъемного assistant traffic до масштабирования production-использования.

Стоимость cache

Отделяйте поведение cache от обычных расходов на промпты с явными ценами cache. Cache read DeepSeek V4 Flash API указана на OurToken как $0.0020 за 1M токенов, а cache write — $0 для repeated-context workloads и повторного использования длинных промптов.

Flash-нагрузки

Используйте маршрут Flash, когда отзывчивость и контроль стоимости важны для production chat, summarization, заметок по программированию и легких agent tasks. Материалы конкурентов позиционируют модель для fast inference и high-throughput workloads, что команды должны проверить на собственных промптах.

Длинный контекст

Оценивайте нагрузки DeepSeek V4 API, которым нужен длинный контекст, например review документов, repository notes, support logs и multi-turn conversations. Тестируйте задержку, качество вывода и поведение cache, прежде чем делать Flash маршрутом по умолчанию для больших промптов.

Обзор бенчмарков

Используйте заявления DeepSeek V4 Flash benchmark как отправную точку, а не production-гарантию. Сравнивайте программирование, рассуждение, задержку, tool use и потребление токенов с собственными acceptance criteria до масштабирования трафика в customer-facing workflows.

Как использовать DeepSeek V4 Flash API на OurToken

Создайте API key, скопируйте deepseek-v4-flash, сравните цены DeepSeek V4, вызовите единый endpoint и отслеживайте реальное использование.

Создайте API Key

Создайте OurToken API key в панели управления и сохраните его в безопасной серверной переменной окружения. Это дает вашему backend доступ к DeepSeek V4 Flash API, сохраняя учетные данные вне клиентского кода и публичных репозиториев.

Скопируйте Model ID

Используйте deepseek-v4-flash как значение model в теле запроса. Хранение точного model ID в конфигурации помогает разработчикам избегать ошибок именования при сравнении маршрутов DeepSeek V4 API в локальных тестах, staging-трафике и production-развертываниях.

Вызовите endpoint

Отправляйте запросы на единый API endpoint OurToken с вашим API key, model ID и prompt payload. Существующие OpenAI-совместимые chat request patterns обычно можно переиспользовать после изменения base URL, credential и model value.

Сравните цены

Сравните цены DeepSeek V4 перед запуском: OurToken указывает $0.1120 за ввод, $0.2240 за вывод и $0.0020 за cache read на 1M токенов. Используйте эти значения, чтобы оценить цену DeepSeek V4 Flash для ожидаемых объемов prompt, output и cache.

Тестируйте бенчмарки

Считайте каждое заявление DeepSeek V4 Flash benchmark промптом для собственной оценки. Запускайте репрезентативные задачи программирования, рассуждения, summarization и agent tasks, затем сравнивайте качество ответов, задержку, поведение инструментов, использование токенов и обработку ошибок.

Отслеживайте стоимость

После запуска просматривайте логи истории по количеству запросов, входным токенам, выходным токенам, cache read tokens и расходам. Реальные данные использования помогают командам сравнивать цены DeepSeek V4 Flash с фактическим трафиком, а не только с provider listing assumptions.

FAQ по DeepSeek V4 Flash API

Ответы о ценах DeepSeek V4 Flash API, доступе DeepSeek V4 API, стоимости cache, настройке model ID, бенчмарках и оценке Flash versus Pro.

Что такое DeepSeek V4 Flash API?

DeepSeek V4 Flash API — это маршрут модели Flash DeepSeek V4, доступный через OurToken для команд, которым нужен более дешевый вариант для chat, заметок по программированию, summarization и assistant workflows. Разработчики могут использовать model ID deepseek-v4-flash, создать OurToken API key и вызывать его через тот же единый API flow, что и другие поддерживаемые модели.

Какие цены DeepSeek V4 Flash API на OurToken?

Цена DeepSeek V4 Flash API на OurToken составляет $0.1120 за 1M входных токенов и $0.2240 за 1M выходных токенов. Официальные ориентиры для DeepSeek V4 Flash — $0.14 за ввод и $0.28 за вывод на 1M токенов, поэтому цены ввода и вывода составляют 80% от официальной цены.

Какова цена DeepSeek V4 Flash для cache read и cache write?

Цена DeepSeek V4 Flash для cache read на OurToken составляет $0.0020 за 1M cache read tokens, по сравнению с официальным ориентиром $0.0028. Cache write указана как $0 за 1M токенов. Поскольку cache read имеет собственное соотношение, не предполагайте, что каждая категория токенов использует ту же скидку, что ввод и вывод.

Как сравниваются цены DeepSeek V4 между Flash и Pro?

В текущем каталоге OurToken цены DeepSeek V4 ниже на маршруте Flash: Flash указывает $0.1120 за ввод и $0.2240 за вывод на 1M токенов, тогда как Pro указывает $0.3480 за ввод и $0.6960 за вывод. Выбирайте Flash для cost-sensitive или high-volume workloads, затем тестируйте Pro, когда требования к качеству оправдывают более сильный маршрут.

Какой model ID использовать для доступа DeepSeek V4 API?

Используйте deepseek-v4-flash как model ID для этого маршрута DeepSeek V4 API на OurToken. Страница API Keys и галерея моделей должны показывать вызываемое значение модели, чтобы разработчики могли скопировать точный ID и избежать ошибок из-за display names, provider prefixes или различий регистра.

Как оценивать заявления DeepSeek V4 Flash benchmark и capabilities?

Считайте каждое заявление DeepSeek V4 Flash benchmark отправной точкой для тестирования, а не production-гарантией. Материалы конкурентов упоминают JSON output, tool calls, программирование, рассуждение и long-context tasks, но командам следует проверять качество ответов, задержку, поведение cache и общую стоимость токенов на своих требованиях.