deepseek/deepseek-v4-flash

$0.1120 / M 입력 토큰 · $0.2240 / M 출력 토큰

DeepSeek V4 Flash는 채팅, 코딩, 요약, 긴 컨텍스트 프롬프트, 대량 어시스턴트 워크로드를 위한 비용 효율적인 옵션이 필요한 개발자를 위해 OurToken에서 제공되는 DeepSeek 모델 라우트입니다.

API 키 받기

24H 상태 모니터

99.3% 가동률

8시간 전현재

정상

2026-07-24 10:46:05 UTC

가격

사용량 기반 결제

선불 비용 없이 사용한 만큼만 결제

80% of official price

입력$0.14 / M$0.1120 / M 토큰

출력$0.28 / M$0.2240 / M 토큰

캐시된 입력$0.0028 / M$0.0020 / M 토큰

캐시 쓰기$0 / M$0 / M 토큰

API 사용법

API 액세스 가이드

기본 URLhttps://api.ourtoken.ai/v1

API 엔드포인트chat/completions

전체 URLhttps://api.ourtoken.ai/v1/chat/completions

모델 IDdeepseek-v4-flash

API 키 받기

코드 예시

이 모델에는 OurToken API 엔드포인트를 사용하세요. 아래 예시는 직접 HTTP 요청과 모델 패밀리에 권장되는 엔드포인트를 사용합니다.

curl https://api.ourtoken.ai/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -d '{
    "model": "deepseek-v4-flash",
    "messages": [
      {
        "role": "user",
        "content": "Hello!"
      }
    ],
    "max_tokens": 256
  }'

Chat Completions API 참조

OpenAI Chat Completions 호환 엔드포인트로 채팅 응답을 생성합니다. SDK Base URL로 https://api.ourtoken.ai/v1을 사용하고 엔드포인트로 POST /chat/completions를 사용하세요.

인증

Content-Type	application/json
Authorization	Bearer YOUR_API_KEY

요청 본문

필드	타입	필수	설명
model	string	필수	호출할 모델 ID입니다.
messages	array<object>	필수	모델에 전송된 대화 메시지입니다.
max_tokens	integer	선택 사항	최대 출력 토큰 수입니다.
temperature	number	선택 사항	샘플링 온도입니다.
top_p	number	선택 사항	Nucleus 샘플링 매개변수입니다.
stream	boolean	선택 사항	스트리밍 응답을 반환할지 여부입니다.
stream_options	object	선택 사항	스트리밍 응답을 위한 추가 옵션입니다.
tools	array<object>	선택 사항	모델에서 사용할 수 있는 도구입니다.
tool_choice	string \| object	선택 사항	모델이 도구를 선택하는 방식을 제어합니다.
response_format	object	선택 사항	JSON 객체 응답 같은 구조화된 출력을 제어합니다.

응답 본문

필드	타입	필수	설명
id	string	필수	고유한 채팅 완료 식별자입니다.
object	"chat.completion"	필수	Chat Completions API가 반환하는 객체 타입입니다.
created	integer	필수	응답이 생성된 Unix 타임스탬프입니다.
model	string	필수	응답을 생성한 모델입니다.
choices	array<object>	필수	모델이 반환한 후보 응답입니다.
choices[].message.role	string	필수	반환된 채팅 메시지의 역할입니다.
choices[].message.content	string	선택 사항	반환된 채팅 메시지의 텍스트 콘텐츠입니다.
choices[].finish_reason	string	선택 사항	생성이 중지된 이유입니다.
usage	object	선택 사항	채팅 완료의 토큰 사용량 정보입니다.
usage.prompt_tokens	integer	선택 사항	입력 토큰 수입니다.
usage.completion_tokens	integer	선택 사항	출력 토큰 수입니다.
usage.total_tokens	integer	선택 사항	총 토큰 수입니다.
usage.prompt_tokens_details	object	선택 사항	입력 토큰 사용량 분석입니다.
usage.prompt_tokens_details.cached_tokens	integer	선택 사항	캐시에서 제공된 토큰입니다.

모델 소개

DeepSeek deepseek-v4-flash

DeepSeek V4 Flash는 응답성, 예측 가능한 가격, 간단한 API 통합이 중요한 애플리케이션 작업을 위해 팀에 더 낮은 비용의 DeepSeek V4 라우트를 제공합니다. 하나의 대시보드에서 model IDs, 사용량 로그, 캐시 비용, 가격 검토를 유지하면서 OurToken 통합 API를 통해 DeepSeek 워크플로를 테스트하고 싶을 때 DeepSeek V4 Flash API를 사용하세요.

돋보이는 이유

입력 및 출력 토큰에 대해 공식 DeepSeek V4 Flash 기준 가격의 80%.
지원되는 다른 모델에 사용되는 동일한 OurToken 엔드포인트를 통한 OpenAI 호환 API 설정.
반복 컨텍스트 프롬프트와 긴 대화 워크로드를 위한 명확한 cache read 및 cache write 가격.
별도의 제공업체 전용 통합 없이 비용 민감형 채팅, 코딩, 요약, 어시스턴트 워크플로를 평가하는 데 유용함.
대시보드 로그와 사용량 가시성은 출시 후 팀이 요청 비용을 검토하는 데 도움이 됩니다.

주요 기능

Model ID: deepseek-v4-flash
Input price: $0.1120 per 1M tokens on OurToken
Output price: $0.2240 per 1M tokens on OurToken
Cache read price: $0.0020 per 1M tokens on OurToken
Cache write price: $0 per 1M tokens on OurToken
Provider: DeepSeek

사양

ProviderDeepSeek

Model TypeLarge Language Model (LLM)

Model IDdeepseek-v4-flash

Context Length1M tokens

Max Output384K tokens

OurToken Input Price$0.1120 / 1M tokens

OurToken Output Price$0.2240 / 1M tokens

OurToken Cache Read Price$0.0020 / 1M tokens

OurToken Cache Write Price$0 / 1M tokens

Official Input Reference$0.14 / 1M tokens

Official Output Reference$0.28 / 1M tokens

Official Cache Read Reference$0.0028 / 1M tokens

DeepSeek V4 Flash API 기능

통합 DeepSeek V4 API 액세스, 투명한 DeepSeek V4 Flash API 가격, 캐시 가시성, 프로덕션 평가를 위해 DeepSeek V4 Flash API를 사용하세요.

통합 액세스

모델 액세스, API 키 관리, 사용량 기록을 한곳에 유지하면서 OurToken의 통합 엔드포인트를 통해 DeepSeek V4 Flash API를 호출하세요. deepseek-v4-flash를 model ID로 사용하고 채팅, 코딩, 에이전트 워크플로에 OpenAI 호환 요청 패턴을 재사용하세요.

명확한 가격

출시 전에 DeepSeek V4 Flash 가격을 검토하세요. OurToken은 1M tokens당 $0.1120 입력 및 $0.2240 출력을 표시하므로, 팀은 프로덕션 사용량을 확장하기 전에 채팅, 코딩, 대량 어시스턴트 트래픽에 대한 DeepSeek V4 Flash 가격을 추정할 수 있습니다.

캐시 비용

명시적인 캐시 가격으로 캐시 동작을 일반 프롬프트 지출과 분리하세요. DeepSeek V4 Flash API cache read는 OurToken에서 1M tokens당 $0.0020으로 표시되며, 반복 컨텍스트 워크로드와 긴 프롬프트 재사용을 위한 cache write는 $0입니다.

Flash 워크로드

프로덕션 채팅, 요약, 코딩 노트, 경량 에이전트 작업에서 응답성과 비용 제어가 중요할 때 Flash 라우트를 사용하세요. 경쟁사 자료는 빠른 추론과 높은 처리량 워크로드에 맞춰 모델을 설명하며, 팀은 자체 프롬프트로 이를 검증해야 합니다.

긴 컨텍스트

문서 리뷰, 저장소 노트, 지원 로그, 다중 턴 대화처럼 긴 컨텍스트가 필요한 DeepSeek V4 API 워크로드를 평가하세요. 큰 프롬프트의 기본 라우트로 Flash를 설정하기 전에 지연 시간, 출력 품질, 캐시 동작을 테스트하세요.

벤치마크 검토

DeepSeek V4 Flash benchmark 주장은 프로덕션 보장이 아니라 시작점으로 사용하세요. 고객 대상 워크플로로 트래픽을 확장하기 전에 코딩, 추론, 지연 시간, 도구 사용, 토큰 소비를 자체 수락 기준과 비교하세요.

OurToken에서 DeepSeek V4 Flash API를 사용하는 방법

API 키를 만들고, deepseek-v4-flash를 복사하고, DeepSeek V4 가격을 비교하고, 통합 엔드포인트를 호출하고, 실제 사용량을 모니터링하세요.

API 키 생성

대시보드에서 OurToken API 키를 만들고 안전한 서버 측 환경 변수에 저장하세요. 이렇게 하면 클라이언트 코드와 공개 저장소에 자격 증명을 노출하지 않으면서 백엔드가 DeepSeek V4 Flash API에 액세스할 수 있습니다.

Model ID 복사

요청 본문에서 모델 값으로 deepseek-v4-flash를 사용하세요. 구성에 정확한 model ID를 유지하면 개발자가 로컬 테스트, 스테이징 트래픽, 프로덕션 배포 전반에서 DeepSeek V4 API 라우트를 비교할 때 명명 실수를 피하는 데 도움이 됩니다.

엔드포인트 호출

API 키, model ID, 프롬프트 페이로드와 함께 OurToken 통합 API 엔드포인트로 요청을 보내세요. base URL, credential, model value를 변경한 뒤 기존 OpenAI 호환 chat 요청 패턴을 보통 재사용할 수 있습니다.

가격 비교

출시 전에 DeepSeek V4 가격을 비교하세요: OurToken은 1M tokens당 $0.1120 입력, $0.2240 출력, $0.0020 cache read를 표시합니다. 이 값을 사용해 예상 프롬프트, 출력, 캐시 볼륨에 대한 DeepSeek V4 Flash 가격을 추정하세요.

벤치마크 테스트

모든 DeepSeek V4 Flash benchmark 주장을 자체 평가를 위한 프롬프트로 취급하세요. 대표적인 코딩, 추론, 요약, 에이전트 작업을 실행한 뒤 응답 품질, 지연 시간, 도구 동작, 토큰 사용량, 오류 처리를 비교하세요.

비용 모니터링

출시 후 기록 로그에서 요청 수, 입력 토큰, 출력 토큰, cache read 토큰, 지출을 검토하세요. 실제 사용량 데이터는 제공업체 목록 가정에만 의존하지 않고 실제 트래픽 대비 DeepSeek V4 Flash 가격을 비교하는 데 도움이 됩니다.

DeepSeek V4 Flash API FAQ

DeepSeek V4 Flash API 가격, DeepSeek V4 API 액세스, 캐시 비용, model ID 설정, benchmark, Flash와 Pro 평가에 대한 답변입니다.

DeepSeek V4 Flash API란 무엇인가요?

DeepSeek V4 Flash API는 채팅, 코딩 노트, 요약, 어시스턴트 워크플로를 위한 더 낮은 비용 옵션을 원하는 팀을 위해 OurToken을 통해 사용할 수 있는 Flash DeepSeek V4 모델 라우트입니다. 개발자는 deepseek-v4-flash model ID를 사용하고, OurToken API 키를 만들고, 지원되는 다른 모델과 동일한 통합 API 흐름으로 호출할 수 있습니다.

OurToken에서 DeepSeek V4 Flash API 가격은 얼마인가요?

OurToken의 DeepSeek V4 Flash API 가격은 1M 입력 토큰당 $0.1120, 1M 출력 토큰당 $0.2240입니다. DeepSeek V4 Flash에 제공된 공식 기준은 1M tokens당 $0.14 입력 및 $0.28 출력이므로 입력 및 출력 가격은 공식 가격의 80%입니다.

DeepSeek V4 Flash의 cache read 및 cache write 가격은 얼마인가요?

OurToken에서 DeepSeek V4 Flash의 cache read 가격은 1M cache read 토큰당 $0.0020이며, 공식 $0.0028 기준과 비교됩니다. cache write는 1M tokens당 $0으로 표시됩니다. cache read는 자체 비율을 가지므로 모든 토큰 카테고리가 입력 및 출력과 동일한 할인을 사용한다고 가정하지 마세요.

Flash와 Pro 사이에서 DeepSeek V4 가격은 어떻게 비교되나요?

현재 OurToken 카탈로그에서 DeepSeek V4 가격은 Flash 라우트가 더 낮습니다: Flash는 1M tokens당 $0.1120 입력 및 $0.2240 출력을 표시하고, Pro는 $0.3480 입력 및 $0.6960 출력을 표시합니다. 비용 민감형 또는 대량 워크로드에는 Flash를 선택하고, 품질 요구가 더 강한 라우트를 정당화할 때 Pro를 테스트하세요.

DeepSeek V4 API 액세스에는 어떤 model ID를 사용해야 하나요?

OurToken의 이 DeepSeek V4 API 라우트에는 model ID로 deepseek-v4-flash를 사용하세요. API Keys 페이지와 모델 갤러리는 호출 가능한 모델 값을 표시해야 하므로 개발자는 정확한 ID를 복사하고 표시 이름, 제공업체 접두사 또는 대소문자 차이로 인한 실수를 피할 수 있습니다.

DeepSeek V4 Flash benchmark 및 기능 주장은 어떻게 평가해야 하나요?

모든 DeepSeek V4 Flash benchmark 주장은 프로덕션 보장이 아니라 테스트 시작점으로 취급하세요. 경쟁사 자료는 JSON output, tool calls, coding, reasoning, long-context tasks를 언급하지만, 팀은 응답 품질, 지연 시간, 캐시 동작, 총 토큰 비용을 자체 요구 사항에 맞춰 검증해야 합니다.