- openai/gpt-5-4-mini
openai/gpt-5.4-mini
128K context · $0.15 / M input tokens · $0.90 / M output tokens
GPT-5.4 Mini उन teams के लिए compact OpenAI model route है जो OurToken unified API के माध्यम से chat, coding, reasoning, vision और structured output workflows तक lower-cost access चाहती हैं।
मूल्य निर्धारण
उपयोग के अनुसार भुगतान
कोई अग्रिम लागत नहीं, केवल उतने के लिए भुगतान करें जितना आप उपयोग करते हैं
API उपयोग
API Access Guide
कोड उदाहरण
इस मॉडल के लिए OurToken API endpoint का उपयोग करें। नीचे दिए गए उदाहरण direct HTTP requests और मॉडल परिवार के लिए recommended endpoint का उपयोग करते हैं।
curl https://api.ourtoken.ai/v1/responses \
-H "Content-Type: application/json" \
-H "Authorization: Bearer YOUR_API_KEY" \
-d '{
"model": "gpt-5.4-mini",
"input": "Hello!",
"max_output_tokens": 256
}'Responses API संदर्भ
OpenAI Responses-संगत endpoint के साथ model response बनाएँ। यह format text input, message arrays, tools, reasoning controls, और multi-turn response continuation को support करता है।
Authorization
| Content-Type | application/json |
| Authorization | Bearer YOUR_API_KEY |
Request Body
| फ़ील्ड | प्रकार | आवश्यक | विवरण |
|---|---|---|---|
| model | string | आवश्यक | कॉल करने के लिए Model ID। |
| input | string | array<object> | वैकल्पिक | string या structured message array के रूप में input content। |
| instructions | string | वैकल्पिक | response पर लागू system या developer instructions। |
| max_output_tokens | integer | वैकल्पिक | model द्वारा generate किए जा सकने वाले output tokens की अधिकतम संख्या। |
| temperature | number | वैकल्पिक | Sampling temperature। |
| top_p | number | वैकल्पिक | Nucleus sampling parameter। |
| stream | boolean | वैकल्पिक | क्या streaming response लौटाना है। |
| tools | array<object> | वैकल्पिक | model के लिए उपलब्ध tools। |
| tool_choice | string | object | वैकल्पिक | model tools कैसे चुनता है, इसे नियंत्रित करता है। |
| reasoning | object | वैकल्पिक | इसे support करने वाले models के लिए reasoning configuration। |
| previous_response_id | string | वैकल्पिक | conversation जारी रखने के लिए previous response ID। |
| truncation | "auto" | "disabled" | वैकल्पिक | automatic context truncation को नियंत्रित करता है। |
Response Body
| फ़ील्ड | प्रकार | आवश्यक | विवरण |
|---|---|---|---|
| id | string | आवश्यक | unique response identifier। |
| object | "response" | आवश्यक | Responses API द्वारा लौटाया गया object type। |
| created_at | integer | आवश्यक | response बनाए जाने का Unix timestamp। |
| status | string | आवश्यक | response lifecycle status। |
| model | string | आवश्यक | वह model जिसने response बनाया। |
| output | array<object> | आवश्यक | model द्वारा लौटाए गए output items की array। |
| output[].content[].text | string | वैकल्पिक | output message item के अंदर text content। |
| usage | object | वैकल्पिक | response के लिए token usage information। |
| usage.prompt_tokens | integer | वैकल्पिक | Input token count। |
| usage.completion_tokens | integer | वैकल्पिक | Output token count। |
| usage.total_tokens | integer | वैकल्पिक | Total token count। |
| usage.prompt_tokens_details | object | वैकल्पिक | input token usage का breakdown। |
| usage.prompt_tokens_details.cached_tokens | integer | वैकल्पिक | cache से served tokens। |
| usage.prompt_tokens_details.text_tokens | integer | वैकल्पिक | Text token count। |
| usage.prompt_tokens_details.audio_tokens | integer | वैकल्पिक | Audio token count। |
| usage.prompt_tokens_details.image_tokens | integer | वैकल्पिक | Image token count। |
| usage.completion_tokens_details | object | वैकल्पिक | output token usage का breakdown। |
| usage.completion_tokens_details.text_tokens | integer | वैकल्पिक | Text token count। |
| usage.completion_tokens_details.audio_tokens | integer | वैकल्पिक | Audio token count। |
| usage.completion_tokens_details.reasoning_tokens | integer | वैकल्पिक | Reasoning token count। |
मॉडल परिचय
OpenAI gpt-5.4-mini
GPT-5.4 Mini उन teams के लिए compact OpenAI model route है जो OurToken unified API के माध्यम से chat, coding, reasoning, vision और structured output workflows तक lower-cost access चाहती हैं।
GPT-5.4 Mini developers को high-volume application workloads के लिए practical model option देता है, जहां cost control, fast iteration और OpenAI-compatible integration मायने रखते हैं। जब आपके product को larger frontier models पर default हुए बिना chat, coding assistance, image input, document handling और structured responses के लिए balanced route चाहिए हो, तब GPT 5.4 Mini API का उपयोग करें।
यह बेहतरीन क्यों है
- Official GPT 5.4 Mini reference price का 20%।
- अन्य supported models द्वारा उपयोग किए जाने वाले उसी OurToken endpoint के माध्यम से OpenAI-compatible API setup।
- Coding, reasoning, vision, structured output और agent-style developer workflows के लिए उपयोगी।
- Fast integration चाहने वाले developers के लिए clear model ID और API key workflow।
- Dashboard logs और usage visibility teams को launch के बाद production cost evaluate करने में मदद करते हैं।
मुख्य विशेषताएँ
- Model ID: gpt-5.4-mini
- Input price: $0.15 per 1M tokens on OurToken
- Output price: $0.90 per 1M tokens on OurToken
- Official reference price: $0.75 input / $4.50 output per 1M tokens
- Input: Text, image according to supplied provider content
- Output: Text
विशिष्टताएँ
Developers के लिए GPT 5.4 Mini API Features
Official price के 20%, clear GPT 5.4 Mini pricing, model ID access और OpenAI-compatible workflows के लिए OurToken पर GPT 5.4 Mini API का उपयोग करें।
Unified Access
Separate provider routes wire करने के बजाय OurToken unified endpoint के माध्यम से GPT 5.4 Mini API call करें। Developers एक API key बना सकते हैं, model ID copy कर सकते हैं, और testing, staging तथा production environments के लिए OpenAI-compatible request patterns बनाए रख सकते हैं।
20% of Official Price
Traffic scale करने से पहले GPT 5.4 Mini pricing compare करें। OurToken $0.15 input और $0.90 output per 1M tokens list करता है, जबकि official reference price $0.75 input और $4.50 output है, जिससे price ratio समझाना आसान होता है।
Cost Planning
Production workloads route करने से पहले prompt length, output length और request volume से GPT 5.4 Mini cost estimate करें। Clear input और output prices teams को यह decide करने में मदद करते हैं कि high-volume application traffic के लिए GPT 5.4 Mini सही default कब है।
Coding Workflows
Code explanation, debugging notes, refactoring suggestions और agent-style developer tasks के लिए GPT 5.4 Mini का उपयोग करें। यह teams को everyday coding workflows के लिए lower-cost route देता है जिन्हें हर request पर सबसे बड़े model की जरूरत नहीं होती।
Vision Tasks
Supplied provider data के अनुसार GPT 5.4 Mini text और image input support करता है, जिससे यह screenshot review, document understanding, product support और visual context वाली task automation जैसे multimodal workflows के लिए उपयोगी है।
Nano Comparison
इसे nano page बनाए बिना GPT 5.4 Nano intent cover करें। GPT 5.4 Mini stronger reasoning और coding work के लिए बेहतर positioned है, जबकि nano आमतौर पर simpler repetitive tasks, routing, extraction और classification के लिए framed होता है।
OurToken पर GPT 5.4 Mini API का उपयोग कैसे करें
API key बनाएं, model ID copy करें, unified endpoint call करें, pricing compare करें, और GPT 5.4 Mini cost monitor करें।
API Key बनाएं
Dashboard से OurToken API key बनाएं और उसे secure server-side environment variable में store करें। इससे GPT 5.4 Mini API access private रहता है और आपके backend को production requests के लिए stable credential मिलता है।
01Model ID Copy करें
API Keys page से gpt-5.4-mini copy करें और उसे अपने request body में model value के रूप में उपयोग करें। यह gpt-5.4 mini search intent cover करता है और exact model string चाहने वाले developers के लिए integration clear रखता है।
02Unified Endpoint Call करें
अपनी API key, messages array और selected model के साथ OurToken OpenAI-compatible endpoint पर chat completions requests भेजें। Backend code में base URL, credential और model value बदलने के बाद existing OpenAI SDK patterns दोबारा उपयोग किए जा सकते हैं।
03Pricing Compare करें
Rollout से पहले GPT 5.4 Mini pricing compare करें: OurToken $0.15 input और $0.90 output per 1M tokens list करता है, जबकि official reference price standard usage today के लिए $0.75 input और $4.50 output per 1M tokens है।
04Workflows Test करें
GPT 5.4 Mini को default route चुनने से पहले coding, reasoning, vision, extraction और agent-style workflows के लिए representative prompts test करें। Real prompts का उपयोग करें क्योंकि quality, verbosity, latency और token usage task तथा product context के अनुसार vary करते हैं।
05Usage Monitor करें
Launch के बाद logs, request counts, token usage और spend monitor करें। इससे GPT 5.4 Mini cost estimate करने, इसे simpler tasks के लिए GPT 5.4 nano से compare करने, और larger models पर safely route करने का फैसला लेने में मदद मिलती है।
06GPT 5.4 Mini API FAQ
GPT 5.4 Mini API access, pricing, price, cost, model ID, coding workflows, vision support और nano comparisons के बारे में उत्तर।