- minimax/minimax-m3
minimax/minimax-m3
- contexto · $0.2400 / M tokens de entrada · $0.9600 / M tokens de saída
MiniMax M3 é uma rota de modelo MiniMax na OurToken para desenvolvedores que precisam de acesso via API hospedada para coding, workflows de agentes, tarefas de contexto longo, avaliação multimodal e assistentes em produção.
Preços
Pay-per-use
Sem custo inicial; pague apenas pelo que usar
Uso da API
Guia de acesso à API
Exemplos de código
Use o endpoint da API OurToken para este modelo. Os exemplos abaixo usam requisições HTTP diretas e o endpoint recomendado para a família do modelo.
curl https://api.ourtoken.ai/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer YOUR_API_KEY" \
-d '{
"model": "minimax-m3",
"messages": [
{
"role": "user",
"content": "Hello!"
}
],
"max_tokens": 256
}'Referência da API Chat Completions
Crie uma resposta de chat com o endpoint compatível com OpenAI Chat Completions. Use https://api.ourtoken.ai/v1 como SDK Base URL e POST /chat/completions como endpoint.
Autorização
| Content-Type | application/json |
| Authorization | Bearer YOUR_API_KEY |
Corpo da requisição
| Campo | Tipo | Obrigatório | Descrição |
|---|---|---|---|
| model | string | Obrigatório | Model ID a chamar. |
| messages | array<object> | Obrigatório | Mensagens da conversa enviadas ao modelo. |
| max_tokens | integer | Opcional | Número máximo de tokens de saída. |
| temperature | number | Opcional | Temperatura de amostragem. |
| top_p | number | Opcional | Parâmetro de nucleus sampling. |
| stream | boolean | Opcional | Define se a resposta será retornada em streaming. |
| stream_options | object | Opcional | Opções adicionais para respostas em streaming. |
| tools | array<object> | Opcional | Tools disponíveis para o modelo. |
| tool_choice | string | object | Opcional | Controla como o modelo seleciona tools. |
| response_format | object | Opcional | Controla saída estruturada, como respostas em objeto JSON. |
Corpo da resposta
| Campo | Tipo | Obrigatório | Descrição |
|---|---|---|---|
| id | string | Obrigatório | Identificador único da chat completion. |
| object | "chat.completion" | Obrigatório | Tipo de objeto retornado pela API Chat Completions. |
| created | integer | Obrigatório | Timestamp Unix de criação da resposta. |
| model | string | Obrigatório | Modelo que gerou a resposta. |
| choices | array<object> | Obrigatório | Respostas candidatas retornadas pelo modelo. |
| choices[].message.role | string | Obrigatório | Role da mensagem de chat retornada. |
| choices[].message.content | string | Opcional | Conteúdo de texto na mensagem de chat retornada. |
| choices[].finish_reason | string | Opcional | Motivo pelo qual a geração parou. |
| usage | object | Opcional | Informações de uso de tokens da chat completion. |
| usage.prompt_tokens | integer | Opcional | Contagem de tokens de entrada. |
| usage.completion_tokens | integer | Opcional | Contagem de tokens de saída. |
| usage.total_tokens | integer | Opcional | Contagem total de tokens. |
| usage.prompt_tokens_details | object | Opcional | Detalhamento do uso de tokens de entrada. |
| usage.prompt_tokens_details.cached_tokens | integer | Opcional | Tokens servidos a partir de cache. |
Introdução ao modelo
MiniMax minimax-m3
MiniMax M3 é uma rota de modelo MiniMax na OurToken para desenvolvedores que precisam de acesso via API hospedada para coding, workflows de agentes, tarefas de contexto longo, avaliação multimodal e assistentes em produção.
MiniMax M3 dá aos times uma rota MiniMax para aplicações em que contexto longo, workflows de coding, prompts multimodais e preços previsíveis de API importam. Use a API MiniMax M3 quando quiser testar workflows MiniMax pela API unificada da OurToken, mantendo model IDs, logs de uso, custos de cache e revisão de preços em um só dashboard.
Por que ele se destaca
- 40% do preço oficial de referência do MiniMax M3 para tokens de entrada, saída e cache read.
- Setup de API compatível com OpenAI pelo mesmo endpoint da OurToken usado por outros modelos suportados.
- Cache write está listado como $0, enquanto tokens padrão de entrada, saída e cache read continuam sendo categorias pagas.
- Útil para avaliar agentes de coding, tarefas de contexto longo, experimentos de tool-use e workflows multimodais sem integração separada específica do provedor.
- Logs no Dashboard e visibilidade de uso ajudam times a revisar o custo de requests após o lançamento.
Principais recursos
- Model ID: minimax-m3
- Preço de entrada: $0.2400 por 1M tokens na OurToken
- Preço de saída: $0.9600 por 1M tokens na OurToken
- Preço de cache read: $0.0480 por 1M tokens na OurToken
- Preço de cache write: $0 por 1M tokens na OurToken
- Provedor: MiniMax
Especificações
Recursos da API MiniMax M3
Use a API MiniMax M3 para acesso unificado à API MiniMax, preços transparentes do MiniMax M3, visibilidade de cache, avaliação multimodal e workflows de agentes em produção.
Acesso unificado
Chame a API MiniMax M3 pelo endpoint unificado da OurToken, mantendo acesso a modelos, gestão de chaves de API e histórico de uso em um só lugar. Use minimax-m3 como model ID e reaproveite padrões de request compatíveis com OpenAI para agentes de coding, sistemas de chat e workflows de contexto longo.
Clareza de preços
Revise os preços do MiniMax M3 antes do rollout. A OurToken lista $0.2400 entrada e $0.9600 saída por 1M tokens, para que times estimem o preço do MiniMax M3 para coding, prompts multimodais e workloads de assistentes em alto volume.
Custos de cache
Separe comportamento de cache do gasto normal de prompt com preços explícitos. O cache read da API MiniMax M3 está listado a $0.0480 por 1M tokens na OurToken, enquanto cache write é $0; esse é o caso gratuito do MiniMax M3 que usuários devem entender com clareza.
Workflows de agentes
Use avaliação do modelo MiniMax M3 para agentes de coding, experimentos de tool-use e automação em várias etapas. Materiais concorrentes destacam capacidade agentic e workflows no estilo OpenCode, mas times devem validar o comportamento Opencode MiniMax M3 com seus próprios prompts e critérios de aceite.
Contexto multimodal
Avalie tarefas de contexto longo e multimodais, como review de documentos, análise de repositório, entradas visuais, prompts baseados em vídeo e colaboração multi-turno. Materiais concorrentes descrevem contexto de 1M e multimodalidade nativa, que devem ser testados no seu próprio workload parecido com produção.
Escolhas de deploy
Compare acesso via API hospedada com buscas como MiniMax M3 HuggingFace e MiniMax M3 Ollama. A OurToken foca em chaves de API gerenciadas, logs de uso, visibilidade de preços e integração simples, não em hospedagem local de modelos.
Como usar a API MiniMax M3 na OurToken
Crie uma chave de API, copie minimax-m3, compare preços do MiniMax M3, chame o endpoint unificado e monitore o uso real.
Criar chave de API
Crie uma chave de API da OurToken pelo dashboard e armazene-a em uma variável de ambiente segura no servidor. Isso dá ao backend acesso à API MiniMax M3 mantendo credenciais fora do código do cliente, notebooks e repositórios públicos.
01Copiar Model ID
Use minimax-m3 como valor do modelo no corpo da request. Manter o model ID exato do MiniMax M3 na configuração ajuda desenvolvedores a evitar erros de nome ao comparar rotas da API MiniMax entre testes locais, tráfego de staging e deployments de produção.
02Chamar endpoint
Envie requests ao endpoint de API unificada da OurToken com sua chave de API, model ID e payload do prompt. Padrões existentes de chat compatíveis com OpenAI geralmente podem ser reaproveitados após trocar base URL, credencial e valor do modelo.
03Comparar preços
Compare os preços da API MiniMax M3 antes do rollout: a OurToken lista $0.2400 entrada, $0.9600 saída e $0.0480 cache read por 1M tokens. Cache write é $0, que é a categoria gratuita de tokens do MiniMax M3 a separar de entrada e saída pagas.
04Testar workflows
Rode prompts representativos de coding, agentes, contexto longo, imagem e entrada de vídeo antes de escalar. Se você estiver avaliando workflows Opencode MiniMax M3, compare comportamento de ferramentas, qualidade de resposta, latência e uso de tokens com seus critérios de aceite de produção.
05Monitorar custo
Após o lançamento, revise logs de histórico para contagem de requests, tokens de entrada, tokens de saída, tokens de cache read e gastos. Dados reais de uso ajudam times a comparar o preço do MiniMax M3 com tráfego efetivo, em vez de depender apenas de páginas de benchmark ou catálogos de provedores.
06FAQ da API MiniMax M3
Respostas sobre preços da API MiniMax M3, acesso à API MiniMax, uso gratuito de cache write, configuração do modelo, workflows OpenCode e comparações de deploy.