minimax/minimax-m3

$0.2400 / M tokens de entrada · $0.9600 / M tokens de saída

MiniMax M3 é uma rota de modelo MiniMax na OurToken para desenvolvedores que precisam de acesso via API hospedada para coding, workflows de agentes, tarefas de contexto longo, avaliação multimodal e assistentes em produção.

Obter chave de API

Monitor de Status 24H

99.29% de uptime

há 8 horasagora

Disponível

2026-07-23 16:34:36 UTC

Preços

Pagamento por uso

Sem custo inicial; pague apenas pelo que usar

40% of official price

Entrada$0.60 / M$0.2400 / M Tokens

Saída$2.40 / M$0.9600 / M Tokens

Entrada em cache$0.12 / M$0.0480 / M Tokens

Gravação de cache$0 / M$0 / M Tokens

Uso da API

Guia de acesso à API

URL basehttps://api.ourtoken.ai/v1

Endpoint da APIchat/completions

URL completahttps://api.ourtoken.ai/v1/chat/completions

ID do modelominimax-m3

Obter chave de API

Exemplos de código

Use o endpoint da API OurToken para este modelo. Os exemplos abaixo usam requisições HTTP diretas e o endpoint recomendado para a família do modelo.

curl https://api.ourtoken.ai/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -d '{
    "model": "minimax-m3",
    "messages": [
      {
        "role": "user",
        "content": "Hello!"
      }
    ],
    "max_tokens": 256
  }'

Referência da API Chat Completions

Crie uma resposta de chat com o endpoint compatível com OpenAI Chat Completions. Use https://api.ourtoken.ai/v1 como SDK Base URL e POST /chat/completions como endpoint.

Autorização

Content-Type	application/json
Authorization	Bearer YOUR_API_KEY

Corpo da requisição

Campo	Tipo	Obrigatório	Descrição
model	string	Obrigatório	Model ID a chamar.
messages	array<object>	Obrigatório	Mensagens da conversa enviadas ao modelo.
max_tokens	integer	Opcional	Número máximo de tokens de saída.
temperature	number	Opcional	Temperatura de amostragem.
top_p	number	Opcional	Parâmetro de nucleus sampling.
stream	boolean	Opcional	Define se a resposta será retornada em streaming.
stream_options	object	Opcional	Opções adicionais para respostas em streaming.
tools	array<object>	Opcional	Tools disponíveis para o modelo.
tool_choice	string \| object	Opcional	Controla como o modelo seleciona tools.
response_format	object	Opcional	Controla saída estruturada, como respostas em objeto JSON.

Corpo da resposta

Campo	Tipo	Obrigatório	Descrição
id	string	Obrigatório	Identificador único da chat completion.
object	"chat.completion"	Obrigatório	Tipo de objeto retornado pela API Chat Completions.
created	integer	Obrigatório	Timestamp Unix de criação da resposta.
model	string	Obrigatório	Modelo que gerou a resposta.
choices	array<object>	Obrigatório	Respostas candidatas retornadas pelo modelo.
choices[].message.role	string	Obrigatório	Role da mensagem de chat retornada.
choices[].message.content	string	Opcional	Conteúdo de texto na mensagem de chat retornada.
choices[].finish_reason	string	Opcional	Motivo pelo qual a geração parou.
usage	object	Opcional	Informações de uso de tokens da chat completion.
usage.prompt_tokens	integer	Opcional	Contagem de tokens de entrada.
usage.completion_tokens	integer	Opcional	Contagem de tokens de saída.
usage.total_tokens	integer	Opcional	Contagem total de tokens.
usage.prompt_tokens_details	object	Opcional	Detalhamento do uso de tokens de entrada.
usage.prompt_tokens_details.cached_tokens	integer	Opcional	Tokens servidos a partir de cache.

Introdução ao modelo

MiniMax minimax-m3

MiniMax M3 dá aos times uma rota MiniMax para aplicações em que contexto longo, workflows de coding, prompts multimodais e preços previsíveis de API importam. Use a API MiniMax M3 quando quiser testar workflows MiniMax pela API unificada da OurToken, mantendo model IDs, logs de uso, custos de cache e revisão de preços em um só dashboard.

Por que ele se destaca

40% do preço oficial de referência do MiniMax M3 para tokens de entrada, saída e cache read.
Setup de API compatível com OpenAI pelo mesmo endpoint da OurToken usado por outros modelos suportados.
Cache write está listado como $0, enquanto tokens padrão de entrada, saída e cache read continuam sendo categorias pagas.
Útil para avaliar agentes de coding, tarefas de contexto longo, experimentos de tool-use e workflows multimodais sem integração separada específica do provedor.
Logs no Dashboard e visibilidade de uso ajudam times a revisar o custo de requests após o lançamento.

Principais recursos

Model ID: minimax-m3
Preço de entrada: $0.2400 por 1M tokens na OurToken
Preço de saída: $0.9600 por 1M tokens na OurToken
Preço de cache read: $0.0480 por 1M tokens na OurToken
Preço de cache write: $0 por 1M tokens na OurToken
Provedor: MiniMax

Especificações

ProvedorMiniMax

Tipo de modeloLarge Language Model (LLM)

Model IDminimax-m3

Comprimento de contexto1M tokens

Saída máxima512K tokens

EntradaTexto, imagem, vídeo

SaídaTexto

Preço de entrada OurToken$0.2400 / 1M tokens

Preço de saída OurToken$0.9600 / 1M tokens

Preço de cache read OurToken$0.0480 / 1M tokens

Preço de cache write OurToken$0 / 1M tokens

Referência oficial de entrada$0.60 / 1M tokens

Referência oficial de saída$2.40 / 1M tokens

Referência oficial de cache read$0.12 / 1M tokens

Recursos da API MiniMax M3

Use a API MiniMax M3 para acesso unificado à API MiniMax, preços transparentes do MiniMax M3, visibilidade de cache, avaliação multimodal e workflows de agentes em produção.

Acesso unificado

Chame a API MiniMax M3 pelo endpoint unificado da OurToken, mantendo acesso a modelos, gestão de chaves de API e histórico de uso em um só lugar. Use minimax-m3 como model ID e reaproveite padrões de request compatíveis com OpenAI para agentes de coding, sistemas de chat e workflows de contexto longo.

Clareza de preços

Revise os preços do MiniMax M3 antes do rollout. A OurToken lista $0.2400 entrada e $0.9600 saída por 1M tokens, para que times estimem o preço do MiniMax M3 para coding, prompts multimodais e workloads de assistentes em alto volume.

Custos de cache

Separe comportamento de cache do gasto normal de prompt com preços explícitos. O cache read da API MiniMax M3 está listado a $0.0480 por 1M tokens na OurToken, enquanto cache write é $0; esse é o caso gratuito do MiniMax M3 que usuários devem entender com clareza.

Workflows de agentes

Use avaliação do modelo MiniMax M3 para agentes de coding, experimentos de tool-use e automação em várias etapas. Materiais concorrentes destacam capacidade agentic e workflows no estilo OpenCode, mas times devem validar o comportamento Opencode MiniMax M3 com seus próprios prompts e critérios de aceite.

Contexto multimodal

Avalie tarefas de contexto longo e multimodais, como review de documentos, análise de repositório, entradas visuais, prompts baseados em vídeo e colaboração multi-turno. Materiais concorrentes descrevem contexto de 1M e multimodalidade nativa, que devem ser testados no seu próprio workload parecido com produção.

Escolhas de deploy

Compare acesso via API hospedada com buscas como MiniMax M3 HuggingFace e MiniMax M3 Ollama. A OurToken foca em chaves de API gerenciadas, logs de uso, visibilidade de preços e integração simples, não em hospedagem local de modelos.

Como usar a API MiniMax M3 na OurToken

Crie uma chave de API, copie minimax-m3, compare preços do MiniMax M3, chame o endpoint unificado e monitore o uso real.

Criar chave de API

Crie uma chave de API da OurToken pelo dashboard e armazene-a em uma variável de ambiente segura no servidor. Isso dá ao backend acesso à API MiniMax M3 mantendo credenciais fora do código do cliente, notebooks e repositórios públicos.

Copiar Model ID

Use minimax-m3 como valor do modelo no corpo da request. Manter o model ID exato do MiniMax M3 na configuração ajuda desenvolvedores a evitar erros de nome ao comparar rotas da API MiniMax entre testes locais, tráfego de staging e deployments de produção.

Chamar endpoint

Envie requests ao endpoint de API unificada da OurToken com sua chave de API, model ID e payload do prompt. Padrões existentes de chat compatíveis com OpenAI geralmente podem ser reaproveitados após trocar base URL, credencial e valor do modelo.

Comparar preços

Compare os preços da API MiniMax M3 antes do rollout: a OurToken lista $0.2400 entrada, $0.9600 saída e $0.0480 cache read por 1M tokens. Cache write é $0, que é a categoria gratuita de tokens do MiniMax M3 a separar de entrada e saída pagas.

Testar workflows

Rode prompts representativos de coding, agentes, contexto longo, imagem e entrada de vídeo antes de escalar. Se você estiver avaliando workflows Opencode MiniMax M3, compare comportamento de ferramentas, qualidade de resposta, latência e uso de tokens com seus critérios de aceite de produção.

Monitorar custo

Após o lançamento, revise logs de histórico para contagem de requests, tokens de entrada, tokens de saída, tokens de cache read e gastos. Dados reais de uso ajudam times a comparar o preço do MiniMax M3 com tráfego efetivo, em vez de depender apenas de páginas de benchmark ou catálogos de provedores.

FAQ da API MiniMax M3

Respostas sobre preços da API MiniMax M3, acesso à API MiniMax, uso gratuito de cache write, configuração do modelo, workflows OpenCode e comparações de deploy.

O que é a API MiniMax M3?

A API MiniMax M3 é a rota do modelo MiniMax M3 disponível pela OurToken para times que querem acesso hospedado a um modelo de coding, agentes, contexto longo e multimodal. Desenvolvedores podem usar o model ID minimax-m3, criar uma chave de API da OurToken e chamá-lo pelo mesmo fluxo de API unificada usado por outros modelos suportados.

Quais são os preços da API MiniMax M3 na OurToken?

Os preços da API MiniMax M3 na OurToken são $0.2400 por 1M tokens de entrada e $0.9600 por 1M tokens de saída. O catálogo também lista cache read a $0.0480 por 1M tokens e cache write a $0, para que times estimem os preços do MiniMax M3 por categoria de token antes de escalar tráfego.

O MiniMax M3 é gratuito na OurToken?

O uso gratuito do MiniMax M3 na OurToken se refere ao preço de cache write, listado como $0 por 1M tokens. Tokens padrão de entrada, saída e cache read continuam sendo categorias pagas. Trate cache write gratuito como um detalhe útil de custo, não como um plano gratuito da API MiniMax M3.

Qual é o preço do MiniMax M3 para cache read e cache write?

O preço do MiniMax M3 para cache read é $0.0480 por 1M tokens de cache read na OurToken, em comparação com a referência oficial de $0.12. Cache write está listado como $0 por 1M tokens. Isso torna importante acompanhar comportamento de cache separadamente do gasto normal de entrada e saída.

Posso usar workflows Opencode MiniMax M3 pela OurToken?

Você pode avaliar workflows Opencode MiniMax M3 chamando minimax-m3 pela OurToken e testando prompts de coding, tool-use e agentes em várias etapas. Materiais concorrentes destacam capacidade agentic e de coding, mas decisões de produção devem comparar prompts de repositório, latência, comportamento de ferramentas e qualidade de saída com seus próprios critérios de aceite.

Como MiniMax M3 HuggingFace, MiniMax M3 Ollama e acesso via API da OurToken se comparam?

MiniMax M3 HuggingFace e MiniMax M3 Ollama são buscas comuns para descoberta de modelos ou caminhos de deploy local. A OurToken foca em acesso hospedado à API MiniMax M3 com chaves de API, logs de uso e visibilidade de preços. Escolha conforme sua prioridade seja integração gerenciada via API, experimentação local ou pesquisa de modelos.