MiniMax

minimax/minimax-m3

- contexto · $0.2400 / M tokens de entrada · $0.9600 / M tokens de saída

MiniMax M3 é uma rota de modelo MiniMax na OurToken para desenvolvedores que precisam de acesso via API hospedada para coding, workflows de agentes, tarefas de contexto longo, avaliação multimodal e assistentes em produção.

Preços

Pay-per-use

Sem custo inicial; pague apenas pelo que usar

40% of official price
Entrada$0.60 / M$0.2400 / M Tokens
Saída$2.40 / M$0.9600 / M Tokens

Uso da API

Guia de acesso à API

Base URLhttps://api.ourtoken.ai/v1
Endpoint da APIchat/completions
URL completahttps://api.ourtoken.ai/v1/chat/completions
Model IDminimax-m3
Obter chave de API

Exemplos de código

Use o endpoint da API OurToken para este modelo. Os exemplos abaixo usam requisições HTTP diretas e o endpoint recomendado para a família do modelo.

curl https://api.ourtoken.ai/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -d '{
    "model": "minimax-m3",
    "messages": [
      {
        "role": "user",
        "content": "Hello!"
      }
    ],
    "max_tokens": 256
  }'

Referência da API Chat Completions

Crie uma resposta de chat com o endpoint compatível com OpenAI Chat Completions. Use https://api.ourtoken.ai/v1 como SDK Base URL e POST /chat/completions como endpoint.

Autorização

Content-Typeapplication/json
AuthorizationBearer YOUR_API_KEY

Corpo da requisição

CampoTipoObrigatórioDescrição
modelstringObrigatórioModel ID a chamar.
messagesarray<object>ObrigatórioMensagens da conversa enviadas ao modelo.
max_tokensintegerOpcionalNúmero máximo de tokens de saída.
temperaturenumberOpcionalTemperatura de amostragem.
top_pnumberOpcionalParâmetro de nucleus sampling.
streambooleanOpcionalDefine se a resposta será retornada em streaming.
stream_optionsobjectOpcionalOpções adicionais para respostas em streaming.
toolsarray<object>OpcionalTools disponíveis para o modelo.
tool_choicestring | objectOpcionalControla como o modelo seleciona tools.
response_formatobjectOpcionalControla saída estruturada, como respostas em objeto JSON.

Corpo da resposta

CampoTipoObrigatórioDescrição
idstringObrigatórioIdentificador único da chat completion.
object"chat.completion"ObrigatórioTipo de objeto retornado pela API Chat Completions.
createdintegerObrigatórioTimestamp Unix de criação da resposta.
modelstringObrigatórioModelo que gerou a resposta.
choicesarray<object>ObrigatórioRespostas candidatas retornadas pelo modelo.
choices[].message.rolestringObrigatórioRole da mensagem de chat retornada.
choices[].message.contentstringOpcionalConteúdo de texto na mensagem de chat retornada.
choices[].finish_reasonstringOpcionalMotivo pelo qual a geração parou.
usageobjectOpcionalInformações de uso de tokens da chat completion.
usage.prompt_tokensintegerOpcionalContagem de tokens de entrada.
usage.completion_tokensintegerOpcionalContagem de tokens de saída.
usage.total_tokensintegerOpcionalContagem total de tokens.
usage.prompt_tokens_detailsobjectOpcionalDetalhamento do uso de tokens de entrada.
usage.prompt_tokens_details.cached_tokensintegerOpcionalTokens servidos a partir de cache.

Introdução ao modelo

MiniMax minimax-m3

MiniMax M3 é uma rota de modelo MiniMax na OurToken para desenvolvedores que precisam de acesso via API hospedada para coding, workflows de agentes, tarefas de contexto longo, avaliação multimodal e assistentes em produção.

MiniMax M3 dá aos times uma rota MiniMax para aplicações em que contexto longo, workflows de coding, prompts multimodais e preços previsíveis de API importam. Use a API MiniMax M3 quando quiser testar workflows MiniMax pela API unificada da OurToken, mantendo model IDs, logs de uso, custos de cache e revisão de preços em um só dashboard.

Por que ele se destaca

  • 40% do preço oficial de referência do MiniMax M3 para tokens de entrada, saída e cache read.
  • Setup de API compatível com OpenAI pelo mesmo endpoint da OurToken usado por outros modelos suportados.
  • Cache write está listado como $0, enquanto tokens padrão de entrada, saída e cache read continuam sendo categorias pagas.
  • Útil para avaliar agentes de coding, tarefas de contexto longo, experimentos de tool-use e workflows multimodais sem integração separada específica do provedor.
  • Logs no Dashboard e visibilidade de uso ajudam times a revisar o custo de requests após o lançamento.

Principais recursos

  • Model ID: minimax-m3
  • Preço de entrada: $0.2400 por 1M tokens na OurToken
  • Preço de saída: $0.9600 por 1M tokens na OurToken
  • Preço de cache read: $0.0480 por 1M tokens na OurToken
  • Preço de cache write: $0 por 1M tokens na OurToken
  • Provedor: MiniMax

Especificações

ProvedorMiniMax
Tipo de modeloLarge Language Model (LLM)
Model IDminimax-m3
Comprimento de contexto1M tokens
Saída máxima512K tokens
EntradaTexto, imagem, vídeo
SaídaTexto
Preço de entrada OurToken$0.2400 / 1M tokens
Preço de saída OurToken$0.9600 / 1M tokens
Preço de cache read OurToken$0.0480 / 1M tokens
Preço de cache write OurToken$0 / 1M tokens
Referência oficial de entrada$0.60 / 1M tokens
Referência oficial de saída$2.40 / 1M tokens
Referência oficial de cache read$0.12 / 1M tokens

Recursos da API MiniMax M3

Use a API MiniMax M3 para acesso unificado à API MiniMax, preços transparentes do MiniMax M3, visibilidade de cache, avaliação multimodal e workflows de agentes em produção.

Acesso unificado

Chame a API MiniMax M3 pelo endpoint unificado da OurToken, mantendo acesso a modelos, gestão de chaves de API e histórico de uso em um só lugar. Use minimax-m3 como model ID e reaproveite padrões de request compatíveis com OpenAI para agentes de coding, sistemas de chat e workflows de contexto longo.

Clareza de preços

Revise os preços do MiniMax M3 antes do rollout. A OurToken lista $0.2400 entrada e $0.9600 saída por 1M tokens, para que times estimem o preço do MiniMax M3 para coding, prompts multimodais e workloads de assistentes em alto volume.

Custos de cache

Separe comportamento de cache do gasto normal de prompt com preços explícitos. O cache read da API MiniMax M3 está listado a $0.0480 por 1M tokens na OurToken, enquanto cache write é $0; esse é o caso gratuito do MiniMax M3 que usuários devem entender com clareza.

Workflows de agentes

Use avaliação do modelo MiniMax M3 para agentes de coding, experimentos de tool-use e automação em várias etapas. Materiais concorrentes destacam capacidade agentic e workflows no estilo OpenCode, mas times devem validar o comportamento Opencode MiniMax M3 com seus próprios prompts e critérios de aceite.

Contexto multimodal

Avalie tarefas de contexto longo e multimodais, como review de documentos, análise de repositório, entradas visuais, prompts baseados em vídeo e colaboração multi-turno. Materiais concorrentes descrevem contexto de 1M e multimodalidade nativa, que devem ser testados no seu próprio workload parecido com produção.

Escolhas de deploy

Compare acesso via API hospedada com buscas como MiniMax M3 HuggingFace e MiniMax M3 Ollama. A OurToken foca em chaves de API gerenciadas, logs de uso, visibilidade de preços e integração simples, não em hospedagem local de modelos.

Como usar a API MiniMax M3 na OurToken

Crie uma chave de API, copie minimax-m3, compare preços do MiniMax M3, chame o endpoint unificado e monitore o uso real.

Criar chave de API

Crie uma chave de API da OurToken pelo dashboard e armazene-a em uma variável de ambiente segura no servidor. Isso dá ao backend acesso à API MiniMax M3 mantendo credenciais fora do código do cliente, notebooks e repositórios públicos.

01

Copiar Model ID

Use minimax-m3 como valor do modelo no corpo da request. Manter o model ID exato do MiniMax M3 na configuração ajuda desenvolvedores a evitar erros de nome ao comparar rotas da API MiniMax entre testes locais, tráfego de staging e deployments de produção.

02

Chamar endpoint

Envie requests ao endpoint de API unificada da OurToken com sua chave de API, model ID e payload do prompt. Padrões existentes de chat compatíveis com OpenAI geralmente podem ser reaproveitados após trocar base URL, credencial e valor do modelo.

03

Comparar preços

Compare os preços da API MiniMax M3 antes do rollout: a OurToken lista $0.2400 entrada, $0.9600 saída e $0.0480 cache read por 1M tokens. Cache write é $0, que é a categoria gratuita de tokens do MiniMax M3 a separar de entrada e saída pagas.

04

Testar workflows

Rode prompts representativos de coding, agentes, contexto longo, imagem e entrada de vídeo antes de escalar. Se você estiver avaliando workflows Opencode MiniMax M3, compare comportamento de ferramentas, qualidade de resposta, latência e uso de tokens com seus critérios de aceite de produção.

05

Monitorar custo

Após o lançamento, revise logs de histórico para contagem de requests, tokens de entrada, tokens de saída, tokens de cache read e gastos. Dados reais de uso ajudam times a comparar o preço do MiniMax M3 com tráfego efetivo, em vez de depender apenas de páginas de benchmark ou catálogos de provedores.

06

FAQ da API MiniMax M3

Respostas sobre preços da API MiniMax M3, acesso à API MiniMax, uso gratuito de cache write, configuração do modelo, workflows OpenCode e comparações de deploy.

01

O que é a API MiniMax M3?

A API MiniMax M3 é a rota do modelo MiniMax M3 disponível pela OurToken para times que querem acesso hospedado a um modelo de coding, agentes, contexto longo e multimodal. Desenvolvedores podem usar o model ID minimax-m3, criar uma chave de API da OurToken e chamá-lo pelo mesmo fluxo de API unificada usado por outros modelos suportados.
02

Quais são os preços da API MiniMax M3 na OurToken?

Os preços da API MiniMax M3 na OurToken são $0.2400 por 1M tokens de entrada e $0.9600 por 1M tokens de saída. O catálogo também lista cache read a $0.0480 por 1M tokens e cache write a $0, para que times estimem os preços do MiniMax M3 por categoria de token antes de escalar tráfego.
03

O MiniMax M3 é gratuito na OurToken?

O uso gratuito do MiniMax M3 na OurToken se refere ao preço de cache write, listado como $0 por 1M tokens. Tokens padrão de entrada, saída e cache read continuam sendo categorias pagas. Trate cache write gratuito como um detalhe útil de custo, não como um plano gratuito da API MiniMax M3.
04

Qual é o preço do MiniMax M3 para cache read e cache write?

O preço do MiniMax M3 para cache read é $0.0480 por 1M tokens de cache read na OurToken, em comparação com a referência oficial de $0.12. Cache write está listado como $0 por 1M tokens. Isso torna importante acompanhar comportamento de cache separadamente do gasto normal de entrada e saída.
05

Posso usar workflows Opencode MiniMax M3 pela OurToken?

Você pode avaliar workflows Opencode MiniMax M3 chamando minimax-m3 pela OurToken e testando prompts de coding, tool-use e agentes em várias etapas. Materiais concorrentes destacam capacidade agentic e de coding, mas decisões de produção devem comparar prompts de repositório, latência, comportamento de ferramentas e qualidade de saída com seus próprios critérios de aceite.
06

Como MiniMax M3 HuggingFace, MiniMax M3 Ollama e acesso via API da OurToken se comparam?

MiniMax M3 HuggingFace e MiniMax M3 Ollama são buscas comuns para descoberta de modelos ou caminhos de deploy local. A OurToken foca em acesso hospedado à API MiniMax M3 com chaves de API, logs de uso e visibilidade de preços. Escolha conforme sua prioridade seja integração gerenciada via API, experimentação local ou pesquisa de modelos.