MCP sem hype: quando tool resolve e quando prompt resolve

gabriel · Julho 2, 2026, 11:01pm

MCP virou buzzword e isso atrapalha. Então vamos fazer diferente: história verificada, ciência revisada por pares e uma régua prática no final. Eu li os papers pra você não precisar (mas devia).

De onde veio isso

A Anthropic anunciou o MCP em 25 de novembro de 2024 como “um novo padrão para conectar assistentes de IA aos sistemas onde os dados vivem” [1]. O problema que ele ataca é velho conhecido de quem integra sistemas: com N aplicações e M ferramentas, você acaba escrevendo N×M integrações customizadas. Todo dev que já manteve três conectores de CRM diferentes sente essa dor no joelho quando chove.

A ideia do protocolo: cada ferramenta expõe um servidor MCP uma única vez, e qualquer cliente compatível usa. N+M em vez de N×M.

flowchart LR
  subgraph antes["Antes: N×M integrações"]
    A1[App 1] --- T1[CRM]
    A1 --- T2[Banco]
    A2[App 2] --- T1
    A2 --- T2
    A3[App 3] --- T1
    A3 --- T2
  end
  subgraph depois["Com MCP: N+M"]
    B1[App 1] --> H((MCP))
    B2[App 2] --> H
    B3[App 3] --> H
    H --> U1[CRM]
    H --> U2[Banco]
  end

E não ficou só na promessa. Em dezembro de 2025 a Anthropic doou o protocolo pra Agentic AI Foundation, fundo da Linux Foundation cofundado por Anthropic, Block e OpenAI, com apoio de Google, Microsoft, AWS, Cloudflare e Bloomberg [2]. No mesmo anúncio: mais de 10.000 servidores MCP públicos ativos e 97 milhões de downloads mensais dos SDKs [2]. A OpenAI declarou que o MCP “é parte central de como construímos, integrado no ChatGPT e na plataforma de desenvolvedores” [3]. Quando os dois maiores concorrentes do planeta assinam o mesmo protocolo, ou é padrão de verdade ou é armadilha muito elaborada.

A spec evolui por revisões datadas: 2024-11-05, 2025-03-26 (OAuth), 2025-06-18 (structured outputs, elicitation, security best practices) e 2025-11-25 [4]. Guarde isso: quando alguém disser “o MCP não faz X”, pergunte de qual revisão a pessoa está falando.

A ciência por trás (sim, tem ciência)

Tool use não nasceu com o MCP. A base acadêmica que sustenta tudo isso:

ReAct (Yao et al., ICLR 2023) mostrou que intercalar raciocínio e ação num loop reduz alucinação: no HotpotQA, a taxa de falso positivo caiu de 14% (chain-of-thought puro) pra 6% quando o modelo podia consultar uma API da Wikipedia em vez de confiar na própria memória [5]. É o loop que todo agente moderno roda até hoje.

Toolformer (Schick et al., NeurIPS 2023) ensinou um modelo a decidir sozinho qual API chamar, quando e com quais argumentos, de forma auto-supervisionada, com meia dúzia de demonstrações por ferramenta [6]. A tese de que o modelo aprende a usar ferramenta sem ser explicitamente programado pra cada uma.

Gorilla (Patil et al., 2023) finetunou um LLaMA que superou o GPT-4 em precisão de chamadas de API no benchmark APIBench, dos próprios autores [7]. Desse trabalho nasceu o Berkeley Function Calling Leaderboard, que até hoje é onde você confere se o modelo da moda sabe mesmo chamar função.

O survey de Qu et al. (Frontiers of Computer Science, 2025) organiza o campo numa taxonomia de 4 estágios que eu uso como mapa mental até em reunião comercial [8]:

flowchart LR
  U([mensagem do usuário]) --> P["Task planning: o que precisa ser feito?"]
  P --> S["Tool selection: qual ferramenta resolve?"]
  S --> C["Tool calling: chama com os argumentos certos"]
  C --> R["Response generation: incorpora o resultado e responde"]
  R -->|precisa de mais?| P
  C -.->|servidor MCP| M[("ferramentas externas")]

Onde o MCP entra nesse mapa? Nos estágios 2 e 3. Ele padroniza como as ferramentas se apresentam e como são chamadas. Os estágios 1 e 4 continuam sendo problema do seu modelo e do seu prompt. MCP não faz seu agente ficar esperto, faz ele ficar conectado. A diferença importa.

A régua prática (a parte que paga boleto)

Com a teoria no bolso, minha régua continua a mesma:

Começo com tudo no prompt. Informação estática (política de troca, horário) não precisa de ferramenta, precisa de contexto.
Promovo pra função no código quando o dado fica dinâmico ou a ação executa algo (consultar pedido, calcular frete).
Promovo pra MCP quando uma segunda peça do sistema precisa da mesma função. Antes disso, protocolo é overhead com diploma.

Um agente com duas tools não precisa de servidor MCP, precisa de duas funções. Não monte infraestrutura de protocolo pra economizar um import. O N×M só vira problema quando N e M são maiores que 1.

As limitações que sobreviveram à checagem

Fui atrás das críticas e uma parte não passou na verificação de fontes, então cito só o que a própria comunidade do protocolo reconhece por escrito:

Operações síncronas. Até setembro de 2025 o MCP era construído em torno de chamadas síncronas, complicado pra tarefas longas. A revisão 2025-11-25 endereçou com o conceito de Tasks (SEP-1686) [9].

Statefulness. A natureza stateful do protocolo dificulta escala horizontal de servidores, discussão aberta no repositório oficial e endereçada no release candidate de 2026 [9].

Segurança. A spec 2025-06-18 incluiu uma página oficial de security best practices [4]. Se você vai expor ferramentas que executam ações no mundo real, leia antes. Ferramenta que age é superfície de ataque, isso não é opinião, é aritmética.

Referências

[1] Anthropic, “Introducing the Model Context Protocol”, nov/2024. Introducing the Model Context Protocol \ Anthropic
[2] Anthropic, “Donating the Model Context Protocol and establishing of the Agentic AI Foundation”, dez/2025. Donating the Model Context Protocol and establishing the Agentic AI Foundation \ Anthropic
[3] MCP Core Maintainers, “One Year of MCP”, nov/2025. One Year of MCP: November 2025 Spec Release | Model Context Protocol Blog
[4] Spec e changelog oficiais. Key Changes - Model Context Protocol
[5] Yao et al., “ReAct: Synergizing Reasoning and Acting in Language Models”, ICLR 2023. [2210.03629] ReAct: Synergizing Reasoning and Acting in Language Models
[6] Schick et al., “Toolformer: Language Models Can Teach Themselves to Use Tools”, NeurIPS 2023. [2302.04761] Toolformer: Language Models Can Teach Themselves to Use Tools
[7] Patil et al., “Gorilla: Large Language Model Connected with Massive APIs”, 2023. [2305.15334] Gorilla: Large Language Model Connected with Massive APIs
[8] Qu et al., “Tool Learning with Large Language Models: A Survey”, Frontiers of Computer Science, 2025. [2405.17935] Tool Learning with Large Language Models: A Survey
[9] MCP, “Update on the Next MCP Protocol Version” + SEP-1686. Update on the Next MCP Protocol Release | Model Context Protocol Blog

Metodologia de quem tem TOC acadêmico: cada afirmação factual acima foi checada contra a fonte primária antes de publicar. O que não passou na checagem ficou de fora, mesmo quando a manchete era boa. Rigor é chato até o dia que te salva de compartilhar bobagem.