IA vertical supera genérica quando há volume, repetição e dados proprietários
A sabedoria convencional é usar os melhores modelos de IA disponíveis (GPT, Claude, Gemini) para resolver qualquer problema. Para muitos casos isso faz sentido. Mas quando existe volume massivo, padrões altamente repetíveis e dados proprietários relevantes, um modelo vertical treinado especificamente para aquele domínio pode ser simultaneamente mais barato E mais eficaz.
O caso do iFood / Prosus
Large Commerce Model (LCM): modelo desenvolvido com dados de 500M+ usuários e 10T+ tokens, focado especificamente em e-commerce.
Performance vs. modelos proprietários genéricos:
- 60x mais barato que modelos genéricos de classe equivalente
- Desempenho superior em tarefas de e-commerce
Resultados em produção (Ailo — assistente de pedidos):
- 48% mais chance de uma busca virar pedido vs. fluxo tradicional
- 33% menos tempo para finalizar um pedido no WhatsApp
- Push notifications: 4x mais pedidos
- Recomendações: +66% de conversão
- Busca em farmácia: +4.6% de pedidos
O insight central:
“Quando a tarefa é essa [entender intenção de compra com milhões de usuários, cardápios, histórico, horário, localização, desconto, tempo de entrega e chance real de conversão], a melhor IA talvez seja a que sabe menos sobre o mundo e mais sobre o seu negócio.”
Por que acontece
Modelos genéricos são otimizados para desempenho geral em uma variedade enorme de tarefas. Isso vem com custos cognitivos (parâmetros, memória, computação) que são desnecessários para tarefas repetíveis e bem definidas.
Quando você tem:
- Volume massivo — milhões de interações/dia
- Padrões repetíveis — a tarefa é sempre variação do mesmo problema
- Dados proprietários — comportamento específico dos seus usuários que nenhum modelo genérico tem
…o tradeoff muda: um modelo menor e mais especializado pode fazer a mesma tarefa melhor, mais rápido e com fração do custo.
O approach híbrido do iFood
A solução não foi abandonar modelos genéricos — foi parar de tratá-los como resposta universal.
“Em algumas partes do fluxo, faz sentido alugar inteligência de fronteira. Em outras, especialmente quando existe volume, repetição e dados proprietários, pagar a mesma tarifa cognitiva para cada microdecisão começa a não fazer sentido.”
O iFood usa arquitetura híbrida: Anthropic + OpenAI + AWS para combinar precisão, velocidade e segurança — com o LCM cobrindo as partes de maior volume e maior repetição.
A implicação estratégica
Ter dados proprietários relevantes + capacidade técnica de treinar modelos específicos = uma forma de ativo estratégico no cenário de IA.
Isso complementa e qualifica o argumento de [[IA muda a lógica da vantagem competitiva baseada em expertise]]: a expertise que a IA não commoditiza é a expertise de domínio + dados proprietários que fundamentam modelos verticais.
Conexões
- Complementa: IA muda a lógica da vantagem competitiva baseada em expertise
- Contexto: Ativo Estratégico — modelo vertical treinado com dados proprietários é um ativo estratégico difícil de replicar
- Relacionado: Triple Product da IA — o modelo do iFood exemplifica o triple product (eficiência operacional + workforce produtiva + crescimento com foco nítido)
- Contraste: IA como Colega Reduz Sociabilidade e Performance do Time — IA como ferramenta especializada vs. IA como colega de time