Categorias do Site

Roteamento de IA: Apps mais inteligentes com SDK

Aprenda a usar o roteamento de modelos sensível ao ambiente para criar apps de IA mais eficientes com o AI SDK.

Círculo preto central com um triângulo branco sobre fundo que se assemelha a uma nuvem rosa gradientemente colorida.

Se você está desenvolvendo aplicações de IA, provavelmente está lidando com mais de um modelo de linguagem em sua aplicação: GPT-4 para tarefas gerais, Claude para codificação ou até mesmo o mais recente Nano Banana para geração de imagens. Durante o desenvolvimento, você pode querer experimentar modelos de código aberto localmente, caso seu hardware suporte.

No entanto, definir manualmente cada instância de modelo em toda a sua aplicação pode rapidamente tornar seu código desorganizado. E quando chega a hora de implantar em produção e usar modelos de última geração na nuvem, a última coisa que você gostaria é reescrever metade do seu código.

Neste artigo, mostramos um padrão útil para rotear chamadas de LLM de maneira “sensível ao ambiente”, usando o middleware do AI SDK. A ideia é simples: o ambiente da aplicação (dev ou prod) decide se as consultas LLM são enviadas para um modelo local (como Llama 3.2) ou um modelo de produção (GPT-5).

Ao final, teremos uma aplicação de chatbot simples com roteamento de modelo sensível ao ambiente para cada solicitação ao LLM:

roteamento de modelo sensível ao ambiente para LLMs

O roteamento sensível ao ambiente oferece várias vantagens, como a gestão consistente de configuração, flexibilidade para experimentação e redução de custos, além de privacidade. Executar modelos localmente pode ajudar a reduzir custos e é mais privado, pois suas conversas não são armazenadas em um banco de dados na nuvem. Isso é especialmente útil durante o desenvolvimento, já que você não quer gastar o orçamento do modelo de produção enquanto depura.

Para começar, vamos configurar um modelo local usando o Ollama, uma ferramenta para baixar e executar modelos de linguagem de código aberto localmente em seu computador. Funciona em Windows, macOS e Linux. Você pode até criar sua própria versão local do ChatGPT.

Após configurar o Ollama, é hora de integrar o AI SDK com Next.js. Vamos criar um novo projeto Next.js e integrar o AI SDK. O AI SDK é um framework de agente TypeScript que torna o trabalho com diferentes modelos de linguagem consistente, independentemente de serem modelos na nuvem ou locais.

Vamos configurar o middleware do AI SDK, criando um arquivo que inicializa tanto modelos locais quanto de produção. O middleware intercepta e modifica solicitações antes de serem executadas, permitindo centralizar toda a lógica de roteamento de modelos em arquivos dedicados.

Finalmente, com o modelo pronto, criamos uma rota de API para lidar com mensagens de chat. A interface de chat se mantém inalterada, apenas o middleware lida com as diferenças entre os modelos locais e na nuvem.

Esse padrão de arquitetura flexível separa preocupações de forma clara e escala conforme suas necessidades. À medida que você desenvolve mais recursos baseados em IA, esse padrão sensível ao ambiente se torna uma base sólida para construir. As tecnologias de IA evoluem rapidamente, mas bons padrões arquiteturais são atemporais.

  • Enfrentando a Complexidade com GraphQL

    Descubra como GraphQL facilita o desenvolvimento de soluções inteligentes com IA.

    Descubra como GraphQL facilita o desenvolvimento de soluções inteligentes com IA.

    Ler notícia completa
    Banner de podcast da UX Magazine intitulado
  • UX: Emoções Além das Telas no Design

    Descubra como o design emocional transforma experiências, indo além das telas e criando conexões humanas.

    Descubra como o design emocional transforma experiências, indo além das telas e criando conexões humanas.

    Ler notícia completa
    Símbolo abstrato em tons de marrom e laranja que se assemelha a uma pessoa estilizada com braços estendidos e uma perna erguida.
  • Como usar CSS line-clamp para limitar texto

    Aprenda a usar a propriedade CSS line-clamp para limitar linhas de texto e melhorar a aparência do layout.

    Aprenda a usar a propriedade CSS line-clamp para limitar linhas de texto e melhorar a aparência do layout.

    Ler notícia completa
    Fundo gradiente em tons de laranja e violeta com o texto
  • Promise.all ainda é relevante em 2025?

    Antes das promises serem introduzidas nativamente no JavaScript, usávamos muitos callbacks para tarefas assíncronas. É comum ver callbacks sendo usados, pois muitos desenvolvedores podem ainda pensar que callbacks e promises são o mesmo, mas não são. Quando promises foram introduzidas, substituíram amplamente os callbacks, tornando a sintaxe mais compreensível. Em 2025, com async/await, Promise.allSettled, Promise.any […]

    Promise.all é crucial para tarefas assíncronas, mas novas alternativas surgem em 2025. Saiba quando usá-lo.

    Ler notícia completa
    Logotipo do JavaScript (JS) em quadrado amarelo sobre fundo com ondas suaves em tons de branco e cinza claro.
  • Equilibrando IA e UX: O Desafio do Design Humanizado

    A IA está sendo integrada aos fluxos de trabalho de design modernos, ajudando na geração de conteúdo, ideação e prototipagem. Isso aumenta a eficiência das equipes de design, aprimorando a forma como criamos, pensamos e resolvemos problemas. No entanto, a IA também traz preocupações ao processo de design, como a possível perda de foco no […]

    Descubra como manter o design UX humanizado enquanto utiliza IA para otimizar processos e aumentar a produtividade.

    Ler notícia completa
    Mão robótica branca tocando a ponta do dedo de uma mão humana contra um fundo colorido em tons de arco-íris.
  • A Revolução dos Navegadores com IA: Impactos e Futuro

    Há uma revolução silenciosa ocorrendo em um software que você usa diariamente, mas raramente pensa sobre: o navegador. Chrome, Safari, Firefox têm sido nossas janelas para a web por décadas. Agora, algo significativo está acontecendo. Uma nova espécie de navegador está surgindo: o navegador com IA. Ele não apenas muda como navegamos, mas redefine o […]

    Navegadores com IA estão mudando a web, impactando a criatividade, economia e verdade online.

    Ler notícia completa
    Tela de interface do Instacart mostrando produtos essenciais para praia à venda, como protetor solar e toalhas, com uma janela de chat com o assistente virtual aberta.
  • As 3 previsões para o futuro do design UX

    A evolução tecnológica moderniza e melhora todas as áreas da tecnologia, incluindo o design de dispositivos digitais, automação, desenvolvimento de software e design UI/UX. Essa evolução e as inovações em HCI (Interação Humano-Computador) impulsionam o design UI/UX para ajudar designers a criar produtos digitais mais amigáveis, usáveis e produtivos para todos os usuários. O design […]

    Confira as três principais previsões para a próxima era do design UX e como elas podem impactar o futuro das interfaces digitais.

    Ler notícia completa
    Ilustração em 3D de um computador desktop moderno com ícones em estilo futurista na tela, sobre fundo roxo com linhas de rede digitais.
  • A Importância do Enquadramento no Design

    No design, o enquadramento do problema está se tornando o cerne do papel humano. À medida que a IA, ou o que chamo de Programa, assume mais o trabalho de solução, nosso ofício muda para como tratamos o problema. “A IA não está substituindo designers; está substituindo designers que focam em saídas automatizáveis.” Citação e […]

    Explorando como o enquadramento de problemas redefine o papel humano no design em tempos de IA.

    Ler notícia completa
    Imagem de rabisco em preto e branco cheia de palavras e desenhos, incluindo cabeças estilizadas, uma palavra
  • Psicologia Ética no E-commerce: Facilite Compras

    A psicologia no e-commerce tem uma má reputação, muitas vezes associada a táticas de manipulação como escassez artificial e cobranças ocultas. No entanto, existe um lado positivo: a facilitação das compras sem manipulação. Trabalhando anos com e-commerce, percebi que a maioria dos problemas de conversão está em facilitar o processo de compra. Vou mostrar quatro […]

    Aprenda como remover barreiras psicológicas no e-commerce, promovendo compras éticas sem manipulação.

    Ler notícia completa
    Ilustração de um trator removendo neve da estrada, com carros vermelhos parcialmente cobertos de neve ao lado. Ambiente frio com árvores ao fundo.