Com as empresas de tecnologia correndo para desenvolver modelos de IA de ponta, as manchetes sobre gastos em infraestrutura de IA dominam o debate. Ao mesmo tempo, alguns dos primeiros a adotar modelos de negócios de IA generativa questionam os benefícios do uso da IA. É crucial avaliar o valor econômico criado por esses investimentos e as fontes de geração de valor nas empresas de IA generativa. Para isso, é preciso primeiro entender a cadeia de valor da IA e, em seguida, identificar as oportunidades de monetização existentes. Uma cadeia de valor de IA é a sequência de atividades e camadas necessárias para transformar recursos computacionais brutos e dados em produtos e serviços com tecnologia de IA que entregam valor aos usuários finais. Ela representa o processo completo de criação, implantação e captura de valor da inteligência artificial. Rohini Chakravarthy, sócia-gerente da NewBuild Venture Capital, abordou as fontes de geração de valor com novas tecnologias. Discutimos a ideia de um "trilho de inovação" de IA – serviços de infraestrutura (que incluem conhecimento de IA, capacidades de execução e um modelo de negócios de consumo) de várias empresas – que coloca em movimento aplicações que priorizam a IA. As aplicações trazem contexto de áreas como cadeia de suprimentos, finanças ou marketing e reutilizam o trilho de inovação de IA para fornecer valor rapidamente.
A cadeia de valor da IA pode ser caracterizada como uma pilha de várias
camadas com componentes distintos, mas interdependentes. Primeiro, há uma camada de infraestrutura central. Na base, há computação e hardware - principalmente chips especializados (GPUs, TPUs, aceleradores de IA personalizados) de empresas como NVIDIA, AMD e Google. Os provedores de nuvem (AWS, Azure, GCP) empacotam essa computação em infraestrutura acessível. A próxima é a camada de modelo que inclui modelos de base - modelos de linguagem grandes, geradores de imagens, modelos de vídeo, etc. As empresas aqui vão desde OpenAI, Anthropic e Google até esforços de código aberto como o Llama da Meta. A terceira camada é a camada de plataforma/middleware, onde há orquestração de valor entre modelos brutos e aplicações. São serviços como bancos de dados vetoriais (Pinecone, Weaviate), plataformas de implantação de modelos, ferramentas de gerenciamento de prompts e gateways de API. Essa camada torna os modelos de IA práticos de usar em escala. Finalmente, temos uma camada de aplicação onde aplicações de usuário final são construídas sobre as camadas de infraestrutura subjacentes. Isso pode variar de assistentes de codificação (GitHub Copilot) a ferramentas de criação de conteúdo, chatbots de atendimento ao cliente e soluções verticais específicas para saúde, direito, finanças, etc.
Gerações anteriores de inovações tecnológicas oferecem paralelos com a estrutura da indústria de IA e apontam para as fontes de captura e criação de valor no mundo da IA. Em particular, a cadeia de valor da IA tem alguns paralelos notáveis com a geração inicial de provedores de computação em nuvem. Antes da nuvem, os fornecedores de infraestrutura vendiam edições corporativas de software de código aberto, e os desenvolvedores de aplicações tinham que construir sua própria infraestrutura para reutilizar o conhecimento em seus contextos. A nuvem possibilitou diferentes tipos de modelos de preços baseados em consumo, ou seja, "pagar pelos resultados" e "pagar apenas pela infraestrutura usada". A computação em nuvem permitiu uma mudança para modelos baseados em consumo, onde os clientes pagam com base nas horas de computação, armazenamento consumido ou largura de banda da rede utilizada. Por exemplo, o AWS EC2 cobra por segundo/minuto de computação. Com a IA generativa, os clientes pagam com base nos tokens processados (entrada + saída), chamadas de API ou horas de inferência do modelo. Alguns provedores também oferecem "capacidade reservada" (como os acordos corporativos da OpenAI ou os planos de acesso a modelos da Anthropic).
A computação em nuvem também viu o surgimento do modelo de plataforma como serviço, onde a estratégia de monetização da AWS, Azure, GCP era oferecer infraestrutura escalável como um serviço, abstraindo o hardware e as operações. Provedores de IA generativa como OpenAI, Anthropic e Cohere fornecem LLM como serviço ou APIs de modelo, abstraindo o treinamento e a manutenção do modelo. Isso espelha a filosofia da nuvem de "alugar em vez de construir". Ambos os paradigmas ofereceram preços em camadas e modelos freemium que tornam econômico para os desenvolvedores de aplicações implementar rapidamente novas ideias. Os modelos de computação em nuvem ofereciam camadas como créditos gratuitos, planos para desenvolvedores, suporte corporativo, descontos por volume. Para GenAI, pode haver preços em camadas semelhantes, onde os provedores podem oferecer acesso gratuito com uso limitado (como o nível gratuito do ChatGPT) e descontos de API corporativos para clientes de alto volume. Embora esses serviços de infraestrutura fundamentais sejam fáceis de adotar, ambas as cadeias de valor têm bloqueios de ecossistema. Os custos de mudança com os provedores de nuvem são altos devido a ferramentas proprietárias e desafios de integração de dados. Os modelos de IA generativa criam bloqueio devido às complexidades do ajuste fino e da integração em fluxos de trabalho. Os clientes geralmente permanecem com um provedor depois de adaptar prompts, pipelines ou proteções de segurança. Para os provedores de infraestrutura, ambos os modelos têm economias de escala e escopo. Com a computação em nuvem, as margens melhoram com a escala porque os custos fixos de infraestrutura são distribuídos por mais uso. Da mesma forma, para modelos de IA generativa, o custo do treinamento do modelo é extremamente caro antecipadamente, mas a inferência se torna mais barata à medida que o uso escala. Os provedores dependem da alta utilização de GPUs/TPUs para fazer a economia funcionar, assim como a utilização de data centers em nuvem. Ambos os modelos parecem oferecer vários modelos de entrega, como IA no local, atrás do firewall corporativo, modelos baseados em nuvem híbrida, etc. A OpenAI parece entender esse paralelo, pois está se movendo para construir sua própria pilha corporativa. Enquanto os fornecedores de nuvem ofereciam nuvens privadas para lidar com as preocupações de segurança das empresas, os fornecedores de IA poderiam adotar abordagens semelhantes adaptadas às necessidades das empresas. Embora a maior parte do hype da IA esteja centrada nos provedores de capacidades de IA de ponta, startups e empresas que buscam usar a IA para criação de valor precisam entender onde as margens existem e onde os pontos de alavancagem estratégica estão na cadeia de valor da IA.
📝 Sobre este conteúdo
Esta matéria foi adaptada e reescrita pela equipe editorial do TudoAquiUSA
com base em reportagem publicada em
Forbes
. O texto foi modificado para melhor atender nosso público, mantendo a precisão
factual.
Veja o artigo original aqui.
0 Comentários
Entre para comentar
Use sua conta Google para participar da discussão.
Política de Privacidade
Carregando comentários...
Escolha seus interesses
Receba notificações personalizadas