A implantação em massa de IA está cada vez mais próxima, com empresas planejando colocar em prática os investimentos de 2024. A PwC estima que a IA pode injetar US$ 15,7 trilhões na economia global até 2030, impulsionando o PIB da América do Norte em quase 15%. Mas, para que esses investimentos gerem retorno, é crucial entender os custos envolvidos, tanto os diretos quanto os “ocultos”.
Empresas, conselhos e investidores estão de olho no retorno sobre o investimento em IA. Por isso, compreender os resultados e os investimentos em IA é mais importante do que nunca.
Desde a integração e o dimensionamento até a coleta intensiva de dados, desenvolvimento e treinamento, quais são os custos óbvios e menos compreendidos que as empresas devem estar preparadas para enfrentar durante esta próxima fase de implantação em massa de IA?
IA On-Premise ou como Serviço?
Uma das razões pelas quais muitos ainda não compreendem a estrutura de custos da IA é porque ela é frequentemente consumida como serviço. Tal como a computação em nuvem, isto permite às empresas aumentar e diminuir convenientemente a sua utilização de IA conforme necessário. Elas podem concentrar-se na sua missão principal e terceirizar despesas de capital de apoio, manutenção e outros custos para fornecedores que beneficiam de economias de escala.
Hoje, as empresas que usam IA dessa forma normalmente pagam um preço acordado por token. Por exemplo, vários dos novos modelos Granite 3.0 da IBM custam vinte cêntimos por milhão de tokens. Esse preço é amplamente impulsionado pelo tamanho de um modelo (ou seja, seu tamanho de parâmetro) e pela quantidade de computação necessária para produzir uma saída. No entanto, a falta de uma compreensão mais profunda do que impulsiona os custos de IA pode levar as empresas a otimizar suas decisões de modelo e plataforma, inibindo sua capacidade de impulsionar o ROI da IA.
Leia também:
Por exemplo, uma empresa pode implantar IA “on-premise” usando servidores GPU que possui e opera para potencialmente reduzir seus custos totais de computação à medida que dimensiona seus casos de uso, mas o custo inicial para adquirir e gerenciar recursos de computação seria irreversível – não aqueles que você aumenta ou diminui. Um punhado de GPUs para inferência pode custar US$ 150.000; a compensação pelo talento para construir e manter esses clusters de GPU pode adicionar outros US$ 500.000, e isso seria apenas um pequeno pagamento inicial nos custos contínuos de treinamento, energia, operacionais e de manutenção.
Uma alternativa interessante para quem busca custo benefício é adquirir uma GPU.
Este exemplo explica por que a maioria das empresas ignora os custos iniciais e escolhe a IA como um serviço. Também destrinça algumas das peças que podem tornar a IA mais ou menos cara – o primeiro passo para uma melhor compreensão do ROI da inteligência artificial.
A Escolha do Modelo na Implantação em Massa de IA
Existem três custos diretos óbvios ao consumir IA.
Primeiro, é o custo de “inferência” ou uso ativo do modelo. Se estiver usando IA como serviço, os preços de tabela geralmente mudam de acordo com o tamanho do modelo. O mesmo vale se você usar seu próprio modelo personalizado, um modelo comercial ou um de código aberto. Os custos de inferência variam com base na eficiência do hardware, mas, para modelos comerciais e de código aberto, os grandes geralmente resultam em custos contínuos mais altos. Escolher um modelo dimensionado para realizar o que você precisa – e não superdimensionado para mais – é fundamental para minimizar os custos.
O segundo é o ajuste do modelo – ou personalização de um modelo “pronto para uso” com os dados e necessidades específicas da sua empresa. Métodos de personalização de modelo como prompt engineering, RAG, ajuste fino completo ou ajuste com eficiência de parâmetro (PEFT) têm cada um custos, benefícios e cronogramas diferentes. Como afinar um violão, esta é uma prática regular que garante que sua IA esteja levando em consideração os melhores e mais recentes dados para fornecer a melodia harmonizada para sua tarefa.
O custo do ajuste depende de quanta computação é necessária para realizar a operação, normalmente cobrada por hora de computação, com a taxa horária dependente do tipo de GPU usada. Portanto, quanto maior o modelo, maior o custo de ajuste. Para alcançar o método de ajuste mais econômico, os líderes devem considerar personalizar modelos menores e confiáveis com dados corporativos proprietários para domínios específicos – idealmente encontrando um “ponto ideal” do menor modelo possível que possa ser ajustado para lidar com eficácia com as necessidades de negócios. Por exemplo, um modelo 3B adaptado para uma tarefa empresarial específica pode custar 100X menos do que um modelo 100X maior e atingir ou exceder o desempenho sem gastar muito.
O terceiro custo óbvio envolve o desenvolvimento de aplicações e a integração desses modelos em sua pilha, o que traz outra camada de custos de desenvolvimento e implantação.
Esses custos diretos são fatores importantes, mas não são abrangentes. Vários outros custos e benefícios “ocultos” envolvidos na implementação da IA também devem ser considerados. Um exemplo é o custo de não garantir uma implementação responsável da IA, em particular em ambientes altamente regulamentados.
Os Custos Escondidos dos Riscos e da Reputação na Implantação em Massa de IA
Em 2023, os EUA tinham 25 regulamentos federais de IA – acima de apenas um 5 anos antes – e 181 projetos de lei relacionados à IA propostos. Globalmente, as menções de IA em processos legislativos quase dobraram em 2023, para quase 2.200. À medida que a adoção da IA aumentou, também aumentaram as preocupações legais, de conformidade e éticas.
Não cumprir os regulamentos pode resultar em custos pesados para as empresas, o que torna essencial examinar cuidadosamente as limitações e os riscos conhecidos associados aos modelos básicos e mitigá-los adequadamente quando aplicável. Isso tem um preço, no entanto. Muitos modelos estão associados a licenças personalizadas complicadas que exigem uma análise completa por uma equipe jurídica. Entre os modelos de IA de código aberto, alguns usam a conhecida licença Apache 2.0, com a qual as equipes jurídicas estão familiarizadas há 20 anos. Outros modelos usam licenças personalizadas totalmente novas, que, no mínimo, exigem uma análise demorada por equipes jurídicas que podem potencialmente se traduzir em custos adicionais.
A falta de transparência em torno dos dados e do processo de treinamento do modelo também pode levar a custos ocultos, resultando potencialmente em infração de PI e, por sua vez, expondo as empresas a litígios dispendiosos. A transparência em torno dos dados também é vital para rastrear e gerenciar a saída e o comportamento do modelo. É essencial que as empresas entendam por que uma saída de IA ocorre e, o mais importante, lhes dêem espaço para corrigi-la ou melhorá-la.
A busca por modelos de IA mais transparentes tem levado ao desenvolvimento de novas ferramentas. O Google lançou recentemente uma busca visual no iPhone que busca trazer mais clareza para os usuários.
A IA transparente e explicável também ajuda a garantir que os dados estejam livres de erros, preconceitos e conteúdo odioso ou abusivo.
Problemas de dados são um dos muitos que, se não forem gerenciados adequadamente, podem potencialmente aumentar os riscos de reputação.
Já houve escândalos de IA resultando em milhões perdidos, percepções públicas alteradas e confiança reduzida do investidor. A IA pode e deve ser usada para impulsionar o valor dos negócios, mas sem aumentar o risco de custos desnecessários em outros lugares. Alguns modelos de IA indenizam os usuários contra riscos de dados – mas outros não.
Para não cair em nenhuma cilada, uma dica interessante é ter em mente 9 dicas para remover anúncios do seu celular, evitando assim clicar em anúncios maliciosos.
A Aterrissagem da Implantação em Massa de IA
Ainda estamos nas primeiras entradas da inteligência artificial. As empresas de VC e os inovadores de IA estão adotando uma abordagem de laissez-faire para a monetização, e os investimentos continuam a fluir. Mas, para as empresas, agora é o momento de entender os custos totais – diretos e indiretos – da inteligência artificial.
Tal como a própria tecnologia, os modelos de preços e o cenário de produtos estão evoluindo diariamente. Mas com insights sobre a estrutura de custos, os líderes de negócios podem entender melhor as compensações. Eles podem entender melhor os benefícios, os potenciais retornos e quais variáveis podem ser ajustadas. Mais importante ainda, eles podem saber as perguntas certas a fazer e fazer escolhas que levam a valor claro e retorno sobre o investimento no próximo ano e além.
Diante de tantas opções no mercado, uma alternativa interessante é acompanhar quais são os melhores iPhones para 2025, buscando sempre as melhores opções do mercado.
Este conteúdo foi auxiliado por Inteligência Artificiado, mas escrito e revisado por um humano.
Via AI Business