Vá além do entusiasmo com a IA generativa e encontre tecnologias de suporte valiosas.
Vá além do entusiasmo com a IA generativa e encontre tecnologias de suporte valiosas.
Por Arun Chandrasekaran | 14 de novembro de 2024
Embora seja verdade que há muita expectativa em torno da IA generativa, também é preciso levar em conta a rápida evolução das tecnologias e técnicas que a sustentam. Estima-se que, até 2026, mais de 80% das empresas terão utilizado APIs ou modelos de IA generativa, ou terão implementado aplicações baseadas em IA generativa em ambientes de produção, em comparação com menos de 5% em 2023.
O entusiasmo e o número de tecnologias e técnicas disponíveis podem dificultar para os responsáveis pela IA a identificação do que terá o maior impacto empresarial a curto e longo prazo. Use o Ciclo de Hype para a IA generativa e identifique inovações que você possa aproveitar de acordo com o risco que sua organização está disposta a assumir.
As tecnologias essenciais no cenário da IA generativa se enquadram em quatro categorias principais: modelos de IA generativa; ferramentas de engenharia de IA; aplicações e casos de uso; e infraestrutura e técnicas de viabilização.
Os modelos de IA pré-treinados estão evoluindo para se tornarem multimodais e estão sendo treinados com instruções para serem conversacionais. As inovações nessa categoria incluem:
Foundation models: grandes modelos de parâmetros treinados a partir de uma série de conjuntos de dados de forma autossupervisionada;
Embedding models: modelos de aprendizado de máquina (machine learning) utilizados para representar dados altamente dimensionais (como texto ou imagens) em incorporações de vetores;
Modelos de IA generativa específicos ao domínio: modelos que foram otimizados para as necessidades de indústrias específicas, funções de negócios ou conjuntos de tarefas relacionadas;
Edge GenAI: refere-se à implantação de modelos de IA generativa na borda ou próximo a ela em smartphones, computadores, dispositivos de Internet das Coisas (IoT) e servidores de borda;
Inteligência artificial geral: a inteligência (atualmente hipotética) de uma máquina que pode realizar qualquer tarefa intelectual que uma pessoa desempenha.
Um ecossistema crescente de ferramentas e técnicas de IA generativa possibilita que as organizações desenvolvam, administrem e personalizem aplicativos baseados nessa tecnologia. As inovações nessa categoria incluem:
AI TRiSM: a gestão da confiança, risco e segurança de IA (AI TRiSM) assegura governança, credibilidade, imparcialidade, confiabilidade, robustez e eficácia da IA, além da proteção de dados;
Segurança contra desinformação: um conjunto de tecnologias que abordam a desinformação para ajudar as empresas a discernir conteúdos confiáveis, proteger sua marca e resguardar sua presença online;
Modelos de orquestração de aplicativos de IA generativa: esses modelos fornecem uma camada de abstração para viabilizar o encadeamento de prompts e modelos, interface com APIs externas, recuperação de dados contextuais de fontes de dados e manutenção de estado (ou memória) em várias solicitações de modelos.
GraphRAG: esta técnica otimiza a precisão, a confiabilidade e a explicabilidade de sistemas de geração aumentada por recuperação (RAG). A abordagem utiliza grafos de conhecimento (KGs) para melhorar o recall e a precisão da recuperação, seja diretamente ao extrair fatos de um KG ou indiretamente ao otimizar outros modelos de recuperação.
O alto número de aplicações e casos de uso da IA generativa representa um grande potencial para a adoção rápida e a geração de valor comercial. Casos de uso nos setores de atendimento ao cliente, TI e marketing são destaque. As inovações nessa categoria incluem:
Assistentes virtuais habilitados por IA generativa: esta nova geração de assistentes virtuais (VAs) utiliza grandes modelos de linguagem (LLMs) para disponibilizar funcionalidades não obtidas com a tecnologia convencional de IA conversacional;
Aplicativos habilitados por IA generativa: esta tecnologia utiliza IA generativa para melhorar a experiência do usuário (UX) e aprimorar as tarefas, acelerando e faciliando a obtenção dos resultados desejados de um usuário;
Engenharia de software aprimorada por IA: a utilização de tecnologias de inteligência artificial para auxiliar engenheiros de software ao longo do ciclo de vida útil do desenvolvimento de programas. Inclui criação, validação, proteção, implantação e manutenção de aplicativos;
Agentes autônomos: sistemas combinados que alcançam metas definidas sem intervenção humana. Eles utilizam uma série de técnicas de IA para identificar padrões em seu ambiente, tomar decisões, desempenhar uma sequência de ações e gerar resultados;
Dados sintéticos: uma categoria de dados gerados artificialmente, e não obtidos a partir de observações diretas do mundo real. Os dados sintéticos utilizam um proxy para dados reais em uma ampla gama de casos de uso, incluindo anonimização de dados.
A IA generativa existe e avançará graças a novas técnicas e inúmeras práticas anteriores de IA. Enquanto isso, a infraestrutura especializada, incluindo supercomputadores poderosos, acelerará o treinamento do modelo e o processo de inferência. As inovações nessa categoria incluem:
Aceleradores da carga de trabalho de IA generativa: chips que operam com uma CPU e respaldam operações de processamento altamente paralelas para desenvolver (treinar) e executar (inferir) aplicativos com base em grandes modelos de IA generativa;
Simulação de IA: a aplicação combinada de IA e tecnologias de simulação para desenvolver conjuntamente agentes de IA e os ambientes simulados nos quais eles podem ser treinados, testados e, às vezes, implantados;
Supercomputação baseada em IA: um domínio em rápida evolução no qual sistemas de supercomputação projetados especificamente combinam inovações de ponta em aceleradores computacionais, software especializado, redes de alta velocidade e armazenamento otimizado para desempenho. Esses elementos criam uma plataforma integrada que acelera o treinamento e a implantação de modelos de IA complexos e intensivos em computação;
Aprendizagem autossupervisionada: uma abordagem de aprendizado de máquina (ML) em que rótulos ou sinais de supervisão são criados a partir dos próprios dados, eliminando a dependência de dados de resultados históricos ou de supervisores (humanos) externos para fornecer rótulos ou feedback;
Aprendizado por transferência: uma técnica que reutiliza modelos de ML treinados anteriormente como um ponto de partida avançado para novas tarefas. O objetivo é reduzir o tempo de aprendizado e os dados exigidos para que o desempenho de tais tarefas seja aceitável.
O Hype Cycle para IA generativa é uma representação gráfica criada pelo Gartner que analisa a maturidade, as métricas de adoção e o impacto comercial dessa tecnologia. O recurso auxilia CIOs e outros líderes de TI a identificar inovações da IA generativa a serem exploradas de acordo com seu apetite por risco em busca de eventuais recompensas.
Descubra o Futuro com as Conferências Gartner!
Embarque em uma jornada de inovação em 2025 e participe das conferências que moldarão o futuro da tecnologia e dos negócios:
📌Conferência Gartner Data & Analytics | 28 e 29 de abril de 2025
📌Conferência Gartner Segurança & Gestão de Risco | 5 e 6 de agosto de 2025
📌Conferência Gartner CIO & IT Executive | 22 a 24 de setembro de 2025
Não perca a chance de liderar o futuro!