Para colher os frutos das iniciativas voltadas para IA, é imprescindível que os dados estejam prontos para essa tecnologia. Entenda como fazer isso e siga cinco etapas para se preparar.
Para colher os frutos das iniciativas voltadas para IA, é imprescindível que os dados estejam prontos para essa tecnologia. Entenda como fazer isso e siga cinco etapas para se preparar.
Por Rita Sallam | 21 de outubro de 2024
Os líderes em análise de dados (dados e analytics) precisam assegurar que os dados de suas organizações estejam preparados para um número crescente de iniciativas focadas em IA. Contudo, há várias diferenças entre os requisitos para dados prontos para IA e a gestão de dados tradicional.
Para preencher essa lacuna, o Gartner recomenda as seguintes etapas:
Avalie suas necessidades relacionadas a dados de acordo com os casos de uso de IA;
Apresente os requisitos à diretoria e busque apoio;
Aprimore as práticas de gestão de dados;
Amplie o ecossistema da gestão de dados;
Expanda e administre.
Essa diretriz garantirá que seus dados estejam prontos para uso nas iniciativas específicas de IA que você pretende colocar em prática, além de assegurar que as partes interessadas compreendam o que isso significa.
Confira também: Esteja pronto para a IA – o que os líderes precisam saber e fazer para saber mais sobre como mapear os casos de uso das oportunidades propiciadas pela IA.
É possível atestar a prontidão para cumprir os requisitos de IA ao alinhar os dados aos casos de uso e, em seguida, qualificá-los, além de demonstrar a governança apropriada. Responder as três perguntas a seguir pode ser útil.
Todo caso de uso de IA deve descrever de quais dados necessita, o que também dependerá da técnica utilizada. Esses detalhes talvez não estejam totalmente definidos no início do processo, mas vão surgir à medida que os dados forem utilizados e que os requisitos de IA forem cumpridos. Aprofunde-se em requisitos como:
Técnicas de IA: diferentes técnicas de IA, como IA generativa ou modelos de simulação, têm requisitos para dados específicos;
Quantificação: garanta um volume de dados suficiente, considerando padrões como sazonalidade;
Semântica e rotulagem: a anotação e a rotulagem adequadas, principalmente para imagens e vídeos, são fundamentais;
Diversidade: incorpore fontes de dados variadas para minimizar o viés;
Linhagem: mantenha a transparência em relação às origens e transformações dos dados.
Qualificar o uso assegura que os dados cumpram os requisitos continuamente, seja para fins de treinamento, desenvolvimento ou execução de um modelo nas operações. Utilize os parâmetros a seguir para garantir que os dados atendam aos requisitos de confiabilidade esperados para casos de uso de IA:
Validação e verificação: garanta que os dados atendam regularmente aos requisitos durante o desenvolvimento e as operações;
Desempenho e custo: os dados devem cumprir acordos de nível de serviço operacional, abrangendo tempo de resposta e eficiência de custos;
Versionamento: monitore e gerencie diferentes versões dos dados para lidar com desvios do modelo e problemas no pipeline;
Testes contínuos de regressão: desenvolva casos de teste para detectar falhas e desvios dos dados;
Métricas de observabilidade: monitore a integridade dos dados, incluindo entrega oportuna e precisão.
Defina os requisitos contínuos de governança de dados que os dados devem cumprir para respaldar o caso de uso de IA utilizando parâmetros como:
Administração de dados: imponha políticas ao longo do ciclo de vida útil dos dados, abrangendo acesso e desenvolvimento do modelo;
Normas e regulamentações: cumpra as regulamentações de IA em constante atualização, como a Lei de IA da UE e o Regulamento Geral de Proteção de Dados da União Europeia (GDPR);
Ética em IA: aborde considerações éticas, como o uso de dados de clientes reais para treinamento;
Inferência e derivação controladas: monitore como os modelos interagem e assegure a governança;
Viés e imparcialidade dos dados: gerencie proativamente o viés dos dados e teste modelos com conjuntos divergentes de dados;
Compartilhamento de dados: viabilize o compartilhamento de dados e metadados para apoiar diversos casos de uso de IA.
Com base em inúmeras interações com clientes que alcançaram o sucesso na implementação de iniciativas de dados prontos para IA, o Gartner recomenda cinco etapas para líderes de D&A na jornada rumo à prontidão para a inteligência artificial.
Avalie a prontidão da gestão de dados: analise o estado atual de suas práticas de gestão de dados para identificar lacunas e áreas de melhoria;
Obtenha apoio da diretoria: garanta o suporte e o alinhamento executivos para assegurar o compromisso e os recursos necessários para as iniciativas voltadas para IA;
Aprimore as práticas de gestão de dados: adapte e aperfeiçoe as estratégias de gestão de dados para cumprir os requisitos específicos dos dados prontos para IA;
Amplie o ecossistema de dados: aumente sua infraestrutura de dados e seus recursos para apoiar casos de uso de IA diversificados e expansíveis;
Expanda e administre: implemente modelos robustos de governança de dados para garantir a qualidade dos dados, a conformidade e o uso ético à medida que suas iniciativas voltadas à IA se ampliam.
Os dados prontos para IA devem ser representativos do caso de uso, de cada padrão, erros, descobertas inesperadas e desvios necessários para treinar ou executar um modelo de IA para determinada utilização. É uma prática e um processo baseados na disponibilidade dos metadados para alinhar, qualificar e administrar os dados.
Não há como preparar os dados para IA em linhas gerais ou com antecedência. A prontidão dos dados para IA depende da forma como os dados serão utilizados. Por exemplo, conjuntos de dados muito diferentes seriam necessários para desenvolver um algoritmo de manutenção preditiva em vez de aplicar a IA generativa aos dados empresariais.
Dados de “alta qualidade”, considerando-se os padrões tradicionais de qualidade dos dados, não equivalem a dados prontos para IA. Quando pensamos nos dados no contexto da análise, por exemplo, espera-se que os desvios sejam eliminados ou que os dados sejam purgados para corroborar as expectativas dos usuários. Porém, ao treinarmos um algoritmo, ele precisará de dados representativos, que também poderão incluir dados de má qualidade.
Conferência Gartner Data & Analytics
Transforme o futuro da sua organização! Nos dias 28 e 29 de abril de 2025, em São Paulo, mergulhe em estratégias de Data & Analytics, tendências emergentes, IA generativa e muito mais. Não perca esta oportunidade única de inovação e aprendizado.
Descubra os principais destaques do que vai acontecer na conferência e garanta o seu lugar!