Dados não estruturados são o combustível ideal para os modelos de IA generativa

Enquanto grande parte do mercado B2C concentra a sua atenção nas mais recentes ferramentas de IA, a vantagem competitiva está a ser decidida nos dados de entrada: imagens, vídeos, voz e sinais de comportamento que permitem automatizar e personalizar melhor, apesar de a maioria dos responsáveis pela IA continuar a pensar que apenas os dados estruturados encontrados nas bases de dados têm valor.
21 de Outubro, 2025

Brendan Witcher, analista da Forrester Research, assina um artigo no site da empresa que valoriza o uso de dados não estruturados para dar verdadeiro potencial aos modelos de inteligência artificial implementados nas empresas.

Os dados não estruturados são todos aqueles dados digitais que não seguem um padrão estruturado de conjunto; por exemplo, uma agenda de contactos com uma série de campos como nome, empresa, número de telefone fixo, telemóvel, e-mail, etc., constituiria uma série de dados estruturados, uma vez que o facto de cada indivíduo estar representado por valores nesses campos nos proporciona uma estrutura, uma base de dados.

Entre os dados não estruturados temos o e-mail (referindo-nos ao seu conteúdo), os documentos de texto (também no que diz respeito ao seu conteúdo), folhas de cálculo (uma vez que cada uma está formatada à sua maneira e possui a sua própria estrutura e dados) ou imagens.

Segundo Witcher, até agora, a informação não estruturada tem sido pouco utilizada devido a limitações técnicas e, além disso, 70% dos responsáveis pela tomada de decisões em matéria de IA para as empresas ainda acreditam que os modelos preditivos só podem ser treinados com dados estruturados, uma ideia que limita o potencial das suas iniciativas.

Os modelos de IA aprendem com todo o material com o qual são treinados, incluindo dados não estruturados, dos quais podem extrair muito mais informação depois de esgotados os dados estruturados.

Assim, o autor aposta na utilização de elementos como avaliações de clientes, transcrições de chamadas, publicações nas redes sociais ou padrões faciais, entre outros, para alimentar os modelos de IA e transformar a forma como as marcas operam, se relacionam com os clientes e crescem.

Três fontes que ganham peso no canal de compra

Witcher apresenta uma série de casos de uso como exemplos de três áreas nas quais podemos fornecer informações não estruturadas a um modelo de IA.

A visão computacional (capacidade das máquinas de interpretar imagens e vídeos) está a transformar telemóveis e câmaras em ferramentas de compra assistida e os espaços físicos em fontes contínuas de informação. A empresa norte-americana Jordan’s Furniture, por exemplo, utiliza vários sensores para digitalizar as dimensões corporais, a distribuição e o peso de cada pessoa, a fim de recomendar um colchão adequado às suas necessidades. O objetivo é aumentar a relevância ao longo de toda a jornada do cliente por meio de uma personalização eficaz.

No processamento de linguagem natural (NLP, na sigla em inglês), a IA interpreta e responde à linguagem humana, escrita ou oral, transformando resenhas, chats e transcrições em conhecimento acionável. Um exemplo é o IndexGPT, desenvolvido pela JPMorganChase, que usa NLP para reunir cestas de investimento temáticas a partir dessas informações textuais.

A biometria começa a ser incorporada nos pontos de venda. Muitas pessoas já a utilizam para desbloquear o telemóvel, ligar o carro, proteger o computador portátil ou passar pelos controlos no aeroporto. O seu interesse para as empresas reside na combinação de personalização e segurança, o que impulsiona novos casos de utilização. A L’Oréal, por exemplo, anunciou um dispositivo na loja, o Cell BioPrint, que realiza análises personalizadas da pele e oferece recomendações aos compradores.

A captura e o uso eficaz de dados não estruturados ajudam a elevar o nível da experiência de compra dos clientes, automatizar com maior precisão e diferenciar a proposta em momentos-chave. A visão computacional, a linguagem natural e a biometria estão a transformar imagens, textos e sinais de comportamento em decisões mais relevantes para cada pessoa, conclui o autor.

Opinião