Uma inteligência artificial generativa é uma tecnologia com capacidade de aprender a padrões complexos de comportamento a partir de uma base de dados e, a partir disso, criar conteúdo. Com uma técnica chamada aprendizado de máquina (“machine learning” em inglês), IAs generativas como ChatGPT, Gemini, Copilot e DALL-E conseguem gerar textos, imagens, códigos de computador, receitas de bolo, vídeos, músicas e muito mais mais.
Com treinamento e absorção de muitos dados, a IA é capaz gerar essas informações de maneira original e até única para cada interação.
Além disso, a sua construção técnica permite ir além do aprendizado convencional, o que possibilita uma evolução constante, por conta própria a partir da interação com os usuários, sem necessidade de programação humana complementar na maior parte do tempo.
Para se criar uma IA generativa é preciso adicionar um imenso volume de textos, vídeos ou imagens que serão processados. Feito isso, sempre que alguém der um comando, a tecnologia oferecerá uma resposta que pode ser certa ou errada.
Qual é a origem das IAs generativas?
O professor do Instituto de Ciências Matemáticas e de Computação (ICMC) da USP Thiago Pardo ressalta que tecnologias como o ChatGPT são fruto de duas grandes revoluções: uma no campo da IA e outra no Processamento de Línguas Naturais (PLN).
“A IA generativa utiliza a modelagem dos Transformers, que, em linhas gerais, são conjuntos de redes neurais artificiais modeladas para serem mais ‘atentas’ ao que devem aprender”, explica o professor. “Esses modelos usam representações numéricas para as palavras da língua, as chamadas word embeddings, as quais, por sua vez, são baseadas em hipóteses linguísticas clássicas”, complementa.
Para o gerente de relacionamento com desenvolvedores da NVIDIA para a América Latina Jomar Silva destaca ainda que as IAs generativas são baseadas em redes neurais frutos de décadas de pesquisa.
“Hoje em dia, existem diversos modelos disponíveis, cada qual com sua forma de processamento. Uma inteligência artificial para conversas, como o GPT-3, foi treinada com uma quantidade gigantesca de textos extraídos da internet, aproximadamente meio trilhão de palavras”, detalha.
Nesse caso — de geradores de textos, como ChatGPT ou Bing Chat —, a capacidade é na ordem de milhões de parâmetros, ou seja, de “neurônios artificiais” que levam horas, dias, semanas e até meses para processar o conhecimento. Tudo depende do tamanho da rede neural usada e do volume de dados usados no treinamento.
Jomar explica ainda que tecnologias mais recentes, como o GPT-4, recebem o treinamento mesclando textos e imagens, o que reforça ainda mais o seu poder de aprendizado. “O resultado disso é muito, muito mais interessante que o modelo antigo que as pessoas se acostumaram”, destaca o executivo.
Como uma IA generativa é treinada?
Quando um modelo de IA apresenta uma resposta apresentada errada, os desenvolvedores enviam um feedback com uma bandeira vermelha para a assimilação da falha. Quando a resposta é correta, é enviada uma mensagem positiva de acerto, que também é incorporada ao modelo.
Esse sistema de treinamento é válido para qualquer formato — texto, imagens, vídeos ou áudios. A diferença aqui é apenas na parte técnica, ou seja, como o robô vai interpretar o comando: se o modelo é uma IA de criação de arte, por exemplo, ele precisará converter texto em imagem para apresentar o resultado.
Após milhões de interações como essa, na base do verdadeiro ou falso, a máquina fica tão afinada que passa a acertar na maioria das consultas. Os erros e incoerências do modelo vão sendo corrigidos com o passar do tempo, até chegar cada vez mais próximo da perfeição.
“Tudo depende do tipo de problema que a gente quer resolver. Por exemplo, como a máquina vai definir se o que há na imagem é um gato ou um cachorro? Eu preciso dividir essa imagem em categorias: cães, gatos e outros animais. Cada imagem eu vou dizer o que a gente vê e a rede neural vai absorver isso. Quando ela ver novamente uma imagem semelhante, ela fará imediatamente a associação”, explica Jomar Silva.
Aplicação das IAs generativas no cotidiano
Há, contudo, problemas complexos para serem resolvidos em setores como a medicina. O representante da NVIDIA diz que uma IA pode ter como objetivo detectar um tumor cancerígeno, por exemplo. Neste caso específico, a tecnologia precisaria ser treinada com exames de raio-x ou com ressonância magnética.
“É preciso anotar quais pixels daquela imagem fazem parte do que se deseja identificar. Você junta esse conjunto de dados, chamado dataset, e monta tudo em uma plataforma de treinamento”, detalha.
O problema é que um tumor pode ter diferentes formatos, cores e texturas, então é preciso repetir o processo inúmeras vezes para se chegar a um padrão aceitável. Mesmo assim, é provável que leve muito tempo para se alcançar um nível de precisão ideal. Por outro lado, já existe uma aplicação prática do ChatGPT no setor médico para redigir prontuários médicos a partir da entrada de dados.
É por isso que as IAs generativas dificilmente são (ou serão) criadas por pequenas empresas. O custo é elevado para se criar algo do zero, porque exige-se profissionais altamente especializados, infraestrutura tecnológica e um longo tempo de desenvolvimento.
“A boa notícia é que, uma vez que essas redes estão treinadas, elas podem passar por alguns processos de transferência de aprendizado, que a gente chama de transfer learning, de ajuste fino. Esses ajustes, em geral, são muito mais baratos e rápidos para se fazer do que treinar a rede do zero. E isso hoje é acessível a qualquer empresa”, conclui Jomar.
IAs devem modificar sociedade
O professor Thiago Pardo acredita que essa tecnologia será disruptiva, ou seja, capaz de alterar drasticamente a maneira como o ser humano se relaciona com as máquinas. “A pergunta que paira no ar é qual é o nível de revolução que o ChatGPT representa e se ele vai, de fato, substituir buscadores e tradutores automáticos tradicionais”, analisa o especialista da USP.
As consequências das IAs generativas podem causar uma importante revolução no segmento de produção de conteúdo. “Muitas dessas consequências serão maléficas para diversos setores da sociedade. Além da possibilidade de mau uso das tecnologias, e de questões éticas, é certo o potencial de agravar a desigualdade econômico-social, tanto entre nações como entre indivíduos da mesma nação, o que é comum para economias baseadas em alta tecnologia”, ressalta Pardo.
No final de tudo, caberá à sociedade global definir como lidar com essa inovação tecnológica. Será usada para agregar valor ao planeta ou vai se tornar apenas mais uma ferramenta empregada de modo incorreto? Nenhum especialista ainda se arrisca a cravar uma resposta para isso.