ChatGPT: Porquê todo este entusiasmo?

Por Tomás Rodrigues Sousa, Associate Consultant, BI4ALL


Num passado recente, as pessoas em todo o mundo têm-se preocupado com a inteligência artificial (IA) e a sua eventual ” conquista ” da sociedade, mas poucos poderiam ter previsto que esta começaria nos campos da literatura e da arte.

Graças ao ChatGPT, um chatbot criado utilizando a tecnologia proprietária GPT-3 da OpenAI, a OpenAI está de volta às luzes da ribalta depois de dominar a Internet com o seu gerador de imagem de IA, Dall-E 2.

Desde o lançamento do ChatGPT através de uma API, o Twitter e o LinkedIn foram inundados com exemplos criativos de pessoas que encontraram formas excitantes e inovadoras de utilizar esta tecnologia revolucionária. Desde escrever livros infantis, propor planos de perda de peso, e até fornecer conselhos de programação!

chatgpt1

Screenshot de uma resposta dada pelo ChatGPT

Para experimentar o ChatGPT basta seguir este link, iniciar sessão e perguntar-lhe qualquer coisa. Durante a pré-visualização da pesquisa, a utilização do ChatGPT é gratuita.

Porquê todo este entusiasmo?

Muitos afirmam que não é tão bom como dizem, outros adoraram e argumentam que pode ultrapassar o motor de busca da Google.

Deixaremos essa discussão para mais tarde, no entanto, é importante compreender que para muitos, especialmente os agnósticos ao Machine Learning e Inteligência Artificial, dispor de uma plataforma (API) que permita experimentar os potenciais da IA, cria uma grande procura para estes tipos de serviços.

O GPT não é novidade na comunidade, outras versões já existem há algum tempo, mas este modelo ultrapassou um limite, uma vez que é verdadeiramente útil para uma vasta gama de tarefas, desde a criação de código à geração de ideias comerciais, até à escrita de um brinde de casamento e e-mails.

Embora as gerações anteriores do sistema pudessem tecnicamente fazer estas coisas, a qualidade dos resultados era muito inferior à produzida por um comum humano.

Mas o que é o GPT?

GPT é a abreviatura de “Generative Pre-Trainer” (Transformador Generativo Pré-formado), é um modelo de linguagem de grande dimensão desenvolvido pela OpenAI, que foi aperfeiçoado para a tarefa de responder às indicações de uma forma conversacional.

É um tipo de modelo de transformador, baseado numa arquitectura de rede neural que foi introduzida no jornal “Attention is All You Need” por Vaswani et al. em 2017.

Um modelo transformador consiste em múltiplas camadas de atenção, que permitem ao modelo processar sequências de entrada em paralelo e não sequencialmente, tornando-o muito mais rápido de treinar e utilizar do que modelos anteriores, tais como RNNs (redes neuronais recorrentes).

O GPT é, portanto, um tipo de modelo de Machine Learning que utiliza técnicas de deep learning para gerar texto do tipo humano. Fá-lo através da previsão da palavra seguinte numa sequência baseada nas palavras que lhe precederam.

Ao treinar o GPT num grande conjunto de dados de texto, este pode aprender os padrões e a estrutura da linguagem, permitindo-lhe gerar um texto coerente e semelhante à escrita humana.

Pode ser utilizado para uma vasta gama de tarefas de processamento de linguagem natural, incluindo tradução linguística, resumo de texto, e resposta a perguntas. Também tem sido utilizado para gerar texto sintético, tais como artigos noticiosos e histórias, e até tem sido utilizado para gerar código.

Como funciona?

Recorrendo às mesmas técnicas que o InstructGPT, o ChatGPT treinou este modelo usando o Reforço da Aprendizagem a partir do Feedback Humano (RLHF), com algumas pequenas variações na configuração da recolha de dados.

De um modo geral, o modelo foi treinado pela primeira vez em bases de dados de texto a partir da Internet. Isto continha 570GB de material que foi recolhido de livros, textos da web, Wikipédia, artigos, e literatura online. Mais precisamente ainda, o algoritmo foi alimentado com 300 biliões de palavras.

O modelo inicial foi treinado através de um aperfeiçoamento supervisionado, no qual instrutores humanos e de IA agiram como utilizadores e como assistentes de IA nas discussões. Os formadores tiveram então acesso a amostras de recomendações escritas para ajudar na criação das suas respostas. O dataset do InstructGPT, que foi convertido num formato de diálogo, é então combinado com o novo dataset de diálogo.

chatgpt-2

Imagem por OpenAi

Considere perguntar ao chat “De que cor é o céu”?

Está planeado que o modelo produzirá um resultado adequado, mas isso não garante que o faça. Quando comete um erro, a equipa da OpenAI volta a introduzir a resposta certa no programa para lhe ensinar a resposta certa e ajudar no desenvolvimento do conhecimento.

A isto chama-se Sistema de Recompensa nos Modelos de Aprendizagem de Reforço. Aqui em particular, de acordo com a qualidade das respostas, é dada uma classificação e o modelo aprende.

Todas as conversas que os formadores de IA tiveram com o chatbot foram utilizadas pela OpenAI para recolher estes dados. Escolheram aleatoriamente uma mensagem escrita pelo modelo, tiraram uma série de potenciais conclusões, e pediram aos formadores de IA que os classificassem. Finalmente, utilizando este modelo de recompensa, aperfeiçoaram o modelo utilizando Proximal Policy Optimization

A fim de se tornar o derradeiro sabe-tudo, esta tecnologia melhora constantemente a sua compreensão dos estímulos e inquéritos, ao mesmo tempo que faz suposições instruídas sobre qual deve ser a palavra seguinte.

Imagine-o como uma versão muito mais avançada e inteligente do software auto-completo que se vê frequentemente na escrita de software ou e-mails. O seu programa de correio eletrónico pede-lhe para começar a escrever uma frase antes de a ter terminado.

Limitações apontadas pela OpenAi

Apesar do desempenho impressionante do GPT-3 ainda há espaço para melhorias, algumas das limitações do modelo podem ser encontradas em posts do Blog da OpenAi, outras são relatadas pelos utilizadores e podem ser encontradas espalhadas por posts nos meios de comunicação social:

  • O modelo tem um conhecimento limitado do mundo depois de 2021. Não tem conhecimento dos líderes mundiais que chegaram ao poder desde 2021, e não será capaz de responder a perguntas sobre acontecimentos recentes.
  • Por vezes fornece respostas que são corretas, mas que na realidade são erróneas ou ilógicas. A resolução deste problema é difícil porque:
  • Não existe atualmente nenhuma fonte de verdade durante a formação RL;
  • Tornar o modelo mais cauteloso faz com que ele recuse perguntas às quais possa responder corretamente;
  • O treino supervisionado engana o modelo porque a melhor resposta depende do conhecimento do modelo e não do conhecimento do demonstrador.
  • É sensível a tentativas repetidas da mesma pergunta. Por exemplo, o modelo pode afirmar não saber a resposta se a pergunta for formulada de uma só forma, mas com uma simples reformulação, pode ser capaz de responder com precisão.
  • O modelo emprega frequentemente palavras e frases desnecessárias, tais como repetir que se trata de um modelo linguístico desenvolvido pela OpenAI. Estes problemas são causados por problemas de sobre-otimização e enviesamento nos dados de formação.
  • Quando o utilizador fornece uma pergunta incerta, o modelo deve idealmente fazer perguntas esclarecedoras. Em vez disso, normalmente faz suposições sobre o que o utilizador quis dizer.
  • O modelo faz um esforço para recusar pedidos inadequados, embora ocasionalmente corresponda a maus conselhos ou se comporte de forma tendenciosa. Embora OpenAi antecipe alguns falsos negativos e positivos por enquanto, aproveita a Moderation API para alertar os utilizadores ou proibir categorias específicas de conteúdo perigoso.

As oportunidades da IA de uma perspetiva de negócio

As empresas que utilizam sabiamente a tecnologia da IA podem beneficiar bastante de ferramentas como o ChatGPT. A IA baseada no Chat pode melhorar a produtividade humana através da automatização de trabalhos monótonos e da promoção de interações mais interessantes entre os utilizadores.

Seguem-se algumas das formas como as empresas podem utilizar ferramentas como o ChatGPT:

  • Compilação de investigação
  • Redação de conteúdo de marketing
  • Ideias de Brainstorming
  • Escrever código informático
  • Automatização de peças do processo de venda
  • Prestação de serviços de assistência pós-venda quando os clientes compram produtos
  • Fornecimento de instruções personalizadas
  • Racionalizar e melhorar os processos utilizando a automatização
  • Tradução de texto de uma língua para outra
  • Suavizar o processo de integração do cliente
  • Aumentar o envolvimento do cliente, levando a uma maior lealdade e retenção

Muitas empresas têm muito espaço para crescer na área do serviço ao cliente e produtividade interna. As empresas podem automatizar numerosas operações tradicionalmente realizadas por pessoas e reduzir significativamente os tempos de resposta, utilizando tecnologia alimentada por IA para produzir respostas para os seus próprios chatbots de atendimento ao cliente.

De acordo com uma pesquisa da Opus Research, 48% dos consumidores não se importam se um inquérito de serviço ao cliente é realizado por um chatbot artificial ou um humano e 35% dos consumidores querem ver mais empresas usarem chatbots.

Resumindo, ChatGPT e IA, em geral, podem ser úteis para qualquer situação em que seja necessário gerar texto de interpretação natural com base nos dados introduzidos.

Por outro lado, as oportunidades da IA podem transformar-se em ameaças se os seus concorrentes conseguirem tirar partido desta tecnologia e a sua empresa não.

O que vem a seguir?

Se o ChatGPT o deixou entusiasmado com os potenciais que a Inteligência Artificial e a Aprendizagem Automática podem ter no seu negócio, contacte-nos via e-mail.

Enquanto espera para experimentar o que o GPT-4 pode fazer, pode começar a aproveitar os seus próprios dados, dê uma vista de olhos às nossas histórias de sucesso.

https://www.bi4all.pt/casos-de-sucesso/

Últimos artigos