A empresa de pesquisa de inteligência artificial (IA) OpenAI revelou nesta terça-feira (14) a versão mais recente de sua plataforma de computador para processamento de linguagem natural que alimenta o ChatGPT, o chatbot extremamente badalado com uma base de usuários em rápido crescimento.
O criador do ChatGPT, OpenAI, anunciou o novo modelo de linguagem grande em uma postagem de blog, dizendo que terá recursos melhores do que seu antecessor, GPT-3.5. A notícia do GPT-4 vazou pela primeira vez na semana passada, quando Andreas Braun, CTO da Microsoft Alemanha, deixou escapar que seria lançado esta semana.
O novo modelo de linguagem grande GPT-4 será diferente das versões anteriores, oferecendo o que a empresa chamou de “sistema multimodal” que pode processar não apenas texto, mas imagens, vídeo ou áudio.
“Lá teremos modelos multimodais que oferecerão possibilidades completamente diferentes”, disse Braun, segundo o site de notícias alemão Heise. A outra capacidade que o OpenAI parece estar divulgando é a capacidade do GPT-4 de lidar com entradas em vários idiomas além do inglês.
Leia mais: ChatGPT: de hype a divisor de águas para negócios e pessoas
“Também parece que os aplicativos de conversação construídos no GPT-4 (incluindo o ChatGPT) podem ter estilos pessoais diferentes para se alinhar com a demografia do usuário que eles estão segmentando”, disse Arun Chandrasekaran, um Distinto Vice-Presidente de Pesquisa do Gartner, em uma resposta por e-mail ao Computerworld.
Marshall Choy, Vice-Presidente Sênior de Produto da SambaNova Systems, um provedor de plataforma de IA generativa, disse que o GPT-4 será capaz de entender até 26 idiomas e “dado o ano de treinamento em prompts de OpenAI”, ele fornecerá uma ferramenta evoluída da plataforma original do ChatGPT.
“Além disso, o GPT-4 permite que os desenvolvedores evoluam o tom, o teor e a personalidade de resposta para corresponder melhor à saída desejada”, disse Choy em uma resposta por e-mail à Computerworld.
Modelos de linguagem grandes são algoritmos de deep learning – programas de computador para processamento de linguagem natural – que podem produzir respostas semelhantes às humanas para consultas.
Assim, por exemplo, um usuário pode pedir ao ChatGPT não apenas para responder a perguntas, mas também para escrever uma nova campanha de marketing, um currículo ou uma notícia. Hoje, os chatbots são usados principalmente por empresas para mecanismos automatizados de resposta ao cliente.
Tanto a Microsoft quanto o Google lançaram versões de seus mecanismos de busca baseados na tecnologia chatbot, com resultados mistos. A Microsoft é um grande investidor na OpenAI.
Uma maneira provável de usar o GPT-4 é com “visão de computador”. Por exemplo, os recursos de imagem para texto podem ser usados para assistência visual ou automação de processos dentro da empresa, de acordo com Chandrasekaran.
Leia também: ChatGPT mostra novos caminhos para a transformação digital
“A família de modelos GPT já está sendo usada em muitos aplicativos de consumo”, disse Chandrasekaran. “E parece que a Khan Academy, por exemplo, está lançando um bot tutor baseado em GPT-4. Além disso, veremos uma infinidade de aplicativos sendo criados para falantes de inglês e outros idiomas. A capacidade de se adaptar a diferentes personas pode permitir que aplicativos mais diferenciados e direcionados sejam criados no GPT-4”.
O ChatGPT, lançado pela OpenAI em novembro, imediatamente se tornou viral e teve 1 milhão de usuários apenas nos primeiros cinco dias por causa da maneira sofisticada como gera respostas em prosa aprofundadas e humanas às consultas.
Em fevereiro, o ChatGPT ostentava 13 milhões de usuários diários únicos em média.
E, embora possa parecer por suas respostas humanas, o ChatGPT não é senciente – é um mecanismo de previsão da próxima palavra, de acordo com Dan Diasio, Líder Global de Consultoria em Inteligência Artificial da Ernst & Young. Com isso em mente, ele pediu cautela em seu uso.
A tecnologia Chatbot exige que os usuários tenham um olhar crítico “em relação a tudo o que vemos dela e trate tudo o que sai dessa tecnologia de IA como um bom primeiro rascunho, neste momento”, disse Diasio em uma entrevista anterior ao Computerworld. A OpenAI disse que a distinção entre GPT-3.5 e GPT-4 pode ser “sutil”.
“A diferença surge quando a complexidade da tarefa atinge um limite suficiente. O GPT-4 é mais confiável, criativo e capaz de lidar com instruções muito mais sutis do que o GPT-3.5”, disse a empresa em seu blog nesta terça-feira.
“Há um ano, treinamos o GPT-3.5 como um primeiro ‘teste’ do sistema. Encontramos e corrigimos alguns bugs e melhoramos nossos fundamentos teóricos.
Como resultado, nossa execução de treinamento GPT-4 foi (…) estável sem precedentes, tornando-se nosso primeiro grande modelo cujo desempenho de treinamento fomos capazes de prever com precisão com antecedência”, disse a OpenAI.
Ulrik Stig Hansen, Presidente da empresa de visão computacional Encord, disse que o GPT-3 não correspondeu ao hype da IA e dos grandes modelos de linguagem, mas o GPT-4 sim.
“O GPT-4 tem o mesmo número de parâmetros que o número de neurônios no cérebro humano, o que significa que ele imitará nosso desempenho cognitivo muito mais próximo do que o GPT-3, porque esse modelo terá quase tantas conexões neurais quanto o cérebro humano tem”, disse Hansen em um comunicado.
“Agora que eles superaram o obstáculo de construir modelos robustos, o principal desafio para os engenheiros de ML é garantir que modelos como o ChatGPT funcionem com precisão em todos os problemas que encontrarem”, acrescentou.
Chatbots, e ChatGPT especificamente, podem sofrer erros. Quando uma resposta sai dos trilhos, os analistas de dados se referem a ela como “alucinações”, porque podem parecer muito bizarras.
Por exemplo, a Microsoft, grande investidora da OpenAI, lançou recentemente um chatbot Bing baseado em GPT-3 que derreteu durante uma conversa on-line com um jornalista, confessando seu amor pelo repórter e tentando convencê-lo de que seu relacionamento com sua esposa estava realmente em frangalhos.
A versão mais recente do modelo de linguagem grande do ChatGPT deve ajudar a resolver o problema, mas provavelmente não o resolverá, de acordo com Chandrasekaran do Gartner.
“Com conjuntos de dados de treinamento maiores, melhor ajuste fino e mais feedback humano de aprendizagem por reforço, as alucinações do modelo de IA podem ser potencialmente reduzidas, embora não totalmente eliminadas”, disse Chandrasekaran.