OpenAI lança GPT-4o, novo motor de IA do ChatGPT

Modelo é capaz de interagir em tempo real com o usuário, por meio de texto, áudio, imagem e vídeo; tempo de resposta em áudio se assemelha ao de um humano
OpenAI lança GPT-4o, novo motor de IA do ChatGPT
Com GPT-4o, ChatGPT será capaz de interagir em tempo real com o usuário, inclusive em áudio, assegura OpenAI (crédito: Freepik)

A OpenAI apresentou, nesta segunda-feira, 13, o GPT-4o, um novo modelo de Inteligência Artificial (IA) generativa incorporado ao ChatGPT. O diferencial do novo motor é a capacidade de interação em tempo real entre usuário e plataforma, com base em texto, áudio e imagem, o que contempla transmissão ao vivo em vídeo. O complemento “o” no nome deriva de “omni” (ou “oni”), que significa “tudo”, “todo” ou “todos”.

O modelo será disponibilizado para todos os usuários, incluindo para quem usa a versão gratuita da plataforma. Inicialmente, apenas os recursos de texto e imagem estão disponíveis. O modo de voz será lançado nas próximas semanas, indicou a empresa.

A versão paga (Plus) do ChatGPT terá limites de mensagens até cinco vezes maiores, além de acesso antecipado ao modo de voz. No caso da gratuita, após o usuário atingir o limite disponível de interações, o sistema automaticamente volta para o GPT-3.5.

Segundo a OpenAI, o GPT-4o consegue responder mensagens de áudio em apenas 232 milissegundos, com uma média de 320 milissegundos, o que, na prática, seria semelhante ao tempo de resposta de um humano em uma conversa. A desenvolvedora diz que isso é possível porque, diferentemente das versões anteriores, o modelo processa todas as entradas e saídas de informação, não dependendo de soluções de apoio.

“Com o GPT-4o, treinamos um único novo modelo de ponta a ponta em texto, visão e áudio, o que significa que todas as entradas e saídas são processadas pela mesma rede neural”, ressalta a empresa.

Em comunicado, a OpenAI diz que reconhece que modalidades de áudio apresentam “uma variedade de novos riscos”. Com isso, nas próximas semanas, a empresa seguirá trabalhando na melhoria da infraestrutura técnica, na usabilidade e na segurança, a fim de liberar o modo de uso. A previsão é de que, no lançamento, o modo de áudio conte com uma seleção limitada e predefinida de vozes.

Aplicativo para computadores

Nesta segunda-feira, a desenvolvedora de IA também anunciou um novo aplicativo de desktop do ChatGPT para o sistema operacional macOS, da Apple. A solução foi projetada para “se integrar perfeitamente a qualquer coisa que você esteja fazendo no seu computador”.

De forma prática, com um atalho de teclado (Opção + Espaço), o usuário pode fazer, em seguida, uma pergunta ao ChatGPT. O modo de voz também poderá ser usado dessa forma. Em nota, a OpenAI informou que planeja lançar uma versão similar para Windows ainda este ano.

Avatar photo

Eduardo Vasconcelos

Jornalista e Economista

Artigos: 1136