Pular para o conteúdo

ChatGPT disponibilizará conversa por voz

ChatGPT disponibilizará conversa por voz

A empresa por trás do ChatGPT disse na segunda-feira que está adicionando recursos de voz e imagem à plataforma generativa de inteligência artificial (IA), há muito limitada a comandos escritos.

Os recursos adicionados às versões pagas do serviço permitem que os usuários conversem com a IA e até “mostrem” o que estão falando, de acordo com a OpenAI.

“Voz e imagem oferecem mais maneiras de usar o ChatGPT em sua vida”, disse OpenAI em um post.

“Tire uma foto de um ponto de referência enquanto viaja e tenha uma conversa ao vivo sobre o que há de interessante nele.”

Exemplos de como os novos recursos poderiam ser usados ​​incluem tirar uma foto do interior de uma geladeira para obter sugestões de receitas de refeições ou uma foto do dever de matemática de uma criança para obter ajuda na resolução de problemas.

Os recursos de voz e imagem serão lançados para usuários do ChatGPT Plus e Enterprise ao longo das próximas semanas e, eventualmente, serão direcionados aos sistemas operacionais de smartphones da Apple e do Google, conforme a Open AI.

“Agora você pode usar a voz para conversar com seu assistente”, disse o criador do ChatGPT.

“Fale com ele em qualquer lugar, solicite uma história para sua família antes de dormir ou resolva um debate à mesa de jantar.”

A OpenAI colaborou com dubladores para tornar as interações faladas mais realistas, de acordo com a startup.

Os programas de IA generativa ganharam destaque no final do ano passado, com o ChatGPT demonstrando a capacidade de gerar ensaios, poemas e conversas a partir dos mais breves prompts.

Os titãs da tecnologia Google, Meta e Microsoft estão entre os que correm para capitalizar a promessa da IA ​​generativa, ao mesmo tempo que tentam evitar perigos como o potencial da tecnologia como arma para a desinformação e o crime cibernético.

Em um anúncio separado, a plataforma sueca de streaming de música Spotify disse na segunda-feira que está aproveitando a tecnologia OpenAI para permitir que podcasts sejam traduzidos para vários idiomas, mantendo o estilo original do locutor.

“Ao combinar a voz do próprio criador, a Tradução de Voz dá aos ouvintes de todo o mundo o poder de descobrir e se inspirar em novos podcasters de uma forma mais autêntica do que nunca”, disse o vice-presidente de personalização do Spotify, Ziad Sultan, em um comunicado.

O Spotify começará nas próximas semanas com episódios em inglês traduzidos para espanhol, francês e alemão, segundo a empresa.

 

Traduzido por Mateus Lynniker de TechXplore

Mateus Lynniker

Mateus Lynniker

42 é a resposta para tudo.