logo

Novedades

GPT-4o: La IA que Habla como Humano y Puede Cambiarlo Todo

El nuevo modelo de IA de OpenAI, GPT-4o, marca un antes y un después en la interacción por voz, permitiendo conversaciones naturales con las máquinas. Esta tecnología podría transformar la accesibilidad y la relación humano-máquina.

La promesa de un diálogo fluido

Durante años, hemos intentado hablar con las máquinas, pero el éxito ha sido limitado. Siri, Alexa y el asistente de Google han demostrado cierto potencial en la interacción por voz, pero solo en situaciones específicas. GPT-4o cambia las reglas del juego.

OpenAI lo confirmó con una serie de demostraciones en video donde empleados de la compañía interactuaban con el renovado ChatGPT. Nada de texto, teclados o pantallas, solo conversaciones fluidas.

Las demostraciones nos acercaron al futuro que imaginaba la película “Her” de Spike Jonze. La voz de ChatGPT, con sus cambios de entonación y expresividad, era sorprendentemente similar a la de un humano.

Reduciendo la latencia, mejorando la experiencia

Un logro crucial de OpenAI fue reducir la latencia, un factor clave para la naturalidad de las conversaciones. En GPT-3.5 la latencia era de 2,8 segundos, mientras que en GPT-4 era de 5,4 segundos. GPT-4o la reduce a 0,32 segundos, e incluso a 0,232 segundos en algunos casos.

Esto permite que ChatGPT responda de forma inmediata y natural, adaptando su entonación al contexto. La síntesis de voz, la comprensión del habla del usuario (aún por perfeccionar con acentos y dialectos) y la baja latencia hacen que hablar con las máquinas sea una realidad.

Accesibilidad e implicaciones

Las implicaciones de este salto tecnológico son enormes, especialmente en términos de accesibilidad. Si bien escribir en un teclado para interactuar con ChatGPT ya era posible, la voz elimina una barrera y acelera la interacción, mejorando la experiencia.

Las demostraciones mostraron la capacidad de ChatGPT para expresar sarcasmo, cambiar el ritmo del habla, traducir idiomas en tiempo real e incluso mostrar emociones artificiales. El alcance es potencialmente ilimitado, impactando en áreas como la educación y nuestra relación con las máquinas.

Replika y “Her” como precursores, una realidad cada vez más cercana

Lo que ya nos adelantaba Replika (y mucho antes, la película “Her”) ahora se vuelve más factible. Una realidad inquietante: una máquina que habla de forma natural y creíble puede convertirse en nuestra amiga, o incluso en algo más.

Como ya mencionaba Sam Altman en 2016, la línea entre la realidad y la simulación se vuelve cada vez más borrosa.

¿El fin de las interfaces tradicionales?

La fluidez y naturalidad de las conversaciones con GPT-4o nos lleva a preguntarnos: ¿podrían las interfaces tradicionales como teclados y pantallas quedar obsoletas? Es posible que en el futuro, la interacción con dispositivos electrónicos se realice principalmente a través de la voz, abriendo un nuevo mundo de posibilidades para la comunicación y la interacción humana-máquina.

#IA #GPT4o #OpenAI #InteracciónPorVoz #Tecnología #RevoluciónDigital #Her #Cibersociedad #SamAltman