Inicio Tecnología Antparping with chatgpt: modo de voz con gpt-5 suena más humano que...

Tecnología

Antparping with chatgpt: modo de voz con gpt-5 suena más humano que nunca

Por

27 agosto 2025

Eran las 8 de la mañana y estaba sentado en el vestíbulo del taller de carrocería cuando me di cuenta de que había olvidado mis auriculares. Normalmente, ese no es un problema importante, pero estaba hablando con mi teléfono. Y no estaba hablando con otra persona. Estaba hablando con chatgpt. Se sintió tan vergonzoso como hacerle una pregunta a Siri desde el otro lado de la habitación o unirse a una reunión de zoom sin auriculares en una oficina abierta.

Estaba probando el modo de voz avanzado que viene con GPT-5, la última versión de Openi del modelo de IA generativo detrás de ChatGPT. GPT-5 cayó este verano después de muchos meses de especulaciones y retrasos, prometiendo a los usuarios de IA una experiencia de chatbot más rápida e inteligente. El jurado aún está sobre si OpenAi ha entregado o no. (Divulgación: Ziff Davis, la empresa matriz de CNET, en abril presentó una demanda contra OpenAi, alegando que infringió los derechos de autor de Ziff Davis en la capacitación y la operación de sus sistemas de IA).

GPT-5 incluye mejoras en su modo de voz avanzado, que es esencialmente una forma de que literalmente hable con ChatGPT y que responda en la voz de su elección. Los usuarios gratuitos como yo ahora tienen acceso a la versión avanzada (los usuarios gratuitos anteriormente solo tenían acceso al modo de voz básico), y los suscriptores de pago recibirán límites de uso más altos. Otra nueva característica GPT-5 le permite elegir qué tipo de personalidad desea que su IA imite, incluidos avatares descarados, nerd y robóticos.

Para usar el modo de voz, abra CHATGPT, toque el botón de audio junto a la ventana de solicitud donde ingresaría una instrucción y comenzaría a chatear. Puede cambiar qué Voice ChatGPT utiliza tocando el icono de configuración en la esquina superior derecha en la aplicación móvil (dos barras apiladas una encima de la otra con círculos en ellos).

¿Más voces de IA humana? Cómo fue mi experiencia

Decidí tratar de hablar con Chatgpt como lo haría con un amigo, como una versión más entusiasta de mí mismo. La IA se echó a reír cuando comencé la llamada con una espíritu «¡Hola novia!» que se sintió divertido y condescendiente.

La voz de Chatgpt fluyó de manera muy pure en una cadencia acquainted, comparable a la forma en que hablaría con un agente de servicio al cliente particularmente amigable. Eso tenía sentido cuando el chatbot en sí me dijo que el modo de voz avanzado actualizado ayudó a que suene más humano.

La voz que usé, Ember, a menudo tomaba pausas para respirar, como lo haría un humano durante una oración más larga. Pensé que period un poco extraño, ya que mientras ChatGPT estaba haciendo su mejor impresión de un humano, ambos sabíamos que en realidad no necesitaba detenerse para recuperar su aliento.

En mi conversación con ChatGPT, fue más empático de lo que esperaba. Me preguntó cómo estaba y dije que no bien y lo conté sobre mi accidente automovilístico. En nuestra conversación de cinco minutos, reservaría muchas de sus respuestas con declaraciones empáticas, como decir que lamentaba que estuviera teniendo una mala semana y acordando que tratar con el seguro puede ser un dolor de cabeza. (¿Chatgpt ha tenido que llamar a un agente de seguros o incluso experimentado un dolor de cabeza? Creo que no).

Si bien un oído robotic simpático puede no parecer un gran problema, puede ser un signo de un problema mayor. La IA sycophántica, el término utilizado para describir cuándo la IA es demasiado cariñosa o emocional, puede ser frustrante para los usuarios que solo buscan información. También puede ser peligroso para las personas que usan IA como terapeutas o consejeros de salud psychological, algo que el CEO de OpenAI, Sam Altman, ha advertido a los usuarios de ChatGPT. Las versiones anteriores de ChatGPT han sido retiradas y relanzadas después de problemas con las tendencias sycófánicas.

También le hice a ChatGPT más preguntas objetivas, como el costo promedio de la mano de obra de reparación de automóviles en Carolina del Norte y a dónde podría ir para obtener una segunda estimación de reparación. Respondió más como un amigo que un chatbot, que puede no ser el más útil. Por ejemplo, cuando escribí la misma solicitud en ChatGPT en mi computadora portátil, sacó un mapa con la lista de tiendas, junto con más información, como información de precios y horas de almacenamiento. Pero cuando estaba chateando con el modo de voz ChatGPT, trajo menos opciones y las describió en base a lo que supongo que son el lenguaje de advertising and marketing de la tienda y las reseñas de los clientes, utilizando frases como «Han existido desde hace bastante tiempo» y diciendo que una tienda es «conocida por su servicio de calidad». Tampoco obtienes ningún enlace o fuente con modo de voz, que no me encanta.

Dos capturas de pantalla que muestran la solicitud regular de ChatGPT versus el modo de voz. El modo de voz tiene menos información y sin mapa — ChatGPT transcribe automáticamente los chats de voz, para que pueda ver la diferencia en el nivel de detalle dado en las indicaciones de texto regulares (izquierda) y los chats de voz (derecha).

Captura de pantalla de Katelyn Chedraoui/CNET

Usar la voz de chatgpt como tablero de sonido

Una de las cosas para el modo de voz es bien adecuado es ser un compañero de lluvia de concepts, un muro literal para rebotar las concepts. Le pedí que me ayudara a planificar una fiesta de cumpleaños con temas de cielo, y me ayudó a desarrollar nuevas concepts y refinar las que ya tenía.

Interrumpí el chatgpt mientras hablaba un par de veces, y fue capaz de pivotar rápidamente. También tiendo a hablar rápidamente, y el chatbot se mantuvo y no se perdió ninguno de mis pensamientos. Me dejé divagar y alejar la conversación fuera de la pista, y ChatGPT no parpadeó un ojo digital. Lo más importante, cuando le hice una pregunta sobre un tema anterior, podría retomar dónde lo dejamos. Las mejoras en la memoria de ChatGPT deben agradecer por esa importante consideración.

Mira esto: El impacto oculto del auge del centro de datos de IA

05:13

¿Deberías usar el modo de voz ChatGPT?

En normal, creo que el modo de voz es bueno como otra forma de usar chatgpt, pero solo es situalmente útil. Si necesita una investigación en profundidad y una información más detallada, el modo de voz no será adecuado para usted. Pero si solo quieres hablar con alguien (más bien, algunoscosa) o trabajar a través de un problema en voz alta, el modo de voz es una buena alternativa para tener que articular sus pensamientos y escribirlos.

Todavía creo que no hemos normalizado hablar con AIS en espacios públicos, especialmente sin auriculares. Pero puede ser una alternativa útil para las personas que piensan mejor en voz alta. Para obtener más información, consulte cómo la IA está cambiando los motores de búsqueda y los mejores generadores de imágenes de IA.

avots

Antparping with chatgpt: modo de voz con gpt-5 suena más humano que nunca

¿Más voces de IA humana? Cómo fue mi experiencia

Usar la voz de chatgpt como tablero de sonido

¿Deberías usar el modo de voz ChatGPT?

DEJA UNA RESPUESTA Cancelar respuesta

Recientemente

La directora de los CDC niega el informe que ha sido...

Las conexiones NYT de hoy sugieren, respuestas y ayuda para el...

Todavía prefiero Apple Watch sobre el anillo de Oura por 3...

El CEO de NVIDIA cube que los modelos de IA más...

Este mini televisor del tamaño de un dormitorio cuesta solo $...

Este es el grupo que ha estado golpeando universidades estadounidenses

NVIDIA informa las ventas récord a medida que continúa el auge...

¿Pueden los peces sentir placer? Los científicos dicen que sí, e...

Cómo este inversor tecnológico de Seattle usa IA y se construye...

iPhone 17 Air se lanzará pronto, aquí están todos los rumores