Google lanza Gemini Live, la respuesta de la compañía al modo de voz avanzado de ChatGPT

Google lanza Gemini Live, la respuesta de la compañía al modo de voz avanzado de ChatGPT

El evento Made by Google de Google ha finalizado oficialmente, en el que la compañía lanzó la última línea de teléfonos inteligentes de su serie insignia Pixel. Los rumores han estado circulando a lo largo de las últimas semanas y muchos de ellos finalmente se han convertido en realidad. Además, como se esperaba, el evento también tuvo más de una mención (bueno, bastantes, en realidad) a la IA.

Entre otras cosas relacionadas con la inteligencia artificial, el anuncio más importante ha sido el lanzamiento de Gemini Live. Google anunció Gemini Live en su conferencia I/O a principios de este año. Finalmente, está disponible para los suscriptores de Gemini Advanced en Android en inglés, y pronto estará disponible en más idiomas y en iOS (a través de la aplicación de Google).

Con Gemini Live, Gemini ahora es capaz de mantener conversaciones bidireccionales más naturales. También puedes interrumpirlo en medio de una respuesta, como en cualquier conversación natural. Puedes ingresar a la aplicación Gemini en Android para conversar con el chatbot.

Esto es similar a la experiencia del modo de voz avanzado en la aplicación ChatGPT, que ahora se está implementando en una versión alfa limitada para los usuarios de ChatGPT Plus. Por una vez, Google se ha adelantado a OpenAI en el cronograma de lanzamiento al iniciar un lanzamiento más amplio.

Gemini Live también está disponible en modo manos libres, por lo que puedes hablar con Gemini en segundo plano o incluso cuando tu teléfono esté bloqueado. También puedes dejar conversaciones a mitad de camino y retomarlas más tarde.

Google está lanzando Gemini Live con 10 nuevas voces para que tus conversaciones con la IA te resulten aún más auténticas; puedes elegir la voz y el tono que más te guste.

Cabe destacar que Gemini Live no puede simular ninguna otra voz que no sean las 10 voces disponibles en la aplicación, posiblemente para evitar problemas de derechos de autor. ChatGPT-4o sigue la misma política. Hay un aspecto en el que Gemini Live no es igual que el modo de voz de ChatGPT-4o. El primero no puede entender tus emociones a partir de tu tono, algo que OpenAI demostró que su chatbot podía hacer.

Además, también hay una capacidad de Gemini Live que Google demostró en la conferencia I/O que no estará disponible en el lanzamiento. Sí, estamos hablando de entradas multimodales. Si no sabes qué era eso, no te preocupes. Aquí tienes un resumen: con las entradas multimodales, Gemini Live puede tomar entradas de la cámara de tu teléfono (tanto fotos como vídeos) en tiempo real y responder a cualquier pregunta o ayudarte a identificar objetos que apuntes. Por ejemplo, puedes apuntarlo a algún equipo de DJ y pedirle que identifique el nombre de una parte o puedes apuntarlo a tu pantalla y preguntar qué hace cierta parte de un código.

Sin embargo, las capacidades multimodales se han retrasado por ahora y Google solo ha dicho que llegarán a finales de este año, sin dar más detalles. Curiosamente, se supone que el modo de voz avanzado de ChatGPT-4o también tendrá capacidades similares, pero tampoco se han lanzado con la versión alfa limitada.

Cabe destacar que Gemini Live es un paso más en el camino para que Google haga realidad el Proyecto Astra.

Hablar con un chatbot a veces es mucho más conveniente que escribir algo, especialmente cuando quieres intercambiar ideas. Y con Gemini Live, la conversación puede ser mucho más fluida. O, si las demostraciones en vivo del evento Made by Google sirven de indicio, bastante fluida. (Aparentemente, el chatbot alucinó durante la demostración en vivo y hay cierta fricción al poner a prueba la función «interrumpir a Gemini en el medio»). Veamos cómo le va en el mundo real, ¿eh? Prepárate para probar Gemini Live en tu Pixel, Samsung u otros dispositivos Android durante las próximas semanas, a partir de hoy.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *