GPT-4o, el último modelo insignia de OpenAI, ha recibido sentimientos encontrados por parte de los usuarios. Mientras que algunos están impresionados por su velocidad y capacidades multimodales, otros están decepcionados por el hecho de que no muestra mejoras en inteligencia y razonamiento con respecto al GPT-4. Pero ya sea que el equipo esté «impresionado» o «meh», todavía es difícil ignorar el hecho de que las capacidades multimodales de GPT-4o cambian las reglas del juego.
Aquí hay ciertas formas en que GPT-4o podrá ayudarlo después de que OpenAI lance las nuevas capacidades de voz y visión.
Socio de aprendizaje/Tutor
Con las capacidades del GPT-40, podría ser el compañero de aprendizaje o tutor perfecto. Puedes usarlo para aprender idiomas u obtener ayuda para resolver problemas matemáticos. Puede señalar objetos para obtener ayuda con el aprendizaje del idioma o compartir sus preguntas de matemáticas con ellos. No se limitará a entregarle las respuestas ni a hacer los deberes por usted.
https://www.youtube.com/watch?v=_nSmkyDNulk
Puede crear una serie de preguntas para ayudarle a comprender el concepto y llegar a la parte de resolución del problema usted mismo, como un verdadero tutor. Además, con sus capacidades avanzadas, es capaz de manejar una situación “con empatía”. Entonces, mientras te instruye, puede demostrar una paciencia y empatía increíbles, empujándote en la dirección correcta, sin frustrarte. Para muchas personas, a veces esto puede resultar bastante difícil de conseguir en la vida real.
Las aplicaciones futuras son aún más intrigantes, si pudieras usar GPT-4o en gafas inteligentes (tomando la idea del Proyecto Astra de Google) para tener siempre a tu lado a tu compañero de aprendizaje.
Obtenga ayuda con la preparación de la entrevista
ChatGPT, cuando funciona con GPT-4o, puede ser el mejor socio en la preparación de entrevistas. Si bien ya se podía simular una conversación de ida y vuelta con ChatGPT para prepararse para una entrevista y podría ayudar a concretar los aspectos técnicos de manera bastante fantástica, el proceso no fue tan natural debido a factores como la latencia y la ausencia de multimodalidad en el núcleo de ChatGPT.
Pero con sus capacidades de razonamiento mejoradas en voz y visión, puede ir un paso más allá para ayudarle. Para empezar, con su nueva capacidad de “verte”, incluso puede guiarte con la parte estética de prepararte para la entrevista, como tu vestimenta.
https://www.youtube.com/watch?v=wfAYBdaGVxs
Sin embargo, las implicaciones son mucho más impactantes. Con sus capacidades visuales y su capacidad para interpretar las emociones humanas, puede incluso proporcionarle información sobre su lenguaje corporal, como un entrenador real.
Asistente de reuniones
ChatGPT puede unirse a tus reuniones, escuchar tus llamadas y transcribir, resumir e incluso presentar sus opiniones, todo en tiempo real, como un verdadero asistente.
Puede preguntarle qué se discutió en la llamada, cuál fue la opinión de cada persona sobre un determinado punto de vista, identificar puntos de vista conflictivos, trabajar en problemas de análisis de datos, buscar cierta información y mucho más.
Traductor de idiomas personales
GPT-4o puede ser un excelente asistente de traducción de idiomas. Puede traducir una conversación en tiempo real, sin necesidad de repetirla varias veces. Por lo tanto, puede tener una conversación normal en diferentes idiomas y cada vez que un orador termina de hablar, ChatGPT lo traducirá al segundo idioma.
¿En qué se diferencia de usar Google Translate o cualquier otra herramienta de traducción? Aparte del hecho de que no es necesario activar la traducción cada vez y mantiene la conversación natural, la capacidad de GPT-4o para comprender la entonación detrás de las palabras significa que se pierde menos en la traducción.
Asistente de accesibilidad para personas ciegas
ChatGPT-4o, con sus capacidades de visión, puede ayudar a las personas con discapacidad visual al observar su entorno y describírselo todo.
https://www.youtube.com/watch?v=KwNUJ69RbwY
Si bien parece bastante aspiracional en su estado actual, imagine las implicaciones si pudiera tener GPT-4o en gafas inteligentes, como las gafas Meta Rayban, donde GPT-4o podría ser literalmente los ojos de una persona con discapacidad visual. Incluso en su forma actual, es bastante sorprendente que la gente pueda apuntar con la cámara de su teléfono a algo y pueda proporcionar todos los detalles.
Si ChatGPT fuera capaz de interpretar el lenguaje de signos, podría incluso ayudar a las personas sordas en el futuro.
Capacidades de monitoreo
ChatGPT-4o puede usarse “potencialmente” para monitorear niños, mascotas, enfermos y ancianos, o incluso simplemente cosas como puertas de entrada, etc. Imagine que tiene que alejarse por un momento y quiere que alguien vigile a su hijo o mascota y avisarle de inmediato si están participando en actividades peligrosas (que usted puede definir).
Si bien pasará algún tiempo antes de que pueda confiar en que la IA no comete errores y entrega resultados confiables en todo momento, definitivamente es un posible caso de uso interesante para el futuro.
Asistente de codificación
Dado que ChatGPT puede acceder a su pantalla compartiendo pantalla, puede tener un asistente de codificación a su lado y guiarlo en todo momento. Si bien también será útil con otras aplicaciones, con las capacidades de codificación mejoradas de GPT-4o, obtener ayuda en la codificación será la mejor aplicación.
Análisis de los datos
GPT-4o tiene mejoras sorprendentes en velocidad con respecto a GPT-4 Turbo y también aporta esta velocidad al análisis de datos. Puede procesar hojas de cálculo, analizar datos e incluso crear diagramas, gráficos y tablas estadísticas en menos de 30 segundos.
Creando modelos 3D
GPT-4o puede incluso crear archivos STL para modelos 3D a partir de mensajes de texto únicos, acelerando el proceso de visualización y creación de prototipos. Entonces, ya sea que desees acelerar tu flujo de trabajo o seas alguien que no tiene los conocimientos técnicos necesarios para esta tarea, ¡ChatGPT puede ayudarte!
Utilicé GPT-4o para crear un archivo STL para un modelo 3D en ~ 20 segundos en mi teléfono. Es bastante notable lo que puedes generar con IA y un mensaje simple ahora. pic.twitter.com/2fbObrpPol
– Min Choi (@minchoi) 14 de mayo de 2024
Creando personajes consistentes
OpenAI introdujo las capacidades de generación de imágenes de DALL-E en ChatGPT hace un tiempo. Pero con GPT-4o, puedes crear múltiples imágenes del mismo personaje manteniendo la coherencia de los mismos. Entonces, ahora puedes usar ChatGPT para crear personajes consistentes para tus historias y puedes crear imágenes de ellos en diferentes acciones.
Transcripción de notas escritas a mano
Con las mayores capacidades de reconocimiento de imágenes del GPT-4o, ahora puede transcribir mejor las notas escritas a mano. Puedes usarlo para digitalizar tus notas escolares o universitarias. Incluso demuestra sorprendentes capacidades de transcripción al manejar cartas escritas a mano del siglo XVIII. Entonces, si bien habrá errores, ¡también acelerará todo el proceso de manera exponencial!
GPT-4o es realmente notable en escritura a mano 18. Le entregué la siguiente carta y le pedí una transcripción. Un par de errores muy pequeños… ¡increíble! pic.twitter.com/3JevZvd5p5
– Historia generativa (@HistoryGPT) 14 de mayo de 2024
Si bien GPT-4o no es una gran mejora con respecto a GPT-4 en términos de inteligencia y razonamiento, tampoco es una mejora pequeña de ninguna manera. Incluso si eres alguien que está más asustado por su antropomorfismo o sus similitudes con la IA de Scarlett Johannsen en Her, no puedes negar que el hecho de que se haya vuelto más inteligente será útil en la práctica.
Sin embargo, también hay otro hecho que no se puede pasar por alto al considerar aplicaciones prácticas para GPT-4o: la ventana contextual de 128K de ChatGPT. Con una ventana de contexto limitada, ChatGPT solo puede ser útil en escenarios como ser asistente de reuniones o traductor de idiomas. La pregunta de cuánto tiempo después de la reunión/conversación se agotaría la ventana de contexto de ChatGPT es extremadamente válida. También está la cuestión de los límites de uso limitado para GPT-4o.
Deja una respuesta