OpenAI presenta GPT-4o Mini, su modelo de IA pequeño más económico hasta el momento

Otro modelo de IA se ha sumado al mar de modelos de IA y este es de OpenAI una vez más. OpenAI lanzó previamente GPT-4o este año, que se suponía que sería más eficiente que GPT-4. Pero aún era bastante costoso y podía generar una factura considerable, especialmente para los desarrolladores que necesitan llamar al modelo de IA a través de la API para sus aplicaciones repetidamente durante el día.

Como resultado, los desarrolladores recurrieron a modelos de IA pequeños y más baratos de la competencia, como Gemini 1.5 Flash o Claude 3 Haiku.

Ahora, OpenAI está lanzando GPT-4o mini, su modelo más rentable hasta el momento, con el que también están entrando en el espacio de los modelos de IA pequeños. Si bien el GPT-4o mini es su modelo más económico hasta el momento, no está logrando ese bajo costo reduciendo la inteligencia; es más inteligente que su modelo GPT-3.5 Turbo existente.

Según OpenAI, GPT-4o mini obtuvo un 82 % en MMLU (Measuring Massive Multitask Language Understanding), superando a muchos modelos; estas son las puntuaciones respectivas de diferentes modelos: GPT-3.5 Turbo (70 %), Claude 3 Haiku (75,2 %) y Gemini 1.5 Flash (78,9 %). GPT-4o obtuvo un 88,7 % en este punto de referencia, y Gemini Ultra obtuvo la puntuación más alta: 90 % (aunque no se trata de modelos de IA pequeños).

Hoy se está implementando GPT-4o mini para los usuarios de ChatGPT Free, Team y Plus, así como para los desarrolladores. Para los usuarios de ChatGPT, básicamente ha reemplazado a GPT-3.5; GPT4o mini será el modelo predeterminado de la conversación una vez que se agoten las consultas gratuitas de GPT-4o. Los desarrolladores aún tendrán la opción de usar GPT-3.5 a través de la API, pero se eliminará con el tiempo. Los usuarios de ChatGPT Enterprise tendrán acceso a GPT-4o mini la próxima semana.

Como se mencionó anteriormente, el objetivo de GPT-4o mini es ayudar a los desarrolladores a encontrar un modelo de bajo costo y latencia para su aplicación que también sea capaz. En comparación con otros modelos pequeños, GPT-4o mini se destaca en tareas de razonamiento tanto en texto como en visión, razonamiento matemático y tareas de codificación, así como razonamiento multimodal.

Actualmente, admite tanto texto como visión en la API, y en la hoja de ruta para el futuro se admitirán entradas y salidas de texto, imágenes, vídeo y audio.

GPT-4o mini tiene una ventana de contexto de 128 000 tokens para entrada y 16 000 tokens para salida por solicitud, y su conocimiento se extiende hasta octubre de 2023. También puede manejar texto que no esté en inglés de manera bastante rentable.