Del nivel 1 al 5: OpenAI y su estrategia hacia la Inteligencia Artificial General
En este newsletter exploraremos la hoja de ruta de OpenIA hacia la Inteligencia Artificial General, una página que permite crear entornos interactivos sin programar, entre otras noticias.
En este newsletter exploraremos las últimas tendencias y avances en inteligencia artificial. Todas las semanas podrás encontrar:
Las noticias más relevantes de la semana en la industria de la inteligencia artificial.
Productos y herramientas gratuitas que permiten maximizar el uso de la inteligencia artificial en tu trabajo o vida personal.
Análisis sobre un artículo científico reciente en el campo de la inteligencia artificial, junto con las implicancias de estos nuevos descubrimientos.
En esta entrega, analizaremos los siguientes tópicos:
La hoja de ruta de OpenAI para llegar a la inteligencia artificial general.
Fecha de lanzamiento de los nuevos Grandes Modelos de Lenguaje de Twitter.
Un uso de IA en la salud puede predecir el Alzheimer.
Crear entornos interactivos sin programar.
Investigadores descubren una técnica para eliminar el trade off entre calidad y costo en las respuestas de los Grandes Modelos de Lenguaje.
Lo que pasó esta semana
La hoja de ruta de OpenAI para conseguir AGI
Bloomberg informó que OpenAI ha implementado internamente un nuevo sistema de clasificación de cinco niveles para medir su progreso hacia la Inteligencia Artificial General (AGI, por sus siglas en inglés).
El sistema de clasificación se estructura de la siguiente manera:
Nivel 1 (IA Conversacional): Este nivel representa la IA conversacional actual, como los chatbots y sistemas de IA con capacidad de lenguaje conversacional. Es el estado actual de la tecnología ampliamente disponible.
Nivel 2 (Razonadores): En este nivel, la IA puede resolver problemas complejos al nivel de un experto humano con educación de doctorado, sin acceso a recursos externos. Esto implica una mejora significativa en las capacidades de análisis y toma de decisiones.
Nivel 3 (Agentes): Aquí, la IA evoluciona a "agentes". Estos sistemas pueden operar de forma autónoma durante períodos prolongados, tomando decisiones y adaptándose a circunstancias cambiantes sin supervisión humana constante. Esto sugiere un nivel de independencia y capacidad de interacción con el mundo real.
Nivel 4 (Innovadores): En este nivel, la IA se convierte en "innovadores", capaces de ayudar en la invención y creación de nuevas ideas y tecnologías. Conseguir esto sería un salto cualitativo en términos de creatividad y pensamiento original.
Nivel 5 (Organizaciones): El nivel más alto describe IA capaz de realizar el trabajo de una organización completa. Esto sugiere sistemas con una comprensión profunda y multifacética de las operaciones complejas, capaces de gestionar recursos, tomar decisiones estratégicas y coordinar múltiples aspectos de una organización.
Según los reportes, OpenAI cree que actualmente estamos en el nivel 1 pero cerca de dar el salto hacia la etapa 2 en el desarrollo hacia la AGI.
Proyecto Strawberry
Por otro lado, Reuters informó que OpenAI está trabajando en un nuevo enfoque para sus modelos de IA bajo el nombre en clave "Strawberry". Este enfoque puede ser lo que permita este salto del nivel 1 al nivel 2.
El objetivo principal del proyecto Strawberry es mejorar las capacidades de razonamiento de los modelos de IA de OpenAI. Aunque los detalles específicos son secreto, se sabe que Strawberry implica un método especializado de "post-entrenamiento" para adaptar los modelos base y mejorar su rendimiento en áreas específicas.
Se espera que Strawberry permita a la IA de OpenAI no solo generar respuestas, sino también planificar y navegar de forma autónoma por internet para realizar lo que la empresa denomina "investigación profunda". Este proyecto es una evolución del proyecto anteriormente conocido como Q*, que ya se consideraba un avance significativo dentro de la empresa.
Las implicaciones de este desarrollo son potencialmente revolucionarias. Podría permitir a los modelos de IA realizar tareas complejas a largo plazo y superar las limitaciones actuales en términos de razonamiento y planificación. Esto representa un paso importante en la carrera por desarrollar IA más avanzada y capaz, con posibles aplicaciones en investigación científica, desarrollo de software y otros campos.
Grok 2 y Grok 3 ya tienen fecha de salida
En una reciente serie de publicaciones en X, Elon Musk, reveló sus planes para el lanzamiento de nuevas versiones del modelo de lenguaje de X, Grok. Según Musk, Grok 2 llegará en agosto, mientras que Grok 3 está previsto para finales de año.
Aunque los detalles sobre estas próximas versiones son escasos, Musk mencionó que Grok 3 se entrenará utilizando 100.000 GPUs Nvidia H100, lo que según él lo convertirá en "algo realmente especial".
Musk también comentó sobre el proceso de entrenamiento de Grok 2, afirmando que se ha realizado un esfuerzo significativo para purgar datos de entrenamiento de internet que pudieran contener salidas de otros modelos de lenguaje. Esto surge en respuesta a las observaciones del CEO de Cohere, Aidan Gomez, sobre cómo muchos modelos están "entrenándose con las salidas de OpenAI".
La versión más reciente, Grok 1.5, lanzada en marzo, mostró mejoras en capacidades de razonamiento y un contexto de 128,000 tokens. Aunque no superó a GPT-4 en algunas pruebas de referencia, logró mejores resultados en el benchmark HumanEval.
A diferencia de otros modelos como ChatGPT, Gemini o Claude, Grok no ofrece una versión gratuita, lo que ha limitado su popularidad. Dada la estrategia de Musk para aumentar los ingresos de X, es poco probable que veamos una versión gratuita de Grok en el futuro cercano.
La IA predice el desarrollo del Alzheimer
Un equipo de investigadores de la Universidad de Cambridge ha creado una innovadora herramienta de inteligencia artificial capaz de predecir con gran precisión el desarrollo del Alzheimer en pacientes con síntomas tempranos de demencia. Esta nueva tecnología acierta en cuatro de cada cinco casos, superando notablemente los métodos de diagnóstico actuales.
La clave de este avance radica en su simplicidad y accesibilidad. A diferencia de las costosas y invasivas pruebas actuales, como los escaneos PET o las punciones lumbares, esta herramienta utiliza datos rutinarios de fácil obtención: pruebas cognitivas y resonancias magnéticas que muestran la atrofia de la materia gris cerebral.
El algoritmo no solo distingue entre casos estables y progresivos, sino que también clasifica a los pacientes en tres grupos según la velocidad de avance de la enfermedad. Esta capacidad de estratificación podría mejorar el tratamiento del Alzheimer, permitiendo intervenciones más tempranas y personalizadas.
Un aspecto crucial de esta investigación es su validación en entornos clínicos reales. El algoritmo se probó con datos de casi 900 pacientes de clínicas de memoria en el Reino Unido y Singapur, demostrando su aplicabilidad práctica más allá del ámbito de investigación.
Mirando al futuro, el equipo planea extender su modelo a otras formas de demencia y explorar el uso de diferentes tipos de datos, como marcadores en análisis de sangre.
La IA puede no reemplazar al trabajo humano
Ken Griffin, fundador y CEO de Citadel, ha expresado su escepticismo sobre la posibilidad de que la inteligencia artificial reemplace pronto los trabajos humanos, señalando deficiencias en los modelos de aprendizaje automático en ciertos escenarios.
Durante un evento para la nueva clase de pasantes de Citadel en Nueva York, Griffin comentó: "Algunos están convencidos de que en tres años, casi todo lo que hacemos como humanos será realizado de una forma u otra por modelos de lenguaje grande (LLMs) y otras herramientas de IA. Por varias razones, no estoy convencido de que estos modelos lograrán ese tipo de avance en un futuro cercano".
Griffin argumenta que los modelos de aprendizaje automático tienen limitaciones, especialmente cuando se trata de adaptarse a cambios:
"Los modelos de aprendizaje automático no funcionan bien en un mundo donde los regímenes cambian. Los coches autónomos no funcionan muy bien en el norte debido a la nieve. Cuando el terreno cambia, no tienen idea de qué hacer", explicó. "Los modelos de aprendizaje automático funcionan mucho mejor cuando hay consistencia". Nótese, sin embargo, que el Nivel 3 propuesto por OpenAI para el avance de la IA menciona específicamente el "adaptarse a situaciones cambiantes”.
El inversor no descarta el poder de la tecnología avanzada a largo plazo. De hecho, prevé avances significativos en áreas como la salud:
"El aumento del poder de cómputo nos está permitiendo resolver todo tipo de problemas que simplemente no eran solubles hace cinco, 10 o 15 años", dijo Griffin. "Esto va a transformar radicalmente la atención médica. Acabaremos con el cáncer tal como lo conocen en su vida".
Este tipo de frases va de la mano con avances como el mencionado anteriormente por científicos de Cambridge. Más allá del rol de la IA en el mercado laboral, el sector de la salud es uno de los más beneficiados por las nuevas tecnologías.
Un uso práctico para la inteligencia artificial
Crear entornos interactivos sin necesidad de programar
WebSim.AI es una plataforma innovadora que transforma la creación de sitios web estáticos en entornos dinámicos e interactivos. Utilizando modelos de lenguaje avanzados como Claude y GPT-4, permite a los usuarios crear aplicaciones web, juegos y espacios 3D a partir de simples indicaciones de texto o URLs.
WebSim.AI ofrece una forma accesible y potente de crear experiencias web interactivas, permitiendo a usuarios sin habilidades de programación dar vida a sus ideas de manera rápida y eficiente.
¿Qué hace WebSim.AI?
Genera contenido web dinámico basado en prompts de texto o URLs.
Crea simulaciones web interactivas.
Permite la personalización de elementos web como texto, imágenes y diseño.
Ofrece funcionalidad de búsqueda "multiverso" para generar contenido contextual.
Facilita el prototipado rápido de conceptos web.
Puede usar las aplicaciones de WebSim.AI creados por la comunidad o crear tu propio proyecto.
A continuación te comentamos cómo usar WebSim.AI para crear tu propio proyecto:
Visita el sitio web https://websim.ai/ y regístrate.
Elige tu modelo de IA preferido (se recomienda Claude Sonnet 3.5).
Ingresa una URL o un prompt de texto en el cuadro de entrada.
Explora la simulación generada:
Revisa cómo el contenido se alinea con el diseño y la disposición.
Prueba los elementos interactivos y botones implementados.
Refina e itera:
Usa la simulación generada como base.
Agrega nuevos detalles al prompt para mejorar elementos específicos.
Haz clic derecho en un elemento para editarlo o profundizar en él.
Si es necesario, actualiza el navegador para asegurar que los elementos interactivos funcionen correctamente.
Guarda y administra tus proyectos:
Usa la función de marcadores para guardar estados específicos del proyecto.
Edita los títulos de los proyectos para una mejor organización.
Publica proyectos para permitir la colaboración de la comunidad.
Comparte tus creaciones:
Usa las opciones de exportación para copiar la URL del proyecto o descargar como HTML.
Para un paso a paso más detallado sobre su uso y ejemplos prácticos de como los usuarios están utilizando esta herramienta te invitamos a entrar al siguiente link.
Los nuevos avances en la academia
La solución al trade off entre calidad y costo
Los investigadores de Meta, FAIR, han dado un salto cualitativo en el desarrollo de modelos de lenguaje grande (LLMs) con su nueva técnica "Destilación del Sistema 2 en el Sistema 1". Esta innovación promete revolucionar la eficiencia y practicidad de los LLMs sin comprometer su capacidad de razonamiento sofisticado.
Hasta ahora, los LLMs operaban bajo dos paradigmas: el Sistema 1, que genera respuestas de forma directa, y el Sistema 2, que produce pensamientos intermedios para mejorar la calidad de las respuestas, pero a expensas de mayor tiempo y recursos computacionales.
Esta es la razón por la cual prompts como "analízalo paso a paso" o técnicas como Chain-of-Thought eran muy efectivas a la hora de lograr mejores respuestas. Sin embargo, el costo era más lentitud y costo. Este trade-off entre calidad de las respuestas y costo de las mismas puede estar próximo a cambiar.
La nueva técnica logra "destilar" las habilidades del Sistema 2 en el Sistema 1, permitiendo que los modelos produzcan respuestas de alta calidad sin necesidad de generar pasos intermedios visibles.
El rol del prompting en este contexto es crucial. Antes de esta técnica, el prompting era utilizado principalmente para guiar al modelo en la generación de pensamientos intermedios (Sistema 2) o para obtener respuestas directas y rapidas (Sistema 1). Con la nueva técnica de destilación, el prompting se utiliza de manera más sofisticada:
Durante el entrenamiento: Se utilizan prompts específicos para generar respuestas de alta calidad utilizando métodos del Sistema 2.
Para la destilación: Se emplean técnicas de filtrado basadas en prompts para seleccionar las mejores respuestas generadas.
Después de la destilación: El modelo resultante puede responder a prompts de manera más eficiente, combinando la velocidad del Sistema 1 con la calidad del Sistema 2.
Esta innovación tiene implicaciones prácticas sustanciales. Facilita la aplicación de técnicas avanzadas de razonamiento en entornos del mundo real, donde la rapidez de respuesta y la eficiencia computacional son vitales. Además, podría impulsar una nueva generación de asistentes de IA más capaces y eficientes, mejorando la interacción humano-máquina en campos diversos como el servicio al cliente, la educación y la investigación.
La técnica también abre nuevas vías para el aprendizaje continuo en sistemas de IA. Al poder "compilar" eficientemente nuevas capacidades, los modelos podrían adaptarse más rápidamente a nuevas tareas y dominios, acelerando potencialmente el progreso en la IA.
El resultado final (si esta técnica logra utilizarse eficazmente en otros contextos y modelos) es un LLM que puede generar respuestas de alta calidad directamente, sin necesidad de generar pasos intermedios visibles, combinando la eficiencia del Sistema 1 con la calidad del Sistema 2.
Si te gustó esta newsletter te invitamos a suscribirte para recibir todas las semanas novedades, análisis y tips sobre todo lo nuevo que ocurre en la inteligencia artificial.
Si te interesa contactarnos, ya sea para adoptar inteligencia artificial en tu empresa, para aprender a usar los grandes modelos de lenguaje o para conocer más acerca de todo lo referido a la inteligencia artificial no dudes en comentar en este post. También puedes seguirnos en LinkedIn y en nuestra página web