31.3 C
Ciudad Bolivar
sábado, febrero 8, 2025

Laboratorio chino lanza IA especializada en razonamiento

El laboratorio chino DeepSeek lanzó R1, un modelo de Inteligencia Artificial (IA) especializado en razonamiento que iguala o supera el rendimiento de los modelos más avanzados de la tecnológica estadounidense, OpenAI; sobre todo en pruebas de matemáticas y programación. Este modelo es de código abierto y completamente gratuito, y dispone de 671 mil millones de parámetros.

Por otra parte, obtuvo un 97,3% de aciertos en pruebas matemáticas MATH-500, en comparación al 96,4% alcanzado por uno de los modelos de OpenAI. Su coste de desarrollo es entre un 90% y un 95% inferior al de sus competidores. DeepSeek logró este hito mediante aprendizaje por refuerzo puro, sin datos etiquetados previamente.

El aprendizaje por refuerzo permite que el modelo aprenda por sí mismo mediante prueba y error. Aunque el resultado inicial es errático, el modelo desarrolla estrategias de razonamiento únicas. DeepSeek refinó este enfoque al combinarlo con entrenamiento supervisado para crear la versión final de R1, el cual mantiene este componente.

Al ser un modelo de razonamiento, R1 se verifica «a sí mismo» de manera eficaz, lo que le permite evitar ciertos obstáculos habituales que suelen enfrentar dichos modelos, como por ejemplo, que estos requieren una mayor cantidad de tiempo para concebir soluciones en comparación con un modelo típico sin razonamiento.

Con información de agencias.-

- ANUNCIO-spot_img
- PUBLICIDAD-spot_img