ASI-Evolve: sistema de IA descubre arquitecturas, datos y algoritmos que superan diseños humanos

Un nuevo trabajo académico plantea una idea ambiciosa y cada vez más concreta: que la inteligencia artificial pueda acelerar el desarrollo de la propia inteligencia artificial. Bajo el nombre ASI-Evolve, un equipo de investigadores presenta un marco agéntico que automatiza ciclos de diseño, experimentación y análisis en áreas tan críticas como arquitecturas neuronales, curación de datos y algoritmos de aprendizaje por refuerzo.
***

ASI-Evolve propone un ciclo de aprender, diseñar, experimentar y analizar para automatizar investigación en IA.
El sistema reportó 105 arquitecturas SOTA de atención lineal y mejoras de hasta +18 puntos en MMLU.
Los autores sostienen que el enfoque podría transferirse más allá de la IA, con pruebas iniciales en matemáticas y biomedicina.

ASI-Evolve: La IA que crea IA

Un nuevo sistema de IA automatiza el diseño y análisis de arquitecturas neuronales.

Descubrió 105 arquitecturas SOTA, mejorando el rendimiento hasta en 18 puntos en benchmarks.

Integrando conocimiento previo y análisis reutilizable, este… pic.twitter.com/8nRTtVzrHR

— Diario฿itcoin (@DiarioBitcoin) April 6, 2026

La idea de que una inteligencia artificial pueda ayudar a crear mejores sistemas de inteligencia artificial ha sido discutida durante años. Sin embargo, llevar ese concepto más allá de tareas puntuales y convertirlo en un proceso de investigación útil, sostenido y con resultados medibles sigue siendo uno de los grandes retos del sector.

En ese contexto, un grupo de investigadores presentó ASI-Evolve: AI Accelerates AI, trabajo firmado por Weixian Xu, Tiantian Mi, Yixiu Liu, Yang Nan, Zhimeng Zhou, Lyumanshan Ye, Lin Zhang, Yu Qiao y Pengfei Liu. El estudio describe un marco agéntico diseñado para cerrar el ciclo de investigación de IA mediante una secuencia de aprender, diseñar, experimentar y analizar.

Según los autores, la motivación central parte de una limitación conocida. Aunque los sistemas agénticos recientes han mostrado buen desempeño en tareas bien acotadas y con retroalimentación rápida, todavía no estaba claro si podían enfrentar bucles de investigación costosos, de largo horizonte y con supervisión débil, que son precisamente los que impulsan el progreso real en inteligencia artificial.

El trabajo propone que sí es posible avanzar en esa dirección. Para ello, ASI-Evolve extiende los agentes evolutivos convencionales con dos piezas adicionales que buscan dar más memoria y mayor capacidad de aprendizaje acumulativo al sistema entre una iteración y otra.

Cómo funciona ASI-Evolve

La primera de esas piezas es una base de cognición. Su función es inyectar conocimiento previo acumulado por humanos en cada ronda de exploración. En otras palabras, el sistema no parte de cero en cada ciclo, sino que incorpora experiencia previa como punto de apoyo para orientar nuevas búsquedas.

La segunda pieza es un analizador dedicado. Ese módulo toma resultados experimentales complejos y los destila en ideas reutilizables para futuras iteraciones. El objetivo es que la IA no solo pruebe variantes, sino que también extraiga lecciones concretas de lo que funcionó y de lo que no funcionó.

Esta lógica de circuito cerrado es importante porque se parece más al trabajo de un equipo de investigación que al de una herramienta aislada. En lugar de limitarse a ejecutar instrucciones fijas, el marco busca sostener un proceso continuo de hipótesis, prueba, evaluación y refinamiento.

De acuerdo con el estudio, este sería el primer marco unificado que demuestra descubrimiento impulsado por IA en tres componentes centrales del desarrollo de la IA: datos, arquitecturas y algoritmos de aprendizaje. Esa afirmación sitúa el aporte del trabajo en un terreno especialmente ambicioso, porque cubre varias capas críticas del stack tecnológico.

Resultados en diseño de arquitecturas neuronales

Uno de los frentes en los que ASI-Evolve fue evaluado es el diseño de arquitecturas neuronales. Allí, el sistema descubrió 105 arquitecturas SOTA de atención lineal, una cifra que destaca por volumen y por la diversidad implícita de configuraciones encontradas durante el proceso de exploración.

El mejor modelo descubierto superó a DeltaNet por +0,97 puntos. Los autores subrayan que esta mejora equivale a casi 3 veces el avance logrado por progresos recientes diseñados por humanos. Ese contraste es relevante porque sugiere que la automatización no solo acelera pruebas, sino que también podría producir saltos más agresivos en rendimiento.

Para lectores menos familiarizados con el tema, la atención lineal es un área muy observada dentro de la investigación en modelos de IA. Mejorar estas arquitecturas puede tener impacto directo sobre eficiencia, escalabilidad y desempeño en tareas complejas, factores que hoy condicionan tanto el costo como la utilidad práctica de los modelos.

En ese sentido, el resultado no implica que la investigación humana deje de ser importante. Más bien apunta a un escenario en el que los equipos de desarrollo podrían apoyarse en sistemas automatizados para ampliar el espacio de búsqueda, explorar combinaciones que serían difíciles de revisar manualmente y detectar configuraciones prometedoras con más rapidez.

Mejoras en datos de preentrenamiento y aprendizaje por refuerzo

El segundo eje del trabajo se centró en la curación de datos de preentrenamiento. Según los resultados reportados, la canalización evolucionada mejoró el rendimiento promedio en benchmarks en +3,96 puntos. En el caso de MMLU, las ganancias superaron los +18 puntos.

Ese dato es especialmente significativo porque la calidad y la composición de los datos de preentrenamiento afectan de forma directa el comportamiento final de los modelos. En la práctica, no basta con tener más datos. También importa mucho qué datos se usan, cómo se filtran y qué señales ofrecen para que el sistema aprenda patrones útiles.

El tercer componente evaluado fue el diseño de algoritmos de aprendizaje por refuerzo. En este apartado, los algoritmos descubiertos por ASI-Evolve superaron a GRPO por hasta +12,5 puntos en AMC32, +11,67 puntos en AIME24 y +5,04 puntos en OlympiadBench.

Estos benchmarks están ligados a tareas exigentes, en especial aquellas que demandan razonamiento y resolución estructurada de problemas. Por eso, mejoras de ese tamaño tienden a llamar la atención en la comunidad técnica. También refuerzan la hipótesis de que una IA bien organizada puede contribuir a diseñar mejores métodos para entrenar otras IAs.

Más allá del stack de IA

El estudio no se limita a mostrar resultados dentro del ecosistema de desarrollo de modelos. Los autores también presentaron evidencia inicial de que este paradigma de IA-para-IA podría transferirse fuera del stack tradicional de inteligencia artificial.

En particular, mencionan experimentos en matemáticas y biomedicina. El trabajo no presenta esa extensión como una validación definitiva, sino como una señal temprana de que el mismo enfoque de ciclo cerrado podría adaptarse a dominios donde también existe investigación iterativa, alto costo experimental y necesidad de extraer conocimiento reutilizable.

Si esa línea prospera, el impacto potencial sería amplio. Herramientas de este tipo podrían asistir en tareas de descubrimiento científico, diseño de hipótesis o evaluación sistemática de alternativas. Aun así, el propio estudio se mueve con cautela y habla de evidencia inicial, no de una solución general ya demostrada.

Esa precisión importa. En áreas como matemáticas o biomedicina, la validación experimental, la interpretación y la seguridad siguen siendo factores decisivos. Un sistema agéntico puede acelerar etapas del proceso, pero eso no elimina la necesidad de verificación rigurosa por parte de especialistas humanos.

Qué significa este avance

En conjunto, los resultados sugieren que ASI-Evolve representa un paso prometedor hacia sistemas capaces de acelerar etapas fundamentales del desarrollo de la IA. La principal tesis del trabajo es que la investigación de ciclo cerrado, asistida por agentes y enriquecida con memoria cognitiva y análisis reutilizable, ya muestra señales de viabilidad práctica.

Para la industria tecnológica, este tipo de avances podría traducirse en ciclos de innovación más rápidos. También podría elevar la competitividad entre laboratorios y empresas que buscan mejores modelos con menos tiempo de ensayo manual. En un sector donde pequeñas mejoras de eficiencia o precisión tienen gran valor, automatizar investigación puede convertirse en una ventaja estratégica.

Al mismo tiempo, el trabajo abre preguntas importantes. Entre ellas, cómo evaluar la robustez de los hallazgos, cómo evitar sesgos acumulados en los ciclos automatizados y cómo garantizar que los resultados sean reproducibles en otros contextos. La disponibilidad de código, mencionada por los autores, puede ayudar a que la comunidad técnica contraste y replique los experimentos.

Por ahora, la principal conclusión es menos futurista de lo que parece. No se trata de una IA que inventa ciencia sin supervisión, sino de un marco que intenta sistematizar y acelerar partes difíciles del proceso de investigación. Si sus resultados se sostienen en futuras validaciones, ASI-Evolve podría marcar una etapa temprana pero relevante en la transición hacia herramientas que ayuden a construir la próxima generación de inteligencia artificial.

Cómo funciona ASI-Evolve

Resultados en diseño de arquitecturas neuronales

Mejoras en datos de preentrenamiento y aprendizaje por refuerzo

Más allá del stack de IA

Qué significa este avance

Related Posts

Develan mural en Venezuela para honrar a héroes de la descentralización

Ethereum lanza sitio web para coordinar sus avances postcuánticos

Por qué Latinoamérica no logra capitalizar el «boom» petrolero