Inteligencia artificial ya supera a programadores humanos

Comparta este Artículo en:

Los programadores ya alucinaban con CoPilot y ChatGPT, pero ahora DeepMind va más allá con AlphaCode.

CoPilot surgió como una revolución para programadores y a pesar de la polémica parece imparable. No está solo.

ChatGPT, el fenómeno viral de los últimos días, también apunta maneras y programa en lo que le eche.

Si esos motores de inteligencia artificial ya nos parecían alucinantes, ahora llega un nuevo motor que va aún más allá.

AlphaCode, este nuevo sistema de inteligencia artificial llega de la mano de la célebre DeepMind, subsidiaria de Google.

La empresa lleva años logrando hitos singulares: logró superar a los humanos al Go o al StarCraft II, jugó mejor que otras máquinas al ajedrez, pero también ayudó a arqueólogos, farmacéuticos, matemáticos y biólogos.

Ahora sus responsables han querido ver cómo se portaba en el mundo de la programación.

Aunque CoPilot y ChatGPT son los más populares, el verdadero referente en sistemas de IA que programan era Codex, lanzado en 2021 por OpenAI y entrenado con más de 100 GB de código de GitHub.

En DeepMind también han entrenado su sistema con código de estos repositorios, pero además han añadido entrenamiento basado en problemas recolectados de competiciones de programación.

Por ejemplo, determinar el número de cadenas binarias de longitud “n” que no tienen ningún cero consecutivo.

Ante un nuevo problema, AlphaCode genera soluciones candidatas en Python o C++ y las filtra para no contemplar las que considera malas.

Codex generaba cientos de soluciones, pero DeepMind ha logrado que AlphaCode genere más de un millón.

A partir de ahí se queda con aproximadamente el mejor 1% de todas ellas y las agrupa en “clústeres” analizando las similitudes entre las salidas y las entradas.

Eso permite enviar los resultados agrupados por estrategia, táctica de programación y resultado, lo que permite plantear alternativas y así ofrecer más posibilidades de resolver el problema.

Tras el entrenamiento, los responsables de DeepMind revelaron en Science que AlphaCode resolvió cerca de un 34% de los problemas que le fueron asignados.

Codex, que ya era bueno, no superaba el 10%.

Para demostrar su capacidad, DeepMind apuntó a AlphaCode a competiciones de programación online en las que participan programadores humanos.

En eventos con al menos 5.000 participantes, el sistema superó al 45,7% de todos ellos, pero lo más sorprendente fue otra cosa.

A pesar de que su entrenamiento está basado en código de GitHub y por tanto sería de esperar que las soluciones fueran por tanto similares al código allí publicado, AlphaCode no duplicó grandes secciones de código o lógica de algoritmos.

En esencia estaba creando algo nuevo.

AlphaCode recibió una clasificación promedio en el 54,3 % superior en evaluaciones simuladas en competencias de codificación recientes en la plataforma de codificación competitiva Codeforces cuando se limita a soluciones de generación 10 por problema.

Sin embargo, el 66% de esos problemas se resolvieron utilizando su primera presentación.

Por ahora, DeepMind quiere reducir los errores del sistema.

Incluso si AlphaCode genera un programa funcional, a veces comete errores simples, como crear una variable y no usarla.

AlphaCode requiere decenas de miles de millones de billones de operaciones por problema: poder de cómputo que solo tienen las compañías tecnológicas más grandes.

Y los problemas que resolvió de las competencias de programación en línea fueron limitados y autónomos.

Pero la programación del mundo real a menudo requiere administrar grandes paquetes de código en múltiples lugares, lo que requiere una comprensión más holística del software.

El estudio también señala el riesgo a largo plazo del software que se mejora recursivamente.

Algunos expertos dicen que tal superación personal podría conducir a una IA superinteligente que se apodere del mundo.

Aunque ese escenario puede parecer remoto, los investigadores todavía quieren que el campo de la codificación de IA instituya barandillas, controles y equilibrios incorporados.

Fuente: Gizmodo