El aprendizaje automático podría usarse para identificar hackers y plagiarios

Comparta este Artículo en:

El aprendizaje automático puede identificar a los programadores.

Los programadores tienden a tener sus propios estilos distintos, pero no es realmente factible examinar muchas líneas de código en busca de pistas reveladoras sobre el autor de un programa.

Ahora, eso podría no ser necesario.

Investigadores de la Drexel University han desarrollado un sistema de aprendizaje automático que puede “des-anonimizar” a los programadores, ya sea a través de código fuente o binarios compilados.

El enfoque entrena un algoritmo para reconocer la estructura de codificación de un programador con base en ejemplos de su trabajo, y los utiliza para identificar rasgos comunes en muestras de código.

Tampoco necesita grandes porciones de un programa dado, los fragmentos cortos a menudo son suficientes.

En una prueba con los resultados de Code Jam de Google, la tecnología basada en inteligencia artificial era relativamente precisa, aunque estaba lejos de ser infalible.

Con 600 programadores y ocho muestras cada uno, el sistema podía identificar creadores el 83 por ciento del tiempo.

La tecnología podría ser una gran ayuda para los investigadores.

Sería útil para identificar creadores de malware, especialmente cuando los perpetradores intentan incriminar a otra persona.

También podría ser útil para casos de plagio, donde el aprendizaje automático podría distinguir entre similitudes puramente coincidentes y copia abierta.

Esto podría dificultar, por otro lado, la contribución de programadores con código valioso que desean verdadero anonimato.

Alguien teóricamente podría reconocer su trabajo abierto incluso si está cambiando cuentas o si no quiere dejar un rastro.

Cualquier posible implementación futura debería tener un equilibrio cuidadoso entre el deseo de seguridad y la necesidad de privacidad.

Fuente: Engadget