Categorías: Tecnología

A la inteligencia artificial le molestan las conversaciones muy largas

Comparta este Artículo en:

Cuando una conversación de humanos con una inteligencia artificial especializada en lenguaje acumula muchas interacciones sin pausa, esa inteligencia artificial a veces empieza a funcionar más despacio y a perder calidad.

Esto le ocurre a inteligencias artificiales como por ejemplo ChatGPT.

Un equipo encabezado por Guangxuan Xiao, del Instituto Tecnológico de Massachusetts (MIT) en Estados Unidos, ha descubierto una sorprendente causa de este problema y ha desarrollado una sencilla solución que permite a un chatbot mantener una conversación ininterrumpida sin bloquearse ni ralentizarse.

El método consiste en modificar la memoria caché de clave-valor (que es como una memoria de conversación) en la que se basan muchos modelos lingüísticos de gran tamaño.

En algunos métodos, cuando esta caché necesita más información de la que puede almacenar, los primeros datos se eliminan. Esto puede hacer que el modelo falle.

Al garantizar que estos primeros datos permanezcan en la memoria, el método de los investigadores permite a un chatbot seguir chateando por muy larga que sea la conversación.

El método, denominado StreamingLLM, permite que un modelo siga siendo eficiente incluso cuando una conversación se prolonga durante más de 4 millones de palabras.

En comparación con otro método que evita los bloqueos volviendo a calcular constantemente parte de las conversaciones pasadas, StreamingLLM funcionó 22 veces más rápido.

Esto podría permitir a un chatbot mantener largas conversaciones durante toda la jornada laboral sin necesidad de reiniciarse continuamente.

Fuente: arXiv

Editor PDM

Entradas recientes

Cámara de alta velocidad captura cómo un CD se calienta en un microondas

Los Slow Mo Guys usan su cámara TMX Phantom de alta velocidad para capturar un…

26 mins hace

Este líquido no está parado ni congelado

El flujo laminar, un efecto físico de los líquidos cuyo resultado es que parece que…

27 mins hace

Los cristales de tiempo son capaces de estabilizar los computadores cuánticos

El vínculo que sostienen los computadores cuánticos y los cristales de tiempo es cada vez…

28 mins hace

Logran reproducir películas completas en un Atari 2600

MovieCart le permite reproducir películas completas en hardware Atari 2600 original a todo color. (more…)

29 mins hace

El supercomputador más potente de NVIDIA está listo

Esta máquina aglutina nada menos que 576 plataformas DGX H100, y cada una de ellas…

1 day hace

Nuevo anticuerpo logra bloquear todas las variantes del virus del COVID

Un nuevo anticuerpo ha conseguido bloquear en modelos preclínicos todas las variantes del SARS-CoV-2, el…

1 day hace
Click to listen highlighted text!