Categorías: Tecnología

Inteligencia artificial para que funcione eficientemente en teléfonos inteligentes

Comparta este Artículo en:

Los modelos de lenguaje grande (LLM, por sus siglas en inglés), como la famosa plataforma de conversación ChatGPT de Open AI, se han vuelto cada vez más comunes y muchos usuarios de Internet confían en ellos para encontrar información rápidamente y producir textos para diversos fines.

Sin embargo, la mayoría de estos modelos funcionan significativamente mejor en computadoras, debido a las altas demandas computacionales asociadas con su tamaño y capacidades de procesamiento de datos.

Para abordar este desafío, los científicos informáticos también han estado desarrollando modelos de lenguaje pequeño (SLM, por sus siglas en inglés), que tienen una arquitectura similar pero son más pequeños.

Estos modelos podrían ser más fáciles de implementar directamente en teléfonos inteligentes, lo que permitiría a los usuarios consultar plataformas similares a ChatGPT con mayor facilidad a diario.

Investigadores de la Universidad de Correos y Telecomunicaciones de Beijing (BUPT, por sus siglas en inglés) presentaron recientemente PhoneLM, una nueva arquitectura SLM para teléfonos inteligentes que podría ser eficiente y de alto rendimiento.

Su arquitectura propuesta fue diseñada para lograr una eficiencia de tiempo de ejecución casi óptima antes de someterse a un entrenamiento previo con datos de texto.

“El objetivo de nuestro reciente proyecto era explorar el espacio de diseño de LLM para una implementación eficiente en el uso de recursos en dispositivos móviles“, dijo Mangwei Xu, autor principal del artículo.

“Anteriormente, el desarrollo de LLM seguía el proceso de diseñar y entrenar previamente el LLM para lograr una buena capacidad (es decir, precisión) y luego optimizarlo en la etapa posterior al entrenamiento, por ejemplo, cuantificación y poda.

Nuestros experimentos, por otro lado, indican que las configuraciones de LLM (por ejemplo, ancho y profundidad) tienen más impacto en la eficiencia del tiempo de ejecución que en la capacidad”.

El modelo presentado por Xu y sus colegas se basa en un principio de diseño innovador que prioriza la eficiencia.

A diferencia de otros SLM existentes, se basa en una llamada búsqueda de arquitectura antes del entrenamiento previo, que implica buscar una arquitectura que funcione de manera más eficiente en el hardware en el que se pretende implementar antes de la etapa de entrenamiento previo.

“PhoneLM sigue una arquitectura LLM estándar“, dijo Xu.

“Lo que lo hace único es cómo está diseñado: buscamos los hiperparámetros de la arquitectura (por ejemplo, ancho, profundidad, número de cabezales, etc.) en un hardware determinado (un teléfono inteligente de alta gama), elegimos la configuración con la mayor velocidad de inferencia y luego lo entrenamos previamente con datos de alta calidad”.

En las pruebas iniciales en dispositivos inteligentes, el modelo desarrollado por este equipo de investigadores funcionó notablemente bien, funcionando extremadamente rápido en comparación con otros LLM con un tamaño de parámetro similar.

Cabe destacar que esta mejora en la velocidad no comprometió significativamente su rendimiento, ya que el modelo aún logró capacidades de procesamiento de lenguaje natural (NLP) de última generación.

“Los hiperparámetros de la arquitectura concreta del decodificador de transformadores tienen un mayor impacto en la eficiencia del tiempo de ejecución que en la capacidad del lenguaje“, dijo Xu.

“Por lo tanto, trasladaremos la consideración de la eficiencia de inferencia en el dispositivo por delante del entrenamiento previo”.

Los investigadores publicaron tanto el código como una demostración de Android de extremo a extremo de una versión optimizada de PhoneLM, publicando ambos en GitHub.

El nuevo modelo de lenguaje para teléfonos inteligentes podría mejorarse y probarse más a fondo para facilitar su futura implementación en dispositivos disponibles comercialmente.

“Ahora continuaremos con el desarrollo de una familia PhoneLM más avanzada, por ejemplo, integrando una combinación de expertos y funciones multimodales“, agregó Xu.

“También estamos explorando el desarrollo de un agente móvil (es decir, un asistente virtual) habilitado para LLM en el dispositivo”.

Fuente: arXiv

Editor PDM

Siguiente Desentrañan misterio clave que podría explicar el 80% de los casos de autismo »

Anterior « El movimiento sincronizado entre robots y humanos genera confianza

Deja un comentario

Publicado por

Editor PDM

Etiquetas: inteligencia artificialPhoneLMSLM

4 months hace

POCO lanza sus teléfonos F7 Pro y F7 Ultra

POCO acaba de presentar los nuevos POCO F7 Pro y POCO F7 Ultra, dos propuestas…

13 hours hace

Tecnología

Nueva métrica para cuantificar las capacidades de las IAs en términos de capacidades humanas

Un equipo de investigadores de IA de la startup METR propone una nueva métrica para…

13 hours hace

Ciencia

Cemento y concreto más sostenibles con agua salada, CO2 y electricidad

El cemento es uno de los materiales artificiales más utilizados en el planeta, pero tiene…

13 hours hace

Tecnología

Tecnología de audio utiliza ultrasonidos para escuchar música en privado sin auriculares

¿Qué pasaría si pudiera escuchar música o un podcast sin auriculares ni audífonos y sin…

13 hours hace

Tecnología

Robot nada, se arrastra y desliza sin ataduras en las profundidades del océano

Un equipo de ingenieros mecánicos de la Universidad de Beihang, en colaboración con un especialista…

13 hours hace

Tecnología

Texas Instruments presenta el microcontrolador más pequeño del mundo

El MSPM0C1104 de Texas Instruments es el microcontrolador más pequeño del mundo. (more…)

2 days hace

Inteligencia artificial para que funcione eficientemente en teléfonos inteligentes

Artículos relacionados:

Entrada Relacionada

Entradas recientes

POCO lanza sus teléfonos F7 Pro y F7 Ultra

Nueva métrica para cuantificar las capacidades de las IAs en términos de capacidades humanas

Cemento y concreto más sostenibles con agua salada, CO2 y electricidad

Tecnología de audio utiliza ultrasonidos para escuchar música en privado sin auriculares

Robot nada, se arrastra y desliza sin ataduras en las profundidades del océano

Texas Instruments presenta el microcontrolador más pequeño del mundo