OpenELM es una familia de modelos de lenguaje que no requieren una conexión a internet, por lo que ofrecen mayor privacidad.
Apple ha entrado en el creciente campo de los modelos de lenguaje grande (LLM) en dispositivos con el lanzamiento de OpenELM, una familia de modelos de código abierto diseñados para ejecutarse de manera eficiente en dispositivos personales como computadores portátiles o teléfonos móviles.
OpenELM (Modelos de Lenguaje Eficientes de Código Abierto) ofrece una ventaja significativa: a diferencia de muchos otros LLM, estos modelos no requieren una conexión constante a servidores en la nube para su procesamiento.
Esto podría conducir a tiempos de respuesta más rápidos y una mejor privacidad para los usuarios.
La familia está conformada por ocho modelos con un tamaño que oscila entre 270 millones y 3.000 millones de parámetros.
Si bien los modelos más pequeños generalmente tienen menos capacidad que sus contrapartes más grandes, el enfoque de Apple utiliza una técnica especial llamada “escalado capa por capa” para ofrecer una buena precisión a pesar del tamaño reducido.
De acuerdo con un documento técnico, los ingenieros de Apple consiguieron ejecutarlos en un MacBook Pro con chip M2 Max y 64 GB de RAM, así como en un computador con procesador Intel Core i9-13900KF con 64 GB en RAM y una GPU NVIDIA RTX 4090.
Tras efectuar diversas pruebas de rendimiento, una de las variantes consiguió un rendimiento por encima de lo esperado.
Los modelos fueron entrenados con un conjunto que contiene datos de Reddit, Github, Wikipedia y más.
OpenELM está disponible en HuggingFace bajo una licencia de código de muestra que permite tanto el uso comercial como la modificación.
Sin embargo, es importante tener en cuenta que Apple no ofrece garantías sobre la seguridad o la precisión de los resultados que estos modelos puedan generar.
Este lanzamiento marca un movimiento sorprendente para Apple en el terreno de la inteligencia artificial.
Hace unas semanas, la empresa de Cupertino presentó MGIE, un modelo de código abierto que permite editar imágenes a través de lenguaje natural.
Diseñado en conjunto con investigadores de la Universidad de California en Santa Bárbara, MGIE puede interpretar una imagen y editarla sin mucho contexto.
Apple también lanzó una herramienta para crear modelos de aprendizaje automático que se ejecuten en los chips Apple Silicon.
Al igual que OpenELM y MGIE, los ingenieros de la tecnológica optaron por un modelo abierto y ofrecieron su trabajo en un repositorio de GitHub.
Los años de secretismo quedaron atrás, al menos en cuestiones de la inteligencia artificial, ya que Apple está tomando una postura similar a Meta y Microsoft al abrir sus avances para que otros contribuyan.
OpenELM es el paso más reciente en la estrategia de Apple para posicionarse en el mercado de la IA.
Si bien los nuevos modelos no alcanzan el rendimiento de GPT-4 o Gemini, se ejecutan directamente en el dispositivo.
Esto significa que no requeriríamos una conexión a la nube, por lo que nuestros datos estarían más seguros.
“El lanzamiento de los modelos OpenELM tiene como objetivo empoderar y enriquecer a la comunidad de investigación abierta al brindar acceso a modelos de lenguajes de última generación.”, dijo Apple.
Apple se encuentra trabajando en una implementación de la IA que vaya en sintonía con sus necesidades y valores.
Hace unos días se rumoreó que los ingenieros de la compañía diseñan un procesador de inteligencia artificial dedicado para servidores.
Esto aliviaría la dependencia de terceros y otorgaría el control total a la empresa para garantizar el rendimiento y la seguridad.
Fuente: arXiv