Apple publica modelos de IA para iOS 18, apuntando a una mayor transparencia y rendimiento local
25 de Abril de 2024 in Análisis y Reseñas by Sofía González
En un movimiento sin precedentes, Apple ha decidido liberar al público sus modelos de inteligencia artificial, que serán parte integral del próximo sistema operativo, iOS 18. Esta decisión no solo incluye los modelos en sí, sino también todos los recursos asociados, desde códigos de entrenamiento hasta configuraciones completas, lo que marca un esfuerzo por aumentar la transparencia y acelerar la preparación de estos sistemas para su lanzamiento oficial.
Destaca entre los modelos publicados el OLMo, que ha sido entrenado con más de 3 mil millones de tokens, diseñado para funcionar de manera local sin dependencia de conexiones a servidores externos. Esto no solo mejora la privacidad del usuario sino que también optimiza el rendimiento del dispositivo.
Además, Apple introduce OpenELM, un modelo de lenguaje de vanguardia que mejora significativamente la reproducibilidad y transparencia de los modelos de lenguaje grandes (LLMs). OpenELM utiliza una estrategia de escalado por capas en su arquitectura de transformador, lo que permite una distribución eficiente de parámetros y mejora la precisión en un 2.36% en comparación con OLMo, todo mientras requiere la mitad de los tokens para el preentrenamiento.
La liberación de estos modelos y sus recursos asociados no solo está destinada a acelerar el desarrollo y adaptación de IA en dispositivos Apple, sino también a fomentar una mayor colaboración y transparencia en la comunidad de investigación de IA. Con estos recursos, los desarrolladores y investigadores podrán entrenar y evaluar estos modelos en conjuntos de datos públicos, lo que representa un paso adelante en el compromiso de Apple por apoyar la investigación abierta y abordar cuestiones como los sesgos de modelos y los riesgos potenciales.