Un desarrollador elude las restricciones de « Apple » para liberar todo el potencial de la IA del M4

Apple's M4 de la empresa cuentan con algunas funciones útiles IA , pero la empresa siempre ha mantenido el hardware bajo un estricto control. Por defecto, el Neural Engine integrado en el M4 está limitado exclusivamente a la inferencia. Esto significa que los desarrolladores solo pueden utilizarlo para ejecutar modelos de IA preentrenados, en lugar de entrenar otros nuevos desde cero.
Sin embargo, un desarrollador ha logrado eludir estas estrictas limitaciones de software, llevando a cabo una ingeniería inversa completa del chip para desbloquear 15,8 TFLOPS de potencia de cálculo de IA oculta. Este avance se debe a un investigador conocido como 0x0SojalSec, quien recientemente ha compartido código en el GitHub en el que detalla cómo ha aprovechado el verdadero potencial del M4. Lo que hace que este logro sea especialmente impresionante es que se ha llevado a cabo completamente al margen del ecosistema de desarrollo oficial de Apple.
Dado que « Apple » no concede los niveles de permiso necesarios para comunicarse directamente con el Neural Engine para estas tareas avanzadas, el desarrollador tuvo que encontrar una forma de trabajar sin utilizar herramientas estándar como CoreML, Metal o incluso sin recurrir a la unidad de procesamiento gráfico. Para lograrlo, crearon desde cero un lenguaje intermedio de modelos (Model Intermediate Language) a medida. Este software personalizado logró salvar la brecha con éxito, permitiendo la retropropagación completa y el entrenamiento de transformadores directamente en el Neural Engine de Apple.
Dado que el hardware está muy limitado por su diseño, el desarrollador también tuvo que recurrir a algunas soluciones alternativas muy ingeniosas para mantener la estabilidad del sistema. Por ejemplo, si un proceso se bloquea durante la fase de entrenamiento intensivo, el lenguaje personalizado utiliza un comando de ejecución específico para, en esencia, reiniciar el proceso. Esto permite al sistema actualizar su estado actual y reanudar inmediatamente el aprendizaje automático sin que se bloquee todo el programa.
La velocidad también fue un factor clave para que esta pesada carga de trabajo se ejecutara de forma eficaz. Para garantizar que el entrenamiento funcionara con la mayor fluidez posible, el desarrollador configuró el proceso para que escribiera todo íntegramente en la memoria RAM del sistema. Al evitar activamente el almacenamiento flash NAND, mucho más lento, toda la operación se mantuvo increíblemente rápida. Para cualquiera que utilice un Mac o iPad , esta fascinante solución demuestra que el chip es más que capaz de gestionar cargas de trabajo de entrenamiento de IA, aunque Apple oficialmente prefiera mantener esas capacidades específicas ocultas.
Top 10 Análisis
» Top 10 Portátiles Multimedia
» Top 10 Portátiles de Juego
» Top 10 Portátiles de Juego ligeros
» Top 10 Portátiles Asequibles de Oficina/Empresa
» Top 10 Portátiles de Juego Ligeros
» Top 10 Portátiles de Oficina/Empresa Premium
» Top 10 Estaciones de Trabajo
» Top 10 Subportátiles
» Top 10 Ultrabooks
» Top 10 Convertibles
» Top 10 Tablets
» Top 10 Tablets Windows
» Top 10 Tablets de menos de 250 Euros
» Top 10 Phablets (>5.5")
» Top 10 Smartphones
» Top 10 Smartphones (≤5")
» Top 10 Smartphones de menos de 300 Euros
» Top 10 Smartphones de menos de 120 Euros
» Top 10 Portátiles de menos de 1000 Euros
» Top 10 Portátiles de menos de 500 Euros
» Top 10 Portátiles de menos de 300 Euros
» Los Mejores Displays de Portátiles Analizados por Notebookcheck














