Tencent ha lanzado un nuevo conjunto de modelos compactos Hunyuan: 0.5.000 millones, 1.800 millones, 4.000 millones y 7.000 millones de parámetros; están dirigidos a despliegues de bajo consumo y de borde. Las cuatro configuraciones ya están disponibles en GitHub y Hugging Face, y cada una de ellas puede ejecutar la inferencia en una sola tarjeta gráfica de consumo, lo que las hace adecuadas para ordenadores portátiles, teléfonos inteligentes, sistemas de cabina inteligente y otro hardware con recursos limitados.
A pesar de su pequeño tamaño, los modelos obtienen puntuaciones punteras en comprensión lingüística, matemáticas y razonamiento en varios puntos de referencia públicos. Tencent atribuye estos resultados a una arquitectura de "razonamiento de fusión" que permite a los usuarios seleccionar entre un modo de pensamiento rápido para respuestas concisas y un modo de pensamiento lento para razonamientos más elaborados de varios pasos.
Una característica técnica clave es la ventana de contexto nativa de 256K tokens, que es suficiente para ingerir aproximadamente 500.000 palabras en inglés en una sola pasada. Tencent destaca aplicaciones internas como Tencent Meeting y WeChat Reading, en las que los modelos pueden analizar de una sola vez la transcripción de toda una reunión o un libro completo, manteniendo las relaciones entre los personajes y los detalles de la trama para consultas posteriores.
Los cuatro LLM compactos se integran con los principales marcos de inferencia, incluidos SGLang, vLLM y TensorRT-LLM, y admiten múltiples formatos de cuantización. Las aprobaciones iniciales de Arm, Qualcomm, Intel y MediaTek indican próximos paquetes de despliegue optimizados para sus respectivos procesadores cliente.
Los primeros casos de uso subrayan el enfoque práctico del lanzamiento. Tencent Mobile Manager informa de la interceptación de spam a nivel de milisegundos sin transferencia de datos fuera del dispositivo. Al mismo tiempo, un esquema de doble modelo en el asistente de cabina inteligente de Tencent equilibra el consumo de energía a bordo con la profundidad de la conversación. Estos ejemplos, según Tencent, demuestran que los modelos pequeños pueden ofrecer capacidades de agente de nivel empresarial cuando se diseñan cuidadosamente.
Fuente(s)
Tecnología rápida (en chino)
Top 10 Análisis
» Top 10 Portátiles Multimedia
» Top 10 Portátiles de Juego
» Top 10 Portátiles de Juego ligeros
» Top 10 Portátiles Asequibles de Oficina/Empresa
» Top 10 Portátiles de Juego Ligeros
» Top 10 Portátiles de Oficina/Empresa Premium
» Top 10 Estaciones de Trabajo
» Top 10 Subportátiles
» Top 10 Ultrabooks
» Top 10 Convertibles
» Top 10 Tablets
» Top 10 Tablets Windows
» Top 10 Tablets de menos de 250 Euros
» Top 10 Phablets (>5.5")
» Top 10 Smartphones
» Top 10 Smartphones (≤5")
» Top 10 Smartphones de menos de 300 Euros
» Top 10 Smartphones de menos de 120 Euros
» Top 10 Portátiles de menos de 1000 Euros
» Top 10 Portátiles de menos de 500 Euros
» Top 10 Portátiles de menos de 300 Euros
» Los Mejores Displays de Portátiles Analizados por Notebookcheck