Inicio Tecnología Google presenta el modelo de IA de código abierto extremely suave y...

Google presenta el modelo de IA de código abierto extremely suave y eficiente Gemma 3 270m que puede ejecutarse en teléfonos inteligentes

50
0

¿Quieres concepts más inteligentes en tu bandeja de entrada? Regístrese en nuestros boletines semanales para obtener solo lo que importa a los líderes de IA, datos y seguridad empresariales. Suscríbete ahora


El equipo de investigación de IA Deepmind de Google tiene presentó un nuevo modelo de IA de código abierto hoy, Gemma 3 270m.

Como su nombre sugeriría, este es un Modelo de 270 millones de parámetros – Mucho más pequeño que los 70 mil millones o más parámetros de muchos LLM de Frontier (los parámetros son el número de configuraciones internas que rigen el comportamiento del modelo).

Si bien más parámetros generalmente se traducen en un modelo más grande y más potente, el enfoque de Google con esto es casi lo contrario: alta eficiencia, lo que brinda a los desarrolladores un modelo Lo suficientemente pequeño como para correr directamente en teléfonos inteligentes y en la zona, sin conexión a Webcomo se muestra en las pruebas internas en un Pixel 9 Professional Soc.

Sin embargo, el modelo todavía es capaz de manejar tareas complejas específicas de dominio y se puede ajustar rápidamente en solo minutos para adaptarse a las necesidades de una empresa o desarrollador independiente.


AI Scaling alcanza sus límites

Los límites de potencia, el aumento de los costos del token y los retrasos de inferencia están remodelando Enterprise AI. Únase a nuestro salón exclusivo para descubrir cómo son los mejores equipos:

  • Convertir la energía en una ventaja estratégica
  • Arquitectura de inferencia eficiente para ganancias reales de rendimiento
  • Desbloquear ROI competitivo con sistemas de IA sostenibles

Asegure su lugar para mantenerse a la vanguardia:


En el red social xGoogle Deepmind Employees IA El ingeniero de relaciones con el desarrollador de AI Omar Sanseviero agregó que Gemma 3 270m también puede Ejecutar directamente en el navegador internet de un usuario, en una Raspberry Piy «en tu tostadora», subrayando su capacidad para operar en {hardware} muy liviano.

Gemma 3 270m combina 170 millones de parámetros de incrustación, gracias a un gran vocabulario de 256k capaz de manejar tokens raros y específicos, con 100 millones de parámetros de bloqueo de transformadores.

Según Google, la arquitectura admite un fuerte rendimiento en las tareas de seguimiento de instrucciones desde el primer momento mientras se mantiene lo suficientemente pequeño para ajustar y implementar rápidamente en dispositivos con recursos limitados, incluido el {hardware} móvil.

GEMMA 3 270M hereda la arquitectura y el pretrete de los modelos más grandes de Gemma 3, asegurando la compatibilidad en el ecosistema de Gemma. Con documentación, recetas de ajuste fino y guías de implementación disponibles para herramientas como abrazar Face, Uncera y Jax, los desarrolladores pueden pasar de la experimentación a la implementación rápidamente.

Puntajes altos en puntos de referencia para su tamaño y alta hefiencia


En el Ifeval Benchmark, que mide la capacidad de un modelo para seguir las instruccionesel Gemma sintonizado con instrucciones 3 270m anotado 51.2%.

El puntaje lo coloca Muy por encima de los modelos pequeños similares como SMOLLM2 135M INSTRUCT y QWEN 2.5 0.5B INSTRUCTy más cerca del rango de rendimiento de algunos modelos de mil millones de parámetros, según la comparación publicada de Google.

Sin embargo, como investigadores y líder En el rival AI Startup Liquid AI señaló en respuestas en X, Google dejó el propio Liquid Modelo LFM2-350M lanzado hacia atrás en julio de este año, que obtuvo un enorme 65.12% Sin embargo, con solo unos pocos parámetros (modelo de lenguaje de tamaño related).

Una de las fortalezas definitorias del modelo es su eficiencia energética. En pruebas internas utilizando el modelo cantizado con INT4 en un Pixel 9 Professional SOC, 25 conversaciones consumieron solo el 0.75% de la batería del dispositivo.

Esto hace que Gemma 3 270m sea una elección práctica para la IA en el dispositivo, particularmente en los casos en que la privacidad y la funcionalidad fuera de línea son importantes.

El lanzamiento incluye un modelo previo y ajustado por instrucciones, lo que brinda a los desarrolladores una utilidad inmediata para tareas generales de seguimiento de instrucciones.

Los puntos de management capacitados por cuantización (QAT) también están disponibles, lo que permite la precisión INT4 con una pérdida de rendimiento mínima y haciendo que el modelo esté listo para la producción para entornos con recursos limitados.

Una pequeña versión de Gemma 3 270m puede realizar muchas funciones de LLM más grandes

Google Frames Gemma 3 270m como parte de una filosofía más amplia de elegir la herramienta adecuada para el trabajo en lugar de depender del tamaño del modelo sin procesar.

Para funciones como análisis de sentimientos, extracción de entidad, enrutamiento de consultas, generación de texto estructurado, verificaciones de cumplimiento y escritura creativa, la compañía cube que un modelo pequeño ajustado puede ofrecer resultados más rápidos y rentables que uno grande de propósito normal.

Los beneficios de la especialización son evidentes en trabajos pasados, como la colaboración de ML adaptativa con SK Telecom.

Al ajustar un modelo GEMMA 3 4B para la moderación de contenido multilingüe, el equipo superó a sistemas de propiedad mucho más grandes.

Gemma 3 270m está diseñado para permitir un éxito related a una escala aún más pequeña, Flotas de soporte de modelos especializados adaptados a tareas individuales.

La aplicación de generador de cuentos de la hora de dormir de la demostración muestra el potencial de Gemma 3 270m

Más allá del uso empresarial, el modelo también se ajusta a escenarios creativos. En Video de demostración publicado en YouTubeGoogle muestra una aplicación de generador de cuentos antes de dormir construida con Gemma 3 270m y Transformers.js que se ejecuta completamente fuera de línea en un navegador internet, mostrando la versatilidad del modelo en aplicaciones ligeras y accesibles.

https://www.youtube.com/watch?v=ds95v-aeu5e

El video destaca la capacidad del modelo para sintetizar múltiples entradas al permitir selecciones para un personaje principal (por ejemplo, «un gato mágico»), un entorno («en un bosque encantado»), un giro de la trama («descubre una puerta secreta»), un tema («aventurero») y una longitud deseada («corta»).

Una vez que se establecen los parámetros, el modelo Gemma 3 270m genera una historia coherente e imaginativa. La aplicación procede a tejer una historia breve y aventurera basada en las elecciones del usuario, lo que demuestra la capacidad del modelo para la generación de texto creativo y consciente del contexto.

Este video sirve como un poderoso ejemplo de cómo El Gemma 3 270m liviano pero capaz puede alimentar aplicaciones rápidas, atractivas e interactivas sin depender de la nubeabriendo nuevas posibilidades para las experiencias de IA en el dispositivo.

De código abierto bajo una licencia personalizada de Gemma

GEMMA 3 270M se libera bajo los Términos de uso de Gemma, que permiten el uso, reproducción, modificación y distribución del modelo y derivados, siempre que se cumplan ciertas condiciones.

Estos incluyen llevar a cabo las restricciones de uso posterior descritas en la política de uso prohibida de Google, suministrar los términos de uso a los destinatarios aguas abajo e indicar claramente cualquier modificación realizada. La distribución puede ser directa o mediante servicios alojados como API o aplicaciones internet.

Para los equipos empresariales y los desarrolladores comerciales, esto significa que el modelo puede integrarse en productos, implementarse como parte de los servicios en la nube o ajustar a derivados especializados, siempre que se respeten los términos de licencia. Google no reclama los resultados generados por el modelo, lo que brinda a las empresas todos los derechos sobre el contenido que crean.

Sin embargo, los desarrolladores son responsables de garantizar el cumplimiento de las leyes aplicables y de evitar usos prohibidos, como generar contenido dañino o violar las reglas de privacidad.

El La licencia no es de código abierto en el sentido tradicional, pero permite un uso comercial amplio sin una licencia pagada por separado.

Para las empresas que construyen aplicaciones comerciales de IA, las principales consideraciones operativas están garantizando que los usuarios finales estén sujetos a restricciones equivalentes, documentando modificaciones del modelo e implementación de medidas de seguridad alineadas con la política de usos prohibidos.

Con el Gemmaverse superando 200 millones de descargas y la alineación de Gemma que abarca las variantes de la nube, el escritorio y las optimizadas móviles, los desarrolladores de Google AI están posicionando Gemma 3 270m como base para construir soluciones AI rápidas, rentables y centradas en la privacidad, y ya parece un gran comienzo.


avots