Inicio Tecnología Nous Analysis deja caer modelos Hermes 4 AI que superan a ChatGPT...

Nous Analysis deja caer modelos Hermes 4 AI que superan a ChatGPT sin restricciones de contenido

35
0

¿Quieres concepts más inteligentes en tu bandeja de entrada? Regístrese en nuestros boletines semanales para obtener solo lo que importa a los líderes de IA, datos y seguridad empresariales. Suscríbete ahora


Nous investigaciónuna nueva empresa de inteligencia synthetic secreta que se ha convertido en una voz principal en el movimiento de IA de código abierto, liberado en silencio Hermes 4 El lunes, una familia de modelos de idiomas grandes que la compañía afirma puede igualar el rendimiento de los principales sistemas propietarios al tiempo que ofrece management de usuarios sin precedentes y restricciones mínimas de contenido.

El lanzamiento representa una escalada significativa en la batalla entre los defensores de la IA de código abierto y las principales compañías de tecnología sobre las que deberían controlar el acceso a capacidades avanzadas de inteligencia synthetic. A diferencia de los modelos de Opadai, Googleo AntrópicoHermes 4 está diseñado para responder a casi cualquier solicitud sin las barandillas de seguridad que se han convertido en estándar en los sistemas comerciales de IA.

«Hermes 4 se basa en nuestro legado de modelos alineados por los usuarios con capacidades de cómputo de tiempo de prueba ampliados», anunció Nous Analysis en X (anteriormente Twitter). «Se prestó especial atención a hacer que los modelos creativos e interesantes para interactuar, sin gastarse por la censura, y alineados neutralmente mientras se mantiene el rendimiento de las matemáticas, codificación y razonamiento de nivel de arte para modelos de peso abierto».

Cómo supera el modo de «razonamiento híbrido» de Hermes 4 supera a Chatgpt y Claude en puntos de referencia de matemáticas

Hermes 4 Presenta lo que Nous Analysis llama «razonamiento híbrido», lo que permite a los usuarios alternar entre respuestas rápidas y procesos más profundos de pensamiento paso a paso. Cuando se activan, los modelos generan su razonamiento interno en especial Etiquetas antes de proporcionar una respuesta closing, comparable a los modelos de razonamiento O1 de OpenAI, pero con plena transparencia en el proceso de pensamiento de la IA.


AI Scaling alcanza sus límites

Los límites de potencia, el aumento de los costos del token y los retrasos de inferencia están remodelando Enterprise AI. Únase a nuestro salón exclusivo para descubrir cómo son los mejores equipos:

  • Convertir la energía en una ventaja estratégica
  • Arquitectura de inferencia eficiente para ganancias reales de rendimiento
  • Desbloquear ROI competitivo con sistemas de IA sostenibles

Asegure su lugar para mantenerse a la vanguardia:


El logro técnico es sustancial. En las pruebas, el modelo de parámetros de 405 mil millones de 405 mil millones de Hermes 4 obtuvo un 96.3% en el Math-500 de referencia en modo de razonamiento y 81.9% en el desafío AIME’24 Competencia de matemáticas – rendimiento que rivaliza o excede muchos sistemas patentados que cuestan a millones más para desarrollar.

«El desafío es hacer que las trazas de pensamiento sean útiles y verificables sin razonamiento fugitivo», señaló investigador de IA Rohan Paul en xdestacando uno de los avances técnicos en el lanzamiento.

Quizás lo más notable, Hermes 4 logró el puntaje más alto entre todos los modelos probados en «Refusalbench», una nueva investigación de referencia creada para medir con qué frecuencia los sistemas de IA se niegan a responder preguntas. El modelo obtuvo un puntaje de 57.1percenten el modo de razonamiento, superando significativamente a GPT-4O (17.67%) y Claude Sonnet 4 (17%).

Los modelos Hermes 4 de Nous Analysis respondieron significativamente más preguntas que los sistemas de IA competidores en Refusalbench, una prueba que mide con qué frecuencia los modelos se niegan a responder a las solicitudes de los usuarios. (Crédito: Nous Analysis)

Inside DataForge y Atropos: los sistemas de entrenamiento innovador detrás de las capacidades de Hermes 4

Detrás de las capacidades de Hermes 4 se encuentra una sofisticada infraestructura de entrenamiento que Nous investigación se ha desarrollado durante varios años. Los modelos fueron entrenados utilizando dos sistemas novedosos: Dataforceun generador de datos sintético basado en gráficos, y Atroposun marco de aprendizaje de refuerzo de código abierto.

Dataforce Crea datos de capacitación a través de lo que la compañía describe como «caminatas aleatorias» a través de gráficos dirigidos, transformando datos simples de pre-entrenamiento en ejemplos complejos de seguimiento de instrucciones. El sistema puede, por ejemplo, tomar un artículo de Wikipedia y transformarlo en una canción de rap, luego generar preguntas y respuestas basadas en esa transformación.

AtroposMientras tanto, opera como cientos de entornos de capacitación especializados donde los modelos de IA practican habilidades específicas (matemáticas, codificación, uso de herramientas y escritura creativa) recurriendo comentarios solo cuando producen soluciones correctas. Este enfoque de «muestreo de rechazo» asegura que solo las respuestas verificadas de alta calidad lleguen a los datos de entrenamiento.

«¡No usó estos entornos para generar el conjunto de datos para Hermes 4!» explicado Tommy Shaughnessyun capitalista de riesgo en Delphi Ventures quien ha invertido en la investigación de nous. «¡Todos en el conjunto de datos contienen 3.5 millones de muestras de razonamiento y 1.6 millones de muestras no de condición! Hermes fue entrenado en datos RL, ¡no solo conjuntos de datos estáticos de preguntas y respuestas!»

El proceso de capacitación requerido 192 nvidia GPU B200 y 71,616 horas de GPU para el modelo más grande, una inversión computacional significativa pero no sin precedentes que demuestra cómo las técnicas especializadas pueden competir con la escala masiva de los gigantes tecnológicos.

Por qué Nous Analysis cree que las barandillas de seguridad de IA son «molestas como el infierno» y lastiman la innovación

Nous investigación ha construido su reputación en una filosofía que coloca el management del usuario por encima de las políticas de contenido corporativo. Los modelos de la compañía están diseñados para ser «orientables», lo que significa que pueden ser ajustados o obligados a comportarse de manera específica sin las restricciones de seguridad rígidas que caracterizan los sistemas de IA comerciales.

«Hermes 4 no está encadenada por renuncias, reglas y ser demasiado cauteloso, lo cual es molesto como el infierno y duele la innovación y la usabilidad», escribió Shaughnessy en un hilo detallado que analiza el lanzamiento. «Si su código abierto, pero rechaza todas las solicitudes. No tiene sentido. No es un problema con Hermes 4.»

Este enfoque ha hecho Nous investigación Fashionable entre los investigadores y desarrolladores de IA que desean la máxima flexibilidad, pero también coloca a la compañía en el centro de los debates en curso sobre la seguridad y la moderación del contenido de la IA. Si bien los modelos se pueden utilizar teóricamente para fines dañinos, Nous Analysis argumenta que la transparencia y el management del usuario son preferibles a la guardia corporativa.

La empresa informe técnicolanzado junto con los modelos, proporciona detalles sin precedentes sobre el proceso de capacitación, los resultados de la evaluación e incluso las salidas de texto reales de las pruebas de referencia. «Creemos que este informe establece un nuevo estándar para la transparencia en la evaluación comparativa», declaró la compañía.

Cómo una pequeña startup con 192 GPU está compitiendo contra los presupuestos de IA de mil millones de dólares de Large Large Tech

Hermes 4El lanzamiento llega en un momento essential en la industria de la IA. Si bien las principales empresas de tecnología han invertido miles de millones en el desarrollo de sistemas de IA cada vez más potentes, un creciente movimiento de código abierto argumenta que estas capacidades no deben ser controladas por un puñado de corporaciones.

Los últimos meses han visto avances significativos en la IA de código abierto, con modelos como Meta’s Llama 3.1, Deepseek’s R1y Alibaba’s Qwen Serie logrando un rendimiento que rivaliza con los sistemas propietarios. Hermes 4 representa otro paso en esta progresión, particularmente en el área del razonamiento, considerando una fortaleza de los sistemas cerrados como OPERAI’S O1.

«Primero, Nous es una startup con docenas de personas extremadamente talentosas». Notado Shaughnessy. «No tienen el gasto de CAPEX anual de $ 100B+ de un hiperscalador ni 1,000 de empleados y, a pesar de que continúan sacando modelos e investigaciones innovadores a un ritmo loco».

La startup, que Recaudó $ 65 millones en fondos A principios de este año dirigido por Paradigmatambién se ha estado desarrollando Red psiqueun sistema de capacitación distribuido que tiene como objetivo coordinar la capacitación de IA en computadoras conectadas a Web utilizando tecnología blockchain.

La solución técnica que impidió que Hermes 4 piense en bucles sin fin

Uno de Hermes 4Las contribuciones técnicas más importantes aborda un problema que afectan a los modelos de razonamiento: procesos de pensamiento demasiado largos. Los investigadores encontraron que su modelo de parámetros más pequeño de 14 mil millones alcanzaría la máxima longitud del contexto del 60% del tiempo al razonar, esencialmente quedarse atascado en infinitos bucles de pensamiento.

Su solución implicó una segunda etapa de entrenamiento que enseña a los modelos a dejar de razonar exactamente a 30,000 tokens, reduciendo la generación demasiado larga en un 65-79% mientras mantiene la mayor parte del rendimiento del razonamiento. Esta técnica de «management de longitud» podría resultar valiosa para la comunidad de investigación de IA más amplia.

«Los modelos más pequeños (<14b) tienden a pensar demasiado cuando se destilan, pero los modelos más grandes no", observó el investigador de IA Muyu él en xdestacando las concepts del informe técnico.

Sin embargo, Hermes 4 Todavía enfrenta limitaciones comunes a los modelos de código abierto. A pesar del impresionante rendimiento de referencia, los modelos requieren recursos computacionales significativos para ejecutar y pueden no coincidir con la facilidad de uso o confiabilidad de los servicios comerciales de IA para muchas aplicaciones.

Dónde probar Hermes 4 y qué cuesta en comparación con Chatgpt y Claude

Nous investigación ha hecho Hermes 4 Disponible a través de múltiples canales, reflejando la filosofía de código abierto. Los pesos del modelo se pueden descargar libremente en abrazar la cara, mientras que la compañía también ofrece acceso a API a través de su interfaz de chat renovada y sus asociaciones con proveedores de inferencia como Chutes, Nebius y Luminal.

«Puedes probar Hermes 4 en la nueva interfaz de usuario de chat Nous renovada», anunció la compañía, destacando características como interacciones paralelas y un sistema de memoria.

Para los usuarios e investigadores empresariales, los modelos representan una alternativa potencialmente atractiva para pagar el acceso de API a sistemas propietarios, especialmente para aplicaciones que requieren altos niveles de personalización o manejo de contenido smart.

La imagen más grande: lo que significa Hermes 4 para el futuro del desarrollo de la IA

El lanzamiento de Hermes 4 Representa más que un lanzamiento modelo de AI: es una declaración sobre quién debería controlar el futuro de la inteligencia synthetic. En una industria cada vez más dominada por un puñado de gigantes tecnológicos con recursos prácticamente ilimitados, Nous Analysis ha demostrado que la innovación aún puede provenir de lugares inesperados.

El enfoque de la Compañía plantea preguntas fundamentales sobre las compensaciones entre la seguridad y la capacidad, entre el management corporativo y la libertad del usuario. Si bien las principales compañías de tecnología argumentan que la moderación cuidadosa de contenido y las barandillas de seguridad son esenciales para el despliegue responsable de la IA, la investigación de Nous sostiene que la transparencia y la agencia de usuarios son más importantes que las restricciones impuestas por las corporaciones.

Queda por ver si esta filosofía será beneficiosa o problemática. Pero una cosa es segura: Hermes 4 ha demostrado que el futuro de la IA no será determinado únicamente por las compañías con los bolsillos más profundos.

En un campo donde las imposibilidades de ayer se convierten en las mercancías del mañana, Nous Analysis demostró que lo único más peligroso que una IA que cube que no podría ser una que esté dispuesta a decir que sí.


avots

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí