Ce géant chinois dévoile un concurrent de taille face à OpenAI

Un nouveau modèle d’intelligence artificielle, baptisé QwQ-32B-Preview, fait sensation sur la scène technologique. Ce modèle, développé par l’équipe Qwen d’Alibaba, se positionne comme l’un des premiers à pouvoir rivaliser avec les IA de raisonnement d’OpenAI, notamment l’o1. Il se distingue par sa taille impressionnante, avec 32,5 milliards de paramètres, et la capacité de traiter des prompts jusqu’à 32 000 mots de long. Pour les non-initiés, les « paramètres » sont des éléments qui mesurent les capacités d’un modèle à résoudre des problèmes : plus un modèle en possède, plus il est censé être performant.

Testé par Alibaba, QwQ-32B-Preview a surpassé l’o1-preview d’OpenAI sur des tests spécifiques, tels que l’AIME et le MATH. AIME est un test où différents modèles d’IA évaluent les performances d’un autre modèle, tandis que MATH se compose de problèmes mathématiques complexes. Grâce à ses capacités de raisonnement, QwQ-32B-Preview est en mesure de résoudre des énigmes logiques et de répondre à des questions mathématiques assez exigeantes. Toutefois, Alibaba souligne que ce modèle n’est pas sans défauts : il peut changer de langue de manière inattendue, se retrouver bloqué dans des boucles logiques, et ne pas toujours réussir des tâches nécessitant un raisonnement « de bon sens ».

L’auto-vérification, un atout des modèles de raisonnement

Contrairement à de nombreuses IA classiques, QwQ-32B-Preview et d’autres modèles de raisonnement vérifient eux-mêmes leurs réponses. Ce processus d’auto-vérification leur permet d’éviter certains pièges qui affectent souvent d’autres systèmes d’IA, bien qu’il entraîne un temps de réponse plus long. Ce modèle de raisonnement suit une démarche où il réfléchit et planifie avant d’agir, ce qui l’aide à déduire les bonnes réponses. Ce processus est similaire à celui d’OpenAI avec son modèle o1.

Disponibilité et licences : une approche semi-ouverte

QwQ-32B-Preview est accessible sur la plateforme de développement Hugging Face, et il peut être téléchargé et utilisé sous une licence Apache 2.0. Cela signifie qu’il est disponible pour des applications commerciales, mais il faut noter que seule une partie du modèle a été rendue publique. Par conséquent, il est impossible de reproduire exactement ce modèle ou de comprendre en profondeur son fonctionnement interne. Ce type de « modèle semi-ouvert » soulève des débats dans la communauté des IA : si certains prônent l’ouverture totale, d’autres estiment que la confidentialité est essentielle pour des raisons de sécurité et de protection des données.

L’impact de la régulation chinoise sur les réponses politiques

QwQ-32B-Preview question

Un aspect particulier du modèle QwQ-32B-Preview est son approche prudente vis-à-vis de certains sujets politiques. En tant qu’entreprise chinoise, Alibaba doit se conformer aux exigences de la régulation internet en Chine, qui impose que les réponses de ses IA respectent les « valeurs socialistes fondamentales ». Ainsi, lorsqu’on lui pose des questions sur des sujets sensibles comme Taiwan ou la place de la Chine sur la scène internationale, QwQ-32B-Preview répond dans le cadre des perspectives officielles du gouvernement chinois. Par exemple, une question sur Taiwan donne une réponse conforme à la position de Pékin, tandis qu’une interrogation sur la place de Tiananmen ne suscite aucune réponse. Cette auto-censure est caractéristique des entreprises technologiques chinoises qui naviguent dans un environnement réglementaire strict.

Une nouvelle ère pour l’IA : les modèles de raisonnement prennent le devant de la scène

Le lancement de QwQ-32B-Preview intervient dans un contexte où les « lois de l’échelle », qui suggèrent qu’augmenter la puissance des données et des calculs permettrait d’améliorer les performances des modèles, sont remises en question. Des rapports récents suggèrent que, malgré des investissements colossaux, les grands laboratoires d’IA comme OpenAI, Google et Anthropic ne voient plus des progrès aussi spectaculaires que par le passé.

Pour faire face à cette stagnation, de nombreuses entreprises, y compris Google et des sociétés chinoises comme Alibaba, parient sur de nouvelles architectures de modèles d’IA et des techniques de développement inédites. L’une de ces techniques est le test-time compute, ou « calcul lors de l’inférence ». Cette méthode permet de donner plus de temps aux modèles pour traiter les tâches, en leur offrant plus de puissance de calcul au moment de la réponse. Ce processus est au cœur de la stratégie de modèles comme o1 et QwQ-32B-Preview, et semble prometteur pour l’avenir de l’IA.

Il est clair que les modèles de raisonnement sont devenus un axe de développement majeur dans la recherche en intelligence artificielle, et que des entreprises comme Alibaba cherchent à se positionner comme des leaders dans cette nouvelle ère. Leurs efforts sont soutenus par des investissements importants, et la concurrence avec OpenAI s’intensifie, ce qui pourrait ouvrir de nouvelles avenues pour des applications commerciales et industrielles.

Send this to a friend