LightOn ouvre la voie à l'AGENTIC RAG avec son nouveau modèle SOTA Reason-ModernColBERT Après la récente publication de GTE-ModernColBERT présentant des résultats sur la recherche dans des contextes longs, LightOn annonce une avancée majeure dans la découverte de connaissances basée sur l'IA : reason-ModernColBERT, un modèle multi-vecteur open source spécialement conçu pour les applications de recherche approfondie. Redéfinir la recherche : de la correspondance au raisonnementSource : BRIGHT : un benchmark réaliste et exigeant pour la recherche intensive en raisonnement. Avec l'essor de la recherche approfondie, les organisations exigent davantage qu'une simple correspondance lexicale ou sémantique.
Les informations stratégiques de pointe dont disposent aujourd'hui les entreprises nécessitent un raisonnement, la capacité de connecter, de synthétiser et de découvrir des connaissances au-delà de ce qui est explicitement énoncé. Les progrès récents dans le domaine des grands modèles linguistiques ont déclenché un boom du raisonnement, redéfinissant les possibilités de l'IA. Cependant, jusqu'à présent, les systèmes de recherche d'informations étaient à la traîne, car ils ne disposaient pas des capacités de raisonnement nécessaires pour prendre pleinement en charge ce nouveau paradigme.
Cette lacune a enfin été comblée. Reason-ModernColBERT relève ce défi grâce à l'engagement de longue date de LightOn en faveur des architectures à interaction tardive. Ses résultats ont été rendus possibles grâce à un écosystème complet spécialement conçu au fil du temps, depuis le développement de la bibliothèque Py late, jusqu'à l'élaboration de l'architecture à interaction tardive Py et à l'établissement de nouvelles normes avec GTE-ModernColBER T. Cet investissement soutenu permet d'obtenir des performances révolutionnaires dans le domaine de la recherche basée sur le raisonnement, avec une simplicité remarquable.
Le résultat : un nouveau modèle pour la recherche complexe et intensive en raisonnement, alimenté par une infrastructure conçue dès le départ dans ce but précis. Une nouvelle approche de la recherche intensive en raisonnement Petit modèle, grands résultats : Malgré seulement 150 millions de paramètres (plus de 45 fois moins que certains concurrents), Reason-ModernColBERT surpasse tous les modèles jusqu'à 7 milliards de paramètres sur BRIGHT, la référence en matière de recherche intensive en raisonnement. Il surpasse même ReasonIR-8B de plus de 2,5 NDCG@10 sur les requêtes Stack Exchange. Entraînement rapide et rationalisé : Conçu à l'aide de la puissante bibliothèque Py late de LightOn, Reason-ModernColBERT a été formé en moins de deux heures avec moins de 100 lignes de code. Avantage de l'interaction tardive : Des comparaisons directes avec des modèles à vecteur unique denses, formés sur des données identiques, mettent en évidence l'avance constante et remarquable offerte par l'architecture à interaction tardive. Ouvrir la prochaine frontière de la recherche ; Reason-ModernColBERT est conçu pour favoriser l'exploration avancée des connaissances, en traitant des cas où les questions sont nuancées et où la pertinence est souvent subtile ou implicite.
Alors que le RAG agentique, la compréhension avancée des documents et la recherche spécifique à un domaine deviennent essentiels pour l'IA d'entreprise, le nouveau modèle de LightOn offre : une recherche améliorée pour les requêtes subtiles, implicites ou basées sur le raisonnement ; une latence d'inférence considérablement réduite par rapport aux LLM massifs ; une reproductibilité et une transparence faciles grâce à une publication en open source ; Réaffirmant l'engagement de LightOn en faveur de la recherche ouverte : Comme pour les modèles précédents, LightOn met à la disposition du public reason-ModernColBERT, son code de formation et les ensembles de données pertinents. Tout le monde peut y accéder librement, l'étendre et le développer, en tirant parti de Py late pour faire progresser la prochaine génération d'innovations en matière de recherche multivectorielle. Reason-ModernColBERT est désormais disponible pour être utilisé et testé sur Hugging Face via Py late, avec une documentation complète et un code facilitant le réglage et le déploiement. Que ce soit pour les équipes de gestion des connaissances, les développeurs d'IA ou les chercheurs scientifiques, reason-ModernColBERT ouvre de nouveaux horizons à l'ère de la recherche approfondie.
Essayez reason-ModernColBERT sur Hugging Face : Documentation Py late : Fondée en 2016 à Paris et première entreprise européenne d'IA générative cotée sur Euronext Growth, LightOn est un acteur pionnier dans le domaine de l'IA générative souveraine. Sa plateforme Paradigm permet aux organisations de déployer l'IA à grande échelle tout en garantissant la confidentialité de leurs données. La technologie de LightOn assure une indépendance stratégique essentielle en proposant des solutions sur mesure.
Cette maîtrise technologique s'accompagne d'une capacité à traiter de grands volumes de données à des fins industrielles, avec des applications dans divers secteurs tels que la finance, l'industrie, la santé, la défense et les services publics. LightOn est cotée sur Euronext Growth.