Découvrez DarkBERT, la seule IA formée sur le Dark Web

Une équipe de chercheurs sud-coréens annonce avoir développé un modèle de langage baptisé DarkBERT pré-formé avec des données collectées sur le Dark web. Les premiers résultats paraissent encourageants. Mais pourquoi former une IA aussi puissante sur cette partie « cachée » du web ?

Dans le cadre de nouveaux travaux, des chercheurs de l’Institut supérieur coréen des sciences et technologies (KAIST) et de la société S2W Inc, spécialisée dans l’analyse des données de cybersécurité, ont développé un LLM similaire. En revanche, celui-ci n’a pas été formé sur des données amassées sur le Web, mais sur le Dark Web.

Pour rappel, le Dark Web fait référence à une partie de l’internet qui n’est pas accessible via les moteurs de recherche traditionnels. Il utilise des réseaux superposés, tels que Tor, pour masquer l’identité des utilisateurs et garantir leur anonymat. Ces réseaux acheminent le trafic Internet à travers plusieurs nœuds, rendant difficile la traçabilité des activités en ligne. Il permet ainsi d’héberger notamment des marchés noirs en ligne, des sites de drogues, des services de piratage ou encore des forums de hacking.

Lire la suite sur SciencePost