Lutte contre l’INFObésité
la trithérapie de Scanlitt

Par Antoine Guy, 16 octobre 2025 à 11:08

Quoi d'9 ?

L’ancien monde souffrait de carences informationnelles. Dans le nouveau, l’infobésité en libre-accès progresse. Des contenus neuro-pollueurs, des perturbateurs endoctriniens YouTubés, des connaissances IA-toxées colonisent nos échanges. Notre réel n’a jamais autant convoqué le débat sur la qualité des données, les canaux pour y accéder, l’esprit critique pour les traiter, et qualifier le statut des connaissances. Isabelle Walsh, experte en systèmes d’information et science des données, a fondé Scanlitt pour y mettre du bon sens. Labellisée, primée, adoubée, cette startup prône la science ouverte, met en ligne des données fiabilisés, et propose des outils brevetés puissants pour en extraire des connaissances validées… à destination de tous !

Anagramme de la vérité... relative


Informations, croyances, connaissances… la liste de ces concepts épistémologiques est longue. Ajoutons pensée, langue, fake, biais, ultracrépidarianisme1, complotisme… Pourquoi cet inventaire à la Prévert ? Parce qu’il illustre ce dont la séquence Covid fut très représentative. Quel rapport entretenons-nous avec la connaissance ? Face au non connu, les questions réflexes sont en théorie : De quoi s’agit-il ? Qui écouter ? À qui ou à quoi accorder sa confiance pour comprendre, connaître, juger ? Mais ce nouvel univers informationnel semble avoir rendu l’exercice moins aisé que dangereux.


« Durant la crise Covid la science s’est confrontée à des distorsions médiatico-politiques », rappelle Isabelle en introduction. La séquence a mis en lumière ce vieux défi résumé dans la question de Pilate, le procurateur de Judée : « Qu’est-ce que la vérité ? » Lui, comme chacun de nous face à une prise de décision, disposait d’informations partielles, sans doute biaisées, et de peu de temps. N’étant pas certains de détenir une connaissance avérée, il a choisi selon la croyance qui lui semblait la plus plausible, la moins invraisemblable, à un instant donné, dans un contexte donné.


Informations tous azimuts : inspiration ou asphyxie ?


L’internet planétaire et son acolyte, l’ubiquitaire smartphone, ont opéré une révolution copernicienne et ouvert les portes de la société de l’information. L’IA générative, dans la même veine, a entamé un saut quantique vers la société de la connaissance, un degré cognitif supérieur, plus noble sans doute. Pourtant ces océans d’informations, devenus aussi des pétaoctets bankables, sont autant porteurs d’espoir que de venin. Plus la fosse est abyssale, plus vaste le champ des inférences intelligentes mais plus probables l’ivresse des profondeurs, la perte d’esprit critique, et l’asphyxie des neurones par infobésité.


Alors quoi ? L’épaisseur des strates d’informations et les technologies de traitement associées vont-elles finir par dévorer leurs créateurs ? Les sapiens, perdus dans un labyrinthe cognitif en expansion perpétuelle et incontrôlée, se dirigent-ils irré-mais-diablement vers une régression de l’accès aux sagesses accumulées, scientifiques, philosophiques, politiques, sociales, vers l’engloutissement dans les sables mouvants de l’inflation informationnelle ?


L’urgence d’une crise accélère la réponse au besoin… de connaissances


Isabelle travaille pour répondre à ces questions depuis nombre d’années. Dès le début de sa vie universitaire, elle s’était penchée sur l’illettrisme ; dans la seconde partie de sa vie universitaire, sur les méthodes pour aider à la création de connaissances.


« Dès les premiers jours de la crise Covid des médecins m’ont approchée. L’urgence de santé publique leur imposait de déterminer très vite la vérité sur ce petit oursin couronné… ses origines, sa transmission, son diagnostic, sa prise en charge… sauf que le tsunami des publications déferlait, suivi de près par celui des patients… », déclare Isabelle pour expliquer le défi ressenti par la communauté médicale et par voie de conséquence par les politiques à la barre du navire. Des vies étant en jeu, comment trouver la petite aiguille de la vérité dans l’énorme botte de foin, entrelacs d’impostures, de fantaisies et de sérieux ?


Elle crée alors une association reconnue d’utilité publique. Son équipe se met au travail avec deux objectifs. D’abord, finir d’automatiser et de mettre au point l’outil de recherche, de sélection et de classification de la masse des publications validées scientifiquement, pertinentes avec un sujet de recherche donné. Puis entraîner le bon modèle d’IA, calibré pour synthétiser en langage naturel les publications retenues et classées lors de l’étape précédente. La démarche, sans être simple à concevoir, a le mérite de se réclamer d’une logique à toute épreuve. La qualité d’une bibliothèque se mesure à l’aune de la taille de son fonds documentaire, mais plus encore à son système de classement par métadonnées pour accéder rapidement aux ouvrages pertinents pour ses usagers… Appelons-la, « méta-thèque ». Scanlitt va s’en inspirer.


Mutation réussie de l’association à la startup


Isabelle et ses collaborateurs cherchent d’abord à s’appuyer sur des bases de métadonnées existantes, qui se révèlent peu qualitatives, dans leurs contenus et leurs services. Comme on n’est jamais mieux servi que par soi-même, ce cénacle s’attelle à créer ses propres bases en qualifiant les données pour éviter le garbage in, garbage out. Après la séquence Covid, la décision de muter l’association en startup est prise. Scanlitt voit le jour. Elle reçoit toutes les bénédictions possibles de Bpifrance (labellisée deeptech, frenchtech émergence, France 2030…) et de l’Europe (WomenTech EU)… De bonnes fées se sont penchées sur son berceau. Elle dépose des brevets et se dote d’un slogan éloquent: « Explorez la littérature scientifique à la vitesse de la lumière »… un phare allumé au cœur de la tempête !


DATA4S, entreposer des métadonnées de qualité


En 2025, notre corpus de connaissances est une bibliothèque virtuelle, planétaire mais disparate, constituée de centaines de base de données regroupant (presque) toutes les publications2 produites depuis l’apparition de l’écriture. Scanlitt et son ardeur vont fédérer une partie de cet univers au sein d’un entrepôt de données. Grâce au soutien de la FNEGE3, la startup a initié la mise en place de sa base de métadonnées, baptisée aujourd’hui DATA4S (DATA for SCIENCE : les données pour la science), et continue évidemment à l’alimenter avec des mises à jour quotidiennes. Répertoire de plus de 30 millions de publications qui ne cesse de grandir, elle se scinde pour l’instant en trois entités : DataSoc (sciences sociales et business), et DataHealth (sciences de la santé) qui sont constituées, enfin DataEngi (sciences de l’ingénieur), en cours de constitution.


ARTIREV, cartographier la recherche, hiérarchiser les sources


Baptisé ARTIREV, ce premier outil logiciel conçu par Scanlitt est « déterministe », insiste Isabelle. ARTIREV travaille sur la base de métadonnées4 DATA4S. Il sélectionne et synthétise les publications scientifiques pertinentes pour le sujet exprimé dans la requête de l’usager. ARTIREV, en tant qu’algorithme déterministe, produit sans possibilité d’erreur et en quelques secondes, une élégante et éloquente cartographie du domaine exploré, puis hiérarchise les résultats pour définir les priorités de lectures du chercheur. À cette étape, ce dernier sait exactement où sont les publications qu’il doit absolument explorer.


SOCRATE : un agent de synthèse et d’interprétation


Le deuxième outil de Scanlitt, baptisé SOCRATE, est une IA agentique générative probabiliste, chargée d’aider l’utilisateur à exploiter avec efficacité les résultats fournis par ARTIREV : structuration du champs de recherche, génération de synthèses en langage naturel, aide à l’interprétation en identifiant les relations entre les publications. « SOCRATE ne peut pas halluciner (au sens de l’IA), car il est alimenté par ARTIREV, un outil déterministe. Nos outils améliorent en moyenne de 60 % l’efficacité des chercheurs », martèle Isabelle.


Tech for Humanity...


« Le vrai défi de Scanlitt réside dans l’assurance de la qualité de ses bases de métadonnées », résume Isabelle. Scanlitt bien sûr propose ses services à ses clients, mais cherche aussi à promouvoir « la science ouverte ». Ainsi DATA4S est mise gratuitement à la disposition des utilisateurs de la plateforme. « Face à la surcharge informationnelle scientifique, nous voulons mettre à disposition les bons outils, les bonnes pratiques, et tout cela dans la transparence. La science doit aider les décideurs, les citoyens, et non l’inverse », commente-t-elle.


Scanlitt ne s’interdit pas de progresser dans d’autres domaines comme le judiciaire. « C’est tout notre rapport à la connaissance que Scanlitt optimise. L’accès aux découvertes scientifiques est un droit pour chacun, une question de respect entre nous aussi. J’aspire à une démocratie intellectuelle, où décideurs et citoyens sont éclairés, s’appuient sur des connaissances fiables, utilisent leurs neurones », conclut Isabelle. Elle ajoute, espiègle, qu’il y a un certain temps, l’OMS avait annoncé avec une probabilité forte, une nouvelle pandémie causée par un moustique. « Tirons les leçons de la pandémie précédente ! J’invite nos gouvernements à nous soutenir pour disposer des bons outils et des bonnes données le moment venu. J’invite aussi des institutions comme INRIA5, l’INIST6 (CNRS) ou le CNRS lui-même à se joindre à nous pour nous aider à continuer de réunir les données nécessaires », lance-t-elle comme un appel, à la fin de l’entretien.


Chez Scanlitt, la connaissance est d’abord un « commun ». Ses promoteurs font du bien. Ses pollueurs, monétiseurs, imposteurs font au contraire beaucoup de mal. Les dérives d’internet, dès ses débuts, ont préoccupé ses détracteurs. Combinées à celles de l’IA, elles peuvent encore plus bousculer l’éthique. Scanlitt démontre, à l’inverse, combien la puissance de ces technologies, bien mise en œuvre, peut non seulement en corriger les errements, mais éclairer et procurer des bénéfices majeurs à leurs usagers.


Dans une publication récente, Étienne Klein énonce une anagramme due à Olivier Garcia que Scanlitt pourrait faire sienne : « la dévalorisation du réel » donne « trouvaille de la déraison ». Les mots éclairent nos angoisses de leurs coïncidences. Quelle lucidité ! Ajoutons que Connaissances rime avec Confiance, et Scanlitt avec Réussite.




1. Ce terme a fait le buzz au moment de la crise Covid. Il désigne le fait de donner son avis sur tout mais sans avoir de connaissances ou de compétences avérées sur les sujets traités.


2. Les revues périodiques sont répertoriées grâce à leur numéro ISSN (International Standard Serial Number), les publications grâce à un DOI (Digital Object Identifier).


3. FNEGE : Fondation nationale pour l’Enseignement de la Gestion des Entreprises.


4. Le titre de la publication bien sûr mais aussi l’auteur, la revue, la date, les mots clés, l’abstract…


5. INRIA : Institut national de Recherche en sciences et technologies du numérique


6. INIST : Organisme dépendant du CNRS, INstitut de l’Information scientifique et technique (information et services numériques pour la recherche).

Parution magazine N°50 (septembre, octobre, novembre)

Qu’en pensez-vous ?

Donnez-nous votre avis

Pour vérifier que vous êtes une intelligence humaine, merci de répondre à ce questionnement lunaire.