Dans une interview, l’épidémiologiste suisse Marcel Salathé explique ce qui le fascine le plus dans la numérisation. Et où il voit ses limites.
asut: Qu’est-ce que l’épidémiologie numérique?
Marcel Salathé: Lors de la pandémie de grippe en 2009, je me suis rendu compte que de nombreuses personnes postaient sur Twitter ce qu’elles pensaient de la vaccination contre la grippe. Dans une autre étude, nous avons examiné les tweets de personnes séropositives qui fournissaient des informations sur les effets secondaires d’un médicament précis. De telles données sont normalement difficiles à obtenir: ici, elles sont publiques et peuvent être exploitées. Les réseaux sociaux en étaient encore à leurs débuts, mais les chercheurs du monde entier ont vu le potentiel pour la santé publique de telles données provenant de sources qui n’étaient manifestement pas créées pour l’épidémiologie. En plus de Twitter, il peut s’agir de données anonymes de téléphones portables, de recherches ou d’autres données librement disponibles sur Internet. Pour moi, l’aspect le plus passionnant de l’évolution numérique n’est donc pas la possibilité de numériser tous les processus imaginables. Elle est la plus impressionnante lorsqu’elle donne jour à des choses inédites.
Comment extraire les informations pertinentes de ces données?
De telles quantités de données, généralement peu structurées et non collectées pour le travail épidémiologique, ne peuvent plus être exploitées à l’aide de méthodes manuelles. En règle générale, l’apprentissage automatique – ou l’intelligence artificielle (IA), comme nous avons tendance à l’appeler aujourd’hui – doit jouer un rôle de fond pour être utile. Mais cela n’est pas toujours nécessaire et cette approche n’est pas toujours la bonne. Il faudrait utiliser l’AI uniquement lorsque l’on n’a plus d’autre choix, car elle a aussi ses points faibles.
Par exemple?
Cela a été très bien démontré avec l’appli de traçage des contacts, au développement de laquelle nous, chercheurs suisses, avons participé dès le début. Des équipes du monde entier étaient favorables à la collecte d’un maximum de données afin d’obtenir le plus d’informations possible. La solution qui s’est imposée au final est cependant un système extrêmement pauvre en données qui fonctionne entièrement sans IA. Et c’est précisément son point fort. L’IA est en fin de compte une paire de lunettes que nous mettons pour pouvoir mieux gérer de grandes quantités de données. Mais cela reste une paire de lunettes. Je ne veux pas dévaloriser l’IA, j’en suis un grand fan et je l’utilise tous les jours dans mon travail. Mais il en va comme de la médecine: s’il y a des opérations extraordinaires, le mieux, c’est encore de ne pas avoir à opérer.
D’après les médias, le premier avertissement du nouveau virus est venu d’un algorithme. L’épidémiologie numérique peut-elle identifier les tendances des maladies plus rapidement que ne le permettent les approches traditionnelles?
Oui, je le pense. La numérisation est certainement la clé ici. Le Covid-19 a montré de façon impressionnante la rapidité avec laquelle les données sont partagées dans la communauté des chercheurs et la rapidité avec laquelle la science a pu progresser. Mais cela a moins à voir avec l’IA qu’avec l’Internet en soi, même si cela peut paraître plus ennuyeux. L’IA fonctionne très bien lorsque l’on doit analyser un grand nombre de données. Lors de la découverte d’une nouvelle maladie, il y a très peu de données disponibles au début et l’IA n’est pas du tout utile dans ce cas. Nous avons reçu les premiers rapports sur la nouvelle maladie pulmonaire par le biais de listes de diffusion par e-mails. Il s’agit peut-être d’une numérisation façon ancienne école, mais cela reste l’un des systèmes les plus fiables. Pour l’appli de traçage des contacts aussi, ce sont des technologies éprouvées qui sont utilisées pour combattre le virus, comme la téléphonie mobile et le Bluetooth.
L’appli de traçage des contacts respecte la vie privée. L’épidémiologie numérique ne pourrait-elle pas être beaucoup plus efficace sans de telles conditions?
En principe oui. Mais alors, on se dirigerait rapidement vers le modèle chinois. En fait, le risque existe que les épidémiologistes soient trop rapidement prêts à acheter des informations au prix d’une moindre protection de la vie privée. La conscience de ce risque, la conscience que c’est du marchandage et que ce n’est pas une bonne affaire, n’est pas encore très répandue, et cela m’inquiète un peu. Car c’est une discussion que nous devons absolument avoir en tant que société, d’autant plus que davantage de données ne signifie pas automatiquement davantage de connaissances. Pour en revenir à la Chine: malgré les scanners de température et la reconnaissance faciale, cela ne s’est au final pas mieux passé là-bas qu’ailleurs.
Des différentes approches de la protection des données ont également conduit les chercheurs suisses impliqués dans le développement de l’application européenne Corona à abandonner le projet. Qu’est-ce qui a fait pencher la balance?
Là encore, le point essentiel était de savoir combien de données devaient être collectées et, en particulier, combien devaient être mises à la disposition des autorités sanitaires, c’est-à-dire de l’Etat. Le débat sur cette question sera un thème récurrent dans les cinq à dix prochaines années. Et bien qu’une grande partie de mon travail consiste à extraire des informations à partir de données, je suis ironiquement convaincu que cela peut être fait avec moins de données. La discussion sur l’appli Corona Warn m’a ouvert les yeux.
Pendant le confinement, il a été question à plusieurs reprises du conflit générationnel entre l’épidémiologie de la vieille école et la jeune discipline de l’épidémiologie basée sur les données. L’Office fédéral de la santé publique aurait-il dû écouter davantage cette dernière?
Il est certain qu’il existe aujourd’hui de nouvelles approches: une jeune génération d’épidémiologistes qui insiste pour utiliser les nouveaux outils de manière responsable et une génération plus âgée qui s’appuie à juste titre sur son expérience. Cela est normal et sera toujours ainsi dans 20 ans: une nouvelle génération voudra alors faire tout complètement différemment de ce que nous faisons aujourd’hui. Finalement, la Suisse a très bien réussi à réunir les deux et à agir sur la base de l’expérience sans se fermer à la nouveauté.