L’édito de février 2025
Quelles bonnes pratiques en matière d’utilisation de l’intelligence artificielle dans les recherches impliquant l’Inserm ? Les systèmes d’intelligence artificielle (SIA) sont devenus d’usage courant. Ils sont un champ de la recherche et en permettent le développement et le rayonnement. Un exemple ? : des développeurs de SIA ont reçu en 2024 deux prix Nobel ! Celui de physique est allé à John J. Hopfield (Princeton University) et Geoffrey Hinton (University of Toronto) «for foundational discoveries and inventions that enable machine learning with artificial neural networks» [1]. Celui de chimie a récompensé Demis Hassabis et John Jumper de l’équipe Google DeepMind qui a conçu le logiciel AlphaFold de prédiction de la structure des protéines [2]. L’utilisation croissante de SIA dans la recherche médicale et en santé, notamment au sein d’institutions telles que l’Inserm, soulève des enjeux majeurs à la fois prometteurs et posant question. Les SIA servent évidemment à soutenir la démarche scientifique, mais leur usage se développe également au sein de l’administration pouvant à terme impliquer l’aide à la décision en matière de projets, de gestion et de ressources humaines. Les SIA offrent des avantages indéniables : ils permettent de traiter des quantités massives de données, d’accélérer la découverte de nouveaux mécanismes à l’origine de pathologies, d’aider à révéler de nouveaux biomarqueurs, à prédire la survenue de pathologies et permettre d’envisager une médecine de plus en plus personnalisable. Au quotidien, les SIA deviennent de remarquables outils d’aide à la rédaction de texte en produisant des résumés, le plan d’un document, en proposant des améliorations de style, en corrigeant l’orthographe, la grammaire, en aidant à la génération de codes informatiques et à leur vérification ou encore comme outil de traduction, tous usages qui permettent de gagner du temps sur des tâches à faible valeur ajoutée. Cependant, cette révolution technologique s’accompagne également d’impacts délétères, par exemple son coût énergétique et son retentissement écologique, et de nombreuses questions sur les effets à plus ou moins long terme de ces technologies, les incertitudes et risques associés, qui concernent notamment la qualité et la confidentialité des données, les biais algorithmiques, l’interprétabilité des résultats, la dépendance aux technologies propriétaires, la fragilisation de pratiques et d’infrastructures en cas d’attaques malveillantes, ou encore la perte de souveraineté. Un organisme de recherche comme l’Inserm doit aborder cette question afin d’établir une politique claire quant à l’usage des SIA tant dans la recherche que dans l’administration, et permettre à ses personnels de connaître ses préconisations et favoriser les débats. Un guide de bonnes pratiques est d’autant plus important que la qualité de la production scientifique utilisant les SIA ira de pair avec la responsabilité des scientifiques qui utiliseront ces systèmes. C’est pourquoi, le comité d’éthique de l’Institut, en collaboration avec le conseil scientifique et des animateurs du programme LORIER ont mené une réflexion qui aboutit à une dizaine de recommandations quant au bon usage des SIA à l’Inserm. Dans une note, qui sera accessible d’ici quelques jours sur la page du comité d’éthique de l’Inserm, nous appelons à la transparence dans l’utilisation des SIA, à la responsabilité des utilisateurs dans les résultats obtenus et la détection des biais potentiels, à la prudence concernant la manipulation des données et, en particulier, au respect de toutes les règles de confidentialité ainsi qu’aux risques concernant la divulgation prématurée de résultats et la communication vers le public. Notre capacité à apprendre à utiliser, contrôler et réguler ces technologies sera un facteur crucial pour en minimiser les effets négatifs anticipables et maximiser leurs impacts sur l’innovation biomédicale et l’amélioration de la prise en charge de tous les patients. Ce travail d’arbitrage doit faire l’objet de débats réguliers et être mené de façon collective et transparente. Hervé Chneiweiss
[1] “This year’s two Nobel Laureates in Physics have used tools from physics to develop methods that are the foundation of today’s powerful machine learning. John Hopfield created an associative memory that can store and reconstruct images and other types of patterns in data. Geoffrey Hinton invented a method that can autonomously find properties in data, and so perform tasks such as identifying specific elements in pictures.” https://www.nobelprize.org/prizes/physics/2024/press-release/ ” |
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~Le prochain RDV LORIERJeudi 20 février 2025 How to reduce the carbon footprint of your research computing?Nick SouterThe storage and processing of research data uses energy, and therefore has a carbon footprint. In his talk, Nick Souter will discuss how computing leads to carbon emissions, and what can be done to reduce personal research computing footprint. Specifically, Nick will provide context on:
The content discussed here will include specific examples from neuroimaging research, but the messages and approaches discussed will apply to any discipline requiring the processing of large amounts of data. The session will end with hands-on demonstrations of a digital carbon tracking tool and a climate aware task scheduler. This webinar will be in English |
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~Quoi de neuf ?Les neurotechnologies et la gouvernance de l’internet Les neurotechnologies visent à développer des outils et des méthodes permettant de diagnostiquer, traiter ou améliorer les fonctions cérébrales et neurologiques. Bien qu’encore naissantes, ces innovations recèlent un potentiel de transformation, en particulier lorsqu’elles sont intégrées à l’IA, ce qui soulève des enjeux importants au niveau mondial, notamment sur des questions liées à l’accès aux infrastructures et à la sécurité des données. Cependant, les discussions actuelles sur le sujet négligent souvent de prendre en compte les contraintes liées à la gouvernance internationale de l’internet. C’est un point sur lequel se penche cette publication en rappelant la nécessité de mener des discussions pour définir les règles qui seront adoptées dans le cadre de l’agenda post-2030. Ioana Andreescu
Quels entrepôts de données utiliser ? Le site CoopIST, alimenté et géré par la Délégation à l’information Scientifique et technique du Cirad, propose une mise à jour de la fiche « Choisir un entrepôt de données » de son menu « Gérer des données » . Lire (ou relire) cette fiche est une occasion de passer en revue les caractéristiques des grands entrepôts accessibles et donc les questions à se poser lorsqu’on souhaite gérer aux mieux les données d’une recherche. Vous trouverez sur le site de CoopIST d’autres informations utiles sur ce thème. Ghislaine Filliatreau
Une estimation de la fréquence de la sérendipité en science Selon une étude rétrospective portant sur plus d’un million de publications, plus de la moitié des publications biomédicales contiennent des découvertes fortuites, c’est-à-dire auxquelles les scientifiques ne s’attendaient pas en formulant leur demande de financement. Ce sont les financements les plus importants et sur des durées les plus longues qui produisent le plus de découvertes fortuites, ce qui souligne l’importance de la durée de l’exploration – et donc du financement – dans la sérendipité. Cette forte incidence de la sérendipité doit être une incitation de plus, s’il vous en fallait une, pour rester attentifs à l’ensemble de vos résultats et pas seulement à ceux qui étaient attendus dans votre projet de recherche initial. Catherine Coirault
Dans le cadre du projet européen iRECS , deux formations pilotes sont proposées : Éthique de l’IA en santé et Éthique de la réalité virtuelle et étendue. Ces formations professionnelles, d’une durée de trois heures chacune et disponibles en français, sont destinées aux membres des comités d’éthique. Parmi les thématiques couvertes, les formations portent sur des domaines tels que l’intelligence artificielle en santé, le biobanking, l’édition du génome humain et non humain, ainsi que la réalité virtuelle et étendue. La présentation détaillée de ces formations est disponible ici. Ioana Andreescu |