Diagnostic médical : une étude alerte sur les limites de ChatGPT



Face à la difficulté croissante d’obtenir un rendez-vous médical, de plus en plus de patients se tournent vers l’intelligence artificielle pour tenter de comprendre leurs symptômes. Mais une nouvelle étude publiée dans Nature Medicine invite à une grande prudence : les principaux modèles d’IA testés ne permettent pas d’établir un diagnostic plus fiable qu’une simple recherche en ligne. Menée auprès de 1 300 personnes au Royaume-Uni, cette recherche a évalué plusieurs outils largement utilisés, dont ChatGPT, Llama (Meta) ou encore Command R+. Verdict : leur performance reste très limitée lorsqu’il s’agit d’aider des patients à identifier correctement un problème de santé.

« L’intelligence atrificielle n’est tout simplement pas prête à remplacer un médecin »
« Il y a un emballement autour des IA, mais elles ne sont tout simplement pas prêtes à remplacer un médecin », souligne Rebecca Payne, chercheuse à l’Université d’Oxford et co-autrice de l’étude, dans un communiqué. Dans le cadre de l’expérience, les participants n’étaient pas réellement malades. Ils ont pris part à un jeu de rôle : les chercheurs leur ont remis dix séries de symptômes, chacune correspondant à un diagnostic faisant consensus au sein du corps médical. Les volontaires pouvaient alors utiliser soit une IA, soit une recherche classique sur internet pour tenter d’identifier la pathologie en question. Résultat : seuls un tiers des participants ont obtenu un diagnostic correct. Un score comparable à celui du groupe…

Lire la suite