Metaverse

Paging Dr. Algorithme: les diagnostics de l’IA de Microsoft comme la maison, les factures comme Costco

Paging Dr. Algorithme: les diagnostics de l'IA de Microsoft comme la maison, les factures comme Costco

Satya Nadella veut que l’IA soit votre prochain médecin.

Le PDG de Microsoft a annoncé cette semaine deux avancées de l’IA de soins de santé sur les réseaux sociaux, notamment Mai-Dxo, un système qui simule plusieurs médecins virtuels travaillant ensemble pour résoudre les mystères médicaux.

Lors des tests contre 304 cas complexes du New England Journal of Medicine, Microsoft a rapporté que l’IA a correctement diagnostiqué 85,5% d’entre eux. Un groupe de 21 médecins expérimentés s’attaquant aux mêmes cas? Ils ont eu 20%.

« Excité de partager deux avancées qui nous rapprochent de l’impact du monde réel dans l’IA des soins de santé », a écrit Nadella. «Mai-Dxo est un orchestrateur agnostique modèle qui simule un panel de médecins virtuels. Il atteint une précision de diagnostic de 85,5% – à vos moments des médecins expérimentés – tout en réduisant les coûts de diagnostic.»

L’annonce intervient alors que Microsoft rejoint un domaine bondé d’entreprises technologiques qui coule pour appliquer l’IA aux problèmes les plus épineux de Healthcare.

Les Américains dépensant près de 5 billions de dollars par an sur les soins de santé et les erreurs de diagnostic affectant 12 millions de personnes Chaque année, selon l’Université Johns Hopkins – l’idée d’utiliser l’IA pour s’adresser Les problèmes liés à l’homme semble être une évidence.

Comment fonctionne le Conseil médical de Microsoft

Mai-Dxo fonctionne comme une équipe de rêve médical piégée dans un ordinateur. Le système s’attaque aux cas à travers ce que Microsoft appelle le benchmark de diagnostic séquentiel, ou sdbench.

Au lieu de questions à choix multiples comme les tests traditionnels d’IA médicale, il reflète le fonctionnement des médecins: commencer par des informations limitées sur un patient, poser des questions de suivi, commander des tests et ajuster les théories à mesure que de nouvelles données arrivent.

Chaque test entraîne un coût en argent virtuel, obligeant l’IA à équilibrer la rigueur contre les dépenses de santé.

En d’autres termes, il simule essentiellement un conseil médical débattant d’un cas, différents modèles jouant différents rôles. Les modèles débattent, ne sont pas d’accord et finissent par atteindre un consensus, tout comme vos médecins le feraient si vous étiez un cas difficile à étudier.

Dans une configuration, Mai-Dxo a atteint une précision de 80% tout en dépensant 2 397 $ par cas, environ 20% de moins que les 2 963 $ que les médecins dépensent généralement.

À la performance de pointe, il a atteint une précision de 85,5% au coût de 7 184 $ par cas. En comparaison, le modèle autonome O3 d’OpenAI a atteint une précision de 78,6% mais a coûté 7 850 $.

Image: Microsoft

Le panel de médecins virtuels comprend le Dr Hypothèse, qui maintient une liste en cours d’exécution des trois diagnostics les plus probables en utilisant des méthodes de probabilité bayésiennes.

Le Dr Test-Chooser sélectionne jusqu’à trois tests de diagnostic par tour, visant un gain d’informations maximal.

Le Dr Challenger agit comme le contrarian, cherchant des preuves qui contredisent la théorie dominante. Le Dr Intendance vet aux tests coûteux avec une faible valeur de diagnostic.

Pendant ce temps, la liste de contrôle du Dr garantit que tous les noms de test sont valides et que le raisonnement de l’équipe reste cohérent.

Image: Microsoft

Microsoft a testé le système sur des cas publiés dans le New England Journal of Medicine entre 2024 et 2025, après la date de coupure de la formation de l’IA, éliminant toute possibilité que le modèle ait mémorisé les réponses.

Les études étaient des cas difficiles qui nécessitaient un examen approfondi pour être correctement diagnostiqués.

Les 21 médecins que Microsoft a recrutés à titre de comparaison avaient entre 5 et 20 ans d’expérience, avec une médiane de 12 ans.

Ils ont travaillé sans accès à des collègues, des manuels ou une assistance en IA pour assurer une comparaison équitable de la capacité de diagnostic brute. Ils ont signalé un taux de réussite de 20% sur ces cas certes difficiles.

Le système fonctionne en plusieurs modes. « Réponse instantanée » fournit un diagnostic basé uniquement sur les informations initiales pour 300 $ – le coût d’une visite d’un médecin.

« Question uniquement » permet des questions de suivi sans commande de tests. « Budgété » suit les coûts avec une limite de dépenses maximale. « Aucun budget » donne le panneau libre, tandis que « Ensemble » exécute plusieurs panneaux et regroupe leurs conclusions pour une précision maximale.

L’avenir de la médecine?

Mai-dxo représente la poussée plus large de Microsoft dans la santé des consommateurs AI.

La société rapporte plus de 50 millions de sessions liées à la santé par jour sur ses produits Bing et Copilot. Des recherches sur la douleur au genou aux recherches de soins urgents, Microsoft voit les moteurs de recherche et les assistants de l’IA devenant la nouvelle porte d’entrée pour les soins de santé.

Bien sûr, ce n’est qu’un pas de plus dans une très longue chronologie de la technologie médicale.

Pour le contexte, le système MyCin de Stanford a diagnostiqué des infections bactériennes dans les années 1970, et les conversations doctorales de Google ont simulé AMIE l’année dernière.

Microsoft a développé Mai-Dxo en tant que système d’agnostique modèle, ce qui signifie qu’il peut fonctionner avec des modèles d’IA de différentes entreprises.

Dans les tests, il a augmenté les performances entre les modèles d’OpenAI, Google, Anthropic, Meta et autres par une moyenne de 11%. L’amélioration était statistiquement significative dans tous les modèles testés.

Le Dr Dominic King et Harsha Nori, qui ont dirigé la recherche à Microsoft AI, ont souligné dans un article de blog que la technologie reste une démonstration de recherche.

« Des défis importants subsistent avant que l’IA générative puisse être déployé en toute sécurité et de manière responsable à travers les soins de santé », ont-ils écrit. Le système excelle à des défis diagnostiques complexes mais a besoin de tests sur des cas de routine.

Microsoft prévoit de soumettre la recherche sur l’examen par les pairs et travaille avec des organisations de soins de santé pour valider l’approche en milieu clinique.

La société a clairement indiqué que tout déploiement nécessiterait des «tests de sécurité rigoureux, validation clinique et revues réglementaires».

Pour l’instant, Mai-Dxo reste confiné aux laboratoires de recherche. Mais avec des erreurs de diagnostic contribuant à près de 10% des décès des patients et affectant des millions par an, le panel de médecins virtuels de Microsoft représente une autre étape vers les soins de santé assistés par l’IA.

L’équipe AI à cinq docteurs pourrait diagnostiquer mieux que 21 médecins humains combinés, mais il est encore trop tôt pour voir une mise en œuvre grand public.

Microsoft dit que l’IA ne remplacera pas les médecins; Cela les augmentera. Les 21 médecins qui ont marqué 20% sur ces cas brutaux de NEJM espèrent probablement que c’est vrai.

To Top