Una rivoluzione silenziosa, ma potenzialmente epocale, arriva dal mondo dell’intelligenza artificiale applicata alla medicina. Microsoft ha presentato un nuovo sistema diagnostico, MAI-DxO, in grado di risolvere correttamente fino all’85% dei casi clinici analizzati — un risultato che supera di oltre quattro volte la media raggiunta da un team di medici esperti (20%).
La piattaforma non si limita a “indovinare” una risposta, ma simula il ragionamento clinico sequenziale: parte dai sintomi, formula ipotesi, ordina esami, valuta risultati e solo alla fine propone una diagnosi. In sostanza, si comporta come un medico in carne e ossa. Ma il vero banco di prova, e punto di svolta dello studio, è stato l’uso dei casi reali pubblicati settimanalmente dal New England Journal of Medicine (NEJM), una delle riviste scientifiche più autorevoli al mondo. Il team di Microsoft AI, sotto la guida di Mustafa Suleyman, ha costruito il proprio benchmark — denominato SD Bench — utilizzando 304 casi clinici pubblicati dal NEJM. Si tratta della rubrica Case Records, da decenni punto di riferimento per la formazione medica avanzata. E proprio lì, dove molti specialisti falliscono, l’IA di Microsoft eccelle.
A eseguire le valutazioni sono stati 21 medici esperti provenienti da Stati Uniti e Regno Unito. Il confronto è stato impietoso: MAI-DxO ha centrato l’85% delle diagnosi corrette, mentre il team umano si è fermato al 20%. In più, il software ha scelto esami più mirati, meno costosi e meno invasivi. L’azienda, però, è chiara: il sistema non sostituirà il medico. “La diagnosi è solo una parte del lavoro clinico. I dottori costruiscono relazioni, gestiscono l’ambiguità, decidono anche quando i dati non sono sufficienti. Nessuna IA può fare questo”, sottolineano i ricercatori. MAI-DxO sarà piuttosto un supporto nei casi complessi o in contesti dove mancano specialisti. La visione di lungo periodo è ambiziosa: Microsoft parla apertamente di un percorso verso una “superintelligenza medica”. L’obiettivo? Costruire un’intelligenza artificiale in grado non solo di eguagliare, ma superare l’intuizione e la competenza umana nella diagnosi, nel trattamento e nella prevenzione delle malattie.
Il benchmark basato sul NEJM verrà reso pubblico, per garantire trasparenza e stimolare ulteriori ricerche. I prossimi test si concentreranno su sintomi comuni, per valutare l’affidabilità anche nella medicina generale. La speranza è che, in un contesto di crescente pressione sui sistemi sanitari — basti pensare che negli USA la spesa ha superato il 20% del PIL — l’intelligenza artificiale possa rappresentare un alleato concreto per ridurre errori, costi e disuguaglianze di accesso alle cure.
