
Negli ultimi anni, l'intelligenza artificiale (IA) ha acquisito un ruolo sempre più centrale nel settore sanitario, promettendo di trasformare il modo in cui i professionisti della salute diagnosticano e trattano le malattie. Tuttavia, un recente studio ha rivelato una realtà preoccupante: i chatbot medici, progettati per fornire risposte a domande cliniche, hanno mostrato un tasso di errore che raggiunge fino al 70%. Questo allarmante dato è emerso da una ricerca premiata dall'Ordine dei Medici di Milano in onore di Roberto Anzalone, figura storica della medicina milanese.
La ricerca, pubblicata sull'European Journal of Pathology, ha analizzato le capacità diagnostiche dei chatbot attraverso un campione di 200 domande. I risultati sono stati sorprendenti: in circa il 70% dei casi, i chatbot hanno fornito risposte con almeno un errore, mentre nel 30% delle domande sono stati riscontrati riferimenti bibliografici errati o addirittura inesistenti. Questo solleva interrogativi significativi sull'affidabilità di tali strumenti nel contesto clinico.
l'obiettivo dello studio
Vincenzo Guastafierro, specializzando in Anatomia Patologica presso l'Istituto Clinico Humanitas e principale autore dello studio, ha spiegato che l'obiettivo della ricerca era valutare i rischi associati all'uso di strumenti di IA nella pratica clinica. "Abbiamo messo alla prova l'IA con quesiti clinici reali, evidenziando gli errori di risposta e l'inadeguatezza dei riferimenti forniti", ha dichiarato. I risultati indicano chiaramente che, sebbene l'IA possa rappresentare un supporto utile, non può sostituire l'esperienza e l'intuito clinico di un professionista.
Per condurre lo studio, i ricercatori hanno creato cinque scenari clinici che simulavano un patologo che utilizza ChatGPT per migliorare le sue diagnosi. Ogni scenario è stato elaborato in conformità con le attuali linee guida diagnostiche e validato da patologi esperti. Le domande sono state poste in forma aperta o a risposta multipla. I risultati sono stati i seguenti:
- Risposte utili: 62,2% dei casi.
- Risposte prive di errori: 32,1% delle risposte.
- Riferimenti bibliografici corretti: 70,1%.
- Riferimenti inaccurati: 12,1%.
- Riferimenti inesistenti: 17,8%.
Una scoperta particolarmente sorprendente è stata che l'IA ha creato riferimenti completamente fittizi, citando fonti che non esistono nella realtà. Questa capacità di generare contenuti apparentemente verosimili ma privi di qualsiasi fondamento scientifico rappresenta un rischio significativo, soprattutto in un campo critico come quello della salute.
riflessioni sulla comunità medica
Questi risultati evidenziano la necessità di un'attenta riflessione all'interno della comunità medica sull'uso di strumenti basati sull'IA. Sebbene chatbot come ChatGPT possano fornire risposte utili in un terzo dei casi, la frequenza degli errori e la loro variabilità pongono interrogativi sulla loro idoneità per l'uso diagnostico di routine. "L'imprecisione dei riferimenti suggerisce cautela nell'uso di questi strumenti per l'autoapprendimento dei medici", ha sottolineato Guastafierro.
La questione dell'affidabilità degli strumenti di IA diventa ancora più cruciale in un contesto in cui i pazienti iniziano a utilizzare queste tecnologie per autodiagnosi. È fondamentale che i medici riconoscano il ruolo insostituibile della loro esperienza e competenza, evitando di delegare completamente decisioni critiche a un algoritmo. La tecnologia, infatti, dovrebbe essere vista come un complemento alla pratica clinica, piuttosto che come un sostituto.
il futuro dell'intelligenza artificiale in medicina
Il percorso di ricerca non si ferma qui. Guastafierro ha annunciato che il team continuerà a studiare l'evoluzione di questi strumenti, utilizzando le versioni più aggiornate dell'IA per valutare come possano migliorare nel tempo. Con l'avanzare della tecnologia, è possibile che si assista a un miglioramento nell'affidabilità e nella precisione dei chatbot medici, ma è essenziale mantenere un approccio critico e cauto.
In un'epoca in cui la tecnologia sta plasmando il futuro della medicina, è fondamentale garantire che l'innovazione non comprometta la qualità delle cure fornite ai pazienti. La sinergia tra intelligenza artificiale e esperienza umana rappresenta la strada da seguire per un futuro in cui tecnologia e competenza medica lavorino insieme per il bene della salute pubblica.