Μπορεί η Τεχνητή Νοημοσύνη να βοηθήσει τους γιατρούς να αποφύγουν εσφαλμένες διαγνώσεις; Νέα μελέτη υποδεικνύει ναι

Σε ορισμένες από τις πιο δύσκολες περιπτώσεις της ιατρικής, το πιο δύσκολο κομμάτι δεν είναι η επιλογή της σωστής διάγνωσης. Είναι η ίδια η σύλληψή της. Η τεχνητή νοημοσύνη μπορεί τώρα να είναι καλύτερη σε αυτό από τους γιατρούς, υποδεικνύει μια νέα μελέτη.

«Παρακολουθούμε μια πραγματικά βαθιά αλλαγή στην τεχνολογία που θα αναδιαμορφώσει την ιατρική», δήλωσε ο Arjun Manrai, επιστήμονας δεδομένων βιοϊατρικής του Πανεπιστημίου Χάρβαρντ, σε συνέντευξη τύπου στις 28 Απριλίου.

Αυτή η αλλαγή τροφοδοτείται από τις εξελίξεις στα μεγάλα γλωσσικά μοντέλα, την ίδια τεχνολογία στην οποία βασίζεται το ChatGPT της OpenAI. Νέες εκδόσεις, που ονομάζονται μοντέλα συλλογισμού, μπορούν να επεξεργαστούν πολύπλοκα προβλήματα βήμα προς βήμα. Από το 2025, 1 στους 5 γιατρούς και νοσηλευτές παγκοσμίως χρησιμοποιούσαν τεχνητή νοημοσύνη για μια δεύτερη γνώμη σε πολύπλοκες περιπτώσεις, και πάνω από τους μισούς θέλουν να τη χρησιμοποιήσουν για αυτόν τον σκοπό, σύμφωνα με μια έρευνα σε περισσότερους από 2.000 κλινικούς γιατρούς. Ωστόσο, η αποτελεσματικότητα της τεχνολογίας σε ιατρικό περιβάλλον έχει συζητηθεί.

Ο Manrai και οι συνεργάτες του δοκίμασαν το μοντέλο o-1 preview της OpenAI σε μια σειρά ιατρικών περιπτώσεων, συμπεριλαμβανομένων κλασικών συνόλων συμπτωμάτων που χρησιμοποιούνται στην ιατρική εκπαίδευση, καθώς και πραγματικών δεδομένων απευθείας από τους φακέλους 76 ασθενών που επισκέφτηκαν ένα τμήμα επειγόντων περιστατικών στη Βοστώνη. Σε αυτές τις δοκιμές κλινικού συλλογισμού, το μοντέλο τεχνητής νοημοσύνης ήταν πιο πιθανό από τους γιατρούς να συμπεριλάβει τη σωστή διάγνωση, ή κάτι πολύ κοντινό σε αυτήν, μεταξύ των πιθανών απαντήσεών του, αναφέρουν οι ερευνητές στις 30 Απριλίου στο Science.

Δεν είναι όλοι οι ερευνητές πεπεισμένοι ότι αυτό σημαίνει ότι πρέπει να εμπιστευτούμε την τεχνητή νοημοσύνη για τις διαγνώσεις μας, υποστηρίζοντας ότι ο συλλογισμός της τεχνητής νοημοσύνης απέχει ακόμα πολύ από αυτό που μπορούν να κάνουν οι ανθρώπινοι γιατροί. «Όταν λέμε κλινικός συλλογισμός, δεν εννοούμε το ίδιο πράγμα με τον συλλογισμό του μοντέλου», λέει η Arya Rao, ερευνήτρια στην Ιατρική Σχολή του Χάρβαρντ, η οποία δεν συμμετείχε στη μελέτη. «Αυτά τα μοντέλα έχουν βελτιστοποιηθεί για να κάνουν αυτό το είδος διαδοχικής σκέψης που ονομάζουμε συλλογισμό, αλλά δεν είναι καθόλου το ίδιο με τον τρόπο που διδάσκουμε τους φοιτητές ιατρικής να συλλογίζονται».

Ο Manrai δεν αντιτίθεται στην κριτική, σημειώνοντας ότι η τεχνολογία τεχνητής νοημοσύνης θα πρέπει να βοηθά αντί να αντικαθιστά τους ανθρώπους σε ιατρικούς ρόλους. «Τελικά, πιστεύω ότι οι άνθρωποι θέλουν ανθρώπους να τους καθοδηγούν… μέσα από δύσκολες αποφάσεις θεραπείας», είπε.

Είναι η Τεχνητή Νοημοσύνη καλύτερη στις ιατρικές διαγνώσεις;

Ένα μοντέλο Τεχνητής Νοημοσύνης ξεπερνά τους γιατρούς στην αναγνώριση σωστών διαγνώσεων

Οι ερευνητές εξέτασαν τρεις μεθόδους διάγνωσης ιατρικών περιπτώσεων: μοντέλα Τεχνητής Νοημοσύνης βασισμένα σε μεγάλα γλωσσικά μοντέλα (σκούρο μπλε), εξειδικευμένο λογισμικό για τον προσδιορισμό μιας διάγνωσης (ανοιχτό μπλε) και ανθρώπους κλινικούς γιατρούς (καφέ). Το μοντέλο συλλογισμού Τεχνητής Νοημοσύνης o1-preview ξεπέρασε όλους, συμπεριλαμβάνοντας τη σωστή διάγνωση στην απάντησή του σχεδόν στο 80% των περιπτώσεων. Ορισμένα από αυτά τα δεδομένα προήλθαν από προηγούμενες μελέτες, οπότε δεν ήταν όλα τα συστήματα να εξετάζουν τις ακριβώς ίδιες περιπτώσεις. Ωστόσο, όλα τα συστήματα εξέτασαν κάποιο υποσύνολο μιας μακροχρόνιας σειράς δύσκολων πραγματικών περιπτώσεων ασθενών που δημοσιεύτηκαν στο New England Journal of Medicine.

Παρόλα αυτά, τα αποτελέσματα δείχνουν ότι αυτός ο τύπος Τεχνητής Νοημοσύνης «λειτουργεί για τη διάγνωση στον πραγματικό κόσμο», δήλωσε ο συν-συγγραφέας Adam Rodman, γιατρός στο Beth Israel Deaconess Medical Center της Βοστώνης, στη συνέντευξη τύπου.

Περιέγραψε έναν ασθενή που έφτασε στο τμήμα επειγόντων περιστατικών με φαινομενικά συμπτώματα αναπνευστικής δυσχέρειας και πρόσφατα είχε υποβληθεί σε μεταμόσχευση οργάνου και ήταν ανοσοκατεσταλμένος. Ο ασθενής αποδείχθηκε ότι έπασχε από μια επικίνδυνη σαρκοβόρο λοίμωξη που απαιτούσε χειρουργική επέμβαση. «Το μοντέλο ήταν στην πραγματικότητα ύποπτο για αυτήν τη (λοιμώξη) από την αρχή, πιθανότατα 12 έως 24 ώρες πριν ο ανθρώπινος γιατρός γίνει ύποπτος για αυτήν», είπε ο Rodman.

Η Rao επαινεί την ομάδα για την παρουσίαση της [Τεχνητής Νοημοσύνης] «ως επέκταση ενός γιατρού, όχι ως αντικαταστάτη». Χαρακτηρίζει τη μελέτη «αυστηρή και στοχαστική». Ωστόσο, δεν πιστεύει ότι υπάρχουν αρκετές αποδείξεις για να πούμε ότι τα μοντέλα τεχνητής νοημοσύνης έχουν τελειοποιήσει τον κλινικό συλλογισμό.

Η ομάδα της κυκλοφόρησε μια μελέτη στις 13 Απριλίου που δοκίμασε 21 μοντέλα τεχνητής νοημοσύνης σε κάθε βήμα της διαδικασίας για την επίτευξη μιας διάγνωσης. Τα μοντέλα συλλογισμού πήραν τις υψηλότερες βαθμολογίες συνολικά. Αλλά όταν η ομάδα της Rao εμβάθυνε για να εντοπίσει ποια μέρη της διαγνωστικής διαδικασίας ήταν τα πιο δύσκολα για την τεχνητή νοημοσύνη, οι ερευνητές βρήκαν ένα αδύναμο σημείο που παρέμεινε από τα παλαιότερα μοντέλα έως τα νεότερα. Αυτή είναι η διαδικασία εξέτασης πολλών διαφορετικών αβέβαιων διαγνώσεων.

Τα μοντέλα Τεχνητής Νοημοσύνης που βασίζονται σε LLM τείνουν να καταλήγουν σε συμπεράσματα. «Ο συλλογισμός τους είναι εύθραυστος ακριβώς εκεί που η αβεβαιότητα και η λεπτότητα έχουν τη μεγαλύτερη σημασία», έγραψαν η Rao και η ομάδα της στην εργασία τους. Το συμπέρασμά τους ήταν ότι τα LLM δεν είναι ακόμη έτοιμα να πάρουν αποφάσεις σε ιατρικά περιβάλλοντα.

Αυτές οι δύο μελέτες αξιολόγησαν διαφορετικά μοντέλα τεχνητής νοημοσύνης με διαφορετικούς τρόπους. Ωστόσο, τα αποτελέσματα δεν είναι τόσο αντίθετα όσο μπορεί να φαίνονται στην επιφάνεια, λένε και οι δύο ομάδες. Συμφωνούν ότι το επόμενο βήμα πρέπει να είναι περισσότερη έρευνα.

Η ομάδα του Manrai σχεδιάζει κλινικές δοκιμές για να βοηθήσει να απαντηθεί το ερώτημα: «Πώς ενσωματώνουμε με ασφάλεια και στοχαστικά την [Τεχνητή Νοημοσύνη] στη φροντίδα;» Η Rao επικροτεί αυτήν την προσέγγιση. Τόσοι πολλοί άνθρωποι «δεν έχουν αρκετή πρόσβαση στη φροντίδα», λέει. Κάποια μέρα, σημειώνει, «πιστεύω ότι η Τεχνητή Νοημοσύνη μπορεί να είναι ένας μεγάλος εξισωτής».

Μπορεί επίσης να σας αρέσει