Όσο περισσότερο χρησιμοποιούν οι άνθρωποι την Τεχνητή Νοημοσύνη, τόσο περισσότερο υπερεκτιμούν τις ικανότητές τους

Η έρευνα έχει διαπιστώσει ότι η χρήση της τεχνητής νοημοσύνης (ΤΝ) μας δίνει μια ψευδή αίσθηση αυτοπεποίθησης.
Όταν μας ζητείται να αξιολογήσουμε πόσο καλοί είμαστε σε κάτι, τείνουμε να κάνουμε εντελώς λάθος εκτίμηση. Είναι μια παγκόσμια ανθρώπινη τάση, με το φαινόμενο να παρατηρείται εντονότερα σε όσους έχουν χαμηλότερα επίπεδα ικανότητας. Αυτό το φαινόμενο ονομάζεται φαινόμενο Dunning-Kruger, από τους ψυχολόγους που το μελέτησαν για πρώτη φορά, και σημαίνει ότι οι άνθρωποι που δεν είναι πολύ καλοί σε ένα συγκεκριμένο έργο είναι υπερβολικά σίγουροι για τον εαυτό τους, ενώ οι άνθρωποι με υψηλή ικανότητα τείνουν να υποτιμούν τις δεξιότητές τους. Συχνά αποκαλύπτεται από γνωστικά τεστ — τα οποία περιέχουν προβλήματα για την αξιολόγηση της προσοχής, της λήψης αποφάσεων, της κρίσης και της γλώσσας.
Αλλά τώρα, επιστήμονες στο Πανεπιστήμιο Aalto της Φινλανδίας (μαζί με συνεργάτες στη Γερμανία και τον Καναδά) διαπίστωσαν ότι η χρήση της τεχνητής νοημοσύνης (ΤΝ) σχεδόν εξαλείφει το φαινόμενο Dunning-Kruger — στην πραγματικότητα, σχεδόν το αντιστρέφει.
Η έρευνά τους έδειξε ότι όταν χρησιμοποιούνται κοινά chatbots για την επίλυση προβλημάτων, όλοι (ανεξάρτητα από το επίπεδο δεξιοτήτων τους) τείνουν να εμπιστεύονται υπερβολικά την ποιότητα των απαντήσεων, με τους πιο έμπειρους χρήστες ΤΝ να το κάνουν περισσότερο. Η ομάδα δημοσίευσε τα ευρήματά της στην έκδοση του Φεβρουαρίου 2026 του περιοδικού Computers in Human Behavior.
Καθώς όλοι γινόμαστε πιο εξοικειωμένοι με την ΤΝ χάρη στην εξάπλωση των μεγάλων γλωσσικών μοντέλων (LLM), οι ερευνητές ανέμεναν ότι οι συμμετέχοντες θα ήταν όχι μόνο καλύτεροι στην αλληλεπίδραση με τα συστήματα ΤΝ, αλλά και καλύτεροι στην αξιολόγηση της απόδοσής τους στη χρήση τους. “Αντίθετα, τα ευρήματά μας αποκαλύπτουν μια σημαντική ανικανότητα ακριβούς αξιολόγησης της απόδοσής κάποιου κατά τη χρήση της ΤΝ, εξίσου σε όλο το δείγμα μας”, δήλωσε σε μια δήλωση ο Robin Welsch, επιστήμονας υπολογιστών στο Πανεπιστήμιο Aalto, ο οποίος συνέγραψε την έκθεση.
Ισοπέδωση της καμπύλης
Στην έρευνα, οι επιστήμονες έδωσαν σε 500 άτομα εργασίες λογικής σκέψης από το Law School Admission Test (Εξετάσεις Εισαγωγής στη Νομική Σχολή), με τους μισούς να επιτρέπεται να χρησιμοποιήσουν το δημοφιλές chatbot ΤΝ ChatGPT. Και οι δύο ομάδες ρωτήθηκαν αργότερα τόσο για την εξοικείωσή τους με την ΤΝ όσο και για το πόσο καλά πίστευαν ότι τα πήγαν, και τους υποσχέθηκαν επιπλέον αποζημίωση εάν αξιολογούσαν με ακρίβεια την απόδοσή τους.
Οι λόγοι πίσω από τα ευρήματα είναι διάφοροι. Επειδή οι χρήστες ΤΝ ήταν συνήθως ικανοποιημένοι με την απάντησή τους μετά από μία μόνο ερώτηση ή προτροπή, αποδεχόμενοι την απάντηση χωρίς περαιτέρω έλεγχο ή επιβεβαίωση, μπορεί να ειπωθεί ότι ασχολήθηκαν με αυτό που ο Welsch αποκαλεί “γνωστική εκφόρτωση” — ανακρίνοντας την ερώτηση με μειωμένο προβληματισμό και προσεγγίζοντάς την με έναν πιο “ρηχό” τρόπο.
Λιγότερη ενασχόληση με τη δική μας συλλογιστική — που ονομάζεται “μεταγνωστική παρακολούθηση” — σημαίνει ότι παρακάμπτουμε τους συνήθεις βρόχους ανάδρασης της κριτικής σκέψης, γεγονός που μειώνει την ικανότητά μας να μετρήσουμε με ακρίβεια την απόδοσή μας.
Ακόμη πιο αποκαλυπτικό ήταν το γεγονός ότι όλοι υπερεκτιμούμε τις ικανότητές μας όταν χρησιμοποιούμε ΤΝ, ανεξάρτητα από τη νοημοσύνη μας, με το χάσμα μεταξύ χρηστών υψηλών και χαμηλών δεξιοτήτων να συρρικνώνεται. Η μελέτη απέδωσε αυτό στο γεγονός ότι τα LLM βοηθούν όλους να αποδώσουν καλύτερα σε κάποιο βαθμό.
Αν και οι ερευνητές δεν αναφέρθηκαν σε αυτό άμεσα, το εύρημα έρχεται επίσης σε μια εποχή που οι επιστήμονες αμφισβητούν αν αρχίζουμε να ρωτάμε αν τα κοινά LLM είναι υπερβολικά κολακευτικά. Η ομάδα του Aalto προειδοποίησε για διάφορες πιθανές συνέπειες καθώς η ΤΝ γίνεται πιο διαδεδομένη.
Πρώτον, η συνολική μεταγνωστική ακρίβεια μπορεί να υποφέρει. Καθώς βασιζόμαστε περισσότερο στα αποτελέσματα χωρίς να τα αμφισβητούμε αυστηρά, προκύπτει ένας συμβιβασμός, όπου η απόδοση των χρηστών βελτιώνεται, αλλά η εκτίμηση του πόσο καλά τα πάμε με τις εργασίες μειώνεται. Χωρίς προβληματισμό στα αποτελέσματα, έλεγχο σφαλμάτων ή βαθύτερη συλλογιστική, κινδυνεύουμε να αποβλακωθούμε στην ικανότητά μας να βρίσκουμε πληροφορίες αξιόπιστα, ανέφεραν οι επιστήμονες στη μελέτη.
Επιπλέον, η ισοπέδωση του φαινομένου Dunning-Kruger θα σημαίνει ότι όλοι θα συνεχίσουμε να υπερεκτιμούμε τις ικανότητές μας κατά τη χρήση της ΤΝ, με τους πιο εξοικειωμένους με την ΤΝ μεταξύ μας να το κάνουν ακόμη περισσότερο — οδηγώντας σε ένα αυξημένο κλίμα εσφαλμένων υπολογισμών στη λήψη αποφάσεων και σε μια διάβρωση των δεξιοτήτων.
Μια από τις μεθόδους που προτείνει η μελέτη για να αναχαιτιστεί μια τέτοια παρακμή είναι να ενθαρρύνει η ίδια η ΤΝ περαιτέρω ερωτήσεις στους χρήστες, με τους προγραμματιστές να επαναπροσανατολίζουν τις απαντήσεις για να ενθαρρύνουν τον προβληματισμό — ρωτώντας κυριολεκτικά ερωτήσεις όπως “πόσο σίγουροι είστε για αυτήν την απάντηση;” ή “τι μπορεί να έχετε χάσει;” ή διαφορετικά προωθώντας περαιτέρω αλληλεπίδραση μέσω μέτρων όπως οι βαθμολογίες εμπιστοσύνης.
