Δίνοντας στην Τεχνητή Νοημοσύνη την Ικανότητα να Παρακολουθεί τη Σκέψη της: Ένα Βήμα προς την Ανθρώπινη Λογική

Έχετε βρεθεί ποτέ να ξαναδιαβάζετε μια πρόταση πολλές φορές, μόνο για να συνειδητοποιήσετε ότι δεν την καταλαβαίνετε; Όπως διδάσκεται στους πρωτοετείς φοιτητές, όταν συνειδητοποιείτε ότι “γυρίζετε στα τυφλά”, είναι καιρός να αλλάξετε προσέγγιση.

Αυτή η διαδικασία, το να συνειδητοποιείτε ότι κάτι δεν λειτουργεί και μετά να αλλάζετε αυτό που κάνετε, είναι η ουσία της μεταγνώσης, δηλαδή της σκέψης για τη σκέψη.

Είναι ο εγκέφαλός σας που παρακολουθεί τη δική του σκέψη, αναγνωρίζει ένα πρόβλημα και ελέγχει ή προσαρμόζει την προσέγγισή σας. Στην πραγματικότητα, η μεταγνώση είναι θεμελιώδης για την ανθρώπινη νοημοσύνη και, μέχρι πρόσφατα, δεν έχει μελετηθεί επαρκώς στα συστήματα τεχνητής νοημοσύνης.

Οι συνάδελφοί μου Charles Courchaine, Hefei Qiu και Joshua Iacoboni κι εγώ εργαζόμαστε για να το αλλάξουμε αυτό. Αναπτύξαμε ένα μαθηματικό πλαίσιο σχεδιασμένο να επιτρέπει στα γενετικά συστήματα τεχνητής νοημοσύνης, συγκεκριμένα στα μεγάλα γλωσσικά μοντέλα όπως το ChatGPT ή το Claude, να παρακολουθούν και να ρυθμίζουν τις δικές τους εσωτερικές “γνωστικές” διαδικασίες. Κατά κάποιο τρόπο, μπορείτε να το σκεφτείτε σαν να δίνετε στην γενετική τεχνητή νοημοσύνη έναν εσωτερικό μονόλογο, έναν τρόπο να αξιολογεί τη δική της αυτοπεποίθηση, να ανιχνεύει σύγχυση και να αποφασίζει πότε να σκεφτεί πιο σκληρά για ένα πρόβλημα.

Γιατί οι μηχανές χρειάζονται αυτογνωσία

Τα σημερινά γενετικά συστήματα τεχνητής νοημοσύνης είναι αξιοσημείωτα ικανά αλλά ουσιαστικά ανενημέρωτα. Δημιουργούν απαντήσεις χωρίς να γνωρίζουν πραγματικά πόσο σίγουρες ή μπερδεμένες μπορεί να είναι η απάντησή τους, αν περιέχει αντιφατικές πληροφορίες ή αν ένα πρόβλημα αξίζει επιπλέον προσοχή. Αυτός ο περιορισμός καθίσταται κρίσιμος όταν η αδυναμία της γενετικής τεχνητής νοημοσύνης να αναγνωρίσει τη δική της αβεβαιότητα μπορεί να έχει σοβαρές συνέπειες, ιδιαίτερα σε εφαρμογές υψηλού κινδύνου, όπως η ιατρική διάγνωση, οι χρηματοοικονομικές συμβουλές και η αυτόνομη λήψη αποφάσεων οχημάτων.

Για παράδειγμα, εξετάστε ένα ιατρικό γενετικό σύστημα τεχνητής νοημοσύνης που αναλύει συμπτώματα. Θα μπορούσε να προτείνει με σιγουριά μια διάγνωση χωρίς κανέναν μηχανισμό για να αναγνωρίσει καταστάσεις όπου θα ήταν πιο κατάλληλο να σταματήσει και να σκεφτεί, όπως “Αυτά τα συμπτώματα έρχονται σε αντίθεση μεταξύ τους” ή “Αυτό είναι ασυνήθιστο, θα πρέπει να το σκεφτώ πιο προσεκτικά”.

Η ανάπτυξη μιας τέτοιας ικανότητας θα απαιτούσε μεταγνώση, η οποία περιλαμβάνει τόσο την ικανότητα να παρακολουθεί κανείς τη δική του συλλογιστική μέσω της αυτογνωσίας όσο και να ελέγχει την απάντηση μέσω της αυτορρύθμισης.

Εμπνευσμένο από τη νευροβιολογία, το πλαίσιο μας στοχεύει να δώσει στην γενετική τεχνητή νοημοσύνη μια εμφάνιση αυτών των δυνατοτήτων χρησιμοποιώντας αυτό που ονομάζουμε διανυσματικό μεταγνωστικό κράτος, το οποίο είναι ουσιαστικά ένα ποσοτικοποιημένο μέτρο της εσωτερικής “γνωστικής” κατάστασης της γενετικής τεχνητής νοημοσύνης σε πέντε διαστάσεις.

5 διαστάσεις της μηχανικής αυτογνωσίας

Ένας τρόπος να σκεφτείτε αυτές τις πέντε διαστάσεις είναι να φανταστείτε να δίνετε σε ένα γενετικό σύστημα τεχνητής νοημοσύνης πέντε διαφορετικούς αισθητήρες για τη δική του σκέψη.

  • Συναισθηματική συνειδητοποίηση, για να το βοηθήσει να παρακολουθεί συναισθηματικά φορτισμένο περιεχόμενο, το οποίο μπορεί να είναι σημαντικό για την πρόληψη επιβλαβών αποτελεσμάτων.
  • Αξιολόγηση ορθότητας, η οποία μετράει πόσο σίγουρο είναι το μεγάλο γλωσσικό μοντέλο για την εγκυρότητα της απάντησής του.
  • Αντιστοίχιση εμπειριών, όπου ελέγχει αν η κατάσταση μοιάζει με κάτι που έχει συναντήσει στο παρελθόν.
  • Ανίχνευση συγκρούσεων, ώστε να μπορεί να εντοπίζει αντιφατικές πληροφορίες που απαιτούν επίλυση.
  • Σημασία προβλήματος, για να το βοηθήσει να εκτιμήσει τα στοιχήματα και τον επείγοντα χαρακτήρα για να ιεραρχήσει τους πόρους.

Ποσοτικοποιούμε κάθε μία από αυτές τις έννοιες σε ένα συνολικό μαθηματικό πλαίσιο για να δημιουργήσουμε το διανυσματικό μεταγνωστικό κράτος και να το χρησιμοποιήσουμε για να ελέγξουμε σύνολα μεγάλων γλωσσικών μοντέλων. Στην ουσία, το διανυσματικό μεταγνωστικό κράτος μετατρέπει τις ποιοτικές αυτοαξιολογήσεις ενός μεγάλου γλωσσικού μοντέλου σε ποσοτικά σήματα που μπορεί να χρησιμοποιήσει για να ελέγξει τις απαντήσεις του.

Για παράδειγμα, όταν η εμπιστοσύνη ενός μεγάλου γλωσσικού μοντέλου σε μια απάντηση πέσει κάτω από ένα ορισμένο όριο ή οι συγκρούσεις στην απάντηση υπερβούν κάποια αποδεκτά επίπεδα, θα μπορούσε να μεταβεί από γρήγορη, διαισθητική επεξεργασία σε αργή, εσκεμμένη συλλογιστική. Αυτό είναι ανάλογο με αυτό που οι ψυχολόγοι αποκαλούν σκέψη Συστήματος 1 και Συστήματος 2 στους ανθρώπους.

Αυτό το εννοιολογικό διάγραμμα δείχνει τη βασική ιδέα για να δοθεί σε ένα σύνολο μεγάλων γλωσσικών μοντέλων μια συνειδητοποίηση της κατάστασης της επεξεργασίας του. (Εικόνα: Ricky J. Sethi)

Διευθύνοντας μια ορχήστρα

Φανταστείτε ένα μεγάλο γλωσσικό μοντέλο, ένα σύνολο σαν ορχήστρα όπου κάθε μουσικός -ένα μεμονωμένο μεγάλο γλωσσικό μοντέλο- μπαίνει σε συγκεκριμένες στιγμές με βάση τις ενδείξεις που λαμβάνει από τον μαέστρο. Το διανυσματικό μεταγνωστικό κράτος ενεργεί ως η συνειδητοποίηση του μαέστρου, παρακολουθώντας συνεχώς αν η ορχήστρα είναι σε αρμονία, αν κάποιος είναι εκτός τόνου ή αν ένα ιδιαίτερα δύσκολο πέρασμα απαιτεί επιπλέον προσοχή.

Όταν εκτελεί ένα οικείο, καλά προβοκαρισμένο κομμάτι, όπως μια απλή λαϊκή μελωδία, η ορχήστρα παίζει εύκολα σε γρήγορο, αποτελεσματικό συντονισμό με ελάχιστο συντονισμό. Αυτή είναι η λειτουργία Συστήματος 1. Κάθε μουσικός γνωρίζει το μέρος του, οι αρμονίες είναι απλές και το σύνολο λειτουργεί σχεδόν αυτόματα.

Αλλά όταν η ορχήστρα συναντά μια σύνθετη σύνθεση τζαζ με αντιφατικές υπογραφές χρόνου, διάφωνες αρμονίες ή ενότητες που απαιτούν αυτοσχεδιασμό, οι μουσικοί χρειάζονται μεγαλύτερο συντονισμό. Ο μαέστρος κατευθύνει τους μουσικούς να αλλάξουν ρόλους: Κάποιοι γίνονται αρχηγοί τμημάτων, άλλοι παρέχουν ρυθμική αγκύρωση και σολίστ εμφανίζονται για συγκεκριμένα αποσπάσματα.

Αυτό είναι το είδος του συστήματος που ελπίζουμε να δημιουργήσουμε σε ένα υπολογιστικό πλαίσιο εφαρμόζοντας το πλαίσιό μας, ενορχηστρώνοντας σύνολα μεγάλων γλωσσικών μοντέλων. Το διανυσματικό μεταγνωστικό κράτος ενημερώνει ένα σύστημα ελέγχου που ενεργεί ως μαέστρος, λέγοντάς του να αλλάξει λειτουργίες σε Σύστημα 2. Στη συνέχεια, μπορεί να πει σε κάθε μεγάλο γλωσσικό μοντέλο να αναλάβει διαφορετικούς ρόλους – για παράδειγμα, κριτικός ή ειδικός – και να συντονίσει τις πολύπλοκες αλληλεπιδράσεις τους με βάση τη μεταγνωστική αξιολόγηση της κατάστασης.

Επιπτώσεις και διαφάνεια

Οι επιπτώσεις εκτείνονται πολύ πέρα από το να κάνουν την γενετική τεχνητή νοημοσύνη ελαφρώς πιο έξυπνη. Στην υγειονομική περίθαλψη, ένα μεταγνωστικό γενετικό σύστημα τεχνητής νοημοσύνης θα μπορούσε να αναγνωρίσει πότε τα συμπτώματα δεν ταιριάζουν με τυπικά μοτίβα και να κλιμακώσει το πρόβλημα σε ανθρώπους ειδικούς αντί να διακινδυνεύσει εσφαλμένη διάγνωση. Στην εκπαίδευση, θα μπορούσε να προσαρμόσει τις διδακτικές στρατηγικές όταν ανιχνεύει σύγχυση των μαθητών. Στην εποπτεία περιεχομένου, θα μπορούσε να εντοπίσει λεπτές καταστάσεις που απαιτούν ανθρώπινη κρίση αντί να εφαρμόζει άκαμπτους κανόνες.

Ίσως το πιο σημαντικό, το πλαίσιο μας καθιστά τη λήψη αποφάσεων με γενετική τεχνητή νοημοσύνη πιο διαφανή. Αντί για ένα μαύρο κουτί που απλώς παράγει απαντήσεις, παίρνουμε συστήματα που μπορούν να εξηγήσουν τα επίπεδα εμπιστοσύνης τους, να εντοπίσουν τις αβεβαιότητές τους και να δείξουν γιατί επέλεξαν συγκεκριμένες στρατηγικές συλλογιστικής.

Αυτή η ερμηνευσιμότητα και η επεξηγησιμότητα είναι ζωτικής σημασίας για την οικοδόμηση εμπιστοσύνης στα συστήματα τεχνητής νοημοσύνης, ειδικά σε ρυθμιζόμενες βιομηχανίες ή εφαρμογές κρίσιμης σημασίας για την ασφάλεια.

Ο δρόμος μπροστά

Το πλαίσιο μας δεν δίνει στις μηχανές συνείδηση ή αληθινή αυτογνωσία με την ανθρώπινη έννοια. Αντίθετα, η ελπίδα μας είναι να παρέχουμε μια υπολογιστική αρχιτεκτονική για την κατανομή πόρων και τη βελτίωση των απαντήσεων που χρησιμεύει επίσης ως ένα πρώτο βήμα προς πιο εξελιγμένες προσεγγίσεις για πλήρη τεχνητή μεταγνώση.

Η επόμενη φάση της εργασίας μας περιλαμβάνει την επικύρωση του πλαισίου με εκτεταμένες δοκιμές, τη μέτρηση του τρόπου με τον οποίο η μεταγνωστική παρακολούθηση βελτιώνει την απόδοση σε διάφορες εργασίες και την επέκταση του πλαισίου για να ξεκινήσουμε να συλλογιζόμαστε για τη συλλογιστική ή μετασυλλογιστική. Μας ενδιαφέρουν ιδιαίτερα σενάρια όπου η αναγνώριση της αβεβαιότητας είναι ζωτικής σημασίας, όπως στις ιατρικές διαγνώσεις, τη νομική συλλογιστική και τη δημιουργία επιστημονικών υποθέσεων.

Το απώτερο όραμά μας είναι γενετικά συστήματα τεχνητής νοημοσύνης που δεν επεξεργάζονται απλώς πληροφορίες, αλλά κατανοούν τους γνωστικούς περιορισμούς και τα δυνατά τους σημεία. Αυτό σημαίνει συστήματα που γνωρίζουν πότε να είναι σίγουρα και πότε να είναι προσεκτικά, πότε να σκέφτονται γρήγορα και πότε να επιβραδύνουν και πότε είναι εξουσιοδοτημένα να απαντήσουν και πότε θα πρέπει να παραπέμψουν σε άλλους.
“`

via

Μπορεί επίσης να σας αρέσει