Γεώργιος Βούρος

Τεχνητή Νοημοσύνη: Ορισμός και κάποιες σκέψεις για τις σύγχρονες εξελίξεις

Αφιέρωμα

Εισαγωγή

Το άρθρο αυτό επιχειρεί έναν ορισμό της τεχνητής νοημοσύνης αρκετά περιεκτικό, ώστε να περιγράψει και τα σύγχρονα παραγωγικά συστήματα, όπως το ChatGPT. Αρχικά παραθέτει κάποιες σκέψεις για τη νοημοσύνη και γι’ αυτό που στην τεχνητή νοημοσύνη καλούμε «πράκτορα», να εξηγήσει βασικές έννοιες και να προχωρήσει στην παρουσίαση του ορισμού της τεχνητής νοημοσύνης. Ακολουθεί μια πολύ περιληπτική περιγραφή των παραγωγικών συστημάτων και το άρθρο καταλήγει με κάποιες σκέψεις για την (παραγωγική) τεχνητή νοημοσύνη και την επιρροή της στη σύγχρονη ζωή.

Νοημοσύνη

Πώς θα ορίζαμε τον όρο «νοημοσύνη»; Υπάρχει κάποιος δόκιμος και γενικά αποδεκτός ορισμός; Η απάντηση δυστυχώς είναι «όχι».

Χρησιμοποιούμε λέξεις όπως «έξυπνος», «νοήμων», «ευφυής» για να χαρακτηρίσουμε κάποιον που διαθέτει νοημοσύνη. Δεν θα προσπαθήσω να ορίσω τι είναι νοημοσύνη, αλλά είναι σημαντικό ίσως να επισημανθούν κάποιες σημαντικές διαφορές μεταξύ του «έξυπνου» και του «νοήμονος»: Ο έξυπνος μπορεί να δίνει λύσεις σε προβλήματα αλλά οι λύσεις αυτές μπορεί να είναι παράτολμες, άδικες προς τους συν-ανθρώπους ή άλλες οντότητες, αναποτελεσματικές με βάση κάποια κοινώς αποδεκτά κριτήρια ή ακόμα και αιρετικές ή μη ηθικές σύμφωνα με τις τρέχουσες αντιλήψεις, δογματισμούς, θεωρίες ή καλώς παγιωμένες αντιλήψεις. Μπορεί να στηρίζονται στο ψέμα ή στην απάτη. Αν ξεπεράσει τα όρια, από έξυπνος γίνεται «εξυπνάκιας».

Ο νοήμων, από την άλλη πλευρά, περιορίζει τις λύσεις ενός προβλήματος σε έναν χώρο δυνατών λύσεων, λαμβάνοντας υπόψη του στην κάθε λύση ζητήματα που αφορούν την αντίληψη που ο ίδιος έχει για τη σχέση του με το περιβάλλον του και τις υπόλοιπες οντότητες που υπάρχουν σε αυτό. Απορρίπτει λύσεις που μάλλον δημιουργούν πρόβλημα, λαμβάνοντας υπόψη περιορισμούς του περιβάλλοντός του. Ίσως είναι περισσότερο προσεκτικός, έχει περισσότερο ενδιαφέρον για τη σχέση του με το περιβάλλον του (και ό,τι αυτό περιέχει, π.χ. τις οντότητες σε αυτό) ή για την «εικόνα» του στο περιβάλλον του, και ίσως δεν φαίνεται τόσο έξυπνος όσο ο «έξυπνος», τουλάχιστον βραχυχρόνια.

Στον χώρο της τεχνητής νοημοσύνης, προσπαθούμε κυρίως να φτιάξουμε νοήμονες μηχανικές/υπολογιστικές οντότητες τις οποίες καλούμε «πράκτορες[1]», χωρίς να αποκλείουμε τα «έξυπνα» συστήματα: Προσπαθούμε οι πράκτορες να είναι νοήμονες ώστε να έχουν τη μεγαλύτερη απαιτούμενη σχέση με το περιβάλλον στο οποίο δραστηριοποιούνται, αλλά επίσης, να είναι ηθικοί και αξιόπιστοι.

Ο πράκτορας ορίζεται ως μια οντότητα που έχει ικανότητα αυτόνομης και ευέλικτης συμπεριφοράς. Αυτόνομη διότι δεν απαιτεί τον «τηλεχειρισμό» της από άλλη οντότητα για να επιτύχει τον στόχο της, και ευέλικτη γιατί προσπαθεί να βρει τρόπους ώστε να επιτύχει τους στόχους της στο περιβάλλον στο οποίο δραστηριοποιείται.

Πράγματι, ένας νοήμων πράκτορας (πρέπει να) έχει διαρκή αντίληψη του περιβάλλοντός του: Λαμβάνει πληροφορία από το περιβάλλον και την επεξεργάζεται για να λάβει αποφάσεις για δράση στο περιβάλλον ώστε να μεγιστοποιήσει την αναμενόμενη ωφέλειά του, δηλαδή το αναμενόμενο κέρδος του, όπου ως κέρδος μπορείτε να φανταστείτε τον βαθμό επίτευξης κάποιων στόχων ή το «βραβείο» επίτευξης των στόχων μείον τη ζημία από τους πόρους που απαίτησε.

Πολύ ωραία, και ένας απλός θερμοστάτης το κάνει αυτό: Με βάση τη θερμοκρασία του χώρου που λαμβάνει από κάποιον αισθητήρα, αποφασίζει για το αν θα ανοίξει ή όχι τον διακόπτη για να πετύχει τον στόχο που του έχει τεθεί. Θεωρείται πράκτορας; Όχι στην απλή περίπτωση. Π.χ. δεν έχει λεπτομερή αίσθηση της αναμενόμενης ωφέλειας και δεν αναζητά λύσεις που να μειώνουν τους πόρους που χρησιμοποιεί: Μπορεί να φτάνει στην επιθυμητή θερμοκρασία αλλά με τρόπο που να σπαταλάει μεγάλες ποσότητες πόρων.

Η λήψη απόφασης με νοήμονα τρόπο που απαιτείται από έναν πράκτορα απαιτεί διάφορες ικανότητες που του προσδίδουν ευελιξία, και που μπορεί να διαφοροποιούνται κατά περίπτωση. Σκεφτείτε ένα άλλο παράδειγμα: Θέλετε να στείλετε έναν πράκτορα σε έναν μακρινό πλανήτη για τη συλλογή δεδομένων από διάφορα σημεία του και φυσικά δεν θέλετε να τον χάσετε στην πρώτη ώρα (ή στο πρώτο λεπτό) της δράσης του. Τι ικανότητες θα θέλατε να έχει;

Ενδεικτικά αναφέρουμε κάποιες από τις ικανότητες:

Να καθοδηγείται από τους στόχους για τους οποίους σχεδιάστηκε.
Να καθοδηγείται από ευκαιρίες που του παρουσιάζει το περιβάλλον για άμεση δράση.
Να αλληλοεπιδρά με άλλους πράκτορες (που είτε βρίσκονται στη γη ή που μελλοντικά θα στείλετε).
Να προσαρμόζεται σε καταστάσεις και απρόβλεπτες εξελίξεις.
Να μαθαίνει από την εμπειρία του.
Να δρα ορθολογικά, με βάση τις προτιμήσεις του και την αίσθηση της ωφέλειας που έχει.

Ένας πράκτορας δεν έχει απαραίτητα όλες αυτές τις ικανότητες, αλλά πρέπει να διαθέτει κάποιες από αυτές για να ανταπεξέρχεται αποτελεσματικά στις δυσκολίες του πραγματικού κόσμου στον οποίο καλείται να δράσει, με πλήρη αυτονομία για την επίτευξη των στόχων για τους οποίους σχεδιάστηκε, στο περιβάλλον δράσης του: Κανένας πράκτορας δεν μπορεί να είναι παντογνώστης αλλά ούτε και ικανός να κάνει τα πάντα σε κάθε κατάσταση στην οποία μπορεί να βρεθεί. Πάντα πρέπει να επιλέγει με βάση την αντίληψή του για το περιβάλλον του, και η επιλογή απαιτεί μοντέλα σκέψης. Για την ακρίβεια, στην περίπτωση της τεχνητής νοημοσύνης, υπολογιστικά μοντέλα σκέψης.

Πληροφορία και ωφέλεια

Ας ξεκινήσουμε από την πληροφορία που λαμβάνει ο πράκτορας για το περιβάλλον του και συγκεκριμένα από την πληροφορία που λαμβάνει μέσω αισθητηρίων οργάνων (π.χ. κάμερες, αισθητήρες θερμοκρασίας, πίεσης, GPS κ.λπ.): Τέτοια πληροφορία μπορεί να βοηθήσει τον πράκτορα να γνωρίσει καλύτερα το περιβάλλον του και τα φαινόμενα σε αυτό, να εξηγήσει ή να προβλέψει καταστάσεις και τελικά να πάρει αποφάσεις για τη μελλοντική εξέλιξη του περιβάλλοντος, σε σχέση και με το τι πράττουν οι υπόλοιπες οντότητες σε αυτό.

Ίσως θα θέλαμε ο νοήμων πράκτορας να αναγάγει την πληροφορία που λαμβάνει μέσω των αισθητηρίων οργάνων του σε ανωτέρου επιπέδου γνώση και θεώρηση του περιβάλλοντός του για την επίλυση δύσκολων και πολύπλοκων προβλημάτων, για την κατανόηση φαινομένων, για την αναπροσαρμογή της σχέσης του με το περιβάλλον και για τη λήψη αποφάσεων που θα τον βοηθήσουν να ανταπεξέλθει στις τωρινές και μελλοντικές συνθήκες και προκλήσεις.

Εδώ γεννιόνται πολλά ερωτήματα: Π.χ. τι πληροφορία απαιτείται, πώς ένας πράκτορας μπορεί να την επεξεργαστεί ώστε αυτή τελικά να αναχθεί σε γνώση και πώς μπορεί αυτή να οδηγήσει σε νοήμονα συμπεριφορά;

Ας επιχειρήσουμε μια πρακτική απάντηση (με πολλά ερωτηματικά και ίσως «επικίνδυνη» αν σκεφτούμε τι μπορεί ο κάθε πράκτορας να θεωρεί «ωφέλεια»):

Απαιτείται τόση πληροφορία όση μπορεί ένας πράκτορας να προσλάβει, να χειριστεί και να αξιοποιήσει μέσω των μηχανισμών σκέψης και δράσης που διαθέτει, ώστε η αναμενόμενη ωφέλεια/ανταμοιβή που απολαμβάνει σε ένα περιβάλλον δράσης, να είναι τουλάχιστον τόση όση αν επέλεγε οποιαδήποτε άλλη πληροφορία, γνώση και τρόπους επεξεργασίας της στο ίδιο περιβάλλον δράσης.

Οι νοήμονες πράκτορες τεχνητής νοημοσύνης, υλοποιούν θεωρίες νοημοσύνης και υπολογιστικές μεθόδους ακολουθώντας την απάντηση αυτή, ό,τι και αν κάνουν, όποιο πρόβλημα και αν λύνουν.

Θα επιχειρήσουμε να εξηγήσουμε τα παραπάνω ορίζοντας τον όρο «τεχνητή νοημοσύνη», ξεκινώντας από βασικούς όρους: Αντίληψη, σκέψη, δράση, περιβάλλον, στόχοι και προτιμήσεις/προτεραιότητες, ωφέλεια.

Τεχνητή νοημοσύνη: Ένας ορισμός

Όταν κάποιος ξεκινά για να ορίσει την τεχνητή νοημοσύνη, αρχικά παραδέχεται ότι δεν έχει έναν κοινά αποδεκτό ορισμό (ή ότι έχει πολλούς αποδεκτούς ορισμούς).

Τελικά, επιχειρούμε να λύσουμε ένα πρόβλημα που δεν μπορούμε να ορίσουμε με έναν ρητό, σαφή και αδιαπραγμάτευτο τρόπο; Γιατί όμως αυτό να είναι εμπόδιο; Προχωράμε με εικασίες, θεωρίες, αναιρέσεις και αναθεωρήσεις, όπως σε κάθε επιστημονικό κλάδο. Όταν όμως πρόκειται για τεχνολογία που επηρεάζει την ανθρώπινη δραστηριότητα και ζωή, τότε κάθε ορισμός είναι κρίσιμος ώστε ως κοινωνία να έχουμε τουλάχιστον μια κοινή αίσθηση της τεχνολογίας για την οποία μιλάμε, για τα επιθυμητά, τα λιγότερο επιθυμητά και τα ανεπιθύμητα χαρακτηριστικά και αποτελέσματα χρήσης της.

Αρχικά, δεν θα επιχειρήσουμε εδώ να αναφέρουμε τους διάφορους ορισμούς για την τεχνητή νοημοσύνη. Πρέπει να πούμε όμως ότι πρόκειται για κλάδο της επιστήμης των υπολογιστών που επιχειρεί να διατυπώσει, να αποδείξει και να υλοποιήσει θεωρήσεις που αφορούν τους μηχανισμούς της νοημοσύνης. Ως κλάδος της επιστήμης των υπολογιστών έχει κυρίως την πρακτική του πλευρά: Οι θεωρήσεις πρέπει να μεταφράζονται σε υπολογιστικά μοντέλα, αλγορίθμους και τεχνολογία που επιλύει προβλήματα που απαιτούν σκέψη.

Θα ξεκινήσουμε από τις βασικές ικανότητες που διαθέτει μια νοήμων οντότητα[2]:

Αντίληψη, Σκέψη, Δράση.

Πράγματι, μια νοήμων οντότητα πρέπει να μπορεί να αντιλαμβάνεται την κατάσταση του περιβάλλοντός της, να επεξεργάζεται την πληροφορία που λαμβάνει και να τη συνδυάζει με άλλη πληροφορία για τη λήψη αποφάσεων ή την εξαγωγή συμπερασμάτων και, τέλος, θα πρέπει να μπορεί να επιδρά στο περιβάλλον μέσω κάποιων μηχανισμών δράσης. Οι μηχανισμοί δράσης μπορεί να συμπεριλαμβάνουν τον γραπτό ή τον προφορικό λόγο, ή απλώς την αποτύπωση ειδικών συμβόλων που αποτελούν ενδείξεις για ένα συμβάν (π.χ. σύμβολο για την ύπαρξη πυρκαγιάς) ή για μια ειδικού τύπου υπόδειξη (π.χ. οι υποδείξεις ενός σηματοδότη).

Όμως είναι αρκετά αυτά; Από τη μικρή και απλή εισαγωγή σε ό,τι αφορά τη νοημοσύνη και την αντίληψη του περιβάλλοντος που πρέπει να έχει ένας νοήμων πράκτορας, καταλαβαίνουμε ότι σε ό,τι αφορά την τεχνητή νοημοσύνη δεν μπορούμε να μείνουμε στις έννοιες αυτές. Θα πρέπει να προχωρήσουμε σε

Μοντέλα που αφορούν την

Αντίληψη, Σκέψη, Δράση.

Ο όρος «μοντέλο» υπονοεί μια αφηρημένη κατασκευή, μια θεώρηση που ίσως θεμελιώνεται ή/και εκφράζεται με μαθηματικές εκφράσεις και παρουσιάζει μια πιστότητα / ανταποκρισιμότητα σε σχέση με αυτό που συμβαίνει στην πραγματικότητα. Ένα τέτοιο μοντέλο μπορεί να είναι πολύ απλό, αλλά αρκούντως ισχυρό σε ό,τι αφορά τα φαινόμενα που μπορεί να μοντελοποιήσει.

Ας δούμε ένα τέτοιο παράδειγμα, που είναι θεμελιώδες για την τεχνητή νοημοσύνη: Το καλούμε «δημιουργία και έλεγχος».

Ας πούμε ότι είστε συλλέκτης γραμματοσήμων, οπότε διαθέτετε τον πρόσφατο ενημερωμένο κατάλογο γραμματοσήμων στη βιβλιοθήκη σας. Κατά τον απογευματινό σας περίπατο βρίσκετε ένα κακοποιημένο γραμματόσημο, του οποίου τα στοιχεία δεν φαίνονται επαρκώς, αλλά μόνο μια πολύ ωραία εικόνα που μόλις διακρίνεται. Δυστυχώς δεν έχετε ξαναδεί κάτι παρόμοιο, σας τραβάει την προσοχή, αλλά και την περιέργεια.

Όταν φτάνετε στο σπίτι, παίρνετε τον κατάλογο γραμματοσήμων σας και ξεκινάτε την αναζήτηση: Ξεκινώντας ίσως από την πρώτη σελίδα, δημιουργείτε μια αρχική υπόθεση για την 1^ηεγγραφή του καταλόγου, την οποία την θέτετε υπό αμφισβήτηση, ελέγχοντας ομοιότητες και διαφορές με το φθαρμένο γραμματόσημο που έχετε στο χέρι. Αν δεν ταιριάζει, προχωράτε στην 2^η εγγραφή του καταλόγου κ.λπ., έως ότου βρείτε την εγγραφή που ταιριάζει καλύτερα με το γραμματόσημό σας ή φτάσετε στο τέλος του καταλόγου. Το μοντέλο αυτό σχηματοποιείται με τον τρόπο που φαίνεται στην παρακάτω εικόνα.

Το παραπάνω είναι ένα μοντέλο σκέψης, αρκετά αφηρημένο και απλό. Όμως στην απλότητά του κρύβεται και η δύναμή του: Σκεφτείτε ότι θα μπορούσατε να αξιοποιήσετε πληροφορία από το περιβάλλον σας, καθώς και τη γνώση σας και την εμπειρία σας για τα γραμματόσημα και να αποφασίσετε για το τμήμα του καταλόγου σας στο οποίο θα περιορίσετε την αναζήτηση. Ίσως, αν έχετε ιδιαίτερη εμπειρία, να εστιάσετε σε κατάλληλα χαρακτηριστικά του γραμματοσήμου και με βάση αυτά να περιορίσετε περισσότερο την αναζήτησή σας, κάνοντάς την περισσότερο αποδοτική. Σε κάθε περίπτωση, ακόμα και ο έλεγχος της υπόθεσής σας μπορεί να γίνει με περισσότερο εκλεπτυσμένο τρόπο, καθώς το κατεστραμμένο γραμματόσημό σας δεν επιτρέπει ένα τέλειο ταίριασμα με αυτά που σας δίνει ο κατάλογός σας. Τέλος, η απόφασή σας για τη δράση που θα αναλάβετε αφού αναγνωρίσετε το γραμματόσημο μπορεί να διαφέρει σημαντικά, αναλόγως την αξία του, τη σπανιότητά του, τις προτεραιότητες και τις αξίες σας, μεταξύ άλλων παραγόντων.

Άρα το μοντέλο αυτό μπορεί να γίνει πολύ συγκεκριμένο και αρκετά εκλεπτυσμένο: Εκεί κρύβεται και η δύναμη της απλότητάς του.

Μιας και αναφέραμε όμως τον όρο «μοντέλο», θα πρέπει να διευκρινίσουμε ότι αυτός ο όρος περιγράφει διάφορες κατασκευές στην τεχνητή νοημοσύνη. Για παράδειγμα, το μοντέλο σκέψης που είδαμε παραπάνω μας βοηθάει στο να δημιουργήσουμε μια θεώρηση για τη διαδικασία σκέψης και λήψης αποφάσεων.

Ως ένα άλλο παράδειγμα μοντέλου, θεωρήστε ένα μοντέλο απόφασης που μπορείτε να χρησιμοποιήσετε για να κατευθύνετε επιτυχώς κάποιο όχημα σε ένα περιβάλλον. Θα θέλατε ίσως το μοντέλο σας να αποφεύγει επικίνδυνα σημεία ή σημεία όπου η κίνηση του οχήματος είναι απαγορευμένη. Παρόμοιοι περιορισμοί υπάρχουν σε πολλά προβλήματα (π.χ. στη χρήση λέξεων για τη σύνταξη προτάσεων, στην επίλυση μαθηματικών προβλημάτων, στην ολοκλήρωση κάποιας διαδικασίας ή ροής εργασιών) και η γνώση τους από τους νοήμονες πράκτορες είναι αναγκαία. Χρήση επιπλέον γνώσης που βοηθάει στην αποτελεσματική λύση ενός προβλήματος είναι πάντα καλοδεχούμενη: Αν το όχημά σας είναι ένα ιστιοπλοϊκό, ίσως η ροή θαλασσίων ρευμάτων και η δύναμη του αέρα βοηθήσουν στη μετακίνησή σας, ενώ αποφεύγετε τη μετακίνηση σε σημεία όπου ο αέρας δεν είναι ευνοϊκός. Επιθυμητό είναι οι επιλογές να εξαρτώνται από τους στόχους και να επιβραβεύονται από τον βαθμό επίτευξής τους: Τι είναι αυτό που προσπαθείτε να επιτύχετε; Οικονομία στα καύσιμα, ανετότερη διαδρομή, γρηγορότερη διαδρομή, ασφαλέστερη διαδρομή, συνδυασμό των παραπάνω; Θα πρέπει το μοντέλο σας να λάβει υπόψη τα κριτήρια ανταμοιβής/ωφέλειας για να σας δώσει την καλύτερη δυνατή λύση, αναλόγως και της αίσθησης της ωφέλειας που έχει.

Συνεπώς, επιδιώκουμε τα μοντέλα μας να επιτρέπουν την κωδικοποίηση γνώσης σχετικά με το πρόβλημα που πρέπει να επιλυθεί σε συγκεκριμένο περιβάλλον, και την έκφραση των περιορισμών που υφίστανται σε αυτό.

Ένα τέτοιο μοντέλο μπορεί να είναι σύνολο αλγεβρικών ή λογικών σχέσεων μεταξύ παραμέτρων ή μια συνάρτηση που χρησιμοποιείται για τη λήψη απόφασης σε συγκεκριμένες καταστάσεις, όταν οι παράμετροι πάρουν συγκεκριμένες τιμές.

Αυτά συμπληρώνουν τον ορισμό της τεχνητής νοημοσύνης που σχηματίζουμε ως εξής:

Η τεχνητή νοημοσύνη αφορά σε

Γνώση και περιορισμούς που εκφράζονται μέσω

Αναπαράστασης γνώσης σε

Μοντέλα που αφορούν την

Αντίληψη, Σκέψη, Δράση.

Τελικά πώς αξιοποιείται ένα μοντέλο για την επίλυση ενός προβλήματος; Προφανώς χρειαζόμαστε κάποιον αλγόριθμο που σύμφωνα με τους περιορισμούς, την αναπαράστασή τους, και με αξιοποίηση επιπλέον γνώσης, δίνει μια ή περισσότερες λύσεις στον τρόπο επίτευξης του στόχου.

Άλλωστε η τεχνητή νοημοσύνη αφορά, όπως επισημάναμε και παραπάνω, σε υπολογιστικά συστήματα και στην τεχνολογία που αναπτύσσεται με αυτά.

Συνεπώς ο πλήρης ορισμός της τεχνητής νοημοσύνης που θα προτείναμε είναι ο εξής:

Η τεχνητή νοημοσύνη αφορά

Αλγορίθμους που χειρίζονται

Γνώση και περιορισμούς που εκφράζονται μέσω

Αναπαράστασης γνώσης σε

Μοντέλα που αφορούν την

Αντίληψη, Σκέψη, Δράση.

Μπορεί κάποιος να αναρωτηθεί αν ο ορισμός αυτός είναι αρκετά «ευρύς» για να χωρέσει όλα τα επιτεύγματα της τεχνητής νοημοσύνης. Η άποψή μου είναι πως είναι αρκούντως ευρύς. Ακόμα και για τα σύγχρονα μοντέλα παραγωγικής τεχνητής νοημοσύνης.

Παραγωγική τεχνητή νοημοσύνη

Οι πράκτορες που αφορούν τη μίμηση συμπεριφοράς ή την παραγωγή, βασιζόμενοι σε μοντέλα που εκπαιδεύονται από δεδομένα (βλ. τα σύγχρονα παραγωγικά μοντέλα, π.χ. GPT), μπορούν να ενταχθούν στον παραπάνω ορισμό:

Κατά την εκπαίδευσή τους, οι πράκτορες αυτοί χρησιμοποιούν αλγορίθμους που χειρίζονται γνώση και περιορισμούς για το πρόβλημα που καλούνται να επιλύσουν εντός συγκεκριμένου πλαισίου (περιβάλλοντος) δράσης. Η γνώση και οι περιορισμοί αυτοί αναπαρίστανται στα μοντέλα που οι πράκτορες αξιοποιούν, και τίθενται από

(α) τα δεδομένα εκπαίδευσης, τα οποία υποτίθεται[3] ότι δημιουργούνται από ειδικούς,

(β) τον στόχο της εκπαίδευσής τους, που αναγκάζει τα μοντέλα να οδηγούν σε συμπεριφορά που αντιγράφει τον τρόπο συμπεριφοράς που επιδεικνύεται στα δεδομένα εκπαίδευσης. Ο στόχος εκπαίδευσης συνήθως συμπεριλαμβάνει και τον βαθμό ανταμοιβής που επιβραβεύει (ή «τιμωρεί») την «καλή» (αντίστοιχα, «κακή) συμπεριφορά του μοντέλου, και τέλος,

(γ) τις παραμέτρους (και τις σχέσεις μεταξύ των παραμέτρων) των μοντέλων.

Τα δεδομένα, ο στόχος και οι παράμετροι καθορίζουν την ποσότητα και ποιότητα της γνώσης που προσλαμβάνουν τα μοντέλα και αξιοποιούν οι πράκτορες.

Τα σύγχρονα μεγάλα μοντέλα, όπως αυτό του GPT, είναι μεγάλα διότι χρησιμοποιούν τεράστιο αριθμό παραμέτρων που διαρκώς αυξάνεται από μια έκδοση του συστήματος στην επόμενη, για να μπορέσουν να ανταπεξέλθουν στον όγκο δεδομένων στον οποίο εκπαιδεύονται (βιβλία, ιστοσελίδες, Wikipedia, πρότυπα, εγχειρίδια κ.λπ.), στις επιδιωκόμενες λειτουργίες τους και στην εκμάθηση περιορισμών. Το μοντέλο απόφασής τους βασίζεται στη μεγιστοποίηση της αναμενόμενης ωφέλειας, που στην περίπτωση αυτή είναι η πιθανοφάνεια των παραγόμενων. Βασικό στοιχείο των αποφάσεών τους είναι η πιθανότητα ενός στοιχείου (π.χ. μιας λέξης/φράσης) να ακολουθεί ένα άλλο. Έτσι όμως, οι διαλογικές τους ικανότητες είναι περιορισμένες, όπως και οι ικανότητες σκέψης/συλλογισμού. Θα πρέπει όμως να παραδεχτούμε ότι η ικανότητά τους στην παραγωγή κειμένου και άλλων κατασκευών (π.χ. κώδικα), όπως και ο βαθμός παραγωγής συμπερασμάτων, είναι αρκετά καλές και ξεπερνούν αυτό που είχαμε συνηθίσει μέχρι σήμερα σε παρόμοια μοντέλα: Δυστυχώς κανείς δεν ξέρει τον ακριβή λόγο που συμβαίνει αυτό.

Σκέψεις

Γενικά, οι παραγωγικοί πράκτορες, αυτοί δηλαδή που αξιοποιούν παραγωγικά μοντέλα τεχνητής νοημοσύνης, μπορούν να χρησιμοποιηθούν με τρόπο που υποβαθμίζουν τον ανθρώπινο παράγοντα, με τρόπο που να δημιουργήσουν «μάζες», να παραπληροφορήσουν σε μεγάλη κλίμακα (τοπική, χρονική και ακόμη χειρότερα, «βάθους»), να περιορίσουν τις γνωσιακές ικανότητες πολλών –ιδιαίτερα νέων– ανθρώπων. Όμως ένας μεγάλος κίνδυνος από αυτά τα αξιοθαύμαστα τεχνολογικά επιτεύγματα βρίσκεται στη συγκέντρωση πολιτικής και οικονομικής δύναμης από τους τεχνολογικούς κολοσσούς οι οποίοι δημιουργούν υπερ-κράτη, πάνω από το ανθρώπινο μέτρο και τη δυνατότητα ελέγχου των κατασκευών που και οι ίδιοι (δεν) διαθέτουν.

Αν και δεν θα ήθελα να αναφερθώ στο (στερεότυπο) παράδειγμα της χρήσης του μαχαιριού, τα τεχνολογικά εργαλεία που παρέχει η τεχνητή νοημοσύνη έχουν την καλή και την κακή χρήση τους. Η τελευταία πρέπει να περιορίζεται είτε μέσω κανονιστικών πλαισίων που καθιστούν απαγορευμένα τα άσχημα αποτελέσματα της κακής χρήσης των εργαλείων αυτών (όπως ακριβώς απαγορεύεται και το κακό αποτέλεσμα της άσχημης χρήσης ενός μαχαιριού), ή περιορίζουν την πιθανότητα κακής χρήσης μέσω σαφών υποδείξεων χρήσης σε συγκεκριμένα πλαίσια και για συγκεκριμένους σκοπούς. Πάντοτε όμως θα πρέπει να τίθενται όροι αξιοπιστίας, υπευθυνότητας και λογοδοσίας της αντίληψης, σκέψης και δράσης των εργαλείων αυτών.

Είναι αναγκαίο λοιπόν η επιστημονική κοινότητα να διαθέσει πόρους για να κατανοήσει καλύτερα τις δυνατότητες και τα όρια των παραγωγικών πρακτόρων πριν αυτοί χρησιμοποιηθούν σε εφαρμογές κρίσιμες για οποιαδήποτε ανθρώπινη δραστηριότητα και για την ίδια την ανθρώπινη ζωή. Θα πρέπει επίσης να επενδύσει στη δημιουργία συστημάτων που εξηγούν τα παραγόμενα αποτελέσματα των πρακτόρων («γιατί» και «πώς») σε όλους τους χρήστες τους, με όρους κατανοητούς και κατάλληλους για το πλαίσιο χρήσης τους, όπως θα απαιτούσαμε ως κοινωνία σε κάθε τέτοια περίπτωση. Ως (ακραίο) παράδειγμα, σκεφτείτε αν θα δεχόσασταν να ταξιδέψετε σήμερα με ένα αεροπλάνο, αν σας ανακοίνωναν ότι ο πιλότος θα είναι ένας πράκτορας από τους γνωστούς παραγωγικούς πράκτορες. Αν έστω στέλνατε ένα αγαθό με ένα τέτοιο αεροπλάνο, δεν θα θέλατε να ξέρατε ποιος λογοδοτεί στην περίπτωση που χαθεί;

Στο σημείο αυτό πρέπει να προσθέσουμε ότι πέρα από τους παραγωγικούς πράκτορες, και τα πολύ ωραία αποτελέσματα που επιδεικνύουν, υπάρχουν και άλλα επιτυχημένα συστήματα τεχνητής νοημοσύνης που αξιοποιούν διαφορετικά μοντέλα αντίληψης, σκέψης και δράσης, λιγότερο όμως γνωστά στην ευρύτερη κοινωνία, αν και ο αντίκτυπός τους είναι σημαντικός για το παρόν και το μέλλον.

Αναμένεται να δούμε και άλλα ωραία αποτελέσματα της τεχνητής νοημοσύνης, και αύξηση των δυνατοτήτων των πρακτόρων, και ιδιαίτερα στον τομέα της συνεργασίας με τον άνθρωπο. Τα μοντέλα της τεχνητής νοημοσύνης, πέρα από τους κινδύνους, μπορούν να βοηθήσουν στην αύξηση της παραγωγικότητας, υποβοηθώντας τις ανθρώπινες ικανότητες και αναπτύσσοντας τις ανθρώπινες δεξιότητες σε πολλούς τομείς της σύγχρονης ζωής, στους οποίους ο άνθρωπος καλείται να ανταπεξέλθει. Μπορούν να βοηθήσουν στην καλύτερη εκπαίδευση και στην κατάρτιση επαγγελματιών σε διάφορους χώρους, αλλά και να δημιουργήσουν νέες ευκαιρίες για επιχειρηματικότητα, εργασία και ανάπτυξη της ανθρώπινης δημιουργικότητας. Θα πρέπει όμως να διασφαλίζεται η σωστή χρήση τους, με όρους αξιοπιστίας, υπευθυνότητας και λογοδοσίας.

***

Ευχαριστίες: Θα ήθελα να ευχαριστήσω θερμά όλους όσους με τα κριτικά σχόλια, τις παρατηρήσεις τους και την όρεξη να συζητήσουν απόψεις στην πρώτη έκδοση του άρθρου αυτού βοήθησαν στη σημαντική βελτίωσή του: Ορέστη Τελέλη, Γιώργο Γιαννακόπουλο, Στράτο Βούρο, Αλεβίζο Μπάστα, Ιγνάτιο Χατζηγιανέλλη, Σταύρο Αμπατζή, Ανδρέα Κοντογιάννη, Πέγκυ Βούρου, Κώστα Κώτη.

⸙⸙⸙

[Ο κ. Γεώργιος Βούρος είναι καθηγητής του Τμήματος Ψηφιακών Συστημάτων του Πανεπιστημίου Πειραιώς.]

[1] Ως «πράκτορα» στο πλαίσιο του κειμένου εννοούμε αποκλειστικά μηχανικούς πράκτορες, που μπορεί να είναι πράκτορες λογισμικού ή και ρομποτικοί πράκτορες.

[2] Ο ορισμός που αναπτύσσεται παρακάτω έχει στοιχεία από τον ορισμό που έδινε ο Patrick Winston, καθηγητής στο MIT. Αφιερώνεται στη μνήμη του εμπνευσμένου αυτού επιστήμονα και δασκάλου.

[3] Αξίζει να αφιερώσετε λίγο χρόνο για να σκεφτείτε τα συνεπακόλουθα αυτής της κρίσιμης υπόθεσης.

009, Γεώργιος Βούρος, Τεχνητή Νοημοσύνη

Γεώργιος Βούρος

Τεχνητή Νοημοσύνη: Ορισμός και κάποιες σκέψεις για τις σύγχρονες εξελίξεις

Ακολουθήστε μας

To blog μας