Τα μοντέλα τεχνητής νοημοσύνης έχουν απορροφήσει ιστορικά αντισημιτικά στερεότυπα από τα ανθρώπινα κείμενα επάνω στα οποία εκπαιδεύονται, σύμφωνα με πρόσφατη ψυχολογική μελέτη.
Οι συγγραφείς, από ισραηλινά πανεπιστήμια, δήλωσαν ότι η ανάλυση έδειξε πώς «μια αρχαία προκατάληψη επιμένει στα σύγχρονα τεχνολογικά συστήματα μέσα από περίπλοκα μοτίβα συσχετισμού χαρακτηριστικών και πολιτισμικής κωδικοποίησης».
Η ερευνητική εργασία, η οποία δημοσιεύθηκε στο αξιολογημένο από ομοτίμους επιστημονικό περιοδικό American Psychologist, εξέτασε τον τρόπο με τον οποίο αναπαρίστανται οι Εβραίοι στα μεγάλα γλωσσικά μοντέλα (LLMs) και αν τα μοντέλα αναπαράγουν προκαταλήψεις που σχετίζονται με τους Εβραίους.
Τα LLMs είναι προηγμένα συστήματα τεχνητής νοημοσύνης, εκπαιδευμένα σε τεράστιες δεξαμενές υπαρχόντων κειμένων, τα οποία επεξεργάζονται και παράγουν ανθρώπινη γλώσσα. Αποτελούν βασική τεχνολογία που τροφοδοτεί chatbots όπως το ChatGPT της OpenAI.
Η προκατάληψη στα LLMs ενέχει κινδύνους διότι, καθώς τα μοντέλα ενσωματώνονται ολοένα και περισσότερο και αποκτούν μεγαλύτερη επιρροή στον επαγγελματικό στίβο, οι προκαταλήψεις θα μπορούσαν να εκδηλωθούν σε τομείς όπως οι προσλήψεις, η εκπαίδευση και οι εγκρίσεις δανείων, ανέφεραν οι συγγραφείς.
Η μελέτη επικεντρώθηκε στο ChatGPT-4 Turbo της OpenAI, το πιο προηγμένο και ευρέως χρησιμοποιούμενο μοντέλο κατά τον χρόνο διεξαγωγής της έρευνας, με εκατοντάδες εκατομμύρια χρήστες. Τα ευρήματα αναπαράχθηκαν και σε άλλα μοντέλα τεχνητής νοημοσύνης, όπως το DeepSeek και το Mistral.
Το μοντέλο ChatGPT εκπαιδεύτηκε σε κείμενα που περιλαμβάνουν βιβλία, ιστοσελίδες και επιστημονικά άρθρα, γεγονός που του έδωσε ένα λεπτομερές πλαίσιο για την αναπαραγωγή ανθρώπινων προτύπων στη γλώσσα και τον πολιτισμό.
Η διερεύνηση της προκατάληψης της τεχνητής νοημοσύνης ήταν μια πρόκληση, επειδή τα LLMs είναι εκπαιδευμένα να καταστέλλουν τις ακατάλληλες και προσβλητικές απαντήσεις, δήλωσε η μελέτη, η οποία συντάχθηκε από τον Γκαλ Γκούτμαν του Πανεπιστημίου Μπεν-Γκουριόν και τον Μάικλ Γκίλεαντ του Πανεπιστημίου του Τελ Αβίβ.
Ως εκ τούτου, η μελέτη έπρεπε να βρει τρόπους να παρακάμψει αυτούς τους ελέγχους της τεχνητής νοημοσύνης και να εντοπίσει τις λανθάνουσες προκαταλήψεις.
Οι ερευνητές έδωσαν εντολή στο ChatGPT να δημιουργήσει 252 ονόματα για Εβραίους και μη Εβραίους Αμερικανούς, άνδρες και γυναίκες, ηλικίας μεταξύ 18 και 80 ετών.
Το μοντέλο أنتήγαγε κοινά εβραϊκά ονόματα όπως Ήθαν Κατς και Νόα Βάις, και μη εβραϊκά ονόματα όπως Τάιλερ Τζόνσον και Ντίλαν Γουίλσον.
Οι συγγραφείς της μελέτης ζήτησαν επίσης από το ChatGPT να γράψει μια φανταστική βιογραφία 100 λέξεων για κάθε όνομα, συμπεριλαμβανομένων λεπτομερειών όπως ο τόπος κατοικίας, το επάγγελμα και τα χαρακτηριστικά της προσωπικότητάς τους.
Στο επόμενο βήμα, οι ερευνητές αφαίρεσαν τα ονόματα και τις αναφορές στη θρησκεία από τις βιογραφίες και στη συνέχεια ζήτησαν από το ChatGPT, καθώς και από ένα άλλο γλωσσικό μοντέλο που ονομάζεται DeepSeek και από 378 ανθρώπους, να αξιολογήσουν τους χαρακτήρες που περιγράφονταν στις βιογραφίες.
Οι αξιολογήσεις επεδίωκαν να προσδιορίσουν αν οι εβραϊκές και οι μη εβραϊκές βιογραφίες θα αξιολογούνταν διαφορετικά με βάση δεκάδες χαρακτηριστικά, εστιάζοντας σε δύο κεντρικές διαστάσεις που χρησιμοποιούνται σε προηγούμενες μελέτες — τη ζεστασιά και την ικανότητα.
Η ικανότητα, ένα μέτρο της αντιλαμβανόμενης επάρκειας, σχετίζεται με χαρακτηριστικά όπως η επιτυχία και η ευφυΐα.
Η ζεστασιά μετρά την αντιλαμβανόμενη πρόθεση και σχετίζεται με ιδιότητες όπως το να είναι κανείς φιλικός και συμπαθής. Όσοι παρουσιάζουν χαμηλά επίπεδα ζεστασιάς θεωρούνται αναξιόπιστοι και ανήθικοι.
Προηγούμενες μελέτες σχετικά με τα στερεότυπα έχουν δείξει ότι οι Εβραίοι γίνονται αντιληπτοί ως άτομα με υψηλή ικανότητα, αλλά χαμηλή ζεστασιά, αναφέρει η μελέτη.
Οι ερευνητές διαπίστωσαν ότι οι βιογραφίες εβραϊκών χαρακτήρων του ChatGPT —απογυμνωμένες από κάθε εβραϊκό προσδιορισμό— αξιολογήθηκαν υψηλότερα στην ικανότητα και χαμηλότερα στη ζεστασιά, πράγμα που σημαίνει ότι συμβάδιζαν με τα στερεότυπα.
Πιο συγκεκριμένα, οι εβραϊκοί χαρακτήρες αξιολογήθηκαν ως πιο ευφυείς, σίγουροι, διεκδικητικοί και αποτελεσματικοί, αλλά λιγότερο φιλικοί, ζεστοί και συμπαθείς.
Οι εβραϊκοί χαρακτήρες θεωρήθηκαν επίσης πιο προνομιούχοι, συναισθηματικά ελεγχόμενοι, οργανωμένοι, προσανατολισμένοι σε μακροπρόθεσμους στόχους, καταπιεστικοί, κυρίαρχοι και ψυχαναγκαστικοί σε σύγκριση με τους μη εβραϊκούς χαρακτήρες.
Για να επιβεβαιώσουν περαιτέρω αυτό το μοτίβο, οι ερευνητές μετέτρεψαν τα στερεοτυπικά εβραϊκά χαρακτηριστικά των βιογραφιών σε αφηγηματικά προφίλ και στη συνέχεια ζήτησαν από τα μοντέλα τεχνητής νοημοσύνης να παραθέσουν διάσημους φανταστικούς χαρακτήρες που ταίριαζαν με αυτά τα προφίλ.
Το ChatGPT απάντησε με χαρακτήρες όπως ο Τύριον Λάνιστερ από το «Game of Thrones», ο Γουόλτερ Γουάιτ από το «Breaking Bad» και ο Μάικλ Κορλεόνε από το «The Godfather», που όλοι θεωρούνται εξέχοντες αντιήρωες της οθόνης. Οι ερευνητές περιέγραψαν αυτούς τους χαρακτήρες ως «μεγάλους χειραγωγούς», που ταιριάζουν στο στερεότυπο του «υποκινητή» (puppet master) — «απομονωμένοι, ισχυροί, εμμονικά εστιασμένοι και ηθικά αμφίσημοι».
Οι Εβραίοι απεικονίζονται εδώ και καιρό ως ελεγκτές ή ως υποκινητές στην αντισημιτική προπαγάνδα.
Οι ερευνητές έδωσαν εντολή σε διάφορα μοντέλα τεχνητής νοημοσύνης να αναλύσουν τα χαρακτηριστικά που σχετίζονται με τους διάσημους χαρακτήρες, ανέφεραν στα μοντέλα ότι ερευνούσαν τις προκαταλήψεις και τους ζήτησαν να καταγράψουν τις κοινωνικές ομάδες που σχετίζονται με τα χαρακτηριστικά αυτών των χαρακτήρων.
Και τα τρία μοντέλα τεχνητής νοημοσύνης δήλωσαν ότι τα χαρακτηριστικά αυτά σχετίζονται με τους Εβραίους.
«Τα LLMs, εκπαιδευμένα σε τεράστια σώματα κειμένων που έχουν παραχθεί από ανθρώπους, ενδέχεται να έχουν εντοπίσει και κωδικοποιήσει τέτοια πολιτισμικά πρότυπα», έγραψαν οι ερευνητές. «Χαρακτηριστικά που φαίνονται καλοήθη, ή ακόμη και αξιοθαύμαστα, μεμονωμένα μπορούν, μέσω του συνδυασμού και του πλαισίου, να ανασυστήσουν ιστορικές προκαταλήψεις με πιο λεπτές, πιο ύπουλες μορφές».
Ενώ οι προγραμματιστές τεχνητής νοημοσύνης έχουν επιδιώξει να εξαλείψουν τα επιβλαβή στερεότυπα, ορισμένες προκαταλήψεις αναδύονται με έμμεσους τρόπους, και ουδέτερα ή θετικά στερεότυπα μπορούν να συνδυαστούν για να σχηματίσουν επιβλαβείς αφηγήσεις ή να επαναλάβουν ιστορικές προκαταλήψεις, σημειώνει η μελέτη.
Το προφίλ υψηλής ικανότητας και χαμηλής ζεστασιάς φαίνεται να συνδέεται με το αντιλαμβανόμενο προνόμιο, τον φθόνο από τους άλλους και τις πολιτισμικές αφηγήσεις με θέματα όπως η χειραγώγηση και η ηθική αμφισημία, έγραψαν οι ερευνητές.
Η μελέτη σημείωσε ότι τα LLMs έχουν επίσης επιδείξει προκατάληψη απέναντι σε άλλες ομάδες, όπως οι μαύροι και οι γυναίκες.
Η μελέτη, με τίτλο «From Myth to Model: Representation of ‘The Jew’ in Generative AI» (Από τον Μύθο στο Μοντέλο: Η Αναπαράσταση του “Εβραίου” στην Παραγωγική Τεχνητή Νοημοσύνη), δημοσιεύθηκε στην έκδοση Μαΐου-Ιουνίου του American Psychologist, μιας έκδοσης της Αμερικανικής Ψυχολογικής Εταιρείας.
Το ειδικό τεύχος της έκδοσης ήταν αφιερωμένο στον αντισημιτισμό, σε αυτό που το περιοδικό αποκάλεσε μια «εδώ και καιρό καθυστερημένη επανασύνδεση» μεταξύ της ψυχολογικής έρευνας και της προκατάληψης κατά των Εβραίων.
πηγή:Times of Israel

