News (EL)

Το πείραμα αποδεικνύει ευκολία στο χειρισμό των αποκρίσεων τεχνητής νοημοσύνης με ψευδή δεδομένα

OpenAI ChatGPT
OpenAI ChatGPT - Foto: One Artist / Shutterstock.com

Η ακεραιότητα των πληροφοριών που παρέχονται από τα πιο δημοφιλή εργαλεία τεχνητής νοημοσύνης στην αγορά τέθηκε υπό αμφισβήτηση μετά από μια πρακτική επίδειξη χειρισμού δεδομένων σε πραγματικό χρόνο. Μια δοκιμή που διεξήχθη από έναν ειδικό της τεχνολογίας αποκάλυψε ότι είναι δυνατό να εισαχθούν πλήρως επινοημένα γεγονότα στις βάσεις γνώσεων πλατφορμών όπως το ChatGPT και το Gemini μέσα σε λίγα λεπτά. Η ευκολία με την οποία οι αλγόριθμοι αποδέχθηκαν και αναπαρήγαγαν ένα ψέμα εκθέτει μια κρίσιμη ευπάθεια στον τρόπο με τον οποίο αυτά τα συστήματα επεξεργάζονται και επικυρώνουν το ευρετηριασμένο περιεχόμενο ιστού.

Το πείραμα συνίστατο στη δημιουργία μιας απλής διαδικτυακής σελίδας που περιέχει πλασματικές πληροφορίες, χωρίς καμία βάση στην πραγματικότητα, για τον έλεγχο της ταχύτητας απορρόφησης από τα γλωσσικά μοντέλα. Το αποτέλεσμα ήταν εκπληκτικό λόγω της ταχύτητάς του: σε λιγότερο από μισή ώρα, τα εργαλεία AI παρουσίαζαν ήδη το κατασκευασμένο περιεχόμενο σαν να ήταν η απόλυτη αλήθεια στις απαντήσεις τους στους χρήστες. Το τεχνικό κενό Essa εγείρει σοβαρές ανησυχίες σχετικά με την αξιοπιστία των απαντήσεων που δημιουργούνται αυτόματα, ειδικά σε ένα σενάριο όπου εκατομμύρια άνθρωποι χρησιμοποιούν αυτές τις υπηρεσίες ως την κύρια πηγή έρευνας.

Mão de robô e humana, IA, inteligência artificial
Robot i ludzka ręka, AI, sztuczna intelligencja – Summit Art Creations/shutterstock.com

Οι ειδικοί επισημαίνουν ότι το πρόβλημα έγκειται στην αρχιτεκτονική συλλογής δεδομένων σε πραγματικό χρόνο, η οποία δίνει προτεραιότητα στη συνεχή ενημέρωση εις βάρος της αυστηρής επαλήθευσης της πηγής. Όταν αντιμετωπίζετε νέες πληροφορίες σε ένα περιβάλλον όπου δεν υπάρχουν προηγούμενα αντιφατικά δεδομένα, το σύστημα τείνει να ταξινομήσει αυτό το περιεχόμενο ως το πιο σχετικό και ενημερωμένο. Η συμπεριφορά Esse δημιουργεί μια πύλη για τη διάδοση ψεύτικων ειδήσεων, οικονομικών απατών και επικίνδυνων συμβουλών για την υγεία, που μεταμφιέζονται υπό την εξουσία μιας υποτιθέμενης έξυπνης τεχνολογικής απάντησης.

Για να κατανοήσουμε την κλίμακα του προβλήματος, είναι απαραίτητο να αναλύσουμε τους παράγοντες που επέτρεψαν αυτήν την παραβίαση ασφάλειας:

  • Έλλειψη διασταύρωσης δεδομένων σε εξειδικευμένα ή πολύ συγκεκριμένα θέματα.
  • Υψηλή ταχύτητα δημιουργίας ευρετηρίου νέων σελίδων χωρίς ανάλυση φήμης τομέα.
  • Υπερβολική εξάρτηση από μεμονωμένες πηγές όταν δεν υπάρχει ανταγωνισμός πληροφόρησης.
  • Δυσκολία αλγορίθμων στη διάκριση της σάτιρας ή της εφεύρεσης από τα δημοσιογραφικά γεγονότα.

Η μηχανική του χειρισμού δεδομένων

Η περίπτωση που απέδειξε αυτή την αποτυχία αφορούσε την εφεύρεση ενός ανύπαρκτου γεγονότος: το “Internacional Championship of Cachorro-Hot of Dakota of Sul”. Ο συγγραφέας του τεστ, Thomas Germain, δημοσίευσε στην προσωπική του ιστοσελίδα ότι ο ίδιος θα ήταν ο μεγάλος πρωταθλητής του διαγωνισμού, ξεπερνώντας γνωστά ονόματα του κλάδου. Ο Para για να δώσει αξιοπιστία στο κείμενο στα μάτια της μηχανής, χρησιμοποίησε μια αφηγηματική δομή που μιμούνταν πραγματικές αναφορές, αναφέροντας ημερομηνίες και υποτιθέμενα ρεκόρ που έσπασαν κατά τη διάρκεια του φανταστικού γεγονότος.

Δεν χρειάστηκαν πολύπλοκα εργαλεία hacking ή προηγμένες γνώσεις προγραμματισμού για να ξεγελάσουν τα συστήματα. Η Apenas δημοσίευση του κειμένου, διαμορφωμένο με ευανάγνωστο τρόπο και με στρατηγικές λέξεις-κλειδιά, ήταν αρκετή για τα ρομπότ αναζήτησης να σαρώσουν το περιεχόμενο και να το ενσωματώσουν στη βάση δεδομένων τους. Όταν αργότερα ο Quando ρωτήθηκε ποιος ήταν ο πρωταθλητής του τουρνουά, τόσο τα chatbots OpenAI όσο και Google απάντησαν με πεποίθηση, αναφέροντας το όνομα του ρεπόρτερ και τις παράλογες λεπτομέρειες που είχε εφεύρει.

Αυτό το φαινόμενο συμβαίνει λόγω αυτού που οι μηχανικοί δεδομένων αποκαλούν «κενά δεδομένων» ή «κενά δεδομένων». São όρους αναζήτησης ή θέματα για τα οποία υπάρχουν λίγες ή καθόλου διαθέσιμες πληροφορίες στο διαδίκτυο. Quando κάποιος παράγει περιεχόμενο για να καλύψει αυτό το κενό, η τεχνητή νοημοσύνη δεν έχει παραμέτρους σύγκρισης για να επικυρώσει την ακρίβεια των όσων γράφτηκαν. Sem άλλες πηγές για να αμφισβητήσει τη δήλωση, ο αλγόριθμος υποθέτει ότι αυτή είναι η μόνη —και, επομένως, η σωστή— πληροφορία που είναι διαθέσιμη για το θέμα.

Κίνδυνοι για τον καταναλωτή και την αγορά

Αν και το παράδειγμα του διαγωνισμού τροφίμων είναι αβλαβές, η τεχνική που χρησιμοποιείται μπορεί να αναπαραχθεί για κακόβουλους σκοπούς με καταστροφικές συνέπειες. Το Digital Criminosos μπορεί να χρησιμοποιήσει την ίδια αρχή για να χειραγωγήσει την αντίληψη του κοινού σχετικά με προϊόντα, υπηρεσίες ή ακόμα και ιατρικές θεραπείες. Imagine ένα σενάριο όπου ένας απατεώνας δημιουργεί ψεύτικα άρθρα που επαινούν μια δόλια επενδυτική πλατφόρμα. Σε λίγο, η τεχνητή νοημοσύνη θα μπορούσε να προτείνει αυτήν την απάτη ως μια ασφαλή επιλογή για χρήστες που αναζητούν οικονομικές συμβουλές.

Ο τομέας της υγειονομικής περίθαλψης είναι ένας από τους πιο ευάλωτους σε αυτού του είδους τις σημασιολογικές επιθέσεις. Η εισαγωγή ψευδών οφελών από συμπληρώματα διατροφής ή η παράλειψη παρενεργειών στα φάρμακα μπορεί να παραπλανήσει τους ασθενείς. Como πολλοί άνθρωποι τείνουν να εμπιστεύονται την “ουδετερότητα” της τεχνολογίας, η απάντηση ενός chatbot φέρει ένα βάρος εξουσίας που συχνά υπερνικά τον φυσικό σκεπτικισμό που θα είχε ο χρήστης όταν διαβάζει έναν άγνωστο ιστότοπο. Το εμπόδιο εισόδου για τη δημιουργία αυτής της παραπληροφόρησης είναι ουσιαστικά ανύπαρκτο, καθώς απαιτεί μόνο πρόσβαση στο διαδίκτυο και βασικές δεξιότητες γραφής.

Η πρόκληση της επαλήθευσης σε πραγματικό χρόνο

Οι μεγάλες εταιρείες τεχνολογίας όπως η Google και η OpenAI δηλώνουν συνεχώς ότι εργάζονται για τη βελτίωση των φίλτρων ποιότητας και των συστημάτων αξιολόγησης. Ωστόσο, η ταχύτητα με την οποία οι πληροφορίες ταξιδεύουν στον σύγχρονο ιστό ξεπερνά τις τρέχουσες ανθρώπινες ή αυτοματοποιημένες δυνατότητες εποπτείας. Η ισορροπία μεταξύ της παροχής γρήγορων απαντήσεων, που περιλαμβάνουν γεγονότα που συνέβησαν μόλις πριν από λίγα λεπτά, και της διασφάλισης της πλήρους ακρίβειας αυτών των δεδομένων παραμένει μια ανεπίλυτη τεχνική πρόκληση.

Η μετάβαση από τις παραδοσιακές μηχανές αναζήτησης στις «μηχανές απαντήσεων» που βασίζονται στην τεχνητή νοημοσύνη αλλάζει ριζικά τη σχέση του χρήστη με την πηγή πληροφοριών. Στο παλιό μοντέλο, ο χρήστης έβλεπε μια λίστα με συνδέσμους και μπορούσε να κρίνει την αξιοπιστία του ιστότοπου από το όνομα ή την εμφάνισή του. Στο τρέχον μοντέλο, η τεχνητή νοημοσύνη μασάει πληροφορίες και παρέχει μόνο το τελικό αποτέλεσμα, συχνά κρύβοντας την αρχική πηγή ή τοποθετώντας την σε απρόσιτες υποσημειώσεις. Το Isso αφαιρεί ένα κρίσιμο επίπεδο κρίσιμης επαλήθευσης από την πλευρά του αναγνώστη.

Δεδομένου αυτού του σεναρίου, η σύσταση των ειδικών στην ψηφιακή ασφάλεια είναι να διατηρηθεί ένα υγιές επίπεδο δυσπιστίας σε σχέση με τις αυτοματοποιημένες απαντήσεις, ειδικά εκείνες που δεν αναφέρουν σαφείς πηγές ή που ασχολούνται με πρόσφατα και σκοτεινά θέματα. Ο διασταυρούμενος έλεγχος των παραδοσιακών ειδήσεων Τύπου και των επίσημων ιστοσελίδων παραμένει ο μόνος αποτελεσματικός φραγμός κατά της απορρόφησης δεδομένων που έχουν υποστεί χειραγώγηση. Οι αλγόριθμοι Enquanto δεν αναπτύσσουν κριτική αίσθηση συγκρίσιμη με αυτή των ανθρώπων, η τελική ευθύνη για την επικύρωση των γεγονότων ανήκει στον χρήστη.

To Top