Το Anthropic μπλοκάρει τη δημόσια χρήση του Claude Mythos αφού η τεχνητή νοημοσύνη ανιχνεύσει κρίσιμα ελαττώματα ασφάλειας ιστού

Anthropic

Anthropic - daily_creativity/Shutterstock.com

Το Anthropic ανακοίνωσε την περιορισμένη κυκλοφορία του Claude Mythos Preview, ενός μοντέλου τεχνητής νοημοσύνης αιχμής που επικεντρώνεται στη μηχανική λογισμικού και στη λογική εξαγωγή συμπερασμάτων. Το εργαλείο πέτυχε ακρίβεια 93,9% στο σημείο αναφοράς SWE-bench Verified, θέτοντας ένα νέο πρότυπο για τον εντοπισμό τρωτών σημείων σε πολύπλοκα συστήματα. Η εταιρεία επέλεξε να μην κυκλοφορήσει την τεχνολογία στο ευρύ κοινό λόγω του υψηλού κινδύνου που σχετίζεται με την ικανότητά της να εκμεταλλεύεται ελαττώματα.

Η απόφαση να κρατηθεί το σύστημα υπό επιχειρησιακό απόρρητο έρχεται αφότου η τεχνητή νοημοσύνη εντόπισε τεράστιο αριθμό τρωτών σημείων zero-day σε παγκόσμιες υποδομές. Essas Τα παραθυράκια, άγνωστα στους αρχικούς προγραμματιστές, αντιπροσωπεύουν ένα κρίσιμο διάνυσμα για μεγάλης κλίμακας αυτοματοποιημένες εισβολές. Η απεριόριστη κυκλοφορία του μοντέλου θα μπορούσε να προσφέρει στους κακόβουλους ηθοποιούς ένα οπλοστάσιο στον κυβερνοχώρο που δεν έχει προηγούμενο στην ιστορία του Διαδικτύου.

Anthropic – Mehaniq/shutterstock.com

Για τη διαχείριση της χρήσης του εργαλείου, δημιουργήθηκε ένας συνασπισμός με στρατηγικούς εταίρους από τον τομέα της τεχνολογίας και των υποδομών ζωτικής σημασίας. Ο κύριος στόχος αυτής της συμμαχίας είναι να χρησιμοποιήσει τις αναλυτικές δυνατότητες της τεχνητής νοημοσύνης για τον εντοπισμό και τη διόρθωση ελαττωμάτων προγραμματισμού προτού οι εξωτερικές απειλές αναπτύξουν παρόμοιες μεθόδους επίθεσης.

Ιστορικές ανακαλύψεις σε συστήματα ανοιχτού κώδικα

Κατά την αρχική φάση των εργαστηριακών δοκιμών, το Claude Mythos εντόπισε ένα κρίσιμο ελάττωμα στο λειτουργικό σύστημα OpenBSD που παρέμενε κρυφό για σχεδόν τρεις δεκαετίες. Οι δυνατότητες επεξεργασίας δεδομένων επέτρεψαν την τεχνητή νοημοσύνη να ξεπεράσει τη χειροκίνητη αναθεώρηση που διενεργείται από ειδικούς ανθρώπους για πολλές γενιές. Το συμβάν Esse δείχνει ότι αρχιτεκτονικές που θεωρούνται εξαιρετικά ασφαλείς εξακολουθούν να διαθέτουν διανύσματα βαθιάς επίθεσης.

Το εργαλείο εντόπισε επίσης ένα δομικό σφάλμα στο FFmpeg, το βασικό λογισμικό για την επεξεργασία βίντεο σε παγκόσμιους διακομιστές, το οποίο υπήρχε για 16 χρόνια χωρίς διόρθωση. Outro Ένα σχετικό εύρημα ήταν ο εντοπισμός της ευπάθειας απομακρυσμένης εκτέλεσης κώδικα στο FreeBSD, επίσημα καταγεγραμμένη σε διεθνή μητρώα ασφαλείας. Τα αποτελέσματα Esses αποδεικνύουν την αποτελεσματικότητα της τεχνητής νοημοσύνης στη σάρωση αποθετηρίων ανοιχτού κώδικα σε βιομηχανική ταχύτητα.

Τεχνική αποτελεσματικότητα στον εντοπισμό λειτουργικών αστοχιών

Οι αξιολογήσεις ασφαλείας που πραγματοποιήθηκαν σε προσομοιωμένα περιβάλλοντα τόνισαν μια σημαντική τεχνική διαφορά μεταξύ της νέας έκδοσης και των προηγούμενων μοντέλων του Anthropic. Σε δοκιμές ακραίων καταστάσεων χρησιμοποιώντας το πρόγραμμα περιήγησης Firefox 147, το Claude Mythos πέτυχε 181 εκμεταλλεύσεις φλοιού. Αντίθετα, το μοντέλο Claude Opus 4.6 κατάφερε να ολοκληρώσει μόνο δύο εισβολές υπό τις ίδιες ελεγχόμενες συνθήκες.

Η τεχνητή νοημοσύνη έδειξε την ικανότητα να παίρνει τον έλεγχο των κρίσιμων διεργασιών του συστήματος 29 φορές κατά τη διάρκεια προσομοιώσεων εισβολής. Το επίπεδο πολυπλοκότητας Esse υποδεικνύει ότι ο αλγόριθμος κατανοεί τη λογική του χειρισμού του λειτουργικού πυρήνα, υπερβαίνοντας την απλή αναγνώριση των ανοιχτών θυρών. Η δυνατότητα παράκαμψης φραγμών απομόνωσης απαιτεί αυστηρά πρωτόκολλα περιορισμού από την πλευρά των προγραμματιστών.

Η αρχιτεκτονική του συστήματος επιτρέπει την ταυτόχρονη ανάλυση αμέτρητων γραμμών κώδικα, εντοπίζοντας μοτίβα που προκαλούν διαρροές μνήμης ή υπερχείλιση στοίβας. Η κατανόηση του περιβάλλοντος εκτέλεσης μειώνει τη συχνότητα εμφάνισης ψευδών θετικών στοιχείων, καθιστώντας τις θεωρητικές επιθέσεις που διατυπώνονται από την τεχνητή νοημοσύνη πολύ ακριβείς. Essa Το Dynamics αλλάζει τα τρέχοντα πρότυπα αμυντικής ασφάλειας στον κυβερνοχώρο.

Στρατηγική εφαρμογή για την άμυνα των υποδομών

Η διακυβέρνηση του Claude Mythos πραγματοποιείται μέσω του Projeto Glasswing, μιας πρωτοβουλίας που συγκεντρώνει δώδεκα σημαντικούς αρχικούς εταίρους στην αγορά τεχνολογίας. Organizações όπως τα Amazon Web Services, Microsoft, Google, Apple και η NVIDIA χρησιμοποιούν επεξεργασία μοντέλου για τον έλεγχο των δικών τους δικτύων και υλικού. Η συνεργασία στοχεύει να σφραγίσει ψηφιακές περιμέτρους που στηρίζουν τις περισσότερες παγκόσμιες διαδικτυακές υπηρεσίες.

Δείτε Επίσης

Το δίκτυο προστασίας καλύπτει περισσότερες από 40 οντότητες που είναι υπεύθυνες για ζωτικές υποδομές, συμπεριλαμβανομένου του χρηματοοικονομικού τομέα και των εταιρειών τηλεπικοινωνιών. Το Instituições καθώς και το JPMorgan Chase και το Cisco αποτελούν μέρος της ομάδας που λαμβάνει έγκαιρες προειδοποιήσεις σχετικά με δομικά τρωτά σημεία. Η ανταλλαγή εμπιστευτικών πληροφοριών μεταξύ των ανταγωνιστών δείχνει τη σοβαρότητα των απειλών που εντοπίζονται από τη νέα τεχνολογία.

Το τεχνικό συμβούλιο του έργου έχει τη συμμετοχή των Linux Foundation και Broadcom, αρμόδιων για την επίβλεψη εφαρμογής επιδιορθώσεων ασφαλείας. Τα δεδομένα που παράγονται από την τεχνητή νοημοσύνη μετατρέπονται σε ενημερώσεις σε πραγματικό χρόνο για τους τελικούς χρήστες. Essa Η προληπτική προσέγγιση αποτρέπει την εκμετάλλευση ελαττωμάτων πριν από τη διανομή των πακέτων ενημέρωσης κώδικα.

Εταιρείες που ειδικεύονται στην ασφάλεια στον κυβερνοχώρο, όπως η CrowdStrike και η Palo Alto Networks, εργάζονται για να μετατρέψουν τα ευρήματα σε εμπορικές υπογραφές προστασίας. Η ενσωμάτωση της νοημοσύνης μοντέλων σε πλατφόρμες ανίχνευσης δημιουργεί μια ψηφιακή ασπίδα που προστατεύει ένα τεράστιο δίκτυο εταιρικών και προσωπικών συσκευών. Ο τελικός καταναλωτής λαμβάνει τα οφέλη του αυτοματοποιημένου ελέγχου χωρίς να χρειάζεται να αλληλεπιδράσει απευθείας με το αρχικό εργαλείο.

Πρόληψη κατά του πολλαπλασιασμού των φορέων επίθεσης

Το διοικητικό συμβούλιο του Anthropic εξέδωσε δηλώσεις προειδοποιώντας ότι η αποκλειστικότητα σε αυτές τις προηγμένες αναλυτικές δυνατότητες έχει σύντομη ημερομηνία λήξης. Η συνεχής πρόοδος του υλικού επεξεργασίας και η βελτίωση των τεχνικών εκπαίδευσης δείχνουν ότι άλλοι οργανισμοί θα αναπτύξουν συστήματα με παρόμοια ισχύ πυρός στο εγγύς μέλλον. Η τρέχουσα στρατηγική επικεντρώνεται στη χρήση αυτού του περιορισμένου χρονικού παραθύρου για την ενίσχυση της παγκόσμιας άμυνας, προωθώντας τη μετάβαση σε αρχιτεκτονικές λογισμικού που είναι εγγενώς ανθεκτικές σε αυτοματοποιημένες επιθεωρήσεις.

Ο κεντρικός κίνδυνος έγκειται στη δυνατότητα αυτοματοποιημένης ανίχνευσης τρωτών σημείων zero-day να γίνει ένα προσβάσιμο εργαλείο για διεθνείς ομάδες εγκληματιών στον κυβερνοχώρο. Η προστασία που βασίζεται στο απόρρητο του πηγαίου κώδικα χάνει την αποτελεσματικότητά της όταν οι αλγόριθμοι μπορούν να σαρώσουν ολόκληρα αποθετήρια μέσα σε λίγα λεπτά. Για το λόγο αυτό, οι εταίροι του έργου δίνουν προτεραιότητα στην ενεργητική άμυνα, διασφαλίζοντας ότι οι επιδιορθώσεις ασφαλείας εφαρμόζονται σε κλίμακα πριν τα ανεξάρτητα εργαλεία εκμετάλλευσης εγκαταλείψουν τα μη ελεγχόμενα εργαστήρια.

Αυστηρά κριτήρια πρόσβασης και συνεχής παρακολούθηση

Η πρόσβαση στο Claude Mythos Preview πραγματοποιείται σύμφωνα με αυστηρές οδηγίες που απαγορεύουν αυστηρά την εξαγωγή πρωτογενών δεδομένων ή την αντίστροφη μηχανική των αλγορίθμων εύρεσης σφαλμάτων. Η εταιρεία Cada που συμμετέχει στην κοινοπραξία ασφαλείας πρέπει να ακολουθεί τεκμηριωμένα πρωτόκολλα διαφάνειας, αναφέροντας λεπτομερώς τον τρόπο με τον οποίο εφαρμόζονται οι ανακαλύψεις τεχνητής νοημοσύνης για τον μετριασμό των συστημικών κινδύνων στα αντίστοιχα δίκτυά τους. Esse το επίπεδο λειτουργικού ελέγχου είναι πρωτοφανές στη βιομηχανία ανάπτυξης λογισμικού για μη στρατιωτικούς σκοπούς, που μοιάζει με διεθνείς συνθήκες που ρυθμίζουν τον χειρισμό τεχνολογιών διπλής χρήσης με στρατιωτικές εφαρμογές. Το Anthropic διατηρεί το μοντέλο περιορισμένο σε περιβάλλοντα απομονωμένα από το Διαδίκτυο, τεχνικά γνωστά ως air-gapped, για να διασφαλίσει ότι η ίδια η τεχνητή νοημοσύνη δεν μπορεί να μεταδώσει ευαίσθητες πληροφορίες σε εξωτερικούς διακομιστές χωρίς τη ρητή και ελεγχόμενη εξουσιοδότηση ανθρώπινου επόπτη. Η συνεχής παρακολούθηση των αλληλεπιδράσεων διασφαλίζει ότι η υπολογιστική ισχύς κατευθύνεται αποκλειστικά σε αμυντικούς σκοπούς.

Προηγμένη ασφάλεια σε περιβάλλοντα υπολογιστικού νέφους

Η ενσωμάτωση νέας τεχνητής νοημοσύνης στις λειτουργίες μεγάλων παρόχων cloud αυξάνει την αξιοπιστία της εταιρικής και κρατικής αποθήκευσης δεδομένων. Η δυνατότητα πρόβλεψης διανυσμάτων επίθεσης επιτρέπει στις εταιρείες φιλοξενίας να εφαρμόζουν προληπτικά ενημερώσεις ασφαλείας, εξουδετερώνοντας τις απειλές πριν πραγματοποιηθούν πραγματικές απόπειρες εισβολής. Η προστασία του απορρήτου των κρυπτογραφημένων επικοινωνιών και η ακεραιότητα των οικονομικών συναλλαγών εξαρτώνται άμεσα από τη διατήρηση αυτού του μοντέλου σε πρωτόκολλα μέγιστης ασφάλειας.

Συντήρηση παλαιού λογισμικού και βιομηχανικών λειτουργιών

Η ικανότητα του εργαλείου να αναλύει κώδικες παλαιού τύπου προσφέρει μια τεχνική λύση για τη συντήρηση υποδομών που λειτουργούν με συστήματα που αναπτύχθηκαν τις τελευταίες δεκαετίες. Redes Τα συστήματα ισχύος και βιομηχανικού ελέγχου συχνά αποφεύγουν τις αναβαθμίσεις λόγω του κινδύνου λειτουργικής αστάθειας. Το μοντέλο σάς επιτρέπει να ελέγχετε αυτές τις παλιές βάσεις με ακρίβεια, προτείνοντας τροποποιήσεις που ενισχύουν την ασφάλεια χωρίς να διακόπτουν την παροχή βασικών υπηρεσιών.

Η συμμετοχή οντοτήτων που εστιάζονται στον ανοιχτό κώδικα διασφαλίζει ότι το οικοσύστημα ελεύθερου λογισμικού λαμβάνει τα οφέλη του αυτοματοποιημένου ελέγχου με δομημένο τρόπο. Η διόρθωση ελαττωμάτων σε στοιχεία που τροφοδοτούν τους περισσότερους διακομιστές Διαδικτύου ενισχύει την ψηφιακή υποδομή με ομοιόμορφο τρόπο. Ο αυστηρός έλεγχος της διαδικασίας ανακάλυψης αποτρέπει τη μετατροπή της τεχνολογίας σε όργανο ψηφιακής δολιοφθοράς.

Δείτε Επίσης