Πρόσφατες δοκιμές αποκαλύπτουν ότι η τεχνητή νοημοσύνη της Apple κάνει λάθη όταν δημιουργεί λίστες αναπαραγωγής στην εφαρμογή

Apple logo

Apple logo -pio3/shutterstock.com

Η ενσωμάτωση νέων τεχνολογιών στο ηχητικό οικοσύστημα του γίγαντα Cupertino υποσχέθηκε να φέρει επανάσταση στον τρόπο που οι συνδρομητές αλληλεπιδρούν με τους τεράστιους μουσικούς καταλόγους του. Η νέα λειτουργία στη δοκιμαστική έκδοση του λειτουργικού συστήματος για κινητά επιτρέπει τη δημιουργία λιστών αναπαραγωγής από απλές εντολές κειμένου, χρησιμοποιώντας επεξεργασία φυσικής γλώσσας για την ερμηνεία των επιθυμιών των ακροατών.

Με βάση προηγμένους αλγόριθμους μηχανικής εκμάθησης, η δυνατότητα επιλέγει μουσικά κομμάτια σύμφωνα με τις περιγραφές που παρέχονται από τους χρήστες στην κύρια διεπαφή. Η κεντρική πρόταση του έργου συνίσταται στην παροχή άκρως εξατομικευμένων επιλογών μέσα σε λίγα δευτερόλεπτα, εξαλείφοντας την ανάγκη χειροκίνητης αναζήτησης συγκεκριμένων καλλιτεχνών ή άλμπουμ μέσα σε μια συλλογή που ξεπερνά το όριο των εκατό εκατομμυρίων τραγουδιών.

Κατά τις αρχικές φάσεις του δημόσιου πειραματισμού, ωστόσο, το εργαλείο παρουσίασε σταθερές δυσκολίες στην ερμηνεία πιο περίπλοκων και λεπτομερών εντολών. Οι τεχνικοί ελεγκτές Relatos υποδεικνύουν ότι το σύστημα συχνά αποτυγχάνει όταν προσπαθεί να επεξεργαστεί συγκεκριμένα στοιχεία, όπως εξειδικευμένα μουσικά υποείδη, ακριβή χρονικά πλαίσια, γεωγραφικές τοποθεσίες προέλευσης καλλιτεχνών και το θεματικό περιεχόμενο των στίχων. Η προσδοκία της αγοράς τεχνολογίας ήταν ότι η νέα ενημέρωση θα προσφέρει εκλεπτυσμένα αποτελέσματα, ικανά να κατανοούν πολιτισμικές αποχρώσεις και προτιμήσεις ήχου με την ίδια ακρίβεια που οι εικονικοί βοηθοί επεξεργάζονται κοινά δεδομένα κειμένου σε άλλες καθημερινές εφαρμογές.

Η αυτοματοποιημένη διαδικασία παρέχει μπλοκ περίπου είκοσι πέντε τραγουδιών που συνοδεύονται από έναν τίτλο που δημιουργείται δυναμικά από την ίδια την πλατφόρμα. Ο μηχανισμός διασταυρώνει το ιστορικό αναπαραγωγής του ατομικού προφίλ με τις παγκόσμιες τάσεις ακρόασης, αλλά συχνά αντιμετωπίζει σημασιολογικούς περιορισμούς που διακυβεύουν την ποιότητα της τελικής επιμέλειας που παραδίδεται στον συνδρομητή.

Δυσκολίες στη διάκριση συγκεκριμένων μουσικών στυλ

Οι τεχνικές αξιολογήσεις έχουν δείξει ότι η τεχνητή νοημοσύνη έχει σημαντικά εμπόδια στο διαχωρισμό των παραλλαγών μέσα στην ίδια μουσική ομπρέλα. Ο Quando υποβλήθηκε σε αιτήματα που απαιτούσαν ορχηστρικά κομμάτια με βαριά και ατμοσφαιρικά στυλ με στόχο τη συγκέντρωση, η πλατφόρμα περιλάμβανε τραγούδια με εξέχοντα φωνητικά και ακόμη και ηχογραφήσεις πεδίου που αποκλίνουν εντελώς από τη ρυθμική δομή που ζητούσε ο χρήστης.

Η αλγοριθμική σύγχυση επεκτείνεται στη μίξη κατηγοριών ήχου που έχουν μικρή πρακτική συσχέτιση στη σημερινή μουσική βιομηχανία. Αντί να εστιάζει αυστηρά στο αρχικό αίτημα, το σύστημα καλύπτει τα κενά με έργα σύγχρονης τζαζ ή ατμοσφαιρικής ηλεκτρονικής μουσικής, δίνοντας προτεραιότητα σε εξαιρετικά δημοφιλή κομμάτια στους διακομιστές της εταιρείας σε σχέση με την τεχνική ακρίβεια που απαιτείται από την αρχική εντολή κειμένου.

Βλάβες στα ενδεικτικά φίλτρα ταξινόμησης και επάρκειας

Τα αιτήματα που στόχευαν στη δημιουργία οικείων περιβαλλόντων ήχου αποκάλυψαν ευπάθειες στο σύστημα εποπτείας περιεχομένου της εφαρμογής. Όταν ζητούσε επιλογές σύγχρονων αστικών ρυθμών κατάλληλων για παιδιά, η πλατφόρμα παρέδιδε λογοκριμένες εκδόσεις άδηλων κομματιών που κυκλοφόρησαν στα τέλη της δεκαετίας του 1990, αγνοώντας το τρέχον πλαίσιο.

Η απλή απόκρυψη της βωμολοχίας δεν αλλοιώνει το ενήλικο θέμα πολλών συνθέσεων, γεγονός που καταδεικνύει μια αποτυχία στην ανάλυση του λυρικού πλαισίου από το γλωσσικό μοντέλο. Το φίλτρο ηλικίας λειτούργησε επιφανειακά, βασιζόμενο αποκλειστικά σε μαρκαρίσματα στούντιο αντί να ερμηνεύσει το πραγματικό νόημα των επεξεργασμένων στίχων.

Καθημερινές καταστάσεις που απαιτούν ουδέτερα soundtracks οδήγησαν επίσης σε προβλέψιμες και ανέμπνευστες επιλογές για τους ακροατές. Η τεχνητή νοημοσύνη σπάνια προτείνει ανεξάρτητους ή ανερχόμενους καλλιτέχνες, επιλέγοντας να ανακυκλώνουν εμπορικές επιτυχίες που έχουν ήδη παιχτεί εξαντλητικά σε παγκόσμια charts.

Υποαπόδοση σε σύγκριση με τους ανταγωνιστές του κλάδου

Αντίπαλες πλατφόρμες που έχουν υλοποιήσει γεννήτριες βασισμένες σε εντολές κειμένου έχουν υψηλότερο επίπεδο ωριμότητας στην κατανόηση φυσικής γλώσσας. Οι συγκρίσεις Testes με τις ίδιες ακριβώς φράσεις έδειξαν αξιοσημείωτες αποκλίσεις στα τελικά αποτελέσματα που παραδόθηκαν στους συνδρομητές.

Το σύστημα που ενσωματώθηκε στην υπηρεσία ήχου Google, για παράδειγμα, κατάφερε να ευθυγραμμίσει τα προτεινόμενα κομμάτια με τις απαιτήσεις του είδους, της διάθεσης και της περιόδου με πολύ πιο συνεκτικό τρόπο. Οι αποκλίσεις στο στυλ ήταν ελάχιστες και η μετάβαση μεταξύ των κομματιών διατήρησε μια καθαρή και ρευστή μουσική λογική.

Η δυνατότητα beta, από την άλλη πλευρά, έχει δημιουργήσει εκδόσεις που περιγράφονται από ειδικούς της τεχνολογίας ως γενικές και ασύνδετες. Η επιμονή να συμπεριλαμβάνονται παγκοσμίου φήμης καλλιτέχνες σε λίστες που ζήτησαν πειραματικούς ή βιομηχανικούς ήχους σπάει την εμβάπτιση που προτείνει το νέο εργαλείο επιμέλειας.

Η διαφορά στην ποιότητα γίνεται ακόμη πιο εμφανής όταν οι εντολές συνδυάζουν πολλαπλές ιδιότητες ταυτόχρονα στην ίδια πρόταση. Pedidos που συνδυάζουν την απουσία φωνητικών με επιρροές από μια συγκεκριμένη δεκαετία καταλήγουν σε λίστες που αγνοούν τουλάχιστον μία από τις παραμέτρους που έχει καθορίσει ο χρήστης.

Πώς λειτουργεί η νέα διεπαφή δημιουργίας

Η πρόσβαση στη γεννήτρια πραγματοποιείται απευθείας μέσω της κύριας καρτέλας της βιβλιοθήκης της εφαρμογής, μέσω ενός κουμπιού αφιερωμένου στην προσθήκη νέων μέσων. Ο συνδρομητής χρησιμοποιεί ένα πλαίσιο ελεύθερου κειμένου για να περιγράψει τη διάθεση, τη φυσική δραστηριότητα, τον ρυθμό ή οποιοδήποτε άλλο επιθυμητό χαρακτηριστικό της καθημερινής συνεδρίας ακρόασης.

Μετά την αρχική επεξεργασία, η διεπαφή επιτρέπει τη μόνιμη αποθήκευση της λίστας, τη μη αυτόματη επεξεργασία ή την επανεγγραφή της αρχικής εντολής για να τελειοποιήσει την αναζήτηση. Η αρχιτεκτονική του πόρου σχεδιάστηκε για να λειτουργεί με ευρύ τρόπο, επεξεργάζοντας πληροφορίες απευθείας στους διακομιστές cloud της εταιρείας.

Εμπόδια στην επεξεργασία γεωγραφικών και χρονικών δεδομένων

Η ερμηνεία των μεταδεδομένων που σχετίζονται με τη γεωγραφική προέλευση των καλλιτεχνών και τη χρονιά που κυκλοφόρησαν τα έργα αντιπροσωπεύει ένα από τα μεγαλύτερα τεχνολογικά σημεία συμφόρησης στην τρέχουσα δοκιμαστική έκδοση του συστήματος. Quando ένας χρήστης ζητά συνθέσεις από ένα συγκεκριμένο πολιτιστικό κίνημα που προέρχεται από τα νότια του Estados Unidos, η βάση δεδομένων συχνά επιστρέφει καλλιτέχνες από εντελώς διαφορετικές περιοχές, όπως το αμερικανικό Midwest ή ακόμα και άλλες ηπείρους, αγνοώντας την ιστορική ρίζα του αιτήματος. Da Ομοίως, η χρονική σήμανση αποτυγχάνει όταν συνδυάζονται εκδόσεις της τελευταίας δεκαετίας με κλασικά πριν από τριάντα χρόνια, απλώς και μόνο επειδή μοιράζονται την ίδια ετικέτα κύριου είδους στη βάση δεδομένων. Η αδυναμία Essa να διασταυρώσει τις συντεταγμένες του χώρου και του χρόνου μειώνει δραστικά τη χρησιμότητα του εργαλείου για μουσικούς ερευνητές, επιμελητές ή ακροατές που αναζητούν αυθεντική πολιτιστική εμβάπτιση, μετατρέποντας αυτό που θα έπρεπε να είναι προηγμένη έρευνα σε έναν απλό τυχαίο παίκτη εμπορικών επιτυχιών που είναι ήδη γνωστές στο ευρύ κοινό.

Σημασία της περιόδου δοκιμής για βελτίωση

Η έγκαιρη διαθεσιμότητα για μια περιορισμένη ομάδα χρηστών έχει τον ακριβή σκοπό της χαρτογράφησης και διόρθωσης αυτών των ασυνεπειών στην επεξεργασία δεδομένων. Ο όγκος των πληροφοριών που παράγονται από τις καθημερινές αλληλεπιδράσεις χρησιμεύει ως θεμελιώδης βάση για τη συνεχή εκπαίδευση των μοντέλων μηχανικής μάθησης της εταιρείας.

Οι μηχανικοί λογισμικού βασίζονται σε λεπτομερείς αναφορές σφαλμάτων για να προσαρμόσουν τα βάρη και να μετρήσουν τον αλγόριθμο που χρησιμοποιεί κατά τη σάρωση του καταλόγου εκατομμυρίων κομματιών. Η προσδοκία του τομέα ανάπτυξης είναι ότι οι σιωπηλές ενημερώσεις στους διακομιστές θα βελτιώσουν σταδιακά την ακρίβεια των απαντήσεων που παρέχονται.

Προοπτικές για την τελική έκδοση του λειτουργικού συστήματος

Η βαθιά ενοποίηση με το οικοσύστημα της συσκευής διασφαλίζει ότι οι λίστες που δημιουργούνται από την τεχνητή νοημοσύνη συγχρονίζονται άμεσα μεταξύ smartphone, έξυπνων ρολογιών και επώνυμων υπολογιστών. Το επίκεντρο των επόμενων εβδομάδων ανάπτυξης θα είναι στη βελτίωση της σημασιολογικής κατανόησης για να διασφαλιστεί ότι η ευκολία που υπόσχεται η αυτοματοποίηση δεν επισκιάζεται από την τεχνική ανακρίβεια στην επιλογή του μουσικού ρεπερτορίου.