Η ενημέρωση της Google επεκτείνει τη δημιουργία μουσικής τεχνητής νοημοσύνης σε κομμάτια τριών λεπτών

Lyria 3 Pro

Lyria 3 Pro - Divulgação

Η Google παρουσίασε μια νέα έκδοση του εργαλείου παραγωγής ήχου που βασίζεται σε AI, σημειώνοντας μια σημαντική πρόοδο στην παραγωγή πλήρους κομματιού. Η τεχνολογία επιτρέπει πλέον στους χρήστες να αναπτύσσουν συνθέσεις με εκτεταμένη διάρκεια, ξεπερνώντας τους τεχνικούς περιορισμούς που βρέθηκαν σε προηγούμενες εκδόσεις του συστήματος.

Η ενημέρωση επεκτείνει τη δυνατότητα δημιουργίας από τριάντα δευτερόλεπτα σε έως και τρία συνεχόμενα λεπτά επεξεργασμένου ήχου. Essa mudança atende a uma demanda crescente de produtores de conteúdo e profissionais do setor audiovisual que buscam trilhas sonoras originais e de rápida execução para seus projetos diários.

https://twitter.com/GeminiApp/status/2036836190431711500?ref_src=twsrc%5Etfw

Η πρόσβαση σε αυτή τη νέα λειτουργικότητα γίνεται σταδιακά, με αρχική εστίαση στους συνδρομητές των premium πλατφορμών της εταιρείας. Η ενοποίηση του συστήματος καλύπτει πολλαπλές εφαρμογές από το οικοσύστημα του τεχνολογικού γίγαντα, διευκολύνοντας τη ροή εργασιών όσων χρησιμοποιούν ήδη αυτά τα εργαλεία για επεξεργασία και δημιουργική ανάπτυξη.

Ικανότητα κατανόησης δομικών και λεπτομερών εντολών

Το ενημερωμένο μοντέλο εισάγει ουσιαστικές βελτιώσεις στον τρόπο με τον οποίο η τεχνητή νοημοσύνη ερμηνεύει τη δομή μιας μουσικής σύνθεσης. Οι χρήστες μπορούν να καθορίσουν ακριβή τεχνικά στοιχεία μέσω απλών εντολών κειμένου, αναφέροντας ακριβώς πού πρέπει να συμβαίνουν οι αλλαγές ρυθμού και μελωδίας.

Αυτή η λειτουργία επιτρέπει τον σαφή ορισμό των εισαγωγών, των ρεφρέν, των στίχων και των γεφυρών μέσα στο ίδιο κομμάτι που δημιουργείται. Το εργαλείο επεξεργάζεται αυτές τις οδηγίες για να προσφέρει ένα αποτέλεσμα που διατηρεί ηχητική συνοχή καθ’ όλη τη διάρκεια της εκτέλεσης, αποφεύγοντας απότομες διακοπές ή αποσυνδεδεμένες μεταβάσεις μεταξύ διαφορετικών τμημάτων του τραγουδιού.

Οι επαγγελματίες που έχουν ήδη δοκιμάσει την τεχνολογία αναφέρουν μια ακριβή απάντηση σε περίπλοκα αιτήματα σχετικά με τις οργανικές ρυθμίσεις και τα φωνητικά στυλ. Η προηγμένη επεξεργασία διασφαλίζει ότι η ποιότητα ήχου παραμένει υψηλή, παρέχοντας στίχους και όργανα που ρέουν φυσικά και ταιριάζουν στο μουσικό είδος που ζητήθηκε στην αρχική εντολή.

Ενοποίηση με το οικοσύστημα εφαρμογών και υπηρεσιών

Η επέκταση της πρόσβασης στο εργαλείο πραγματοποιείται μέσω πλατφορμών που έχουν ήδη καθιερωθεί στην αγορά τεχνολογίας και ανάπτυξης. Οι συνδρομητές επί πληρωμή της ναυαρχίδας εφαρμογής της εταιρείας είναι οι πρώτοι που βιώνουν προοδευτική δημιουργία μακρύτερων κομματιών απευθείας στις κινητές συσκευές και στους προσωπικούς τους υπολογιστές.

Οι προγραμματιστές λογισμικού λαμβάνουν επίσης αποκλειστική υποστήριξη μέσω συγκεκριμένων περιβαλλόντων προγραμματισμού και διεπαφών εφαρμογών. Το τεχνικό άνοιγμα του Essa καθιστά δυνατή τη δημιουργία προσαρμοσμένων λύσεων και την ενσωμάτωση της μηχανής ήχου σε εφαρμογές τρίτων που απαιτούν παραγωγή ήχου κατ’ απαίτηση.

Μεγάλες εταιρείες και στούντιο παραγωγής αποκτούν δομημένη εταιρική πρόσβαση, επιτρέποντας τη χρήση της τεχνολογίας σε μεγάλη κλίμακα. Το Aplicativos που στοχεύει στην επεξεργασία εταιρικών βίντεο και συνεργατικών πλατφορμών παραγωγής μουσικής έχουν ήδη το εργαλείο ενσωματωμένο στις κύριες διεπαφές επεξεργασίας τους.

Αυτές οι άμεσες συνδέσεις εξαλείφουν την ανάγκη εναλλαγής μεταξύ διαφορετικών προγραμμάτων κατά τη διάρκεια της διαδικασίας οπτικοακουστικής δημιουργίας. Οι επαγγελματίες μπορούν να ξεκινήσουν ένα έργο βίντεο, να ζητήσουν το ιδανικό soundtrack για τη σκηνή και να ολοκληρώσουν την επεξεργασία στο ίδιο ψηφιακό περιβάλλον εργασίας, βελτιστοποιώντας τον χρόνο παράδοσης.

Εργαλεία διαφάνειας και προστασίας πνευματικών δικαιωμάτων

Η πρόοδος στη δημιουργία ήχου με χρήση τεχνητής νοημοσύνης συνοδεύεται από αυστηρά τεχνικά μέτρα για την αποτροπή παραβίασης πνευματικών ιδιοτήτων και την προστασία του έργου των ανθρώπων καλλιτεχνών. Η εταιρεία εφάρμοσε ένα προηγμένο σύστημα φίλτρων που δρα απευθείας στη φάση επεξεργασίας εντολών κειμένου, εμποδίζοντας το μοντέλο να αντιγράψει ή να μιμηθεί συγκεκριμένες φωνές και στυλ πραγματικών τραγουδιστών και συγκροτημάτων. Quando ένας χρήστης εισάγει το όνομα ενός διάσημου καλλιτέχνη στο αίτημα, το σύστημα αποκλείει την ακριβή αναπαραγωγή και χρησιμοποιεί τις πληροφορίες μόνο ως μακρινή αναφορά του είδους ή της μουσικής ατμόσφαιρας, διασφαλίζοντας ότι το τελικό αποτέλεσμα είναι ένα εντελώς νέο έργο και απαλλαγμένο από άμεσες λογοκλοπές.

Εκτός από το προληπτικό μπλοκάρισμα, όλες οι συνθέσεις που δημιουργούνται από την πλατφόρμα λαμβάνουν ένα αόρατο ψηφιακό υδατογράφημα ενσωματωμένο απευθείας στο αρχείο ήχου. Η τεχνολογία παρακολούθησης Essa δεν επηρεάζει την ποιότητα του ήχου ή την εμπειρία ακρόασης, αλλά επιτρέπει στο λογισμικό επαλήθευσης να αναγνωρίζει άμεσα τη συνθετική προέλευση του υλικού. Η υιοθέτηση αυτού του προτύπου αναγνώρισης ανταποκρίνεται στις αυξανόμενες απαιτήσεις για διαφάνεια στην ψηφιακή αγορά, διασφαλίζοντας ότι οι πλατφόρμες διανομής, τα κοινωνικά δίκτυα και οι ακροατές γνωρίζουν πώς να διακρίνουν ξεκάθαρα ένα τραγούδι που παράγεται από έναν άνθρωπο και ένα κομμάτι που δημιουργήθηκε από αλγόριθμους μηχανικής μάθησης.

Πρακτικές εφαρμογές στην οπτικοακουστική αγορά

Η δυνατότητα δημιουργίας τριών συνεχόμενων λεπτών ήχου μεταμορφώνει τη χρησιμότητα του εργαλείου για τους δημιουργούς ψηφιακού περιεχομένου. Produtores βίντεο για το Διαδίκτυο, οι υπεύθυνοι για τα podcast και οι ανεξάρτητοι προγραμματιστές παιχνιδιών βρίσκουν την τεχνολογία μια γρήγορη εναλλακτική για να ανταποκριθεί στη συνεχή ζήτηση για πρωτότυπα soundtrack χωρίς περιπλοκές με την παραδοσιακή αδειοδότηση.

Η ευελιξία στη διαδικασία δημιουργίας επιτρέπει στις διαφημιστικές εταιρείες να δοκιμάζουν πολλαπλές παραλλαγές κουδουνιών και μουσικών υποβάθρων για καμπάνιες μέσα σε λίγα λεπτά. Η ευελιξία Essa μειώνει το αρχικό κόστος προπαραγωγής και προσφέρει μεγαλύτερη γκάμα δημιουργικών επιλογών πριν από την τελική έγκριση ενός εμπορικού ή ψυχαγωγικού έργου.

Τεχνική ανάπτυξη και επαγγελματική συνεργασία

Η εξέλιξη της μηχανής τεχνητής νοημοσύνης που είναι υπεύθυνη για αυτή τη νέα ικανότητα παραγωγής μουσικής απαιτούσε μια πολύπλοκη διαδικασία εκπαίδευσης, βασισμένη σε άμεση συνεργασία με ειδικούς από τη μουσική βιομηχανία. Το λογισμικό Engenheiros συνεργάστηκε με επαγγελματίες μουσικούς, παραγωγούς στούντιο και θεωρητικούς μουσικής για να διδάξει στον αλγόριθμο τις βασικές αρχές του ρυθμού, της αρμονίας, της μελωδίας και της εξέλιξης των συγχορδιών. Η κοινή προσπάθεια Esse κατέληξε σε ένα μοντέλο ικανό να κατανοήσει όχι μόνο τη βασική θεωρία της μουσικής, αλλά και τις συναισθηματικές και δομικές αποχρώσεις που κάνουν ένα κομμάτι ευχάριστο στο ανθρώπινο αυτί. Η αρχιτεκτονική του συστήματος έχει επανασχεδιαστεί για να υποστηρίζει την επεξεργασία μεγάλων σειρών δεδομένων ήχου χωρίς απώλεια συνοχής, μια σημαντική τεχνική πρόκληση στον τομέα της γενετικής τεχνητής νοημοσύνης. Η συνεχής επεξεργασία διασφαλίζει ότι τα όργανα διατηρούν το σωστό κούρδισμα και ότι ο ρυθμός δεν υφίσταται ανεπιθύμητες διακυμάνσεις κατά τη διάρκεια του χρόνου αναπαραγωγής των τριών λεπτών, θέτοντας ένα νέο πρότυπο σταθερότητας για τα εμπορικά διαθέσιμα αυτοματοποιημένα εργαλεία δημιουργίας ήχου.

Επισημασμένα χαρακτηριστικά συστήματος

Η νέα διεπαφή λειτουργίας τεχνητής νοημοσύνης σχεδιάστηκε για να απλοποιεί την πρόσβαση σε προηγμένες λειτουργίες σύνθεσης, επιτρέποντας ακόμη και σε χρήστες χωρίς επίσημη γνώση της θεωρίας της μουσικής να επιτύχουν επαγγελματικά αποτελέσματα. Το σύστημα επεξεργάζεται μια σειρά δομικών παραμέτρων που εγγυώνται πλήρη προσαρμογή του παραγόμενου κομματιού σύμφωνα με τις συγκεκριμένες ανάγκες κάθε οπτικοακουστικού έργου.

– Το Definição χρειάζεται εισαγωγή, στίχους και ρεφρέν μέσω εντολών κειμένου.

– Ενσωματωμένο Suporte για σύνθετες μεταβάσεις μεταξύ διαφορετικών τμημάτων του τραγουδιού.

– Geração κομμάτια βελτιστοποιημένα για vlog, podcast και εκπαιδευτικά βίντεο.

– Processamento ταυτόχρονα φωνητικά, στίχοι και οργανικές διασκευές.

Διαθεσιμότητα στο ευρύ κοινό

Η πρόσβαση στο εργαλείο παραγωγής μουσικής ακολουθεί ένα σταδιακό χρονοδιάγραμμα κυκλοφορίας που δομείται από την εταιρεία τεχνολογίας. Οι χρήστες που έχουν ενεργές συνδρομές στα πιο προηγμένα προγράμματα στο οικοσύστημα τεχνητής νοημοσύνης μπορούν πλέον να χρησιμοποιούν τους πόρους σύμφωνα με τα ημερήσια όρια επεξεργασίας που έχουν καθοριστεί για κάθε κατηγορία λογαριασμού.

Η συνεχής επέκταση της υπηρεσίας προβλέπει τη συμπερίληψη νέων χαρακτηριστικών και προσαρμογών που βασίζονται σε απευθείας σχόλια από τους πρώτους χρήστες. Η ομάδα ανάπτυξης παρακολουθεί συνεχώς την απόδοση του αλγορίθμου για να βελτιώσει την ποιότητα του ήχου και να βελτιστοποιήσει τους χρόνους απόκρισης του διακομιστή ενώ δημιουργεί ολοκληρωμένα κομμάτια.