Το ενημερωμένο εργαλείο Google δημιουργεί μουσικές συνθέσεις τριών λεπτών στην εφαρμογή Gemini

Lyria 3 Pro

Lyria 3 Pro - Divulgação

Η Google κυκλοφόρησε το Lyria 3 Pro, μια ενημερωμένη έκδοση του μοντέλου τεχνητής νοημοσύνης της που στοχεύει στη δημιουργία συνθέσεων ήχου και ήχου. Η κύρια τεχνική αλλαγή του εργαλείου συνίσταται στην αύξηση του χρονικού ορίου για κάθε κομμάτι, το οποίο πήγε από τριάντα δευτερόλεπτα στην προηγούμενη γενιά σε τρία συνεχόμενα λεπτά. Η νέα δυνατότητα ανταποκρίνεται στις απαιτήσεις των δημιουργών περιεχομένου και των ψηφιακών παραγωγών για πιο εκτεταμένο και πλήρες υλικό. Η αρχική πρόσβαση πραγματοποιείται σταδιακά για χρήστες που έχουν πληρώσει συνδρομές στην εφαρμογή Gemini.

Η πρόοδος στα μήκη των κομματιών συνοδεύει βελτιώσεις στην αρχιτεκτονική του μοντέλου, το οποίο πλέον επεξεργάζεται εντολές κειμένου με μεγαλύτερη ακρίβεια για τη δομή των συνθέσεων. Η εταιρεία έχει ενσωματώσει την τεχνολογία σε διάφορες πτυχές του εταιρικού της οικοσυστήματος, επιτρέποντας στους επαγγελματίες επεξεργασίας και στους προγραμματιστές λογισμικού να χρησιμοποιούν τεχνητή νοημοσύνη απευθείας στις ροές εργασίας τους. Η επεξεργασία πραγματοποιείται σε αποκλειστικούς διακομιστές, γεγονός που εγγυάται την παράδοση αρχείων με φωνητικά, όργανα και ποιότητα στούντιο μέσα σε λίγα δευτερόλεπτα μετά την εισαγωγή της προτροπής.

https://twitter.com/GeminiApp/status/2036836190431711500?ref_src=twsrc%5Etfw

Capacidade εκτεταμένη επεξεργασία και δόμηση ήχου

Η μετάβαση από τριάντα δευτερόλεπτα σε τρία λεπτά αντιπροσωπεύει ένα σημαντικό υπολογιστικό άλμα στο τμήμα παραγωγής ήχου. Το Lyria 3 Pro καταφέρνει να διατηρεί αρμονική και ρυθμική συνοχή σε όλο το μήκος της πίστας, αποφεύγοντας παραμορφώσεις ή απώλειες ποιότητας που συνήθως συμβαίνουν σε παρατεταμένες γενιές. Το σύστημα αναλύει το αίτημα του χρήστη και χτίζει τη μουσική στρώμα προς στρώμα, συνδυάζοντας ρυθμούς, μελωδίες φόντου και συνθετικές φωνές με συγχρονισμένο τρόπο.

Οι χρήστες έχουν τον έλεγχο της δομής του τραγουδιού μέσω λεπτομερών εντολών κειμένου. Το μοντέλο περιλαμβάνει συγκεκριμένες οδηγίες για το διαχωρισμό της σύνθεσης σε παραδοσιακά μπλοκ, όπως εισαγωγή, στίχους, γέφυρες και ρεφρέν. Η τμηματοποίηση Essa διευκολύνει τη δημιουργία κομματιών που ακολουθούν εμπορικά ή πειραματικά πρότυπα, ανάλογα με τις ανάγκες του έργου. Η τεχνητή νοημοσύνη προσαρμόζει τις μεταβάσεις μεταξύ αυτών των τμημάτων, έτσι ώστε η αλλαγή του ρυθμού να ακούγεται φυσική στα αυτιά σας.

Οι δοκιμαστές μουσικής και beta του Produtores ανέφεραν ότι το εργαλείο ανταποκρίνεται αποτελεσματικά σε σύνθετα αιτήματα σχετικά με μουσικές ρυθμίσεις και είδη. Υπάρχει η δυνατότητα να ζητήσετε τη μίξη διαφορετικών στυλ στο ίδιο κομμάτι ή να αλλάξετε την ένταση των οργάνων σε συγκεκριμένες στιγμές του τραγουδιού. Η επεξεργασία φυσικής γλώσσας του συστήματος μεταφράζει τεχνικούς όρους από τη θεωρία της μουσικής σε πρακτικά ηχητικά αποτελέσματα, μειώνοντας τον χρόνο που αφιερώνεται για τη δημιουργία σκίτσων ή κομματιών υποστήριξης.

Integração με το οικοσύστημα εφαρμογών και υπηρεσιών

Η διανομή του Lyria 3 Pro πραγματοποιείται σε πολλαπλές πλατφόρμες που διατηρούνται από το Google. Στην καταναλωτική αγορά, οι συνδρομητές των προηγμένων προγραμμάτων του Gemini έχουν πρόσβαση στη διεπαφή δημιουργίας απευθείας μέσω της εφαρμογής ή του προγράμματος περιήγησης. Para στον τομέα των επιχειρήσεων και της ανάπτυξης, η εταιρεία κυκλοφόρησε το μοντέλο AI Google στο Studio και μέσω του Gemini API. Το άνοιγμα του Essa επιτρέπει στους προγραμματιστές να δημιουργούν εφαρμογές τρίτων που χρησιμοποιούν τη μηχανή ήχου Google για τη δημιουργία μουσικής κατ’ απαίτηση σε άλλες διεπαφές.

Οι εταιρείες Grandes και τα δημιουργικά στούντιο έχουν πρόσβαση μέσω του Vertex AI, της πλατφόρμας μηχανικής εκμάθησης cloud της εταιρείας. Το μοντέλο Além έχει ενσωματωθεί εγγενώς στο Google Vids, την εφαρμογή επεξεργασίας βίντεο που εστιάζει στην επιφάνεια εργασίας και στο ProducerAI, ένα συνεργατικό περιβάλλον για παραγωγή μουσικής. Η παρουσία του εργαλείου σε αυτό το λογισμικό εξαλείφει την ανάγκη αναζήτησης soundtrack σε εξωτερικές τράπεζες ήχου.

Δείτε Επίσης

Η ευελιξία του μοντέλου εξυπηρετεί διαφορετικές θέσεις στην αγορά της οπτικοακουστικής και ψηφιακής ψυχαγωγίας. Η γρήγορη παραγωγή δομημένου ήχου βελτιστοποιεί το χρονοδιάγραμμα για έργα που απαιτούν μεγάλο όγκο πρωτότυπου ηχητικού υλικού.

  • Criação αποκλειστικών soundtrack για εκπαιδευτικά βίντεο και εταιρικά vlog.
  • Desenvolvimento βινιέτες και μουσική μετάβασης για επεισόδια podcast.
  • Geração εφέ και δυναμικής μουσικής υπόκρουσης για τον τομέα του gaming.
  • Produção ακουστικού υλικού σε κλίμακα για ψηφιακές διαφημιστικές καμπάνιες.

Η ενσωμάτωση με ήδη καθιερωμένες ροές εργασίας καταδεικνύει τη στρατηγική της Google να τοποθετεί τα εργαλεία παραγωγής της ως πρακτικά βοηθητικά προγράμματα. Οι συντάκτες μάρκετινγκ και βίντεο Profissionais μπορούν να καλέσουν την επιθυμητή διάθεση για μια σκηνή και να λάβουν ένα κομμάτι τέλεια χρονομετρημένο με το οπτικό υλικό.

Mecanismos ασφάλεια και προστασία πνευματικών δικαιωμάτων

Η πρόοδος των τεχνολογιών παραγωγής ήχου εγείρει συζητήσεις σχετικά με τα πνευματικά δικαιώματα και την κατάχρηση πνευματικών ιδιοτήτων. Para Για να μετριάσει αυτούς τους κινδύνους, η Google έχει εφαρμόσει αυστηρά φίλτρα ασφαλείας στο Lyria 3 Pro. Το σύστημα εμποδίζει τις προσπάθειες κλωνοποίησης των φωνών πραγματικών τραγουδιστών και εμποδίζει το μοντέλο να παράγει απευθείας αντίγραφα μουσικής που προστατεύεται από πνευματικά δικαιώματα. Quando ένας χρήστης εισάγει το όνομα ενός διάσημου καλλιτέχνη στην εντολή, η τεχνητή νοημοσύνη ερμηνεύει την αναφορά μόνο ως αναφορά στο στυλ ή το είδος, χωρίς να μιμείται τη φωνητική ταυτότητα του ατόμου.

Το μέτρο ασφαλείας Outra που υιοθετήθηκε από την εταιρεία είναι η εφαρμογή του SynthID σε όλα τα κομμάτια που δημιουργούνται από την πλατφόρμα. Η τεχνολογία Essa ενσωματώνει ένα αόρατο και μη ακουστό ψηφιακό υδατογράφημα απευθείας στο ηχητικό φάσμα του αρχείου. Ο δείκτης αντιστέκεται στην επεξεργασία, τη συμπίεση ή τις αλλαγές μορφής, επιτρέποντας στο λογισμικό επαλήθευσης να αναγνωρίσει τη συνθετική προέλευση του υλικού. Η πρωτοβουλία στοχεύει στην προώθηση της διαφάνειας στην κατανάλωση των μέσων ενημέρωσης και στην καταπολέμηση της παραπληροφόρησης ή της απάτης που περιλαμβάνει ψεύτικο ήχο.

Οι έλεγχοι ασφαλείας πραγματοποιούνται σε πραγματικό χρόνο κατά την άμεση επεξεργασία. Εάν το σύστημα εντοπίσει ότι το αίτημα παραβιάζει τις οδηγίες χρήσης ή προσπαθεί να παρακάμψει την προστασία πνευματικών δικαιωμάτων, η παραγωγή διακόπτεται αμέσως. Η Google διατηρεί ομάδες αφοσιωμένες στη συνεχή ενημέρωση αυτών των φίλτρων, ακολουθώντας τους ισχύοντες κανονισμούς για την τεχνητή νοημοσύνη σε διάφορες χώρες.

Impacto στην αγορά δημιουργίας ψηφιακού περιεχομένου

Η ανάπτυξη του Lyria 3 Pro περιελάμβανε τη συμμετοχή επαγγελματιών μουσικών, μηχανικών ήχου και παραγωγών κατά τη διάρκεια της φάσης εκπαίδευσης του μοντέλου. Η τεχνική συνεργασία του Essa εξασφάλισε ότι η τεχνητή νοημοσύνη κατανοούσε τις αποχρώσεις της αρμονίας, της εξέλιξης της χορδής και της μίξης. Το πρακτικό αποτέλεσμα είναι ένα εργαλείο που παρέχει ισορροπημένα αρχεία ήχου, όπου τα φωνητικά δεν επικαλύπτονται λανθασμένα με τα βασικά όργανα.

Η διαθεσιμότητα πλήρων συνθέσεων τριών λεπτών αλλάζει τη δυναμική εργασίας των ανεξάρτητων δημιουργών. Τα προφίλ βίντεο και κοινωνικών μέσων Canais αποκτούν αυτονομία για την παραγωγή των δικών τους κομματιών, μειώνοντας το κόστος αδειοδότησης για εμπορική μουσική. Το μοντέλο λειτουργεί ως βοηθός σύνθεσης, επιτρέποντας στους καλλιτέχνες να δοκιμάσουν γρήγορα τις εξελίξεις και τις διασκευές πριν ηχογραφήσουν την τελική έκδοση στο στούντιο με πραγματικά όργανα.

Το Google διατηρεί έναν κύκλο επαναληπτικών ενημερώσεων στο μοντέλο, με βάση τον όγκο των δεδομένων που δημιουργούνται από τους χρήστες και τα σχόλια από τις κοινότητες προγραμματιστών. Η επέκταση της ικανότητας επεξεργασίας ήχου ενοποιεί την υποδομή της εταιρείας στον τομέα της παραγωγής τεχνητής νοημοσύνης, ανταγωνιζόμενη άμεσα άλλες πλατφόρμες που εστιάζονται σε δημιουργικές λύσεις για την εταιρική και την τελική αγορά των καταναλωτών.

Δείτε Επίσης