חדשות אחרונות (HE)

כלי Google המעודכן יוצר יצירות מוזיקליות באורך שלוש דקות באפליקציית Gemini

Lyria 3 Pro
Foto: Lyria 3 Pro - Divulgação

גוגל הפכה את Lyria 3 Pro לזמינה, גרסה מעודכנת של מודל הבינה המלאכותית שלה שמטרתה ליצור קומפוזיציות אודיו וסאונד. השינוי הטכני העיקרי של הכלי מורכב מהגדלת מגבלת הזמן לכל רצועה, שעברה משלושים שניות בדור הקודם לעד שלוש דקות רצופות. הפיצ’ר החדש עונה על דרישה של יוצרי תוכן ומפיקי דיגיטל לחומרים נרחבים ושלמים יותר. גישה ראשונית מתרחשת בהדרגה עבור משתמשים שיש להם מנויים בתשלום לאפליקציית Gemini.

ההתקדמות באורכי המסלול מלווה שיפורים בארכיטקטורת המודל, שמעבדת כעת פקודות טקסט בדיוק רב יותר כדי לבנות את הקומפוזיציות. החברה שילבה טכנולוגיה בהיבטים שונים של המערכת האקולוגית הארגונית שלה, ומאפשרת לאנשי מקצוע לעריכה ולמפתחי תוכנה להשתמש בבינה מלאכותית ישירות בתהליכי העבודה שלהם. העיבוד מתבצע בשרתים ייעודיים, מה שמבטיח אספקת קבצים עם איכות שירה, נגינה ואיכות אולפן תוך שניות ספורות לאחר הכניסה להנחיה.

יכולות עיבוד ומבנה אודיו מורחבות

המעבר משלושים שניות לשלוש דקות מייצג קפיצת מדרגה חישובית משמעותית בגזרת האודיו הגנרטיבית. Lyria 3 Pro מצליח לשמור על קוהרנטיות הרמונית וקצבית לכל אורך המסלול, תוך מניעת עיוותים או אובדן איכות הנוטים להתרחש בדורות ממושכים. המערכת מנתחת את בקשת המשתמש ובונה את המוזיקה שכבה אחר שכבה, תוך שילוב של ביטים, מנגינות רקע וקולות סינתטיים בצורה מסונכרנת.

למשתמשים יש שליטה על מבנה השיר באמצעות פקודות טקסטואליות מפורטות. הדגם כולל הוראות ספציפיות להפרדת הקומפוזיציה לבלוקים מסורתיים, כגון הקדמה, פסוקים, גשרים ופזמונים. פילוח זה מקל על יצירת מסלולים העוקבים אחר סטנדרטים מסחריים או ניסיוניים, בהתאם לצרכי הפרויקט. בינה מלאכותית מתאימה את המעברים בין חלקים אלו כך ששינוי הקצב יישמע טבעי לאוזניכם.

מפיקים מוזיקליים ובוחני בטא דיווחו שהכלי מגיב ביעילות לבקשות מורכבות לגבי עיבודים וז’אנרים מוזיקליים. אפשר לבקש ערבוב של סגנונות שונים באותו רצועה או לשנות את עוצמת הכלים ברגעים ספציפיים בשיר. עיבוד השפה הטבעית של המערכת מתרגם מונחים טכניים מתורת המוזיקה לתוצאות קוליות מעשיות, ומצמצם את הזמן המושקע ביצירת סקיצות או רצועות גיבוי.

אינטגרציה עם המערכת האקולוגית של יישומים ושירותים

Lyria 3 Pro מופץ על פני מספר פלטפורמות המתוחזקות על ידי Google. בשוק הצרכנים, מנויי תוכנית מתקדמת של Gemini ניגשים לממשק היצירה ישירות דרך האפליקציה או הדפדפן. עבור מגזר הארגונים והפיתוח, החברה פרסמה את המודל ב-Google AI Studio ודרך ה-API של Gemini. הפתיחות הזו מאפשרת למתכנתים לבנות אפליקציות צד שלישי המשתמשות במנוע האודיו של גוגל כדי ליצור מוזיקה לפי דרישה בממשקים אחרים.

לתאגידים גדולים ולאולפנים יצירתיים יש גישה דרך Vertex AI, פלטפורמת למידת המכונה בענן של החברה. בנוסף, המודל שולב באופן מקורי ב-Google Vids, אפליקציית עריכת הווידאו הממוקדת בשולחן העבודה, וב-ProducerAI, סביבה שיתופית להפקה מוזיקלית. נוכחות הכלי בתוכנות אלו מבטלת את הצורך בחיפוש אחר פסקולים בבנקי אודיו חיצוניים.

הרבגוניות של הדגם משרתת נישות שונות בשוק הבידור האודיו-ויזואלי והדיגיטלי. יצירה מהירה של אודיו מובנה מייעלת את לוח הזמנים עבור פרויקטים הדורשים נפח גדול של חומר סאונד מקורי.

  • יצירת פסקולים בלעדיים עבור סרטוני הדרכה וולוגים ארגוניים.
  • פיתוח ויגנטים ומוזיקת ​​מעבר לפרקי פודקאסט.
  • יצירת אפקטים ומוזיקת ​​רקע דינמית לתחום המשחקים.
  • הפקת חומר שמע בקנה מידה לקמפיינים פרסומיים דיגיטליים.

אינטגרציה עם זרימות עבודה שכבר הוקמה מדגים את האסטרטגיה של Google למיצוב הכלים היצירתיים שלה ככלי עזר מעשיים. משווקים ועורכי וידאו יכולים להזין את מצב הרוח הרצוי לסצנה ולקבל רצועה בתזמון מושלם לחומר החזותי.

מנגנוני אבטחה והגנה על זכויות יוצרים

התקדמות טכנולוגיות לייצור אודיו מעוררת ויכוחים על זכויות יוצרים ושימוש לרעה בנכסים רוחניים. כדי להפחית את הסיכונים הללו, גוגל הטמיעה מסנני אבטחה קפדניים ב- Lyria 3 Pro. המערכת חוסמת ניסיונות לשכפל קולות של זמרים אמיתיים ומונעת מהדוגמנית לייצר עותקים ישירים של מוזיקה המוגנת בזכויות יוצרים. כאשר משתמש מזין בפקודה את שמו של אמן מפורסם, הבינה המלאכותית מפרשת את האזכור רק כהתייחסות לסגנון או לז’אנר, מבלי לחקות את זהותו הווקאלית של האדם.

אמצעי אבטחה נוסף שאומצה על ידי החברה הוא יישום SynthID על כל המסלולים שנוצרו על ידי הפלטפורמה. טכנולוגיה זו מטביעה סימן מים דיגיטלי בלתי נראה ובלתי נשמע ישירות בספקטרום האודיו של הקובץ. הסמן מתנגד לעריכה, דחיסה או שינויי פורמט, ומאפשר לתוכנת אימות לזהות את המקור הסינטטי של החומר. היוזמה נועדה לקדם שקיפות בצריכת מדיה ולהילחם במידע שגוי או הונאה הכוללת שמע מזויף.

בדיקות אבטחה מתרחשות בזמן אמת במהלך עיבוד מהיר. אם המערכת מזהה שהבקשה מפרה את הנחיות השימוש או מנסה לעקוף הגנות על זכויות יוצרים, היצירה נעצרת מיד. גוגל מחזיקה צוותים המוקדשים לעדכון מתמיד של מסננים אלה, בהתאם לתקנות הנוכחיות בנושא בינה מלאכותית במדינות שונות.

השפעה על שוק יצירת התוכן הדיגיטלי

הפיתוח של Lyria 3 Pro כלל השתתפות של מוזיקאים מקצועיים, מהנדסי סאונד ומפיקים במהלך שלב ההכשרה של הדגם. שיתוף הפעולה הטכני הזה הבטיח שהבינה המלאכותית מבינה ניואנסים של הרמוניה, התקדמות אקורדים ומיקס. התוצאה המעשית היא כלי המספק קבצי שמע מאוזנים, כאשר השירה אינה חופפת בצורה שגויה לכלי הבסיס.

הזמינות של קומפוזיציות שלמות באורך שלוש דקות משנה את דינמיקת העבודה של יוצרים עצמאיים. ערוצי וידיאו ופרופילים ברשתות חברתיות זוכים לאוטונומיה לייצר רצועות משלהם, מה שמפחית את עלויות הרישוי למוזיקה מסחרית. הדגם משמש כעוזר קומפוזיציה, ומאפשר לאמנים לבדוק במהירות התקדמות ועיבודים לפני הקלטת הגרסה הסופית באולפן עם כלים אמיתיים.

גוגל שומרת על מחזור של עדכונים איטרטיביים למודל, בהתבסס על נפח הנתונים שנוצרו על ידי משתמשים ומשוב מקהילות מפתחים. הרחבת קיבולת עיבוד האודיו מגבשת את תשתית החברה בתחום הבינה המלאכותית הגנרטיבית, מתחרה ישירות עם פלטפורמות אחרות המתמקדות בפתרונות יצירתיים עבור השווקים הארגוניים והצרכניים.

Veja Tambem em חדשות אחרונות (HE)