Google अपडेट कृत्रिम बुद्धिमत्ता संगीत निर्माण को तीन मिनट के ट्रैक तक विस्तारित करता है

Maria

em २६ मार्च २०२६

Google ने अपने कृत्रिम बुद्धिमत्ता-आधारित ऑडियो जेनरेशन टूल का एक नया संस्करण पेश किया है, जो पूर्ण ट्रैक के उत्पादन में एक महत्वपूर्ण प्रगति है। प्रौद्योगिकी अब उपयोगकर्ताओं को सिस्टम के पिछले संस्करणों में पाई गई तकनीकी सीमाओं को पार करते हुए विस्तारित अवधि के साथ रचनाएँ विकसित करने की अनुमति देती है।

अद्यतन निर्माण क्षमता को मात्र तीस सेकंड से लेकर लगातार तीन मिनट तक संसाधित ऑडियो तक विस्तारित करता है। यह परिवर्तन दृश्य-श्रव्य क्षेत्र में सामग्री उत्पादकों और पेशेवरों की बढ़ती मांग को पूरा करता है जो अपनी दैनिक परियोजनाओं के लिए मूल, तुरंत चलने वाले साउंडट्रैक की तलाश करते हैं।

https://twitter.com/GeminiApp/status/2036836190431711500?ref_src=twsrc%5Etfw

इस नई कार्यक्षमता तक पहुंच धीरे-धीरे होती है, शुरुआती फोकस कंपनी के प्रीमियम प्लेटफॉर्म के ग्राहकों पर होता है। सिस्टम एकीकरण प्रौद्योगिकी दिग्गज के पारिस्थितिकी तंत्र से कई अनुप्रयोगों को कवर करता है, जो उन लोगों के वर्कफ़्लो को सुविधाजनक बनाता है जो पहले से ही संपादन और रचनात्मक विकास के लिए इन उपकरणों का उपयोग करते हैं।

संरचनात्मक और विस्तृत आदेशों को समझने की क्षमता

अद्यतन मॉडल कृत्रिम बुद्धिमत्ता द्वारा संगीत रचना की संरचना की व्याख्या करने के तरीके में पर्याप्त सुधार लाता है। उपयोगकर्ता सरल टेक्स्ट कमांड के माध्यम से सटीक तकनीकी तत्वों को निर्दिष्ट कर सकते हैं, जिसमें सटीक विवरण दिया जा सकता है कि लय और माधुर्य में परिवर्तन कहां होना चाहिए।

यह कार्यक्षमता एक ही उत्पन्न ट्रैक के भीतर परिचय, कोरस, छंद और पुल की स्पष्ट परिभाषा की अनुमति देती है। टूल इन निर्देशों को संसाधित करके ऐसा परिणाम देता है जो पूरे प्रदर्शन के दौरान ध्वनि सुसंगतता बनाए रखता है, जिससे गाने के विभिन्न हिस्सों के बीच अचानक टूटने या डिस्कनेक्ट होने से बचा जा सकता है।

जिन पेशेवरों ने पहले ही प्रौद्योगिकी का परीक्षण कर लिया है, वे वाद्य व्यवस्था और गायन शैलियों के बारे में जटिल अनुरोधों पर सटीक प्रतिक्रिया देते हैं। उन्नत प्रसंस्करण यह सुनिश्चित करता है कि ऑडियो गुणवत्ता उच्च बनी रहे, ऐसे गीत और उपकरण प्रदान करें जो स्वाभाविक रूप से प्रवाहित हों और प्रारंभिक कमांड में अनुरोधित संगीत शैली के अनुरूप हों।

अनुप्रयोगों और सेवाओं के पारिस्थितिकी तंत्र के साथ एकीकरण

टूल तक पहुंच का विस्तार प्रौद्योगिकी और विकास बाजार में पहले से स्थापित प्लेटफार्मों के माध्यम से होता है। कंपनी के फ्लैगशिप ऐप के भुगतान वाले ग्राहक सीधे अपने मोबाइल उपकरणों और व्यक्तिगत कंप्यूटरों पर लंबे ट्रैक की प्रगतिशील पीढ़ी का अनुभव करने वाले पहले व्यक्ति हैं।

सॉफ़्टवेयर डेवलपर्स को विशिष्ट प्रोग्रामिंग वातावरण और एप्लिकेशन इंटरफ़ेस के माध्यम से समर्पित समर्थन भी प्राप्त होता है। यह तकनीकी खुलापन अनुकूलित समाधान बनाना और ऑडियो इंजन को तीसरे पक्ष के अनुप्रयोगों में एकीकृत करना संभव बनाता है जिनके लिए ऑन-डिमांड ध्वनि उत्पादन की आवश्यकता होती है।

बड़े निगम और उत्पादन स्टूडियो संरचित कॉर्पोरेट पहुंच प्राप्त करते हैं, जिससे प्रौद्योगिकी का बड़े पैमाने पर उपयोग संभव हो पाता है। कॉरपोरेट वीडियो और सहयोगी संगीत उत्पादन प्लेटफार्मों को संपादित करने के उद्देश्य से बनाए गए एप्लिकेशन में पहले से ही उनके मुख्य संपादन इंटरफेस में टूल अंतर्निहित है।

ये प्रत्यक्ष कनेक्शन दृश्य-श्रव्य निर्माण प्रक्रिया के दौरान विभिन्न कार्यक्रमों के बीच स्विच करने की आवश्यकता को समाप्त करते हैं। पेशेवर एक वीडियो प्रोजेक्ट शुरू कर सकते हैं, दृश्य के लिए आदर्श साउंडट्रैक का अनुरोध कर सकते हैं और डिलीवरी समय को अनुकूलित करते हुए उसी डिजिटल कार्य वातावरण में संपादन पूरा कर सकते हैं।

पारदर्शिता और कॉपीराइट सुरक्षा उपकरण

कृत्रिम बुद्धिमत्ता का उपयोग करके ऑडियो निर्माण में प्रगति के साथ-साथ बौद्धिक गुणों के उल्लंघन को रोकने और मानव कलाकारों के काम की सुरक्षा के लिए कठोर तकनीकी उपाय भी किए गए हैं। कंपनी ने एक उन्नत फ़िल्टर सिस्टम लागू किया जो सीधे टेक्स्ट कमांड प्रोसेसिंग चरण में कार्य करता है, जिससे मॉडल को वास्तविक गायकों और बैंडों की विशिष्ट आवाज़ों और शैलियों की नकल करने से रोका जा सके। जब कोई उपयोगकर्ता अनुरोध में किसी प्रसिद्ध कलाकार का नाम दर्ज करता है, तो सिस्टम सटीक प्रतिकृति को अवरुद्ध कर देता है और जानकारी को केवल शैली या संगीत वातावरण के दूर के संदर्भ के रूप में उपयोग करता है, यह सुनिश्चित करता है कि अंतिम परिणाम प्रत्यक्ष साहित्यिक चोरी से मुक्त एक पूरी तरह से नया काम है।

निवारक अवरोधन के अलावा, प्लेटफ़ॉर्म द्वारा उत्पन्न सभी रचनाओं को एक अदृश्य डिजिटल वॉटरमार्क प्राप्त होता है जो सीधे ऑडियो फ़ाइल में एम्बेडेड होता है। यह ट्रैकिंग तकनीक ध्वनि की गुणवत्ता या सुनने के अनुभव को प्रभावित नहीं करती है, लेकिन सत्यापन सॉफ़्टवेयर को सामग्री की सिंथेटिक उत्पत्ति की तुरंत पहचान करने की अनुमति देती है। इस पहचान मानक को अपनाने से डिजिटल बाजार में पारदर्शिता की बढ़ती मांग पूरी होती है, जिससे यह सुनिश्चित होता है कि वितरण प्लेटफॉर्म, सोशल नेटवर्क और श्रोता जानते हैं कि किसी इंसान द्वारा निर्मित गीत और मशीन लर्निंग एल्गोरिदम द्वारा बनाए गए ट्रैक के बीच स्पष्ट रूप से अंतर कैसे किया जाए।

दृश्य-श्रव्य बाज़ार में व्यावहारिक अनुप्रयोग

लगातार तीन मिनट तक ऑडियो उत्पन्न करने की क्षमता डिजिटल सामग्री निर्माताओं के लिए टूल की उपयोगिता को बदल देती है। इंटरनेट वीडियो निर्माता, पॉडकास्टर और स्वतंत्र गेम डेवलपर्स पारंपरिक लाइसेंसिंग जटिलताओं से मुक्त मूल साउंडट्रैक की निरंतर मांग को पूरा करने के लिए प्रौद्योगिकी को एक त्वरित विकल्प पाते हैं।

निर्माण प्रक्रिया में चपलता विज्ञापन एजेंसियों को कुछ ही मिनटों में अभियानों के लिए जिंगल और संगीत पृष्ठभूमि के कई रूपों का परीक्षण करने की अनुमति देती है। यह लचीलापन प्रारंभिक पूर्व-उत्पादन लागत को कम करता है और किसी वाणिज्यिक या मनोरंजन परियोजना की अंतिम मंजूरी से पहले रचनात्मक विकल्पों की एक बड़ी श्रृंखला प्रदान करता है।

तकनीकी विकास और पेशेवर सहयोग

इस नई संगीत निर्माण क्षमता के लिए जिम्मेदार कृत्रिम बुद्धिमत्ता इंजन के विकास के लिए एक जटिल प्रशिक्षण प्रक्रिया की आवश्यकता थी, जो संगीत उद्योग के विशेषज्ञों के सीधे सहयोग पर आधारित थी। सॉफ्टवेयर इंजीनियरों ने एल्गोरिदम को लय, सामंजस्य, माधुर्य और राग प्रगति के आवश्यक बुनियादी सिद्धांतों को सिखाने के लिए पेशेवर संगीतकारों, स्टूडियो निर्माताओं और संगीत सिद्धांतकारों के साथ मिलकर काम किया। इस संयुक्त प्रयास के परिणामस्वरूप एक ऐसा मॉडल तैयार हुआ जो न केवल बुनियादी संगीत सिद्धांत को समझने में सक्षम है, बल्कि भावनात्मक और संरचनात्मक बारीकियों को भी समझने में सक्षम है जो ट्रैक को मानव कान के लिए सुखद बनाते हैं। सिस्टम आर्किटेक्चर को सामंजस्य खोए बिना ऑडियो डेटा के लंबे अनुक्रमों के प्रसंस्करण का समर्थन करने के लिए फिर से डिजाइन किया गया है, जो जनरेटिव आर्टिफिशियल इंटेलिजेंस के क्षेत्र में एक महत्वपूर्ण तकनीकी चुनौती है। निरंतर प्रसंस्करण यह सुनिश्चित करता है कि उपकरण सही ट्यूनिंग बनाए रखें और तीन मिनट के प्लेटाइम के दौरान बीट में अवांछित बदलाव न हो, जो व्यावसायिक रूप से उपलब्ध स्वचालित ध्वनि निर्माण उपकरणों के लिए स्थिरता का एक नया मानक स्थापित करता है।

सिस्टम सुविधाओं पर प्रकाश डाला गया

नए कृत्रिम बुद्धिमत्ता ऑपरेटिंग इंटरफ़ेस को उन्नत रचना सुविधाओं तक पहुंच को सरल बनाने के लिए डिज़ाइन किया गया था, जिससे संगीत सिद्धांत का कोई औपचारिक ज्ञान न रखने वाले उपयोगकर्ताओं को भी पेशेवर परिणाम प्राप्त करने की अनुमति मिलती है। सिस्टम संरचनात्मक मापदंडों की एक श्रृंखला को संसाधित करता है जो प्रत्येक दृश्य-श्रव्य परियोजना की विशिष्ट आवश्यकताओं के अनुसार उत्पन्न ट्रैक के पूर्ण अनुकूलन की गारंटी देता है।

– टेक्स्ट कमांड के माध्यम से परिचय, छंद और कोरस की सटीक परिभाषा।

– गीत के विभिन्न खंडों के बीच जटिल बदलावों के लिए अंतर्निहित समर्थन।

– वीलॉग, पॉडकास्ट और ट्यूटोरियल वीडियो के लिए अनुकूलित ट्रैक का निर्माण।

– स्वर, गीत और वाद्य व्यवस्था का एक साथ प्रसंस्करण।

आम जनता के लिए उपलब्धता

संगीत निर्माण उपकरण तक पहुंच प्रौद्योगिकी कंपनी द्वारा संरचित क्रमिक रिलीज शेड्यूल के अनुसार होती है। जिन उपयोगकर्ताओं के पास कृत्रिम बुद्धिमत्ता पारिस्थितिकी तंत्र में सबसे उन्नत योजनाओं की सक्रिय सदस्यता है, वे अब प्रत्येक खाता श्रेणी के लिए स्थापित दैनिक प्रसंस्करण सीमाओं के अनुसार संसाधनों का उपयोग कर सकते हैं।

सेवा के निरंतर विस्तार में पहले उपयोगकर्ताओं से सीधे फीडबैक के आधार पर नई सुविधाओं और समायोजनों को शामिल करने की उम्मीद है। विकास टीम पूर्ण ट्रैक बनाते समय ऑडियो गुणवत्ता को परिष्कृत करने और सर्वर प्रतिक्रिया समय को अनुकूलित करने के लिए एल्गोरिदम के प्रदर्शन की लगातार निगरानी करती है।

Umkhiqizi Even Realities wethula inkundla yohlelo lokusebenza nomsizi womhlangano wezingilazi ze-G2 »

« Nintendo actualiza Alarmo con siete nuevas pistas gratuitas de Super Mario Bros Wonder

Tags: आर्टिफिशियल इंटेलिजेंसऑडियो तकनीकगूगल जेमिनीलिरिया 3 प्रोसंगीत रचना

Alunos aguardam resultado LSS USS 2026 em Kerala; site oficial apresenta instabilidade para consulta