News (MR)

अलीकडील चाचण्यांमध्ये असे दिसून आले आहे की ऍपलच्या कृत्रिम बुद्धिमत्तेमुळे ॲपमध्ये प्लेलिस्ट तयार करताना चुका होतात.

Apple logo
Apple logo -pio3/shutterstock.com

क्युपर्टिनो जायंटच्या ऑडिओ इकोसिस्टममध्ये नवीन तंत्रज्ञानाच्या एकत्रीकरणामुळे सदस्यांनी त्याच्या विशाल संगीत कॅटलॉगशी संवाद साधण्याच्या पद्धतीमध्ये क्रांती घडवून आणण्याचे वचन दिले आहे. मोबाईल ऑपरेटिंग सिस्टीमच्या चाचणी आवृत्तीमध्ये नवीन लाँच केलेले वैशिष्ट्य श्रोत्यांच्या इच्छेचा अर्थ लावण्यासाठी नैसर्गिक भाषा प्रक्रियेचा वापर करून, साध्या मजकूर आदेशांमधून प्लेलिस्ट तयार करण्यास अनुमती देते.

प्रगत मशीन लर्निंग अल्गोरिदमवर आधारित, वैशिष्ट्य मुख्य इंटरफेसमध्ये वापरकर्त्यांनी दिलेल्या वर्णनानुसार संगीत ट्रॅक निवडते. प्रकल्पाच्या मध्यवर्ती प्रस्तावात काही सेकंदात अत्यंत वैयक्तिकृत निवडी वितरीत करणे, शंभर दशलक्ष गाण्यांच्या संख्येपेक्षा जास्त असलेल्या संग्रहामध्ये विशिष्ट कलाकार किंवा अल्बम शोधण्याची आवश्यकता दूर करणे समाविष्ट आहे.

सार्वजनिक प्रयोगाच्या सुरुवातीच्या टप्प्यात, तथापि, साधनाने अधिक जटिल आणि तपशीलवार आदेशांचा अर्थ लावण्यात सातत्याने अडचणी दाखवल्या. परीक्षकांचे तांत्रिक अहवाल सूचित करतात की विशिष्ट घटकांवर प्रक्रिया करण्याचा प्रयत्न करताना सिस्टम वारंवार अपयशी ठरते, जसे की कोनाडा संगीताच्या उपशैली, अचूक वेळ फ्रेम, कलाकारांच्या उत्पत्तीची भौगोलिक स्थाने आणि गीतांची थीमॅटिक सामग्री. तंत्रज्ञान बाजाराची अपेक्षा अशी होती की नवीन अपडेट परिष्कृत परिणाम देईल, सांस्कृतिक बारकावे आणि ध्वनी प्राधान्ये समजून घेण्यास सक्षम असेल त्याच अचूकतेसह आभासी सहाय्यक इतर दैनंदिन अनुप्रयोगांमध्ये सामान्य मजकूर डेटावर प्रक्रिया करतात.

स्वयंचलित प्रक्रिया अंदाजे पंचवीस गाण्यांचे ब्लॉक्स वितरीत करते आणि प्लॅटफॉर्मद्वारेच डायनॅमिकरित्या व्युत्पन्न केलेल्या शीर्षकासह. यंत्रणा जागतिक ऐकण्याच्या ट्रेंडसह वैयक्तिक प्रोफाइलच्या पुनरुत्पादनाचा इतिहास ओलांडते, परंतु बऱ्याचदा अर्थपूर्ण मर्यादांमध्ये जाते ज्यामुळे ग्राहकांना वितरित केलेल्या अंतिम क्युरेशनच्या गुणवत्तेशी तडजोड केली जाते.

विशिष्ट संगीत शैली वेगळे करण्यात अडचणी

तांत्रिक मूल्यमापनांनी दर्शविले आहे की कृत्रिम बुद्धिमत्तेमध्ये समान संगीत छत्रातील भिन्नता विभक्त करण्यात महत्त्वपूर्ण अडथळे आहेत. एकाग्रतेच्या उद्देशाने जड आणि वातावरणीय शैलींसह वाद्य ट्रॅक आवश्यक असलेल्या विनंत्या सबमिट केल्यावर, प्लॅटफॉर्ममध्ये प्रमुख गायन असलेली गाणी आणि अगदी फील्ड रेकॉर्डिंगचा समावेश होता जो वापरकर्त्याने विनंती केलेल्या तालबद्ध संरचनेपासून पूर्णपणे विचलित होतो.

अल्गोरिदमिक गोंधळ आजच्या संगीत उद्योगात थोडासा व्यावहारिक सहसंबंध असलेल्या ध्वनी श्रेणींच्या मिश्रणापर्यंत विस्तारित आहे. मूळ विनंतीवर काटेकोरपणे लक्ष केंद्रित करण्याऐवजी, सिस्टम समकालीन जॅझ किंवा सभोवतालच्या इलेक्ट्रॉनिक संगीताच्या कार्यांसह अंतर भरते, प्रारंभिक मजकूर आदेशाद्वारे आवश्यक असलेल्या तांत्रिक अचूकतेपेक्षा कंपनीच्या सर्व्हरवर अत्यंत लोकप्रिय ट्रॅकला प्राधान्य देते.

सूचक वर्गीकरण आणि पर्याप्तता फिल्टरमध्ये अपयश

परिचित ध्वनी वातावरण तयार करण्याच्या उद्देशाने केलेल्या विनंत्यांनी ॲपच्या सामग्री नियंत्रण प्रणालीमधील भेद्यता प्रकट केल्या. मुलांसाठी उपयुक्त असलेल्या आधुनिक शहरी तालांच्या निवडीची विनंती करताना, प्लॅटफॉर्मने वर्तमान संदर्भाकडे दुर्लक्ष करून 1990 च्या दशकाच्या उत्तरार्धात प्रसिद्ध झालेल्या सुस्पष्ट ट्रॅकच्या सेन्सॉर केलेल्या आवृत्त्या वितरित केल्या.

अपवित्रपणाचे साधे लपविल्याने अनेक रचनांची प्रौढ थीम बदलत नाही, जी भाषा मॉडेलद्वारे गीतात्मक संदर्भाचे विश्लेषण करण्यात अपयश दर्शवते. वय फिल्टर प्रक्रिया केलेल्या गीतांच्या वास्तविक अर्थाचा अर्थ लावण्याऐवजी केवळ स्टुडिओ मार्किंगवर अवलंबून राहून, वरवरचे कार्य केले.

तटस्थ साउंडट्रॅकची मागणी करणाऱ्या दैनंदिन परिस्थितींमुळे श्रोत्यांसाठी अंदाजे आणि प्रेरणाहीन निवडी देखील होतात. कृत्रिम बुद्धिमत्ता क्वचितच स्वतंत्र किंवा उदयोन्मुख कलाकारांना सुचवते, जे आधीच जागतिक चार्टवर पूर्णपणे प्ले केलेल्या व्यावसायिक हिट्सचे रीसायकल करण्याचा पर्याय निवडतात.

उद्योगातील प्रतिस्पर्ध्यांच्या तुलनेत कमी कामगिरी

प्रतिस्पर्धी प्लॅटफॉर्म ज्यांनी मजकूर आदेशांवर आधारित जनरेटर कार्यान्वित केले आहेत त्यांच्यामध्ये नैसर्गिक भाषा समजण्याची उच्च पातळी आहे. अगदी समान वाक्ये वापरून तुलनात्मक चाचण्यांनी सदस्यांना वितरित केलेल्या अंतिम निकालांमध्ये लक्षणीय विसंगती दिसून आली.

Google च्या ऑडिओ सेवेसह समाकलित केलेली प्रणाली, उदाहरणार्थ, सुचविलेले ट्रॅक शैली, मूड आणि कालावधीच्या आवश्यकतांसह अधिक सुसंगत पद्धतीने संरेखित करण्यात सक्षम होती. शैलीतील विचलन अत्यल्प होते आणि ट्रॅकमधील संक्रमण स्पष्ट आणि द्रव संगीत तर्क राखले.

दुसरीकडे, बीटा वैशिष्ट्याने तंत्रज्ञान तज्ञांनी जेनेरिक आणि असंबद्ध म्हणून वर्णन केलेल्या बिल्ड्स व्युत्पन्न केल्या आहेत. प्रायोगिक किंवा औद्योगिक ध्वनींची विनंती करणाऱ्या सूचींमध्ये जागतिक स्तरावर प्रसिद्ध कलाकारांचा समावेश करण्याचा आग्रह नवीन क्युरेशन टूलद्वारे प्रस्तावित केलेल्या विसर्जनाला खंडित करतो.

गुणवत्तेतील फरक अधिक स्पष्ट होतो जेव्हा आज्ञा एकाच वाक्यात अनेक गुणधर्म एकत्र करतात. विशिष्ट दशकातील प्रभावांसह स्वरांची अनुपस्थिती एकत्रित करणाऱ्या विनंत्या वापरकर्त्याद्वारे स्थापित केलेल्या पॅरामीटर्सपैकी किमान एकाकडे दुर्लक्ष करणाऱ्या सूचीमध्ये परिणाम करतात.

नवीन निर्मिती इंटरफेस कसे कार्य करते

जनरेटरमध्ये प्रवेश थेट अनुप्रयोगाच्या लायब्ररीच्या मुख्य टॅबद्वारे होतो, नवीन मीडिया जोडण्यासाठी समर्पित बटणाद्वारे. दैनंदिन ऐकण्याच्या सत्रातील मूड, शारीरिक क्रियाकलाप, वेग किंवा इतर कोणत्याही इच्छित वैशिष्ट्यांचे वर्णन करण्यासाठी ग्राहक विनामूल्य मजकूर बॉक्स वापरतो.

प्रारंभिक प्रक्रियेनंतर, इंटरफेस सूची कायमस्वरूपी जतन करण्याची, व्यक्तिचलितपणे संपादित करण्याची किंवा मूळ कमांड शोध परिष्कृत करण्यासाठी पुन्हा लिहिण्याची परवानगी देतो. संसाधनाचे आर्किटेक्चर कंपनीच्या क्लाउड सर्व्हरवर थेट माहितीवर प्रक्रिया करण्यासाठी, विस्तृत मार्गाने कार्य करण्यासाठी डिझाइन केले होते.

भौगोलिक आणि ऐहिक डेटावर प्रक्रिया करण्यात अडथळे

कलाकारांच्या भौगोलिक उत्पत्तीशी संबंधित मेटाडेटाचे स्पष्टीकरण आणि कार्ये ज्या वर्षी रिलीज केली गेली ती प्रणालीच्या सध्याच्या चाचणी आवृत्तीतील सर्वात मोठ्या तांत्रिक अडथळ्यांपैकी एक आहे. जेव्हा एखादा वापरकर्ता दक्षिण युनायटेड स्टेट्समध्ये उद्भवलेल्या विशिष्ट सांस्कृतिक चळवळीतील रचनांची विनंती करतो, तेव्हा डेटाबेस अनेकदा विनंतीच्या ऐतिहासिक मुळांकडे दुर्लक्ष करून, अमेरिकन मिडवेस्ट किंवा अगदी इतर खंडांसारख्या पूर्णपणे भिन्न प्रदेशातील कलाकारांना परत करतो. त्याचप्रमाणे, तीस वर्षांपूर्वीच्या क्लासिक्ससह गेल्या दशकातील प्रकाशनांचे मिश्रण करताना टाइमस्टँपिंग अयशस्वी होते, कारण ते डेटाबेसमध्ये समान मुख्य शैलीचे टॅग सामायिक करतात. अंतराळ आणि वेळ समन्वय ओलांडण्याची ही असमर्थता संगीत संशोधक, क्युरेटर किंवा अस्सल सांस्कृतिक विसर्जन शोधणाऱ्या श्रोत्यांसाठी साधनाची उपयुक्तता कमालीची कमी करते, प्रगत संशोधन काय असावे हे सामान्य लोकांना आधीच ज्ञात असलेल्या व्यावसायिक हिट्सच्या केवळ यादृच्छिक खेळाडूमध्ये बदलते.

सुधारणेसाठी चाचणी कालावधीचे महत्त्व

वापरकर्त्यांच्या प्रतिबंधित गटासाठी लवकर उपलब्धता या डेटा प्रोसेसिंग विसंगती मॅपिंग आणि दुरुस्त करण्याचा अचूक हेतू आहे. कंपनीच्या मशीन लर्निंग मॉडेल्सच्या सतत प्रशिक्षणासाठी दैनंदिन परस्परसंवादाद्वारे व्युत्पन्न होणारी माहितीची मात्रा मूलभूत आधार म्हणून काम करते.

लाखो ट्रॅकचे कॅटलॉग स्कॅन करताना अल्गोरिदम वापरत असलेले वजन आणि मापे समायोजित करण्यासाठी सॉफ्टवेअर अभियंते तपशीलवार त्रुटी अहवालांवर अवलंबून असतात. विकास क्षेत्राची अपेक्षा अशी आहे की सर्व्हरवरील मूक अद्यतने वितरीत केलेल्या प्रतिसादांची अचूकता हळूहळू सुधारतील.

ऑपरेटिंग सिस्टमच्या अंतिम आवृत्तीसाठी संभावना

डिव्हाइस इकोसिस्टमसह सखोल एकीकरण हे सुनिश्चित करते की कृत्रिम बुद्धिमत्तेद्वारे तयार केलेल्या याद्या स्मार्टफोन, स्मार्ट घड्याळे आणि ब्रँडेड कॉम्प्युटर यांच्यामध्ये त्वरित समक्रमित होतात. ऑटोमेशनद्वारे वचन दिलेली सोय संगीताच्या भांडाराची निवड करताना तांत्रिक अयोग्यतेमुळे आच्छादित होणार नाही याची खात्री करण्यासाठी पुढील काही आठवड्यांच्या विकासाचा भर अर्थविषयक समज सुधारण्यावर असेल.

To Top