ताज़ा खबरें (HI)

Google एंड्रॉइड पर डिक्टेशन को बेहतर बनाने के लिए जेमिनी इंटेलिजेंस के साथ जीबोर्ड कीबोर्ड पर नया रैम्बलर सिस्टम तैयार कर रहा है

Gemini
Gemini - mundissima/ Shutterstock.com

Google अपने आधिकारिक वर्चुअल कीबोर्ड के लिए एक अपडेट के विकास में आगे बढ़ रहा है। कंपनी जेमिनी इंटेलिजेंस के साथ जीबोर्ड में रैम्बलर टूल के मूल एकीकरण की तैयारी कर रही है, जो स्मार्टफोन पर वॉयस डिक्टेशन को दोबारा आकार देने के लिए डिज़ाइन किया गया सिस्टम है। तकनीकी विश्लेषण के दौरान नई सुविधा एप्लिकेशन की आंतरिक फ़ाइलों में छिपी हुई दिखाई दी। मुख्य उद्देश्य में लंबे ऑडियो के स्वचालित ट्रांसक्रिप्शन में खामियों को दूर करना शामिल है।

एंड्रॉइड सिस्टम के लिए इंस्टॉलेशन पैकेज के विस्तृत निरीक्षण के बाद परियोजना के बारे में पुष्टि हुई। विशेषज्ञ सेटिंग मेनू में नए विकल्पों का खुलासा करते हुए, इंटरफ़ेस को पहले से सक्षम करने में कामयाब रहे। कार्यात्मक बटनों की उपस्थिति इंगित करती है कि आंतरिक परीक्षण चरण पूरा होने की ओर बढ़ रहा है। आने वाले महीनों में वैश्विक वितरण होने की उम्मीद है।

रिवर्स इंजीनियरिंग से एंड्रॉइड सिस्टम में छिपे इंटरफ़ेस का पता चलता है

यह खोज एप्लिकेशन के डेटा पैकेज में कोड स्कैनिंग के माध्यम से हुई। एंड्रॉइड अथॉरिटी पोर्टल ने ऐसे परीक्षण किए जिन्होंने नई कृत्रिम बुद्धिमत्ता के लिए जिम्मेदार कमांड लाइनों को उजागर किया। डेवलपर्स ने लॉक स्क्रीन को सामान्य उपयोगकर्ताओं के लिए प्रदर्शित करने के लिए रिवर्स इंजीनियरिंग का उपयोग किया। प्रक्रिया विज़ार्ड की सेटिंग्स की दृश्य संरचना को मैप करने की अनुमति देती है।

सक्रिय स्क्रीन हाल के भाषा मॉडल के साथ कीबोर्ड को एकीकृत करने के लिए Google द्वारा चुने गए पथ दिखाती हैं। आंतरिक मेनू कैप्चर किए गए ऑडियो को प्रबंधित करने के लिए विशिष्ट चेकबॉक्स प्रस्तुत करता है। आर्किटेक्चर स्थानीय स्तर पर सूचना के बुद्धिमान प्रसंस्करण पर ध्यान केंद्रित करने का सुझाव देता है। यह दृष्टिकोण वाक् पहचान के लिए बाहरी सर्वर से कनेक्शन पर निर्भरता को कम करता है।

प्रारंभिक पहुंच ने प्रदर्शित किया कि इंटरफ़ेस ज्ञात दृश्य पहचान को बनाए रखेगा। उन्नत कॉन्फ़िगरेशन में एकीकरण विवेकपूर्वक होता है, जिसके लिए केवल डिजिटल स्विच के सक्रियण की आवश्यकता होती है। यह सरलता उन एल्गोरिदम की जटिलता से भिन्न है जो स्वर पैटर्न को डिकोड करने के लिए पृष्ठभूमि में काम करते हैं। मॉडल मुख्य स्क्रीन को प्रदूषित किए बिना मजबूत सुविधाएँ जोड़ता है।

रैम्बलर तकनीक व्याकरण को सही करती है और भाषण में रुकावट को खत्म करती है

तकनीकी अंतर वास्तविक समय में भाषण की प्रासंगिक व्याख्या करने की क्षमता में निहित है। यह टूल उपयोगकर्ता को विचार के प्रवाह का अनुसरण करते हुए पूरे पैराग्राफ को प्राकृतिक तरीके से निर्देशित करने की अनुमति देता है। आर्टिफिशियल इंटेलिजेंस अंतिम पाठ की संरचना, सामंजस्य और तरलता सुनिश्चित करने की जिम्मेदारी लेता है। इंजन एक त्वरित प्रूफ़रीडर के रूप में कार्य करता है जो शब्दों को संसाधित करता है।

माइक्रोफ़ोन खुला रहने पर डेटा प्रोसेसर स्वचालित संपादन कार्य करता है। मुख्य कार्यों में शामिल हैं:

  • मौखिक संचार में सामान्य झिझक, जैसे हकलाना और अक्षरों की अनैच्छिक पुनरावृत्ति को पूरी तरह से दूर करना।
  • माइक्रोफ़ोन द्वारा उठाए गए पृष्ठभूमि शोर का स्वचालित उन्मूलन और शब्दों के बीच लंबे विराम का दमन।
  • स्वर और वाक्य के संदर्भ के आधार पर पूर्ण विराम, अल्पविराम और प्रश्न चिह्न का सटीक सम्मिलन।
  • निर्देशित संदेश के मूल अर्थ को बदले बिना मौखिक और नाममात्र समझौते की त्रुटियों का सुधार।
  • स्पष्टता सुनिश्चित करने और त्वरित मैसेजिंग अनुप्रयोगों में तेजी से पढ़ना आसान बनाने के लिए समायोजित सिंटैक्स।

एल्गोरिदम का अंशांकन संदेश उत्पन्न करने वाले की पहचान को हटाए बिना लिखित अभिव्यक्ति को परिष्कृत करने का प्रयास करता है। सिस्टम को क्षेत्रीय शब्दों और स्लैंग को संरक्षित करने के लिए प्रशिक्षित किया गया था, जिसमें कामचलाऊ भाषा दोषों पर सुधार पर ध्यान केंद्रित किया गया था। प्रौद्योगिकी व्याकरण संबंधी त्रुटि को जानबूझकर बोलचाल की अभिव्यक्ति से अलग करती है। यह क्षमता पुराने प्रतिलेखकों की तुलना में एक महत्वपूर्ण सुधार का प्रतिनिधित्व करती है।

स्थानीय प्रसंस्करण ऑडियो रूपांतरण में चपलता सुनिश्चित करता है

हार्डवेयर पर सीधे ट्रांसक्रिप्शन कार्य करना श्रुतलेख सेवाओं के लिए एक बदलाव का प्रतिनिधित्व करता है। जेमिनी इंटेलिजेंस वाला जीबोर्ड क्लाउड पर लगातार ऑडियो पैकेट भेजे बिना भाषण का विश्लेषण करने के लिए डिवाइस के न्यूरल प्रोसेसर का उपयोग करता है। रणनीति भाषण और शब्दों की उपस्थिति के बीच विलंबता को कम करती है। उपयोगकर्ता लगभग तुरंत प्रतिक्रिया नोटिस करता है।

इंटरनेट की आंशिक स्वतंत्रता अस्थिर कवरेज वाले क्षेत्रों में उपयोग की समस्याओं का समाधान करती है। जब डिवाइस सिग्नल छाया क्षेत्रों से गुजरता है तब भी सिस्टम ट्रांसक्रिप्शन सटीकता बनाए रख सकता है। सेवा की निरंतरता कनेक्शन ड्रॉप के कारण निर्धारित अनुभागों के नुकसान को रोकती है। यह सुविधा भाषा मॉडल को आंतरिक मेमोरी में संग्रहीत करती है।

स्थानीय प्रसंस्करण दृष्टिकोण डिजिटल गोपनीयता की बढ़ती मांगों को पूरा करता है। डिवाइस के भीतर ही आवाज़ को टेक्स्ट में बदलने से संवेदनशील जानकारी के ट्रैफ़िक से जुड़े जोखिम कम हो जाते हैं। वॉयस बायोमेट्रिक डेटा और संदेश सामग्री मालिक के हार्डवेयर तक ही सीमित रहती है। कंपनी तीसरे पक्ष के सर्वर पर निर्भरता सीमित करके सुरक्षा को मजबूत करती है।

पारिस्थितिकी तंत्र के विस्तार से सेल फोन बाजार में प्रतिस्पर्धा तेज हो गई है

रैम्बलर की शुरूआत जेनरेटिव एआई के माध्यम से उपयोगकर्ता अनुभव को बदलने की कंपनी की रणनीति को समेकित करती है। मई में घोषित इस परियोजना ने हालिया लीक तक परिचालन विवरण को प्रयोगशालाओं तक ही सीमित रखा था। वर्चुअल कीबोर्ड अरबों उपकरणों में डेटा प्रविष्टि के लिए इंटरैक्शन के मुख्य बिंदु के रूप में कार्य करता है। अपडेट एक यूटिलिटी ऐप को राइटिंग असिस्टेंट में बदल देता है।

जेमिनी इंटेलिजेंस सील लगाने से एप्पल द्वारा विकसित देशी समाधानों के खिलाफ सीधा प्रतिस्पर्धी लाभ मिलता है। मोबाइल उत्पादकता उपकरणों में प्रभुत्व की लड़ाई मुफ़्त प्रासंगिक ट्रांसक्रिप्शन के साथ एक नए अध्याय पर ले जाती है। एंड्रॉइड निर्माता एशियाई वाहन निर्माताओं द्वारा कार्यान्वित सॉफ़्टवेयर संशोधनों को पार करते हुए, स्मार्ट टाइपिंग अनुभव को मानकीकृत करना चाहता है। एकीकृत कीबोर्ड एक साथ नवाचार सुनिश्चित करता है।

विश्लेषकों का अनुमान है कि सर्वर की स्थिरता की गारंटी के लिए नए उत्पाद का वितरण विभिन्न चरणों में होगा। उम्मीद यह है कि पिक्सेल लाइन के स्मार्टफ़ोन को शुरुआती अवधि के दौरान विशेष रूप से यह सुविधा प्राप्त होगी। ऑपरेटिंग सिस्टम के साथ संगत अन्य उपकरणों का विस्तार धीरे-धीरे होना चाहिए। क्रमबद्ध शेड्यूल इंजीनियरों को बड़े पैमाने पर रिलीज से पहले किसी भी खामी को ठीक करने की अनुमति देता है।

To Top