Google मीट आर्टिफिशियल इंटेलिजेंस सेल फोन पर मूल आवाज के साथ वास्तविक समय में ऑडियो का अनुवाद करता है

Google Meet

Google Meet -Saitee / Shutterstock.com

Google मीट ऐप ने एंड्रॉइड और iOS डिवाइस के लिए एक नया रियल-टाइम वॉयस ट्रांसलेशन टूल रोल आउट करना शुरू कर दिया है। यह कार्यक्षमता प्रतिभागियों के भाषण को लगभग तुरंत संसाधित करने के लिए जेमिनी कृत्रिम बुद्धिमत्ता मॉडल का उपयोग करती है। संसाधन पिछले वर्ष से ही वेब ब्राउज़र के लिए संस्करण में काम कर रहा है। अपडेट उपयोगकर्ताओं को स्मार्टफोन और टैबलेट से जुड़े स्पीकर या हेडफ़ोन पर सीधे अनुवादित ऑडियो सुनने की अनुमति देता है। सिस्टम प्रारंभ में कॉर्पोरेट वातावरण में व्यापक रूप से उपयोग की जाने वाली अंग्रेजी और अन्य भाषाओं के बीच द्विदिशीय जोड़ियों का समर्थन करता है।

प्रौद्योगिकी ध्वनि पुनरुत्पादन उत्पन्न करके स्वचालित उपशीर्षक के पारंपरिक प्रारूप से आगे निकल जाती है जो ब्रॉडकास्टर की मुखर विशेषताओं को संरक्षित करती है। यह उपकरण आवाज के स्वर, शब्दों पर जोर और बोलने वाले व्यक्ति की मूल लय को बनाए रखता है। परिणाम वीडियो मीटिंग के दौरान अधिक तरल संचार अनुभव बनाता है। अनुवादित ऑडियो पेशेवर डबिंग की तरह काम करता है, जबकि कॉल की पृष्ठभूमि में प्रतिभागी की मूल ध्वनि काफी कम मात्रा में सुनाई देती रहती है।

गूगल मीट – फोटो: थसपोल सांगसी / शटरस्टॉक.कॉम

ऑडियो प्रोसेसिंग और अपडेट शेड्यूल

एक साथ अनुवाद डेटा की एक सतत धारा के माध्यम से संचालित होता है जो मूल ऑडियो को संसाधित करता है और अनुवादित संस्करण को मिलीसेकंड में वितरित करता है। मीटिंग प्रतिभागी नियंत्रण कक्ष में सेटिंग सक्रिय करता है और वांछित लक्ष्य भाषा का चयन करता है। सिस्टम प्राप्त भाषण को पकड़ता है, वाक्य के संदर्भ का विश्लेषण करता है और श्रोता द्वारा चुनी गई भाषा में सामग्री को पुन: प्रस्तुत करता है। तकनीकी दृष्टिकोण बहुराष्ट्रीय टीमों में भाषा संबंधी बाधाओं को कम करता है। जो पेशेवर एक ही भाषा नहीं बोलते हैं वे संदेशों को समझने में अधिक स्पष्टता और कम देरी के साथ बातचीत करने में सक्षम होते हैं।

संपूर्ण वैश्विक उपयोगकर्ता आधार के लिए फीचर रोलआउट शेड्यूल धीरे-धीरे होता है। रैपिड रिलीज़ प्रोफ़ाइल के साथ कॉन्फ़िगर किए गए डोमेन को 8 अप्रैल, 2026 से मोबाइल एप्लिकेशन में अपडेट मिलना शुरू हुआ। निर्धारित रिलीज़ योजना का उपयोग करने वाले कॉर्पोरेट डोमेन को 23 अप्रैल, 2026 से टूल तक पहुंच प्राप्त होगी। फ़ंक्शन की अंतिम उपलब्धता एप्लिकेशन के नवीनतम संस्करण की स्थापना पर निर्भर करती है, जिसे सीधे आधिकारिक Google Play Store या ऐप स्टोर से डाउनलोड किया जाना चाहिए।

समर्थित भाषाएँ और टेम्पलेट विकास

वर्तमान तकनीकी सहायता में अंग्रेजी और पांच अन्य वैश्विक भाषाओं के बीच दो-तरफा अनुवाद जोड़े शामिल हैं। प्रारंभिक अनुकूलता सूची में स्पेनिश, फ्रेंच, जर्मन, पुर्तगाली और इतालवी शामिल हैं। भाषा कवरेज कॉर्पोरेट वातावरण, शैक्षणिक संस्थानों और वाणिज्यिक वार्ताओं में किए गए अंतर्राष्ट्रीय संचार के एक महत्वपूर्ण हिस्से को कवर करता है। इन भाषाओं का चयन कंपनी की वीडियो कॉन्फ्रेंसिंग सेवाओं के लिए मुख्य उपभोक्ता बाजारों की मांग को दर्शाता है।

विकास टीम ने बताया कि नए भाषा पैक अगले कुछ महीनों में एप्लिकेशन कैटलॉग में प्रवेश करेंगे। सिस्टम के अपडेट रोडमैप में तुर्की भाषा को अगली पुष्टि के रूप में शामिल किया गया है। क्षेत्रीय बारीकियों का पता लगाने में अधिक सटीकता सुनिश्चित करने के लिए इंजीनियर कृत्रिम बुद्धिमत्ता मॉडल में सुधार करने के लिए काम करते हैं। मोबाइल उपयोगकर्ताओं को दिए जाने वाले अनुवाद की समग्र गुणवत्ता बढ़ाने के लिए स्थानीय मुहावरों और कठबोली भाषा के प्रसंस्करण में भी तकनीकी सुधार किया जाता है।

पहुँच आवश्यकताएँ और गोपनीयता नीतियाँ

वॉयस ट्रांसलेशन का उपयोग करने के लिए विशिष्ट Google वर्कस्पेस इकोसिस्टम योजनाओं या कृत्रिम बुद्धिमत्ता टूल पर केंद्रित सदस्यता के लिंक की आवश्यकता होती है। योग्य कॉर्पोरेट पैकेज में बिजनेस स्टैंडर्ड, बिजनेस प्लस, एंटरप्राइज स्टैंडर्ड और एंटरप्राइज प्लस श्रेणियां शामिल हैं। Google AI प्रो और अल्ट्रा जैसे व्यक्तिगत सदस्यता विकल्प भी सेल फोन पर कार्यक्षमता जारी करते हैं। एजुकेशन प्लस योजना के साथ पंजीकृत शैक्षणिक संस्थानों के पास एक साथ डबिंग सुविधा तक पूर्ण पहुंच है।

यह भी देखें

टूल के संचालन की गतिशीलता के लिए आवश्यक है कि केवल एक कॉल प्रतिभागी के खाते में योग्य योजना सक्रिय हो। वर्चुअल रूम में एकल ग्राहक की उपस्थिति बैठक के अन्य सभी सदस्यों को अतिरिक्त व्यक्तिगत लाइसेंस खरीदने की आवश्यकता के बिना, अनुवाद का उपयोग करने की अनुमति देती है। यह प्रारूप मुफ़्त खातों का उपयोग करने वाले बाहरी ग्राहकों और व्यावसायिक भागीदारों के साथ संचार की सुविधा प्रदान करता है।

एप्लिकेशन का सुरक्षा आर्किटेक्चर कॉर्पोरेट और शैक्षिक वीडियो कॉल के दौरान वोकल प्रोसेसिंग तकनीक के उपयोग के लिए सख्त दिशानिर्देश स्थापित करता है:

  • टूल को सक्रिय करने के लिए सेल फ़ोन स्क्रीन पर अनुमति बटन के माध्यम से उपयोगकर्ता की स्पष्ट सहमति की आवश्यकता होती है।
  • कॉल के दौरान किसी भी समय अनुवाद प्राधिकरण को रद्द करने का पूरा नियंत्रण प्रतिभागी के पास रहता है।
  • सूचना प्रौद्योगिकी प्रशासकों के पास कंपनी के बुनियादी ढांचे में संसाधनों को अवरुद्ध करने के लिए नियंत्रण पैनल होते हैं।
  • वॉयस डेटा प्रोसेसिंग सर्वर पर बातचीत के अनुचित भंडारण से बचने के लिए एन्क्रिप्शन प्रोटोकॉल का पालन करती है।

गोपनीयता ढाँचा यह सुनिश्चित करता है कि बैठकों में चर्चा की गई संवेदनशील जानकारी प्लेटफ़ॉर्म की अनुपालन नीतियों के तहत सुरक्षित रहे। एप्लिकेशन के लिए जिम्मेदार कंपनी यह सुनिश्चित करने के लिए नियमित ऑडिट करती है कि कृत्रिम बुद्धिमत्ता मॉडल वीडियो कॉन्फ्रेंस समाप्त होने के बाद ऑडियो अंशों को बरकरार नहीं रखता है।

मोबाइल उपकरणों पर टूल कॉन्फ़िगरेशन

वास्तविक समय डबिंग को सक्रिय करने की प्रक्रिया चल रही कॉल के दौरान सीधे मुख्य एप्लिकेशन इंटरफ़ेस में होती है। जो उपयोगकर्ता सेल फोन या टैबलेट के माध्यम से मीटिंग रूम में शामिल होते हैं, उन्हें स्क्रीन के नीचे स्थित तीन-बिंदु वाले आइकन पर टैप करना होगा। अतिरिक्त विकल्प मेनू एप्लिकेशन की सामान्य सेटिंग टैब प्रदर्शित करता है। प्रतिभागी को ध्वनि अनुवाद अनुभाग का पता लगाना होगा और ऑडियो प्रोसेसिंग शुरू करने के लिए वर्चुअल स्विच को सक्रिय करना होगा।

सेटिंग्स मेनू में विकल्प की अनुपस्थिति इंगित करती है कि डिवाइस अभी भी सॉफ़्टवेयर का पुराना संस्करण चलाता है। उपयोगकर्ता को अपने ऑपरेटिंग सिस्टम के एप्लिकेशन स्टोर तक पहुंचना होगा और अप्रैल 2026 से जारी अपडेट पैकेजों की उपलब्धता की जांच करनी होगी। पैकेज स्थापित करने के बाद एप्लिकेशन को पुनरारंभ करना प्रोग्राम के स्रोत कोड में एकीकृत नए कृत्रिम बुद्धिमत्ता मॉड्यूल की सही लोडिंग सुनिश्चित करता है।

दूरस्थ संचार और शिक्षा पर प्रभाव

मोबाइल उपकरणों पर कार्यक्षमता के आगमन से पारंपरिक कार्यालयों के बाहर काम करने वाले पेशेवरों के लिए काम की संभावनाओं का विस्तार होता है। बिक्री प्रतिनिधि, क्षेत्र निरीक्षक और अधिकारी केवल एक मोबाइल इंटरनेट कनेक्शन और एक स्मार्टफोन का उपयोग करके जटिल अंतरराष्ट्रीय बैठकों में भाग ले सकते हैं। विदेशी भाषा पाठ्यक्रमों या आभासी विनिमय कार्यक्रमों में नामांकित छात्रों को देशी शिक्षकों द्वारा पढ़ाए जाने वाले निम्नलिखित कक्षाओं के लिए व्यावहारिक सहायता प्रदान करने के लिए उपकरण भी मिलते हैं।

आवाज के मूल स्वर को संरक्षित करने की तकनीक रोबोटिक अनुवाद प्रणालियों में आम कृत्रिमता की भावना को कम करती है। अनुवादित ऑडियो में उत्साह, गंभीरता या आश्चर्य व्यक्त करने की क्षमता वार्ताकारों को करीब लाती है और बातचीत के भावनात्मक संदर्भ की व्याख्या में सुधार करती है। कृत्रिम बुद्धिमत्ता पर आधारित समाधानों के विकास को प्राथमिकता देने की रणनीति कॉर्पोरेट संचार प्लेटफार्मों के लिए प्रतिस्पर्धी बाजार में एप्लिकेशन की स्थिति को मजबूत करती है, ऐसे उपकरण प्रदान करती है जो दूरी पर मानव इंटरैक्शन के समय और स्पष्टता को अनुकूलित करते हैं।

यह भी देखें