A Google a Rambler technológiát mesterséges intelligenciával integrálja a Gboardba, hogy javítsa a diktálást Androidon

Gemini

Gemini - mundissima/ Shutterstock.com

Az Google előrehaladt a mobileszközökre szánt hivatalos virtuális billentyűzet szerkezeti frissítésének fejlesztésében. A technológiai vállalat az Rambler eszköz natív integrációját készíti elő az Gboard-be, az Gemini Intelligence adatbázis segítségével újrafogalmazva a hangdiktálási rendszert az okostelefonokon. Az új funkciót az alkalmazás legújabb verziójának belső fájljaiban azonosították, és fő célja a felhasználók által a napi kommunikáció során tapasztalt krónikus automatikus átírási hibák megoldása.

A projekt technikai megerősítésére azután került sor, hogy a szoftverszakértők elemezték az Android operációs rendszer alkalmazástelepítő csomagját. A rejtett kódok kényszeraktiválása egy példátlan menüt tárt fel a hangrögzítési beállításokkal, jelezve, hogy közeledik a funkcionalitás nagyközönség számára történő bevezetése. A motor fejlett nyelvi modelleket használ a mondatok szövegkörnyezetének valós idejű értelmezésére, leküzdve a hagyományos átírók korlátait, amelyek csak elszigetelt hangokat alakítanak át írott szöveggé.

Az Descoberta az Android fájlokban új rögzítési felületet tár fel

Az Android Authority speciális portál gyakorlati teszteket végzett, amelyek feltárták a billentyűzet új mesterséges intelligenciájának támogatásáért felelős parancssorokat. A mérnökök reverse engineering technikákat alkalmaztak a fejlesztési akadályok megkerülésére és a fogyasztók számára terjesztett grafikus felület elérésére. A manuális eljárás bebizonyította, hogy a rendszer alapstruktúrája a vállalat szerverein belül már az érlelés előrehaladott stádiumában van.

A kódbeolvasás által feltárt konfigurációs képernyők az intelligens hangfeldolgozásra jellemző jelölőnégyzeteket mutatnak. A szoftverarchitektúra hibrid végrehajtásra utal, ahol az adatértelmezés jelentős része közvetlenül a mobiltelefon hardverén történik. Az Essa technikai megközelítés csökkenti a megszakítás nélküli internetkapcsolatoktól való függőséget. A felhasználó beszéde és a képernyőn megjelenő szavak közötti válaszidő drasztikusan csökken.

A teljesen felhőfüggő modellről a helyi feldolgozórendszerre való áttérés a mobileszközökhöz készült chipek legújabb innovációit tükrözi. A modern processzorok neurális feldolgozó egységekkel rendelkeznek a gépi tanulási feladatokra. Az Gboard billentyűzet ezt a hardveres képességet kihasználva összetett beszédfelismerő algoritmusokat futtathat anélkül, hogy lemerítené az okostelefon akkumulátorát, vagy túlzott mobiladat-mennyiséget fogyasztana.

A Voice Tecnologia kiküszöböli a szüneteket és rendezi a nyelvtani szerkezetet

A különbség az Rambler rendszer és a között, hogy képes megérteni az emberi gondolkodás természetes áramlását a hosszú mondatok megfogalmazása során. A mesterséges intelligencia azonnali lektorként működik. A rendszer lehetővé teszi a személynek, hogy folyamatosan diktáljon tartalmat, anélkül, hogy írásjelek parancsait verbalizálnia vagy szünetet kellene tartania a kiejtési hibák javításához. Az algoritmus vállalja a felelősséget a végső szöveg szintaktikai koherenciájú és gördülékeny olvasási strukturálásáért.

Az Gboard-be integrált adatfeldolgozó több egyidejű szerkesztési feladatot hajt végre, miközben a mikrofon aktív marad. A szövegen alkalmazott fejlesztések a következők:

  • Remoção azonnali vokális tétovázás, dadogás és szótagok akaratlan ismétlése beszéd közben
  • Filtragem automatikus háttérzaj-eltávolítás és a diktált szavak közötti hosszú szünetek kizárása
  • Inserção pontok, vesszők és kérdőjelek mondatkörnyezet-elemzés alapján
  • Correção szóbeli és névleges megegyezés a továbbított üzenet eredeti jelentésének módosítása nélkül
  • Általános szintaxis Ajuste a nagyobb tisztaság érdekében az üzenetküldő alkalmazásokban történő gyors olvasás során

A nyelvi modellt úgy kalibrálták, hogy finomítsa az írást anélkül, hogy a küldő személyazonosságát pasztörizálná. A rendszer megőrzi a felhasználó személyes szókincsére jellemző szleng, regionális kifejezések és kifejezések használatát. A mesterséges intelligencia teljesítménye szigorúan a rögtönzött szóbeli kommunikációra jellemző nyelvi hibák kiküszöbölésére koncentrál. A gépelési képernyőre eljuttatott eredmény csiszoltnak és azonnali küldésre késznek tűnik.

A helyi Processamento erősíti az adatbiztonságot a mobileszközökön

A hang helyi feldolgozására vonatkozó döntés jelentős technikai előrelépést jelent a felhasználók személyes adatainak védelme terén. A korábbi Modelos átírási programok megkövetelték a hangcsomagok folyamatos küldését a vállalat szervereire. Az Essa gyakorlat gyakori kérdéseket generált a privát beszélgetések titkosságával kapcsolatban. Az Gemini Intelligence közvetlenül az alkalmazásba integrálása lehetővé teszi a lexikális elemzést az okostelefon saját processzorán belül, elkülönítve az adatokat a külső környezettől.

Az Especialistas a digitális biztonságban rámutat arra, hogy az építészeti paradigma változása megfelel a biometrikus adatok feldolgozásával kapcsolatos új globális szabályozási követelményeknek. Azáltal, hogy a feldolgozást az eszközre korlátozza, az Google csökkenti az átvitel közbeni hangelfogás kockázatát. A vállalat a működési költségeit is csökkenti a felhő infrastruktúrájával. Az új mobil processzorok energiahatékonysága lehetővé teszi összetett neurális hálózatok futtatását anélkül, hogy az eszköz általános teljesítményét veszélyeztetné.

A hangfelismerés fejlődése végigkíséri a digitális hozzáférhetőség iránti növekvő igényt. Pontos diktálás Az Ferramentas megkönnyíti a kommunikációt a mozgássérült vagy látássérült emberek számára. Az Gboard folyamatos fejlesztése biztosítja, hogy a lakosság nagyobb része hatékonyan tudjon kommunikálni a digitális platformokkal. Az automatikus nyelvtani pontosság megszünteti a kommunikációs akadályokat szakmai és tudományos környezetben.

A vállalat Estratégia az Pixel vonal kezdeti kizárólagosságára összpontosít

Az Rambler Gboard-be való implementálása megszilárdítja az Google taktikáját, miszerint az Android ökoszisztémát a generatív mesterséges intelligencián alapuló eszközökkel átalakítja. A projekt egy nagyobb erőfeszítés része, amelynek célja a vállalat szolgáltatásainak az Gemini Intelligence ernyő alatt történő egyesítése. A virtuális billentyűzet a szöveges interakció fő pontjaként működik több milliárd aktív eszközön. Az eszköz ideális eszközzé válik az új természetes nyelvi feldolgozási technológia tömeges kiterjesztéséhez.

A cég igyekszik közvetlen versenyelőnyt teremteni az Apple által fejlesztett natív megoldásokkal és az operációs rendszer módosított verzióit használó ázsiai gyártókkal szemben. A hangátírás pontossága megváltoztatja a mindennapi termelékenységükhöz virtuális asszisztensekre támaszkodó fogyasztókat. A hivatalos billentyűzet korszerűsítésének célja, hogy megtartsa a felhasználókat a vállalat saját alkalmazás-ökoszisztémájában, megakadályozva az alkalmazásboltokban kapható, harmadik féltől származó billentyűzetekre való migrációt.

A technológiai piac Analistas azt vetíti előre, hogy a funkcionalitás kezdetben kizárólag az Pixel vonal okostelefonjaira fog megjelenni. Az ellenőrzött bevezetési stratégia lehetővé teszi a fejlesztők számára, hogy az algoritmusok teljesítményét az optimalizált hardveren nyomon kövessék a hozzáférés kiterjesztése előtt. Az Android rendszert futtató más márkák eszközei fokozatosan elérhetők. A megjelenés ütemezése a nagyszabású tesztelési időszak lezárultától és a frissítési csomagok stabilizálásától függ a vállalat globális szerverein.

Lásd még