News (SI)

Google Gemini Live යෙදුමේ හඬ පද්ධතිය වෙනස් කරන අතර කලාපීය උච්චාරණවල කේන්දරය වෙනස් කරයි

Gemini
Foto: Gemini - Primakov / Shutterstock.com

Google හි අතථ්‍ය සහායක පරිශීලකයින් තත්‍ය කාලීන අන්තර්ක්‍රියා වලදී ශ්‍රව්‍ය සැකසුම්වල සැලකිය යුතු අස්ථාවරතා වාර්තා කිරීමට පටන් ගත්හ. වෙනස් කිරීම් පරිශීලක අත්දැකීමට සෘජුවම බලපාන අතර, යෙදුමේ තෝරාගත් විකල්පවල මූලික ලක්ෂණ වෙනස් කරයි.

ගැටලුව ප්‍රධාන වශයෙන් ප්‍රකාශ වන්නේ කථනයේ කේන්දරය, ප්‍රතිචාරවල ස්වරය සහ කලාපීය උච්චාරණවල අනුකූලතාවයෙනි. Essas විචලනයන් අනපේක්ෂිත ලෙස සිදු වේ, අඛණ්ඩ සංවාද වලදී කෘතිම බුද්ධි පද්ධතියේ සන්නිවේදන රටාව පරිවර්තනය කරයි.

මිථුන ලග්නය
මිථුන – mundissima/ Shutterstock.com

සමාගමේ භාෂා මාදිලි සඳහා මෑත කාලීන යාවත්කාලීන කිරීම් ක්‍රියාත්මක කිරීමෙන් පසු දෝෂ පැහැදිලි විය. සැකසුම් තුළ ඉදිරිපත් කරන ලද ශ්‍රව්‍ය නියැදිය සහ ප්‍රායෝගිකව ප්‍රතිනිෂ්පාදනය කරන ලද ශබ්දය අතර විෂමතාව ජංගම උපාංග කෙරෙහි අවධානය යොමු කරන ලද තාක්ෂණික සංසදවල පැමිණිලිවල ප්‍රධාන ඉලක්කය බවට පත්ව ඇත.

ශබ්ද නොගැලපීම් සහ පරිශීලක අත්දැකීම්

බ්‍රිතාන්‍ය කාන්තා උච්චාරණයකින් සංලක්ෂිත Capella ලෙස හැඳින්වෙන හඬ විකල්පය, දියත් කළ දා සිට වඩාත්ම පැහැදිලි විකෘති කිරීම් ඇත. පළමු විධාන කිහිපයෙන් පසු ශ්‍රව්‍යයේ මුල් පෞරුෂය ඉක්මනින් නැති වී යන බව පාරිභෝගිකයින් දකී.

දිගුකාලීන සංවාද වලදී, පුද්ගලයා විසින් තෝරා ගන්නා ලද කලාපීය රටාව පවත්වාගෙන යාමේ අපහසුතාවයක් පද්ධතිය පෙන්නුම් කරයි. සහායකයාගේ ප්‍රතිචාර ඕස්ට්‍රේලියානු උච්චාරණ සහ ඇමරිකානු ඉංග්‍රීසියේ වඩාත් මධ්‍යස්ථ වෙනස්කම් අතර ස්වයංක්‍රීයව මාරු වීමට පටන් ගනී, දෛනික කාර්යයන් හෝ අධ්‍යයන සඳහා මෙවලම මත යැපෙන අයට ඛණ්ඩනය වූ සහ ව්‍යාකූල සවන්දීමේ අත්දැකීමක් නිර්මාණය කරයි.

යෙදුමේ හැසිරීම යෝජනා කරන්නේ කෘත්‍රිම බුද්ධි ආකෘතියේ නව අනුවාදවලට අවශ්‍ය සංකීර්ණ හඬ මොඩියුලය පවත්වා ගැනීමට උත්සාහ කරන විට තත්‍ය කාලීන සැකසුම් බාධකවලට මුහුණ දෙන බවයි. Quando පරිශීලකයා මෘදුකාංගයේ බලහත්කාරයෙන් නැවත ආරම්භ කිරීම සිදු කරයි, මුල් උච්චාරණය ප්රතිෂ්ඨාපනය වේ, නමුත් මෙම නිවැරදි කිරීම තාවකාලික බලපෑමක් ඇති කරයි. Após මිනිත්තු කිහිපයක අඛණ්ඩ අන්තර්ක්‍රියාවකින් පසුව, කටහඬ නැවත දෙමුහුන් අනුවාදයක් බවට පරිවර්තනය වේ, කථන සංස්ලේෂණ පද්ධතියට වැඩි සන්දර්භීය සැකසුම් සහ දිගු ප්‍රතිචාර අවශ්‍ය වන සැසිවල ස්ථායිතාව පවත්වා ගත නොහැකි බව පෙන්වයි.

  • සංකීර්ණ ප්රතිචාර වලදී කථන වේගය සැලකිය යුතු ලෙස අඩු වේ.
  • භාවිතයේදී මුල් ත්‍රිත්ව නාද සැලකිය යුතු ලෙස අඩු වේ.
  • එකම වාක්‍යයේ විවිධ උච්චාරණ මිශ්‍ර වන්නේ නොදැනුවත්ව ය.
  • යෙදුම නැවත ආරම්භ කිරීම ගැටලුවට විසඳුමක් ලබා දෙයි.

දීර්ඝ සැසිවල ශ්‍රව්‍ය පුරාවස්තු

වාචික අනන්‍යතාවයේ වෙනස්වීම් වලට අමතරව, ප්‍රතිචාර ප්‍රතිනිෂ්පාදනය කිරීමේදී සහායකයා අනවශ්‍ය ශබ්ද ඉදිරිපත් කිරීමට පටන් ගත්තේය. Artefatos පොප්, කුඩා පොප් සහ පසුබිම් හිස් වැනි ශබ්ද, පද්ධතිය සකසන අතර ඉල්ලන ලද තොරතුරු ලබා දෙන අතරතුර වරින් වර දිස් වේ.

මෙම ධ්වනි බාධා කිරීම් උච්චාරණ වෙනස් කිරීම සමඟ සෘජු සම්බන්ධයක් නැත, නමුත් ඒවා සේවා ගුණාත්මක භාවයේ පහත වැටීමක් පිළිබඳ සංජානනය නරක අතට හැරේ. සක්‍රිය කර ඇති හඬ විකල්පය සහ වේදිකාවට ප්‍රවේශ වීමට භාවිතා කරන උපාංගය මත පදනම්ව ශබ්දවල සංඛ්‍යාතය බොහෝ සෙයින් වෙනස් වේ.

වේදිකාව අනුව කාර්ය සාධන වෙනස්කම්

ප්‍රායෝගික පරීක්ෂණ මගින් පෙන්නුම් කරන්නේ ශ්‍රව්‍ය ස්ථායීතාවය භාවිතයේ සන්දර්භය සහ දෘඪාංග පරිසරය මත දැඩි ලෙස රඳා පවතින බවයි. Comandos කෙටි ප්‍රතිචාර අවශ්‍ය වන ඉක්මන් සහ වෛෂයික, පාරිභෝගිකයින් විසින් වාර්තා කරන ලද කේඩන්ස් හිඩැස් හෝ උච්චාරණ මිශ්‍ර කිරීම් කලාතුරකින් අවුලුවයි.

Android Auto වැනි මෝටර් රථ පද්ධති සමඟ සහායකගේ ඒකාබද්ධ වීම කැපී පෙනෙන ලෙස උසස් හැසිරීමක් පෙන්නුම් කරයි. Nesses පරිසරයන්, දිගු සැකසුම් කාලයක් අවශ්‍ය වන අන්තර්ක්‍රියා වලදී පවා තෝරාගත් කටහඬවල මුල් ලක්ෂණ වඩාත් ඵලදායී ලෙස සංරක්ෂණය කෙරේ.

කාර්ය සාධනයේ මෙම වෙනස පෙන්නුම් කරන්නේ ජංගම යෙදුමේ සම්පත් කළමනාකරණය ශ්‍රව්‍ය විදැහුම්කරණයට බලපෑම් කළ හැකි බවයි. ස්මාර්ට් ෆෝන් වල දත්ත සම්පීඩනය හෝ මතකය වෙන් කිරීම, ස්වර විශ්වාසවන්තභාවය පවත්වා ගැනීමට ආකෘතියට ඇති හැකියාවට සෘජුවම බාධා කරන බව පෙනේ.

අභිරුචිකරණ විකල්ප සහ ගැලපීම් තිබේ

සහකරුගේ සැකසුම් පැනලය අභිරුචිකරණය සඳහා විවිධ ස්වර පැතිකඩ නාමාවලියක් සපයයි. සමාගමේ පරමාර්ථය වන්නේ යන්ත්‍රය සමඟ අන්තර් ක්‍රියා කිරීම වඩාත් ස්වාභාවික හා විනෝදජනක කරවන ස්වරයක්, රිද්මයක් සහ උච්චාරණයක් සොයා ගැනීමට එක් එක් පුද්ගලයාට හැකිවීමයි.

පැතිකඩ වඩාත් බැරෑරුම් සහ විධිමත් දැවවල සිට වඩාත් ඉහළ තාර සහ ලිහිල් විකල්ප දක්වා විහිදේ. තේරීම සරලව සිදු කරනු ලබන්නේ ප්‍රධාන මෙනුව හරහා වන අතර එහිදී පාරිභෝගිකයාට තෝරා ගැනීමේදී සහාය වීම සඳහා කෙටි ශ්‍රව්‍ය සාම්පලයක් වාදනය කෙරේ.

මෑත කාලීන ගැටළු වලට අනුව, බොහෝ පරිශීලකයින් අසාර්ථක වීමට ඉඩ ඇති විකල්පයක් සොයා ගැනීමට උත්සාහ කිරීමේදී මෙම පැතිකඩ අතර නිරන්තරයෙන් මාරු වීමේ උපාය මාර්ගයක් අනුගමනය කර ඇත. කෙසේ වෙතත්, හඬ මාරු කිරීම පද්ධති අස්ථාවරත්වය සඳහා තාවකාලික විසඳුමක් ලෙස පමණක් ක්රියා කරයි.

ගැටලුවේ මූලය මෘදුකාංගය තත්‍ය කාලීනව ස්වභාවික භාෂාව සකසන ආකාරය හා බැඳී පවතී. සමාගමේ සේවාදායකවල අඛණ්ඩ යාවත්කාලීන කිරීම් තෝරාගත් ස්වරය නොසලකා නාමාවලියෙහි ඇති සියලුම විකල්පවල හැසිරීමට බලපායි.

කෘතිම බුද්ධි යාවත්කාලීන වල බලපෑම

ශ්‍රව්‍ය හැසිරීම් වල අනවශ්‍ය වෙනස්කම් Google භාෂා මාදිලිවල නව අනුවාදයන් ක්‍රියාත්මක කිරීමේ කාලසීමාව සමඟ සමපාත වේ, විශේෂයෙන් Flash Live වැනි අනුවාදය වැනි වේගය-නාභිගත ගෘහනිර්මාණ වෙත සංක්‍රමණය වීම. මෙම යාවත්කාලීනවල ප්‍රධාන පරමාර්ථය වන්නේ පරිශීලකයාගේ සැබෑ ප්‍රතිචාරය අතර ප්‍රමාද කාලය අඩු කිරීම සහ යන්ත්‍රය අතර ප්‍රමාද කාලය අඩු කිරීමයි. සංවාදය.

කෙසේ වෙතත්, වේගවත් ජයග්‍රහණ සඳහා ප්‍රශස්ත කිරීම කථන සංස්ලේෂණයේ විදැහුම්කරණයේ අතුරු ආබාධ ජනනය කර ඇති බව පෙනේ. උත්පාදනය කරන ලද පෙළ වේගයෙන් බෙදා හැරීමට ප්‍රමුඛත්වය දෙන විට, ශ්‍රව්‍ය පද්ධතියට දත්ත පැකට් ඛණ්ඩනය වන ආකාරයෙන් ලබා ගත හැකි අතර, එමඟින් කේඩනය නැතිවීම, ඉහළ ස්වර අඩුවීම සහ ඉතා දිගු ඡේද තුළ සංකීර්ණ කලාපීය උච්චාරණ පවත්වා ගැනීමට ඇති නොහැකියාව පැහැදිලි කරයි.

ප්‍රවේශ්‍යතාව සහ ස්ථාවර ප්‍රමිතීන් මත රඳා පැවතීම

කෘත්‍රිම කටහඬ ප්‍රතිනිෂ්පාදනයේ අනුකූලතාව සෞන්දර්යාත්මක මනාප ප්‍රශ්නයෙන් ඔබ්බට ගොස් ඩිජිටල් ප්‍රවේශ්‍යතා ක්ෂේත්‍රයට සෘජුවම බලපායි. Indivíduos දෘශ්‍යාබාධිත, කියවීමේ අපහසුතා හෝ විශේෂිත ස්නායු රෝග තත්ත්වයන් සහිත පුද්ගලයන් බොහෝ විට අන්තර්ජාලය පිරික්සීමට, ලේඛන කියවීමට සහ දෛනික චර්යාවන් සංවිධානය කිරීමට අතථ්‍ය සහායකයින් මත විශ්වාසය තබයි. Para මෙම ප්‍රේක්ෂකයින් සඳහා, තොරතුරු ඵලදායී ලෙස අවබෝධ කර ගැනීම සඳහා තෝරාගත් කටහඬේ ස්වරය, වේගය සහ පැහැදිලි බව පිළිබඳ හුරුපුරුදුකම අත්‍යවශ්‍ය වේ. Quando පද්ධතිය හදිසියේ එහි කේන්දරය වෙනස් කරයි, ශබ්දය ඇතුල් කරයි හෝ වාක්‍යයක් මැද උච්චාරණය වෙනස් කරයි, පණිවිඩය අර්ථ නිරූපණය කිරීමට අවශ්‍ය සංජානන භාරය සැලකිය යුතු ලෙස වැඩි වේ. Essa සාමාන්‍ය ජනතාවට කෘත්‍රිම බුද්ධි යාවත්කාලීන නිකුත් කිරීමට පෙර ශ්‍රව්‍ය ස්ථායීතාවය කෙරෙහි අවධානය යොමු කරන වඩාත් දැඩි පරීක්ෂණ ක්‍රම ක්‍රියාත්මක කිරීමට තාක්‍ෂණ සමාගම්වලට ඇති තීරණාත්මක අවශ්‍යතාවය ඉස්මතු කරමින් බලාපොරොත්තු කඩ කිරීම ප්‍රයෝජනවත් මෙවලමක් කලකිරීමේ මූලාශ්‍රයක් බවට පත් කරයි.

අඛණ්ඩ ස්ථානගත කිරීම සහ අධීක්ෂණය

අද දක්වා, මෘදුකාංග සංවර්ධකයා මෙම වාචික විෂමතා නිශ්චිතව නිවැරදි කිරීම සඳහා කාලරාමුවක් විස්තර කරන නිල ප්‍රකාශ නිකුත් කර නැත. තාක්‍ෂණ ප්‍රජාව උපාංග වෙත තල්ලු කරන සෑම නව කුඩා නිහඬ යාවත්කාලීනයක් සමඟම යෙදුම් හැසිරීම නිරීක්ෂණය කිරීම දිගටම කරගෙන යයි.

ස්වභාවික භාෂා සැකසීමේ පරිණාමය

තත්‍ය කාලීන කථන සංස්ලේෂණය පිටුපස ඇති ඉංජිනේරු විද්‍යාව යන්ත්‍ර ඉගෙනුම් ක්ෂේත්‍රයේ අද වන විට විශාලතම අභියෝගයක් නියෝජනය කරයි. පද්ධතියට ජනනය කරන ලද පෙළ අර්ථකථනය කිරීමට, සන්දර්භය මත පදනම්ව නිවැරදි ස්වරය යෙදීමට සහ ශ්‍රව්‍ය ක්ෂණිකව ලබා දීමට අවශ්‍ය වේ.

කැඩෙන්ස් සහ උච්චාරණවල වත්මන් දෝෂ තිබියදීත්, සජීවී සංවාද තාක්ෂණය වේගයෙන් ඉදිරියට යයි. Ajustes ශ්‍රව්‍ය සම්පීඩන සහ සැකසුම් ඇල්ගොරිතම අවසානයේ සියලුම ජංගම වේදිකාවල අභිරුචි කටහඬවල ක්‍රියාකාරිත්වය ස්ථාවර කළ යුතුය.

Veja Tambem em News (SI)

නව Apple පද්ධති යාවත්කාලීනය iPhone භාවිතා කරන්නන් සඳහා හදිසි කාර්ය කළමනාකරණය ප්‍රශස්ත කරයි

නව Apple පද්ධති යාවත්කාලීනය iPhone භාවිතා කරන්නන් සඳහා හදිසි කාර්ය කළමනාකරණය ප්‍රශස්ත කරයි

Apple විසින් නව නැමිය හැකි iPhone නිපදවන අතර සන්නාමයේ 20 වසර සැමරීම සඳහා විශේෂ සංස්කරණයක් සූදානම් කරයි

Apple විසින් නව නැමිය හැකි iPhone නිපදවන අතර සන්නාමයේ 20 වසර සැමරීම සඳහා විශේෂ සංස්කරණයක් සූදානම් කරයි

වෝල්ට් ඩිස්නි ඩිජිටල් ක්‍රීඩා වෙළඳපොලේ ආධිපත්‍යය පුළුල් කිරීම සඳහා එපික් ක්‍රීඩා සම්පූර්ණයෙන් අත්පත් කර ගැනීම අධ්‍යයනය කරයි

වෝල්ට් ඩිස්නි ඩිජිටල් ක්‍රීඩා වෙළඳපොලේ ආධිපත්‍යය පුළුල් කිරීම සඳහා එපික් ක්‍රීඩා සම්පූර්ණයෙන් අත්පත් කර ගැනීම අධ්‍යයනය කරයි

නව Xiaomi 18 Pro Max ස්මාර්ට් ජංගම දුරකථනය 200 MP කැමරා දෙකක් සහ නවතම පරම්පරාවේ ප්‍රොසෙසරය ඒකාබද්ධ කරයි

නව Xiaomi 18 Pro Max ස්මාර්ට් ජංගම දුරකථනය 200 MP කැමරා දෙකක් සහ නවතම පරම්පරාවේ ප්‍රොසෙසරය ඒකාබද්ධ කරයි

නව ගෝලීය සංචාලන ආකෘතිය පෘථිවි චුම්බක ධ්‍රැවයේ කිලෝමීටර 36 ක වාර්ෂික විස්ථාපනය නිවැරදි කරයි

නව ගෝලීය සංචාලන ආකෘතිය පෘථිවි චුම්බක ධ්‍රැවයේ කිලෝමීටර 36 ක වාර්ෂික විස්ථාපනය නිවැරදි කරයි

Xiaomi TV Stick HD 2 දියත් කිරීම Google TV සහ රූපවාහිනී පරිවර්තනය කිරීම සඳහා සුපිරි කාර්ය සාධනයක් ගෙන එයි

Xiaomi TV Stick HD 2 දියත් කිරීම Google TV සහ රූපවාහිනී පරිවර්තනය කිරීම සඳහා සුපිරි කාර්ය සාධනයක් ගෙන එයි

Nintendo Switch 2 නොමිලේ GameChat අවසන් කරන අතර අප්‍රේල් මාසයේදී සබැඳි සේවාව සඳහා දායකත්වය අවශ්‍ය වේ

Nintendo Switch 2 නොමිලේ GameChat අවසන් කරන අතර අප්‍රේල් මාසයේදී සබැඳි සේවාව සඳහා දායකත්වය අවශ්‍ය වේ

NVIDIA බීටා යෙදුම් යාවත්කාලීනය RTX 50 සඳහා DLSS 4.5 Dynamic Frame Generation සමඟ හඳුන්වා දෙයි

NVIDIA බීටා යෙදුම් යාවත්කාලීනය RTX 50 සඳහා DLSS 4.5 Dynamic Frame Generation සමඟ හඳුන්වා දෙයි

නළුවන් වන Kazunari Ninomiya සහ Elaiza Ikeda Marugame Seimen ගේ නව කෑමක් සඳහා ප්‍රචාරක කටයුතු භාර ගනී

නළුවන් වන Kazunari Ninomiya සහ Elaiza Ikeda Marugame Seimen ගේ නව කෑමක් සඳහා ප්‍රචාරක කටයුතු භාර ගනී

නව Harry Potter කතා මාලාවේ වාර්ගික ප්‍රහාරයන්ට එරෙහිව Paapa Essiedu ගේ ආරක්ෂාව විකාශනය ශක්තිමත් කරයි

නව Harry Potter කතා මාලාවේ වාර්ගික ප්‍රහාරයන්ට එරෙහිව Paapa Essiedu ගේ ආරක්ෂාව විකාශනය ශක්තිමත් කරයි

නැමිය හැකි ස්මාර්ට් ජංගම දුරකතනයේ නව සංස්කරණය ශීත ඍතු ක්‍රීඩා තරඟකරුවන්ට රන් නිමාවක් ගෙන එයි

නැමිය හැකි ස්මාර්ට් ජංගම දුරකතනයේ නව සංස්කරණය ශීත ඍතු ක්‍රීඩා තරඟකරුවන්ට රන් නිමාවක් ගෙන එයි

Xbox Series S වලට වඩා උසස් ග්‍රැෆික්ස් සහිත නව අතේ ගෙන යා හැකි PlayStation හි දෘඪාංග කාන්දු වීම

Xbox Series S වලට වඩා උසස් ග්‍රැෆික්ස් සහිත නව අතේ ගෙන යා හැකි PlayStation හි දෘඪාංග කාන්දු වීම