Google ປ່ຽນແປງລະບົບສຽງໃນແອັບພລິເຄຊັນ Gemini Live ແລະດັດແປງ cadence ຂອງສຳນຽງພາກພື້ນ

Gemini

Gemini - Primakov / Shutterstock.com

ຜູ້ໃຊ້ຜູ້ຊ່ວຍສະເໝືອນຂອງ Google ເລີ່ມລາຍງານຄວາມບໍ່ສະຖຽນທີ່ສຳຄັນໃນການຕັ້ງຄ່າສຽງໃນລະຫວ່າງການໂຕ້ຕອບແບບສົດໆ. ການປ່ຽນແປງໂດຍກົງຜົນກະທົບຕໍ່ປະສົບການຂອງຜູ້ໃຊ້, ການປ່ຽນແປງລັກສະນະພື້ນຖານຂອງທາງເລືອກທີ່ເລືອກໃນແອັບພລິເຄຊັນ.

ບັນຫາສະແດງໃຫ້ເຫັນຕົວຂອງມັນເອງສ່ວນໃຫຍ່ແມ່ນຢູ່ໃນຈັງຫວະຂອງການປາກເວົ້າ, ໂຕນຂອງການຕອບສະຫນອງແລະຄວາມສອດຄ່ອງຂອງສໍານຽງພາກພື້ນ. Essas ການປ່ຽນແປງເກີດຂຶ້ນຢ່າງບໍ່ສາມາດຄາດເດົາໄດ້, ການຫັນປ່ຽນຮູບແບບການສື່ສານຂອງລະບົບປັນຍາປະດິດໃນລະຫວ່າງການສົນທະນາຢ່າງຕໍ່ເນື່ອງ.

Gemini – mundissima/ Shutterstock.com

ຂໍ້ບົກພ່ອງດັ່ງກ່າວໄດ້ເຫັນໄດ້ຊັດເຈນຫຼັງຈາກການປະຕິບັດການປັບປຸງທີ່ຜ່ານມາກັບຮູບແບບພາສາຂອງບໍລິສັດ. ຄວາມແຕກຕ່າງລະຫວ່າງຕົວຢ່າງສຽງທີ່ສະເຫນີໃນການຕັ້ງຄ່າແລະສຽງທີ່ຜະລິດຄືນໃຫມ່ໃນການປະຕິບັດໄດ້ກາຍເປັນເປົ້າຫມາຍຕົ້ນຕໍຂອງການຮ້ອງທຸກໃນເວທີເຕັກໂນໂລຢີທີ່ສຸມໃສ່ອຸປະກອນມືຖື.

ຄວາມບໍ່ສອດຄ່ອງຂອງສຽງແລະປະສົບການຂອງຜູ້ໃຊ້

ຕົວເລືອກສຽງທີ່ຮູ້ຈັກເປັນ Capella, ມີລັກສະນະເປັນສໍານຽງຂອງແມ່ຍິງອັງກິດ, ມີການບິດເບືອນທີ່ຊັດເຈນທີ່ສຸດນັບຕັ້ງແຕ່ການເປີດຕົວ. ຜູ້ບໍລິໂພກສັງເກດເຫັນວ່າລັກສະນະຕົ້ນສະບັບຂອງສຽງຈະສູນເສຍໄປຢ່າງໄວວາຫຼັງຈາກຄໍາສັ່ງສອງສາມຄັ້ງທໍາອິດ.

ໃນລະຫວ່າງການສົນທະນາທີ່ຍາວນານ, ລະບົບສະແດງໃຫ້ເຫັນຄວາມຫຍຸ້ງຍາກໃນການຮັກສາຮູບແບບພາກພື້ນທີ່ເລືອກໂດຍບຸກຄົນ. ຄຳຕອບຂອງຜູ້ຊ່ວຍເລີ່ມສະຫຼັບກັນຢ່າງເປັນເອກະລາດລະຫວ່າງສຳນຽງອອສເຕຣເລຍ ແລະ ການປ່ຽນແປງທີ່ເປັນກາງຂອງພາສາອັງກິດອາເມຣິກັນ, ສ້າງປະສົບການການຟັງທີ່ແຕກແຍກ ແລະສັບສົນໃຫ້ກັບຜູ້ທີ່ອາໄສເຄື່ອງມືສຳລັບວຽກປະຈຳວັນ ຫຼືການສຶກສາ.

ພຶດຕິກຳຂອງແອັບພລິເຄຊັ່ນແນະນຳວ່າການປະມວນຜົນແບບສົດໆປະເຊີນກັບຂໍ້ບົກຜ່ອງເມື່ອພະຍາຍາມຮັກສາການດັດແປງສຽງທີ່ຊັບຊ້ອນທີ່ຕ້ອງການໂດຍຕົວແບບປັນຍາປະດິດລຸ້ນໃໝ່. Quando ຜູ້ໃຊ້ປະຕິບັດການເລີ່ມຕົ້ນໃຫມ່ຂອງຊອບແວທີ່ຖືກບັງຄັບ, ການອອກສຽງຕົ້ນສະບັບຖືກຟື້ນຟູ, ແຕ່ການແກ້ໄຂນີ້ມີຜົນກະທົບຊົ່ວຄາວເທົ່ານັ້ນ. Após ຫຼັງຈາກສອງສາມນາທີຂອງການໂຕ້ຕອບຢ່າງຕໍ່ເນື່ອງ, ສຽງໄດ້ປ່ຽນກັບຄືນໄປບ່ອນເປັນສະບັບປະສົມ, ສະແດງໃຫ້ເຫັນວ່າລະບົບການສັງເຄາະສຽງເວົ້າບໍ່ສາມາດຮັກສາຄວາມຫມັ້ນຄົງໃນກອງປະຊຸມທີ່ຕ້ອງການການປະມວນຜົນບໍລິບົດຫຼາຍກວ່າເກົ່າແລະການຕອບສະຫນອງຍາວ.

  • ຄວາມໄວໃນການປາກເວົ້າຫຼຸດລົງຢ່າງຫຼວງຫຼາຍໃນການຕອບສະຫນອງທີ່ສັບສົນ.
  • ສຽງສາມຫຼ່ຽມຕົ້ນສະບັບແມ່ນຫຼຸດລົງຢ່າງເຫັນໄດ້ຊັດໃນລະຫວ່າງການໃຊ້.
  • ສຳນຽງທີ່ແຕກຕ່າງແມ່ນປະສົມຢູ່ໃນປະໂຫຍກດຽວກັນໂດຍບໍ່ຕັ້ງໃຈ.
  • ການຣີສະຕາດແອັບພລິເຄຊັນພຽງແຕ່ສະຫນອງການແກ້ໄຂຕໍ່ກັບບັນຫາ.

ສິ່ງປະດິດສຽງໃນເຊດຊັນຂະຫຍາຍ

ນອກເຫນືອຈາກການປ່ຽນແປງໃນຕົວຕົນຂອງສຽງ, ຜູ້ຊ່ວຍໄດ້ເລີ່ມຕົ້ນນໍາສະເຫນີສິ່ງລົບກວນທີ່ບໍ່ຕ້ອງການໃນລະຫວ່າງການແຜ່ພັນຂອງຄໍາຕອບ. Artefatos ສຽງ, ເຊັ່ນ pops, pops ຂະຫນາດນ້ອຍແລະ hiss ໃນພື້ນຫລັງ, ປາກົດເປັນບາງໆໃນຂະນະທີ່ລະບົບປະມວນຜົນແລະສົ່ງຂໍ້ມູນທີ່ຮ້ອງຂໍ.

ການແຊກແຊງທາງສຽງເຫຼົ່ານີ້ບໍ່ມີການເຊື່ອມຕໍ່ໂດຍກົງກັບການປ່ຽນແປງການອອກສຽງ, ແຕ່ພວກມັນເຮັດໃຫ້ຄວາມຮັບຮູ້ຂອງການຫຼຸດລົງຂອງຄຸນນະພາບການບໍລິການ. ຄວາມຖີ່ຂອງສິ່ງລົບກວນແມ່ນແຕກຕ່າງກັນຢ່າງຫຼວງຫຼາຍໂດຍຂຶ້ນກັບຕົວເລືອກສຽງທີ່ເປີດໃຊ້ງານ ແລະອຸປະກອນທີ່ໃຊ້ໃນການເຂົ້າເຖິງເວທີ.

ການປ່ຽນແປງປະສິດທິພາບໂດຍເວທີ

ການທົດສອບການປະຕິບັດສະແດງໃຫ້ເຫັນວ່າຄວາມຫມັ້ນຄົງຂອງສຽງແມ່ນຂຶ້ນກັບສະພາບການຂອງການນໍາໃຊ້ແລະສະພາບແວດລ້ອມຂອງຮາດແວ. Comandos ດ່ວນແລະມີຈຸດປະສົງ, ເຊິ່ງຕ້ອງການຄໍາຕອບສັ້ນໆ, ບໍ່ຄ່ອຍຈະເຮັດໃຫ້ເກີດຊ່ອງຫວ່າງ cadence ຫຼື accent mix-ups ລາຍງານໂດຍຜູ້ບໍລິໂພກ.

ການເຊື່ອມໂຍງຂອງຜູ້ຊ່ວຍກັບລະບົບລົດຍົນ, ເຊັ່ນ: Android Auto, ສະແດງໃຫ້ເຫັນພຶດຕິກໍາທີ່ໂດດເດັ່ນ. Nesses ສະພາບແວດລ້ອມ, ລັກສະນະຕົ້ນສະບັບຂອງສຽງທີ່ເລືອກໄດ້ຖືກຮັກສາໄວ້ຢ່າງມີປະສິດທິພາບ, ເຖິງແມ່ນວ່າໃນການໂຕ້ຕອບທີ່ຕ້ອງການເວລາປຸງແຕ່ງດົນກວ່າ.

ຄວາມແຕກຕ່າງໃນການປະຕິບັດນີ້ຊີ້ໃຫ້ເຫັນວ່າການຈັດການຊັບພະຍາກອນຂອງແອັບຯມືຖືອາດມີອິດທິພົນຕໍ່ການສະແດງສຽງ. ການບີບອັດຂໍ້ມູນ ຫຼືການຈັດສັນໜ່ວຍຄວາມຈຳໃນສະມາດໂຟນປະກົດວ່າແຊກແຊງໂດຍກົງກັບຄວາມສາມາດຂອງຕົວແບບໃນການຮັກສາຄວາມຊື່ສັດຂອງສຽງ.

ຕົວເລືອກການປັບແຕ່ງແລະການປັບຕົວທີ່ມີຢູ່

ແຜງການຕັ້ງຄ່າຂອງຜູ້ຊ່ວຍໃຫ້ລາຍການທີ່ຫຼາກຫຼາຍຂອງໂປຣໄຟລ໌ສຽງສຳລັບການປັບແຕ່ງ. ເປົ້າຫມາຍຂອງບໍລິສັດແມ່ນເພື່ອໃຫ້ແຕ່ລະຄົນສາມາດຊອກຫາສຽງ, ຈັງຫວະແລະສໍານຽງທີ່ເຮັດໃຫ້ການພົວພັນກັບເຄື່ອງຈັກເປັນທໍາມະຊາດແລະມ່ວນຊື່ນ.

ໂປຣໄຟລມີຕັ້ງແຕ່ໄມ້ທີ່ຮຸນແຮງ ແລະເປັນທາງການໄປຈົນເຖິງທາງເລືອກທີ່ມີສຽງສູງ ແລະຜ່ອນຄາຍຫຼາຍຂຶ້ນ. ການເລືອກແມ່ນເຮັດແບບງ່າຍໆຜ່ານເມນູຫຼັກ, ບ່ອນທີ່ມີຕົວຢ່າງສຽງສັ້ນໆເພື່ອຊ່ວຍເຫຼືອຜູ້ບໍລິໂພກໃນການເລືອກ.

ໃນຄວາມສະຫວ່າງຂອງບັນຫາທີ່ຜ່ານມາ, ຜູ້ໃຊ້ຈໍານວນຫຼາຍໄດ້ຮັບຮອງເອົາຍຸດທະສາດຂອງການປ່ຽນແປງຢ່າງຕໍ່ເນື່ອງລະຫວ່າງໂປຣໄຟລ໌ເຫຼົ່ານີ້ໃນຄວາມພະຍາຍາມທີ່ຈະຊອກຫາທາງເລືອກທີ່ມີຄວາມອ່ອນໄຫວຫນ້ອຍຕໍ່ກັບຄວາມລົ້ມເຫຼວ. ຢ່າງໃດກໍຕາມ, ການປ່ຽນສຽງພຽງແຕ່ເຮັດຫນ້າທີ່ເປັນການຊົ່ວຄາວສໍາລັບຄວາມບໍ່ສະຖຽນລະພາບຂອງລະບົບ.

ຮາກຂອງບັນຫາຍັງຄົງຕິດພັນກັບວິທີທີ່ຊອບແວປະມວນຜົນພາສາທໍາມະຊາດໃນເວລາຈິງ. ການປັບປຸງຢ່າງຕໍ່ເນື່ອງກ່ຽວກັບເຄື່ອງແມ່ຂ່າຍຂອງບໍລິສັດມີຜົນກະທົບຕໍ່ພຶດຕິກໍາຂອງທາງເລືອກທັງຫມົດທີ່ມີຢູ່ໃນລາຍການ, ໂດຍບໍ່ຄໍານຶງເຖິງສຽງທີ່ເລືອກ.

ຜົນກະທົບຂອງການປັບປຸງປັນຍາທຽມ

ການປ່ຽນແປງທີ່ບໍ່ຕ້ອງການໃນພຶດຕິກໍາສຽງ coincide ກັບໄລຍະເວລາການປະຕິບັດຂອງຮຸ່ນພາສາ Google ຮຸ່ນໃຫມ່, ໂດຍສະເພາະການຫັນໄປສູ່ສະຖາປັດຕະຍະກໍາທີ່ເນັ້ນຄວາມໄວ, ເຊັ່ນ: ສະບັບ Flash Live. ຈຸດປະສົງຕົ້ນຕໍຂອງການປັບປຸງເຫຼົ່ານີ້ແມ່ນເພື່ອຫຼຸດຜ່ອນເວລາ latency ລະຫວ່າງຄໍາຖາມຂອງຜູ້ໃຊ້ແລະການຕອບໂຕ້ຂອງໄຂ້ຫວັດໃຫຍ່ຫຼາຍຂຶ້ນ.

ຢ່າງໃດກໍ່ຕາມ, ການເພີ່ມປະສິດທິພາບສໍາລັບຄວາມໄວທີ່ເພີ່ມຂຶ້ນເບິ່ງຄືວ່າມີຜົນກະທົບຂ້າງຄຽງໃນການສະແດງການສັງເຄາະສຽງເວົ້າ. ເມື່ອຈັດລໍາດັບຄວາມສໍາຄັນຂອງການຈັດສົ່ງໄວຂອງຂໍ້ຄວາມທີ່ສ້າງຂຶ້ນ, ລະບົບສຽງອາດຈະໄດ້ຮັບຊຸດຂໍ້ມູນໃນລັກສະນະທີ່ແຕກແຍກ, ເຊິ່ງຈະອະທິບາຍເຖິງການສູນເສຍ cadence, ການຫຼຸດລົງຂອງສຽງສູງແລະຄວາມບໍ່ສາມາດຮັກສາການອອກສຽງຂອງພາກພື້ນທີ່ສັບສົນໃນລະຫວ່າງວັກຍາວຫຼາຍ.

ການ​ເຂົ້າ​ເຖິງ​ແລະ​ການ​ອີງ​ໃສ່​ມາດ​ຕະ​ຖານ​ທີ່​ສອດ​ຄ້ອງ​ກັນ​

ຄວາມສອດຄ່ອງໃນການສືບພັນຂອງສຽງສັງເຄາະແມ່ນເກີນກວ່າບັນຫາຂອງຄວາມມັກດ້ານຄວາມງາມແລະມີຜົນກະທົບໂດຍກົງຕໍ່ຂອບເຂດຂອງການເຂົ້າເຖິງດິຈິຕອນ. Indivíduos ຄົນທີ່ມີຄວາມບົກຜ່ອງທາງດ້ານສາຍຕາ, ຄວາມຫຍຸ້ງຍາກໃນການອ່ານຫຼືສະພາບທາງປະສາດສະເພາະມັກຈະອີງໃສ່ຜູ້ຊ່ວຍ virtual ເພື່ອທ່ອງອິນເຕີເນັດ, ອ່ານເອກະສານແລະຈັດລະບຽບປະຈໍາວັນ. Para ສໍາລັບຜູ້ຊົມນີ້, ຄວາມຄຸ້ນເຄີຍກັບໂຕນ, ຄວາມໄວແລະຄວາມຊັດເຈນຂອງສຽງທີ່ເລືອກແມ່ນເປັນສິ່ງຈໍາເປັນສໍາລັບການເຂົ້າໃຈຂໍ້ມູນຢ່າງມີປະສິດທິພາບ. Quando ລະບົບປ່ຽນຈັງຫວະຢ່າງກະທັນຫັນ, ໃສ່ສຽງດັງ ຫຼືປ່ຽນສຳນຽງຢູ່ເຄິ່ງກາງຂອງປະໂຫຍກ, ການໂຫຼດສະຕິປັນຍາທີ່ຕ້ອງການເພື່ອຕີຄວາມໝາຍຂອງຂໍ້ຄວາມເພີ່ມຂຶ້ນຢ່າງຫຼວງຫຼາຍ. Essa ຄວາມຄາດຫວັງທີ່ແຕກຫັກປ່ຽນເປັນເຄື່ອງມືທີ່ເປັນປະໂຫຍດເປັນແຫຼ່ງຂອງຄວາມອຸກອັ່ງ, ເນັ້ນຫນັກເຖິງຄວາມຕ້ອງການທີ່ສໍາຄັນສໍາລັບບໍລິສັດເຕັກໂນໂລຢີໃນການປະຕິບັດປົກກະຕິການທົດສອບທີ່ເຂັ້ມງວດກວ່າທີ່ສຸມໃສ່ຄວາມຫມັ້ນຄົງຂອງສຽງກ່ອນທີ່ຈະປ່ອຍການປັບປຸງປັນຍາປະດິດໃຫ້ແກ່ປະຊາຊົນທົ່ວໄປ.

ການຈັດຕໍາແຫນ່ງແລະການຕິດຕາມຢ່າງຕໍ່ເນື່ອງ

ມາຮອດປັດຈຸບັນ, ຜູ້ພັດທະນາຊອບແວຍັງບໍ່ໄດ້ອອກຖະແຫຼງການຢ່າງເປັນທາງການທີ່ລາຍລະອຽດກ່ຽວກັບໄລຍະເວລາສໍາລັບການແກ້ໄຂຄວາມຜິດປົກກະຕິຂອງສຽງເຫຼົ່ານີ້ຢ່າງແນ່ນອນ. ຊຸມຊົນເຕັກໂນໂລຢີຍັງສືບຕໍ່ຕິດຕາມພຶດຕິກໍາຂອງແອັບຯໂດຍແຕ່ລະການອັບເດດ silent ຂະຫນາດນ້ອຍໃຫມ່ pushed ກັບອຸປະກອນ.

ວິວັດທະນາການປຸງແຕ່ງພາສາທໍາມະຊາດ

ວິສະວະກໍາທີ່ຢູ່ເບື້ອງຫລັງການສັງເຄາະສຽງເວົ້າໃນເວລາຈິງເປັນຕົວແທນຂອງສິ່ງທ້າທາຍທີ່ໃຫຍ່ທີ່ສຸດໃນມື້ນີ້ໃນພາກສະຫນາມຂອງການຮຽນຮູ້ເຄື່ອງຈັກ. ລະບົບຈໍາເປັນຕ້ອງຕີຄວາມຫມາຍຂໍ້ຄວາມທີ່ສ້າງຂຶ້ນ, ນໍາໃຊ້ສຽງ intonation ທີ່ຖືກຕ້ອງໂດຍອີງໃສ່ສະພາບການ, ແລະສະແດງສຽງທັນທີ.

ເຖິງວ່າຈະມີຂໍ້ບົກພ່ອງໃນປະຈຸບັນໃນຈັງຫວະແລະການອອກສຽງສູງ, ເຕັກໂນໂລຢີການສົນທະນາສົດຍັງສືບຕໍ່ກ້າວຫນ້າຢ່າງໄວວາ. Ajustes ໃນການບີບອັດສຽງ ແລະການປະມວນຜົນ algorithms ໃນທີ່ສຸດຄວນເຮັດໃຫ້ປະສິດທິພາບຂອງສຽງທີ່ກຳນົດເອງຢູ່ໃນທຸກແພລດຟອມມືຖື.