News (CN)
谷歌的人工智能系统使口头搜索适应印度十多种方言
这家科技巨头专门针对亚洲市场对其自然语言处理算法进行了强有力的更新。该搜索引擎现在可以处理十多种印度本土语言的语音命令。这项技术变革旨在以明确且直观的方式将数百万不以英语为主要语言的用户整合到全球数字生态系统中。 在官方公告中,公司高管详细介绍了新的语音识别软件架构的工作原理。该平台使用先进的机器学习来实时解码地区口音和复杂的语法结构,无需打字。实施的最初重点是农村人口、田野工人和传统识字率较低的地区。 技术基础设施专家指出,语言障碍是南亚互联网普及的最大障碍之一。通过使界面适应严格的口头命令,搜索过程中不再需要非拉丁字母的虚拟键盘。该措施为世界各地的软件开发商和硬件制造商设立了新的可访问性标准。 在线导航的历史障碍 从历史上看,互联网的架构是在英语占主导地位的情况下建立的,这在快速发展的国家中造成了接入差距。在印度这个拥有数百种方言和宪法认可的数十种语言的国家,这种限制使很大一部分人口无法使用基本的数字服务。物理或虚拟键盘始终要求一定的识字水平,但这并不能反映该国内陆几个省份的教育现实。 面对这种排他性的场景,向基于语音的界面的过渡成为一种实用且快速采用的工程解决方案。偏远村庄的居民以前依靠中介机构获取政府信息或农产品价格,现在获得了立即的自主权。口头命令用文本菜单取代了复杂的导航,简化了用户从第一次接触智能手机屏幕开始的旅程。 应用人工智能架构 这项创新的核心在于深度神经网络,该网络使用多年研究收集的 PB 级区域音频数据进行训练。软件工程师向系统提供包含同一语言或地理区域内极端语音变化的录音。这种大规模的训练使得人工智能能够理解句子的上下文,即使用户使用当地俚语或将本地术语与英语单词混合。 通过优化战略性地位于亚洲地区的云服务器,数据处理延迟已大大减少。当发出语音命令时,音频会在几毫秒内转换为文本,由搜索引擎处理,并将响应合成为与请求者相同的母语的音频。整个计算周期几乎立即发生,保证了类似于自然人类对话的流畅性。 持续更新发送到移动设备,以提高离线模式下的语音识别,无需依赖外部网络。这种技术特性对于互联网连接长期不稳定或传输速度较低的农村地区至关重要。该系统将重要的数据包存储在设备本身上,确保无论电信运营商的信号质量如何,基本搜索功能都保持活动状态。 系统组合中的语言多样性 新整合的语言列表涵盖了印度次大陆最常用的语言,确保了前所未有的大规模人口覆盖。该平台的官方支持现在包括印地语、孟加拉语、泰米尔语、泰卢固语、马拉地语、古吉拉特语、卡纳达语、马拉雅拉姆语和旁遮普语。这些语言中的每一种都具有独特的形态特征,需要公司的开发人员创建特定的语言模型。 为了确保响应的语义准确性,该公司在应用程序的 Beta 测试阶段与当地语言学家和大学建立了合作伙伴关系。这些专家帮助对算法进行精细校准,纠正可能产生误导性、断章取义或文化冒犯性搜索结果的解释错误。在任何公开更新之前,人工验证仍然是软件质量控制的严格步骤。 产品组合中这种多样性的影响直接反映在搜索平台在亚洲的参与度指标上。初步数据表明,在印度主要城市中心以外的地区,来自移动设备的每日搜索量呈指数增长。当系统以高准确率和速度响应时,消费者行为表现出对口头互动的明显偏好。 经常使用的标记说明了这些新连接人群日常生活中的范式转变: – 农业规划准确天气预报的咨询。 –...