Vietnamita News

Google công bố Gemini 3.1 Flash Live trong bản cập nhật Gemini Live

Gemini
Gemini - Mehaniq/shutterstock.com

Google hôm thứ Năm đã công bố Gemini 3.1 Flash Live là mẫu âm thanh và giọng nói chất lượng cao nhất cho đến nay. Bản phát hành này thúc đẩy một số cải tiến đáng kể cho Gemini Live và Search Live. Mô hình này hiện có sẵn ở dạng xem trước thông qua Gemini Live API trong Google AI Studio. Nó nổi bật vì có độ trễ thấp hơn so với phiên bản trước và hiệu quả cao hơn trong việc nhận biết các sắc thái âm thanh như âm sắc và nhịp điệu.

Các nhà phát triển có thể thử nghiệm mô hình mới ngay lập tức để xây dựng các ứng dụng với các cuộc hội thoại đa phương thức, thời gian thực. Gemini 3.1 Flash Live lọc tiếng ồn xung quanh chính xác hơn và có thể phân biệt rõ hơn lời nói có liên quan giữa các âm thanh môi trường như giao thông hoặc tivi. Hơn nữa, hệ thống hỗ trợ hơn 90 ngôn ngữ, giúp mở rộng phạm vi tương tác trực tiếp.

  • Cải thiện khả năng nhận biết các sắc thái âm thanh như cao độ và nhịp điệu
  • Giảm độ trễ trong các cuộc hội thoại theo thời gian thực
  • Lọc tiếng ồn xung quanh và âm thanh môi trường hiệu quả hơn
  • Hỗ trợ hơn 90 ngôn ngữ cho tương tác đa phương thức

Cải tiến kỹ thuật cho mô hình âm thanh

Mô hình mới cải thiện đáng kể khả năng kích hoạt các công cụ bên ngoài trong các cuộc trò chuyện trực tiếp. Nó cũng có tính năng thực hiện tốt hơn các hướng dẫn phức tạp, giúp tổng đài viên luôn trong giới hạn hoạt động ngay cả khi các cuộc hội thoại có những bước ngoặt bất ngờ. Những thay đổi này dẫn đến phản ứng tự nhiên và đáng tin cậy hơn.

Trong Gemini Live dành cho thiết bị Android và iOS, Flash Live 3.1 mang lại phản hồi nhanh hơn với ít lần tạm dừng hơn. Hệ thống có thể theo dõi lý do của cuộc trò chuyện hai lần lần trước. Điều này cho phép các buổi động não kéo dài hơn mà không làm mất đi dòng suy nghĩ của bạn.

Gemini Live linh hoạt điều chỉnh độ dài và giọng điệu của câu trả lời cho phù hợp với bối cảnh của thời điểm đó. Người dùng cho biết tương tác mượt mà hơn và ít bị gián đoạn hơn trong quá trình sử dụng hàng ngày. Việc tích hợp với mô hình mới góp phần mang lại trải nghiệm tổng thể nhất quán hơn.

Mở rộng toàn cầu của Search Live

Google sử dụng Gemini 3.1 Flash Live để triển khai Search Live trên toàn cầu tại hơn 200 quốc gia. Bản mở rộng bao gồm tất cả các ngôn ngữ và địa điểm hiện có sẵn Chế độ AI. Tính năng này cho phép các cuộc trò chuyện tương tác với Google Tìm kiếm, bao gồm cả âm thanh và video thông qua Google Lens.

Giờ đây, người dùng có thể thực hiện tìm kiếm hội thoại theo thời gian thực với độ chính xác cao hơn trên các khu vực khác nhau. Hệ thống xử lý các truy vấn đa phương thức hiệu quả hơn trong các môi trường khác nhau. Tính khả dụng này mở rộng quyền truy cập vào thông tin giọng nói trên quy mô toàn cầu.

Tìm kiếm trực tiếp được hưởng lợi trực tiếp từ những cải tiến về nhận dạng giọng nói và giảm độ trễ. Cuộc trò chuyện với tìm kiếm trở nên tự nhiên hơn và phù hợp với ngữ cảnh hơn. Tích hợp âm thanh và video tạo điều kiện tương tác trong các tình huống thực tế hàng ngày.

Google
Google – daily_creativity/shutterstock.com

Thông tin chi tiết về ngôn ngữ và hỗ trợ đa phương thức

Hỗ trợ hơn 90 ngôn ngữ cho phép thực hiện các cuộc hội thoại đa phương thức theo thời gian thực chất lượng cao. Mô hình xử lý tốt hơn các biến thể vùng trong cách phát âm và giọng. Điều này giúp Gemini Live dễ tiếp cận hơn với người dùng ở các quốc gia khác nhau.

Các nhà phát triển có được các công cụ để tạo ra trải nghiệm được cá nhân hóa dựa trên mô hình mới. API giúp dễ dàng tích hợp vào các ứng dụng yêu cầu tương tác bằng giọng nói phong phú. Việc tập trung vào độ trễ thấp giúp cuộc trò chuyện diễn ra tự nhiên.

Ứng dụng thực tế trong sử dụng hàng ngày

Trong cuộc sống hàng ngày, Gemini Live với mô hình mới phản ứng nhanh hơn với các lệnh và câu hỏi phức tạp. Hệ thống duy trì ngữ cảnh trong thời gian dài hơn mà không cần khởi động lại lý luận. Người dùng có thể khám phá ý tưởng liên tục trong các phiên học kéo dài.

Khả năng lọc tiếng ồn môi trường giúp cải thiện hiệu suất ở những địa điểm đông đúc hoặc có âm thanh nền. Cuộc trò chuyện trong môi trường như đường phố hoặc phòng có tivi trở nên rõ ràng hơn. Điều chỉnh động âm sắc và thời lượng phản hồi phù hợp với phong cách tương tác.

Những tiến bộ trong việc tích hợp với các công cụ bên ngoài

Mô hình cải tiến kích hoạt các công cụ bên ngoài hiệu quả hơn trong các cuộc hội thoại. Nó tuân theo các hướng dẫn của hệ thống một cách nhất quán hơn ngay cả trong các hộp thoại phân nhánh. Sự ổn định này góp phần mang lại kết quả dễ dự đoán hơn trong các ứng dụng thực tế.

Nhà phát triển và người dùng cuối được hưởng lợi từ các tương tác mạnh mẽ hơn. Gemini Live trở thành một công cụ đáng tin cậy hơn cho các nhiệm vụ có nhiều bước. Sự kết hợp giữa âm thanh tiên tiến và khả năng suy luận mở rộng sẽ mở rộng khả năng sử dụng.

Google tiếp tục đầu tư vào các mô hình âm thanh để giúp tương tác AI trở nên tự nhiên hơn. Việc phát hành Gemini 3.1 Flash Live thể hiện một bước quan trọng theo hướng này. Người dùng Android và iOS có thể trải nghiệm các tính năng mới trực tiếp trong ứng dụng Gemini Live.

Cập nhật liên quan về hệ sinh thái Gemini

Thông báo này bao gồm các cải tiến bổ sung cho bảng điều khiển nổi Gemini Live trên Android. Những thay đổi này nhằm mục đích tạo điều kiện truy cập nhanh vào các chức năng giọng nói. Bộ bản cập nhật củng cố cam kết về trải nghiệm đàm thoại nâng cao.

Giờ đây, Tìm kiếm trực tiếp tiếp cận được nhiều đối tượng hơn nhờ khả năng âm thanh và video tích hợp. Mở rộng toàn cầu dân chủ hóa quyền truy cập vào tìm kiếm bằng giọng nói tương tác. Người dùng ở các khu vực khác nhau có được công cụ mạnh mẽ hơn cho các truy vấn theo thời gian thực.

Gemini 3.1 Flash Live đánh dấu một bước tiến đáng chú ý về chất lượng âm thanh và giọng nói của các mẫu máy Google. Những cải tiến về độ trễ, lọc tiếng ồn và hướng dẫn theo sau sẽ nâng cao tiêu chuẩn tương tác trực tiếp. Bản phát hành xem trước cho phép các nhà phát triển khám phá các ứng dụng mới ngay bây giờ.

To Top