Google công bố Magic Pointer, một con trỏ thông minh hoạt động trong bối cảnh thời gian thực và sử dụng trí tuệ nhân tạo để nhận dạng nội dung trên màn hình. Công cụ này được phát triển bởi DeepMind, bộ phận nghiên cứu AI của công ty và tiết lộ vào ngày 12 tháng 5. Hệ thống này hiện đang được thử nghiệm trong Google AI Studio và sẽ được tích hợp vào ứng dụng ghi chú Googlebook mới, dự kiến ra mắt vào cuối năm 2024.
Cách hoạt động của Con trỏ ma thuật
Magic Pointer hoạt động một cách đơn giản và trực quan. Khi người dùng di chuyển con trỏ nhẹ, hệ thống sẽ được kích hoạt và đọc nội dung trên màn hình bằng trí tuệ nhân tạo để xử lý thông tin. Không giống như các công cụ AI khác bị giới hạn trong các cửa sổ cụ thể, Magic Pointer hoạt động trực tiếp trong giao diện người dùng mà không cần các lệnh dài và cụ thể. Người dùng chỉ cần chọn nội dung đa dạng và đưa ra hướng dẫn chung, cho phép AI hiểu ngữ cảnh và thực hiện hành động tương ứng.
Tính năng thực tế được chứng minh
Trong bài kiểm tra Magic Pointer, các ví dụ về cách sử dụng trong bảng tính điện tử đã được trình bày. Khi con trỏ được định vị trên hai cột và người dùng nói “hợp nhất”, hệ thống sẽ tự động hợp nhất chúng thành một cột duy nhất. Chức năng này cũng hoạt động trong các ngữ cảnh khác, chẳng hạn như chỉnh sửa hình ảnh và tìm kiếm bản đồ. Công cụ này thể hiện tính linh hoạt trong nhiều ứng dụng.
- Hợp nhất các cột trong bảng tính bằng các lệnh đơn giản.
- Chọn và chỉnh sửa nhiều yếu tố trong hình ảnh một cách nhanh chóng.
- Tìm kiếm các mục trên trang web mà không cần sử dụng cửa sổ trợ giúp của trình duyệt.
- Tự động so sánh sản phẩm khi chọn lọc trên các trang mua sắm.
- Kích hoạt Gemini trực tiếp bằng con trỏ cho các nhiệm vụ cụ thể.
Tích hợp với Chrome và Gemini
Google giải thích rằng Magic Pointer sẽ hoạt động như một công cụ hỗ trợ cho Gemini, trí tuệ nhân tạo được tích hợp vào trình duyệt Chrome. Khi người dùng chọn nhiều sản phẩm trên một trang và nói “so sánh”, Gemini sẽ mở một tab bổ sung và tự động so sánh các mặt hàng mà không cần mở tab mới. Sự tích hợp này giúp đơn giản hóa các quy trình công việc thông thường, tiết kiệm thời gian cho các tác vụ lặp đi lặp lại. Mô hình hộp thoại được phát triển để loại bỏ các giao diện truyền thống dựa trên các lời nhắc dài, tìm kiếm các lệnh tự nhiên và phù hợp với ngữ cảnh hơn.
Trình duyệt Chrome sẽ nhận được hỗ trợ riêng cho chức năng này, cho phép người dùng kích hoạt các tính năng AI thông qua các lựa chọn trực tiếp trên trang. Cách tiếp cận này thể hiện sự tiến hóa trong cách mọi người tương tác với trợ lý kỹ thuật số, làm cho quá trình này trở nên trôi chảy hơn và ít phụ thuộc hơn vào các hướng dẫn phức tạp.
Sự sẵn có hiện tại và triển vọng trong tương lai
Người dùng muốn thử nghiệm Magic Pointer không cần phải đợi Googlebook ra mắt. Phiên bản beta hiện có sẵn trên Google AI Studio, nơi bạn có thể dùng thử công cụ này trong các tình huống chỉnh sửa hình ảnh và tìm kiếm bản đồ. Khi truy cập phiên bản dùng thử, hệ thống sẽ đánh giá độ chính xác và đưa ra phản hồi cải tiến trước khi tích hợp hoàn toàn vào ứng dụng ghi chú mới.
Sự ra mắt của Googlebook dự kiến vào cuối năm 2024, đánh dấu sự gia nhập chính thức của Magic Pointer vào thị trường. Sáng kiến này phản ánh chiến lược của Google nhằm tăng cường sự hiện diện của mình trong lĩnh vực trợ lý AI tích hợp phần cứng, theo xu hướng do Apple và Microsoft thiết lập. Vị trí của Magic Pointer như một điểm khác biệt cho thấy rằng Google đang tập trung trải nghiệm người dùng xung quanh các tương tác tự nhiên với AI, củng cố vai trò của trí tuệ nhân tạo như một yếu tố trung tâm của các thiết bị hiện đại.

