Google giới thiệu Magic Pointer với trí tuệ nhân tạo cho Googlebook mới

Google

Google - daily_creativity/shutterstock.com

Google đã công bố Magic Pointer, một con trỏ chuột thông minh hoạt động theo thời gian thực với khả năng nhận biết ngữ cảnh. Công cụ này được phát triển bởi DeepMind, bộ phận nghiên cứu trí tuệ nhân tạo của công ty và được tiết lộ công khai vào ngày 12 tháng 5. Hệ thống này hiện đang trong giai đoạn thử nghiệm tại Google AI Studio và sẽ được tích hợp vào sổ ghi chép trí tuệ nhân tạo Googlebook mới, dự kiến ​​ra mắt vào cuối năm 2024.

Cách hoạt động của Con trỏ ma thuật

Magic Pointer hoạt động một cách đơn giản và trực quan. Khi người dùng di chuyển con trỏ trên màn hình, hệ thống sẽ tự động được kích hoạt và đọc nội dung trực quan trong ngữ cảnh đầy đủ. Mô hình trí tuệ nhân tạo xử lý thông tin thu được và thực hiện các hành động tương ứng. Không giống như các công cụ trí tuệ nhân tạo khác bị giới hạn trong các cửa sổ chuyên dụng, Magic Pointer hoạt động trực tiếp trong giao diện người dùng mà không cần các lệnh dài và cụ thể. Người dùng chỉ cần chọn nội dung khác nhau và đưa ra hướng dẫn chung để trí tuệ nhân tạo hiểu được tình huống và thực hiện hành động thích hợp.

Tính năng thực tế được chứng minh

Trong bài kiểm tra Magic Pointer, các ví dụ về cách sử dụng trong bảng tính đã được trình bày. Khi con trỏ được định vị trên hai cột và người dùng nói “hợp nhất”, hệ thống sẽ ngay lập tức hợp nhất chúng thành một cột duy nhất. Chức năng này cũng hoạt động trong các bối cảnh khác, chẳng hạn như chỉnh sửa hình ảnh và tìm kiếm bản đồ. DeepMind đã phát hành các kịch bản ứng dụng chính cho tài nguyên:

  • Tự động hợp nhất các cột trong bảng tính bằng các lệnh đơn giản.
  • Chọn nhanh nhiều yếu tố trong hình ảnh để chỉnh sửa.
  • Tìm kiếm trong trình duyệt mà không cần sử dụng các cửa sổ phụ trợ.
  • Tự động so sánh sản phẩm trên trang web khi chọn sản phẩm.
  • Kích hoạt trực tiếp Gemini cho các tác vụ cụ thể thông qua con trỏ.

Tích hợp với Chrome và Gemini

Google giải thích rằng Magic Pointer hoạt động như một công cụ hỗ trợ cho Gemini, trí tuệ nhân tạo được tích hợp vào trình duyệt Chrome. Khi người dùng chọn nhiều sản phẩm trên một trang và nói “so sánh”, Gemini sẽ mở một tab bổ sung và tự động so sánh các mặt hàng. Sự tích hợp này giúp đơn giản hóa quy trình làm việc thông thường và giảm thời gian dành cho các tác vụ lặp đi lặp lại. Trình duyệt Chrome sẽ nhận được hỗ trợ riêng cho chức năng này, cho phép người dùng kích hoạt các tính năng trí tuệ nhân tạo thông qua các lựa chọn trực tiếp trên trang.

Mô hình hội thoại được phát triển dựa trên những lời nhắc bằng văn bản dài, thể hiện sự tiến hóa so với các giao diện truyền thống. Hệ thống tìm kiếm sự tự nhiên hơn trong bối cảnh, tránh xa các lệnh nhân tạo và hướng tới các tương tác trực quan hơn. Cách tiếp cận này thể hiện mục tiêu của Google là tạo ra một hệ thống lệnh thích ứng một cách tự nhiên với quy trình làm việc của người dùng.

Sự sẵn có hiện tại và triển vọng trong tương lai

Người dùng quan tâm đến Magic Pointer không cần phải đợi Googlebook ra mắt. Phiên bản beta hiện đã có trên Google AI Studio, cho phép thử nghiệm các tình huống chỉnh sửa hình ảnh và tìm kiếm bản đồ. Khi truy cập phiên bản dùng thử, hệ thống sẽ đánh giá độ chính xác của công cụ và đưa ra phản hồi về các cải tiến trước khi tích hợp hoàn toàn vào máy tính xách tay mới. Việc ra mắt Googlebook dự kiến ​​vào cuối năm 2024, củng cố chiến lược của Google về phần cứng với trí tuệ nhân tạo tích hợp.

Magic Pointer đánh dấu sự đi sâu trong chiến lược của Google về trợ lý trí tuệ nhân tạo tích hợp phần cứng. Các công ty như Apple và Microsoft đã đặt ra xu hướng tương tự với các trợ lý tích hợp của riêng họ. Định vị của Google thể hiện sự cạnh tranh khốc liệt trên thị trường notebook với trí tuệ nhân tạo bản địa. Điểm khác biệt của Magic Pointer nằm ở cách tiếp cận tập trung tương tác trí tuệ nhân tạo không phải như một công cụ riêng biệt mà là một thành phần thiết yếu của trải nghiệm người dùng trên thiết bị.

Xem Thêm