Google chính thức ra mắt ứng dụng AI Edge Eloquent trên iOS, cho phép chuyển đổi giọng nói thành văn bản ngoại tuyến với khả năng tự động biên tập và tóm tắt thông minh.
Google AI Edge Eloquent là ứng dụng chuyển đổi giọng nói thành văn bản mới nhất của Google trên nền tảng iOS, đánh dấu bước tiến lớn trong việc nhập liệu thông minh. Khác với các công cụ truyền thống, ứng dụng này tích hợp các mô hình ngôn ngữ lớn để xử lý nội dung ngay trên thiết bị mà không cần kết nối internet.
Ứng dụng vận hành dựa trên các mô hình nhận dạng giọng nói Gemma, cho phép hiển thị nội dung theo thời gian thực khi người dùng nói. Điểm đột phá nằm ở khả năng "hậu kỳ" tức thì: ngay khi người dùng dừng lại, hệ thống sẽ tự động lọc bỏ các từ đệm thừa như "um", "ah" và điều chỉnh cấu trúc câu văn để trở nên rõ ràng, mạch lạc hơn.

Kết quả đầu ra không chỉ là những dòng ghi chép thô mà giống như một đoạn văn đã qua biên tập chuyên nghiệp. Điều này giúp người dùng tiết kiệm đáng kể thời gian chỉnh sửa văn bản sau khi thực hiện ghi âm hoặc soạn thảo bằng lời nói.
Bên cạnh khả năng chuyển đổi cơ bản, Google AI Edge Eloquent còn cung cấp bộ công cụ xử lý nội dung chuyên sâu. Người dùng có thể yêu cầu hệ thống tóm tắt ý chính, thay đổi văn phong hoặc điều chỉnh độ dài văn bản chỉ với vài thao tác đơn giản.
Đáng chú ý, ứng dụng duy trì sự cân bằng giữa hiệu suất và quyền riêng tư. Ở chế độ mặc định, dữ liệu được xử lý nội bộ trên thiết bị. Khi người dùng cần nâng cao chất lượng xử lý phức tạp, hệ thống có thể kết nối với đám mây để tận dụng sức mạnh của mô hình Gemini.
Dù hiện tại mới chỉ xuất hiện trên iOS, các thông tin rò rỉ cho thấy Google đang tích cực phát triển phiên bản dành cho Android. Dự kiến, ứng dụng này sẽ được tích hợp sâu hơn vào hệ sinh thái, có khả năng hoạt động dưới dạng nút nổi hoặc thay thế hoàn toàn bàn phím mặc định trên smartphone.
Sự ra đời của Google AI Edge Eloquent cho thấy xu hướng AI không chỉ dừng lại ở việc ghi lại âm thanh mà đã chuyển sang giai đoạn thấu hiểu và tối ưu hóa nội dung theo ngữ cảnh. Đây có thể là bước đệm để việc soạn thảo bằng lời nói trở thành phương thức giao tiếp chính trên các thiết bị di động trong tương lai gần.