Google cho phép dịch giọng nói ngay trong cuộc gọi

T.A-Thứ tư, ngày 21/05/2025 16:24 GMT+7

(Ảnh: Getty Images)

bangdatally.xyz - Google chính thức triển khai tính năng dịch giọng nói trực tiếp trong cuộc gọi video, cho phép tái hiện giọng nói, ngữ điệu và biểu cảm của người nói một cách tự nhiên.

Tại hội nghị thường niên Google I/O 2025 diễn ra ngày 21/5, CEO Sundar Pichai giới thiệu công nghệ mới như một bước tiến nhằm "phá vỡ rào cản ngôn ngữ", đồng thời xác nhận Google Meet sẽ là nền tảng đầu tiên tích hợp tính năng này.

"Công nghệ này có thể đồng bộ giọng nói, ngữ điệu, thậm chí cả biểu cảm của người nói gần như theo thời gian thực", ông Pichai nói. "Điều này giúp con người tiến gần hơn đến những cuộc trò chuyện tự nhiên, liền mạch giữa các ngôn ngữ".

Trong video giới thiệu, lời nói bằng tiếng Tây Ban Nha được AI chuyển đổi sang tiếng Anh một cách mượt mà và tự nhiên, và ngược lại, dù vẫn tồn tại độ trễ nhỏ. Đáng chú ý, hệ thống sử dụng chính giọng nói gốc của người dùng để tái tạo bản dịch, trong khi âm thanh ban đầu vẫn được giữ lại với âm lượng nền thấp, tạo cảm giác chân thực và liên tục trong hội thoại.

Google cho phép dịch giọng nói ngay trong cuộc gọi - Ảnh 1.

Google Meet bổ sung tính năng dịch cuộc gọi theo thời gian thực (Ảnh: Google)

Tính năng này được đánh giá sẽ hữu ích trong nhiều tình huống, từ kết nối giữa các thành viên gia đình sống ở nhiều quốc gia, đến việc hỗ trợ giao tiếp trong các doanh nghiệp đa quốc gia. Theo Google, công nghệ mới sở hữu độ trễ rất thấp - yếu tố mà các giải pháp hiện tại chưa thể đáp ứng.

Giai đoạn đầu, tính năng chỉ hỗ trợ dịch giữa tiếng Anh và tiếng Tây Ban Nha, dành riêng cho người dùng gói Google AI Pro và Ultra. Hãng cho biết sẽ sớm bổ sung thêm nhiều ngôn ngữ mới trong "vài tuần tới", đồng thời mở rộng thử nghiệm cho khách hàng doanh nghiệp sử dụng Google Workspace trong năm nay.

Dịch giọng nói theo thời gian thực là một trong những thành quả quan trọng của dự án Starline được Google công bố năm 2021. Dự án hướng tới việc mang lại trải nghiệm gọi điện với cảm giác chân thực như đang trò chuyện trực tiếp.

Bên cạnh những công nghệ ngôn ngữ tiên tiến, Google còn phát triển hệ thống camera 3D giúp tái hiện hình ảnh người gọi một cách sống động. Tại sự kiện Google I/O 2025, hãng cũng giới thiệu Google Beam - thiết bị phần cứng hỗ trợ các cuộc gọi trong khuôn khổ dự án này.

AirPods sắp có tính năng phiên dịch trực tiếp AirPods sắp có tính năng phiên dịch trực tiếp

bangdatally.xyz - Apple đang lên kế hoạch bổ sung tính năng dịch trực tiếp cho AirPods, giúp tai nghe có thể dịch các cuộc hội thoại sang ngôn ngữ khác theo thời gian thực.

* Mời quý độc giả theo dõi các chương trình đã phát sóng của Đài Truyền hình Việt Nam trên TV OnlineVTVGo!

Cùng chuyên mục

TIN MỚI

    X

    ĐANG PHÁT

    Bản tin thời tiết chào buổi sáng 3 phút trước