Google phát triển mô hình AI giao tiếp với cá heo

Andrew Paul 21:35 17/04/2025
Google vừa hợp tác cùng các nhà khoa học để phát triển một mô hình trí tuệ nhân tạo mang tên DolphinGemma, với mục tiêu giúp con người lần đầu tiên có thể “trò chuyện” với cá heo.

Một bước tiến công nghệ đầy hứa hẹn trong lĩnh vực giao tiếp giữa các loài đang được Google và các nhà nghiên cứu triển khai: mô hình trí tuệ nhân tạo DolphinGemma — hệ thống AI ngôn ngữ lớn (LLM) được thiết kế riêng để tương tác với cá heo — có thể sớm mở ra khả năng trò chuyện giữa con người và loài động vật thông minh bậc nhất đại dương này.

Dự kiến ra mắt trong thời gian tới, DolphinGemma sẽ được thử nghiệm cùng với một hệ thống hỗ trợ khác có tên CHAT (Cetacean Hearing Augmentation Telemetry). Hai công nghệ này được kỳ vọng có thể phân tích, mô phỏng và “phiên dịch” những âm thanh phức tạp như tiếng huýt, tiếng nhấp và các xung âm thanh đặc trưng của cá heo. Nếu thành công, đây sẽ là thành quả quan trọng sau hơn bốn thập kỷ nghiên cứu, quan sát và bảo tồn loài sinh vật biển thông minh này.

Hơn 40 năm theo dõi để hiểu một cộng đồng cá heo

Dự án được xây dựng trên nền tảng dữ liệu đồ sộ do nhóm nghiên cứu Wild Dolphin Project (WDP) thu thập trong suốt 40 năm qua. WDP đã liên tục theo dõi một cộng đồng cá heo đốm Đại Tây Dương tại vùng biển Bahamas, ghi lại hàng nghìn giờ dữ liệu âm thanh và video dưới nước. Qua đó, các nhà khoa học đã bước đầu liên hệ được một số âm thanh cụ thể với hành vi giao tiếp như gọi tên, tán tỉnh hay thậm chí là tranh cãi giữa các cá thể cá heo.

Tuy nhiên, rào cản công nghệ trong việc giải mã và phản hồi ngôn ngữ của cá heo vẫn là một thách thức lớn. Các nhà khoa học từ lâu đã tin rằng cá heo có một “ngôn ngữ” riêng, nhưng chưa có công cụ đủ mạnh để phân tích hoặc bắt chước chính xác hệ thống âm thanh phức tạp đó — cho đến khi các mô hình ngôn ngữ lớn (LLM) như ChatGPT xuất hiện.

DolphinGemma: AI phiên bản đại dương

Hợp tác cùng Google và Viện Công nghệ Georgia, nhóm WDP đã cung cấp một kho dữ liệu âm thanh khổng lồ đã được phân loại rõ ràng để huấn luyện mô hình AI. Từ đó, DolphinGemma ra đời — một mô hình có khoảng 400 triệu tham số, được xây dựng dựa trên công nghệ tương tự như hệ thống Gemini của Google. Mô hình này hoạt động tương tự các LLM khác: tiếp nhận đầu vào âm thanh, phân tích và dự đoán âm thanh tiếp theo, nhưng được “tối ưu hóa” để hiểu tiếng cá heo.

Đi cùng DolphinGemma là hệ thống CHAT - thiết bị được cài đặt trên điện thoại Google Pixel đã được điều chỉnh, đóng vai trò như một “cầu nối” giao tiếp. Dù chưa thể dịch hoàn toàn ngôn ngữ của cá heo, CHAT giúp xây dựng một vốn từ vựng chung giữa người và cá heo thông qua các tiếng huýt nhân tạo gắn với các vật thể quen thuộc như cỏ biển, tảo sargassum, hoặc những chiếc khăn mà các nhà nghiên cứu hay sử dụng.

Tương lai của những cuộc hội thoại dưới nước

Mục tiêu trong giai đoạn đầu là dạy cá heo nhận biết và sử dụng các tín hiệu nhân tạo này để biểu đạt mong muốn. Nếu thành công, điều đó đồng nghĩa với việc một cá thể cá heo có thể “nói” rằng nó muốn chơi với chiếc khăn của nhà nghiên cứu, hoặc tương tác theo cách mà con người có thể hiểu được.

Dù còn nhiều thử thách trước mắt, sự kết hợp giữa công nghệ LLM tiên tiến và hàng chục năm dữ liệu nghiên cứu đã đưa giấc mơ giao tiếp giữa người và cá heo đến gần thực tế hơn bao giờ hết. Trong tương lai không xa, những cuộc hội thoại giữa hai loài hoàn toàn có thể trở thành hiện thực. Đây không chỉ là một kỳ tích công nghệ mà còn là bước ngoặt trong hành trình khám phá và thấu hiểu thế giới tự nhiên.

Andrew Paul là nhà báo chuyên về khoa học và công nghệ của Popular Science (PopSci). Bài viết được đăng trên PopSci vào ngày 14/04/2025.

Popular Science là tạp chí khoa học nổi tiếng của Mỹ, được xuất bản từ năm 1872. Tạp chí cung cấp thông tin về các phát minh, nghiên cứu và tiến bộ trong các lĩnh vực như công nghệ, sinh học, vũ trụ học và môi trường, với cách tiếp cận dễ hiểu, giúp người đọc phổ thông tiếp cận kiến thức khoa học một cách sinh động và hấp dẫn.

Biên dịch: Thu Hoài