Các mô hình trí tuệ nhân tạo tiên tiến ngày nay có thể viết mã máy tính và hỗ trợ khám phá dược phẩm mới. Tuy nhiên, khi nhận diện các vật thể đơn giản trong điều kiện bị xoay, thay đổi kích thước hoặc che khuất một phần, AI vẫn chưa thể vượt qua loài chuột.
Đây là kết luận từ một nghiên cứu mới được công bố trên tạp chí Patterns. Trong nghiên cứu này, các nhà khoa học từ SISSA (Ý) đã thử nghiệm một mô hình nhận diện hình ảnh và yêu cầu nó xác định các vật thể trong điều kiện thay đổi như trên. Kết quả cho thấy, dù AI rất mạnh trong nhiều lĩnh vực, loài chuột vẫn có khả năng nhận diện chính xác hơn khi đối mặt với những thử thách này.
Ban đầu, mô hình AI chưa thể sánh ngang với khả năng xử lý hình ảnh của loài chuột. Chỉ khi được tăng cường thêm tài nguyên và sức mạnh tính toán, nó mới có thể bắt kịp.
Cả AI và chuột đều nhận diện tốt các vật thể ở vị trí ban đầu. Tuy nhiên, khi các vật thể bị xoay, thay đổi kích thước hoặc che khuất một phần, AI cần được điều chỉnh và cải thiện hiệu suất mới có thể đạt độ chính xác tương đương với chuột.
Các nhà nghiên cứu cho rằng kết quả này cho thấy thị giác của loài chuột, được "tinh chỉnh" qua hàng triệu năm tiến hóa, vẫn hiệu quả hơn ngay cả so với những hệ thống nhận diện hình ảnh tiên tiến nhất hiện nay.
Chuột có thị giác linh hoạt và thích nghi vượt trội.
Thị giác của loài chuột có nhiều điểm khác biệt đáng chú ý so với con người. Trước hết, giống như nhiều loài động vật có vú khác, mắt chuột được đặt ở hai bên đầu, giúp chúng có tầm nhìn rộng hơn. Đây là một lợi thế quan trọng trong môi trường hoang dã, cho phép chúng quan sát xung quanh tốt hơn và nhanh chóng phát hiện cũng như né tránh kẻ săn mồi.
Điều đặc biệt hơn nữa là theo các nghiên cứu trước đây, mắt chuột có khả năng di chuyển theo hai hướng ngược nhau tùy theo góc nghiêng của đầu. Khi cúi xuống, chúng trông như bị "lé" do hai mắt hướng về hai phía đối lập, một đặc điểm thị giác khá hiếm gặp ở các loài động vật có vú.
Trong thí nghiệm này, các nhà nghiên cứu đã huấn luyện chuột nhận diện vật thể hiển thị trên màn hình bằng phương pháp sử dụng phần thưởng. Khi xác định đúng mục tiêu, chúng sẽ chạm vào cảm biến để gửi tín hiệu phản hồi, giúp các nhà khoa học theo dõi và đánh giá khả năng nhận diện của chúng một cách chính xác.

Để so sánh thị giác của loài chuột với AI, các nhà nghiên cứu tại SISSA đã phát triển một mạng nơ-ron tích chập (CNN). Đây là một mô hình học sâu tiên tiến, được giới kỹ sư đánh giá là một trong những hệ thống AI mạnh mẽ nhất hiện nay trong lĩnh vực nhận diện hình ảnh. Đáng chú ý, CNN được lấy cảm hứng một phần từ cách hoạt động của vỏ não thị giác ở động vật có vú.
CNN hoạt động theo cơ chế phân lớp để nhận diện đối tượng. Lớp đầu tiên, cơ bản nhất, xử lý các đặc điểm đơn giản như đường nét và độ tương phản. Các lớp tiếp theo được bổ sung để nhận diện các hình ảnh ngày càng phức tạp hơn. Tuy nhiên, mỗi lớp bổ sung đòi hỏi nhiều tài nguyên và sức mạnh tính toán hơn để vận hành. Có thể hình dung CNN giống như một chiếc bánh lasagna nhiều tầng—càng thêm lớp, hệ thống càng trở nên phức tạp và ngốn nhiều “nguyên liệu” hơn.
Các nhà nghiên cứu đã sử dụng mô hình Mạng nơ-ron tích chập (CNN) để mô phỏng khả năng nhận diện vật thể của chuột trong nhiều điều kiện khác nhau. Khi vật thể không bị che khuất và nằm ở vị trí thông thường, cả chuột và mô hình AI đều nhận diện chính xác. Trong trường hợp này, mô hình AI chỉ cần sử dụng lớp đầu tiên của nó.
Tuy nhiên, khi độ phức tạp của nhiệm vụ tăng lên, sự khác biệt bắt đầu xuất hiện. Khi vật thể bị xoay hoặc thay đổi kích thước, mô hình CNN cần bổ sung thêm nhiều lớp và sử dụng nhiều tài nguyên hơn để xử lý. Ngược lại, chuột vẫn duy trì khả năng nhận diện ổn định ngay cả khi vật thể bị biến đổi. Thậm chí, chuột còn có thể nhận diện vật thể khi chúng bị che khuất một phần, điều mà mô hình AI gặp nhiều khó khăn.
Từ những kết quả này, các nhà nghiên cứu kết luận rằng thị giác của chuột linh hoạt và có khả năng thích ứng tốt hơn so với các hệ thống nhận diện hình ảnh AI hiện tại.
Trong một tuyên bố nhà thần kinh học Davide Zoccolan - tác giả của thí nghiệm cho biết: “Chuột, vốn thường bị xem là mô hình kém hiệu quả để nghiên cứu thị giác, thực tế lại thể hiện những khả năng tinh vi buộc chúng ta phải nhìn nhận lại tiềm năng của hệ thống thị giác của chúng, đồng thời đánh giá lại những hạn chế của mạng nơ-ron nhân tạo,”
AI vẫn còn nhiều điều phải học trước khi thực thực sự đạt đến cấp độ "siêu trí tuệ"
Nghiên cứu về thị giác của chuột là một lời nhắc nhở quan trọng rằng, dù các mô hình AI hiện đại có thể thực hiện xuất sắc một số nhiệm vụ cụ thể, nhưng chúng vẫn không phải là những hệ thống hoàn hảo hay không xảy ra sai sót.
Vào cuối năm ngoái, Sam Altman, CEO của OpenAI, đã đăng một bài viết mang tính tuyên ngôn, trong đó dự đoán rằng thế giới có thể chứng kiến sự xuất hiện của AI "siêu trí tuệ" trong vòng vài nghìn ngày tới. Tương tự, tỷ phú Elon Musk cũng đưa ra dự đoán rằng AI siêu trí tuệ có thể trở thành hiện thực ngay trong năm nay.
Nhưng những cột mốc đó thực sự có ý nghĩa gì? Đúng là các mô hình ngôn ngữ lớn đã vượt qua một số bài kiểm tra tiêu chuẩn trong lĩnh vực y khoa và luật, thậm chí đạt điểm cao hơn con người. Tuy nhiên, AI vẫn chưa thể tự đưa ra chẩn đoán y khoa chính thức nếu không có sự xác nhận của bác sĩ. Trong lĩnh vực pháp lý, đã có trường hợp luật sư bị phạt và đình chỉ hành nghề vì sử dụng tài liệu pháp lý do AI tạo ra, trong đó chứa những thông tin sai lệch.
Mặt khác, các hệ thống AI tiên tiến được triển khai trong robot hai chân vẫn gặp khó khăn trong việc giữ thăng bằng. Và như nghiên cứu của SISSA cho thấy, ngay cả ở khả năng nhận diện hình ảnh, AI dường như vẫn chưa thể sánh bằng thị giác của loài chuột.
Nói cách khác, AI vẫn còn rất nhiều điều cần học hỏi, không chỉ từ con người mà cả từ thế giới động vật.