AI mới quét não biến suy nghĩ thành văn bản

Trong hai nghiên cứu mới đây, các nhà khoa học tại Meta đã sử dụng trí tuệ nhân tạo (AI) và kỹ thuật quét não không xâm lấn để khám phá cách biến đổi suy nghĩ thành câu chữ.

Trong nghiên cứu đầu tiên, nhóm khoa học đã phát triển một mô hình AI có thể giải mã tín hiệu não để tái tạo các câu văn mà tình nguyện viên đã gõ. Ở nghiên cứu thứ hai, họ sử dụng AI để lập bản đồ cách não bộ tạo ra ngôn ngữ, chuyển suy nghĩ thành văn bản.

Tiềm năng hỗ trợ giao tiếp cho người bị tổn thương não

Nghiên cứu này có thể mở ra cơ hội phát triển công nghệ giúp con người giao tiếp bằng suy nghĩ mà không cần cấy ghép thiết bị vào não. Điều này đặc biệt hữu ích cho những người bị tổn thương não hoặc gặp khó khăn trong việc diễn đạt ý tưởng. Nhà khoa học thần kinh Alexander Huth từ Đại học Texas, Austin, nhận định trên Live Science rằng đây là một bước tiến quan trọng trong việc giải mã suy nghĩ, đặc biệt là khi sử dụng phương pháp không xâm lấn.

Hiện nay, một số giao diện não – máy tính đã được cấy ghép vào não của những người mất khả năng giao tiếp, nhưng nghiên cứu mới có thể mở ra hướng phát triển các thiết bị đeo hỗ trợ tương tự mà không cần phẫu thuật.

Giải mã suy nghĩ bằng AI

Trong nghiên cứu đầu tiên, các nhà khoa học sử dụng phương pháp từ não đồ (MEG), giúp đo lường từ trường do các xung điện trong não tạo ra, để theo dõi hoạt động thần kinh khi người tham gia gõ câu văn. Dữ liệu thu được sau đó được dùng để huấn luyện một mô hình AI ngôn ngữ nhằm giải mã tín hiệu não và tái tạo lại các câu gõ từ dữ liệu MEG.

Mô hình này đạt độ chính xác 68% khi giải mã các chữ cái mà người tham gia đã gõ. Các chữ cái phổ biến thường được nhận diện chính xác hơn, trong khi những chữ hiếm như "Z" hay "K" có tỷ lệ lỗi cao hơn. Khi mô hình mắc lỗi, nó thường thay thế bằng những ký tự nằm gần phím cần gõ trên bàn phím QWERTY, cho thấy nó dựa vào tín hiệu vận động từ não để dự đoán ký tự được nhập.

Cách não bộ tạo ra ngôn ngữ khi gõ văn bản

Ở nghiên cứu thứ hai, nhóm khoa học tiếp tục thu thập 1.000 ảnh chụp MEG mỗi giây khi người tham gia gõ câu văn để giải mã từng giai đoạn sản sinh ngôn ngữ trong não.

Họ phát hiện rằng, trước tiên, não tạo ra thông tin về ngữ cảnh và ý nghĩa của câu, sau đó dần hình thành các cấp độ chi tiết hơn của từng từ, âm tiết và chữ cái khi người đó gõ văn bản.

"Những kết quả này xác nhận giả thuyết lâu đời rằng việc tạo ra ngôn ngữ là một quá trình phân tách có hệ thống, từ ý nghĩa tổng thể của câu đến các đơn vị nhỏ hơn, cuối cùng kiểm soát hành động vận động," nhóm nghiên cứu viết.

Ngoài ra, họ cũng phát hiện não sử dụng một "mã thần kinh động" để tránh sự chồng chéo giữa các từ hoặc chữ cái liên tiếp, giúp duy trì thông tin trong thời gian dài và liên kết các ký tự theo trình tự chính xác. Tuy nhiên, MEG chưa đủ khả năng xác định chính xác vị trí cụ thể của các hoạt động này trong não.

Tiềm năng phát triển thiết bị giao tiếp không xâm lấn

Mặc dù hai nghiên cứu trên chưa được các chuyên gia thẩm định chính thức, nhưng chúng vẫn có tiềm năng góp phần phát triển các thiết bị hỗ trợ giao tiếp không xâm lấn cho người mất khả năng nói.

Dù hệ thống hiện tại vẫn cồng kềnh và nhạy cảm, chỉ hoạt động tốt trong môi trường phòng thí nghiệm, nhưng các nhà khoa học tin rằng những tiến bộ trong công nghệ MEG có thể mở đường cho các thiết bị đeo nhỏ gọn hơn trong tương lai.

"Họ thực sự đang đi đầu trong lĩnh vực này," Huth nhận xét. "Với công nghệ hiện tại, họ đã tận dụng tối đa khả năng giải mã tín hiệu não."

Skyler Ware: Cộng tác viên của Live Science. Bài viết được đăng trên Live Science vào ngày 10/3/2025.
Live Science là trang tin khoa học uy tín, chuyên cung cấp những phát hiện, nghiên cứu và tin tức mới nhất về vũ trụ, công nghệ, sức khỏe và môi trường, với nội dung được kiểm chứng bởi các chuyên gia.