Điểm mù trong bộ dữ liệu AI: Bỏ qua giá trị con người

The Conversation 11:04 14/03/2025
Điều này có ý nghĩa gì trong việc quản trị và đạo đức AI?

Các đồng nghiệp của tôi và tôi tại Đại học Purdue đã phát hiện một sự mất cân bằng rõ rệt trong các giá trị con người được tích hợp vào các hệ thống AI. Những hệ thống này chủ yếu tập trung vào các giá trị thông tin và tiện ích, trong khi lại thiếu chú trọng đến các giá trị liên quan đến xã hội, phúc lợi và quyền công dân.

Tại trung tâm của nhiều hệ thống AI là một kho dữ liệu khổng lồ bao gồm hình ảnh, văn bản và các loại dữ liệu khác được sử dụng để huấn luyện các mô hình. Mặc dù các bộ dữ liệu này được biên tập rất tỉ mỉ, nhưng đôi khi vẫn chứa đựng những nội dung không đạo đức hoặc bị cấm.

Để đảm bảo rằng các hệ thống AI không sử dụng những nội dung có hại khi trả lời người dùng, các nhà nghiên cứu đã giới thiệu phương pháp học tăng cường từ phản hồi của con người. Các bộ dữ liệu được biên tập kỹ lưỡng về sở thích của con người được sử dụng để định hướng hành vi của các hệ thống AI sao cho hữu ích và trung thực.

Trong nghiên cứu của chúng tôi, chúng tôi đã xem xét ba bộ dữ liệu huấn luyện mã nguồn mở được sử dụng bởi các công ty AI hàng đầu tại Mỹ. Chúng tôi xây dựng một phân loại các giá trị con người thông qua tổng quan tài liệu từ triết lý đạo đức, lý thuyết giá trị và nghiên cứu về khoa học, công nghệ và xã hội.

Các giá trị này bao gồm phúc lợi và hòa bình, tìm kiếm thông tin, công lý, quyền con người và quyền động vật, nghĩa vụ và trách nhiệm, trí tuệ và kiến thức; văn minh và khoan dung, và sự đồng cảm cùng lòng hữu ích. Chúng tôi sử dụng phân loại này để ghi chú thủ công một bộ dữ liệu, và sau đó sử dụng những ghi chú này để huấn luyện một mô hình ngôn ngữ AI.

Mô hình của chúng tôi cho phép chúng tôi kiểm tra các bộ dữ liệu của các công ty AI. Chúng tôi phát hiện rằng các bộ dữ liệu này chủ yếu huấn luyện các hệ thống AI trở nên hữu ích và trung thực khi người dùng đặt các câu hỏi như “Làm thế nào để tôi đặt vé máy bay?”.

Tuy nhiên, chúng lại thiếu các ví dụ về cách trả lời các câu hỏi liên quan đến sự đồng cảm, công lý và quyền con người. Nhìn chung, trí tuệ và kiến thức cùng với việc tìm kiếm thông tin là hai giá trị phổ biến nhất, trong khi công lý, quyền con người và quyền động vật lại là những giá trị hiếm hoi nhất trong bộ dữ liệu.

Tại sao điều này lại quan trọng

Sự mất cân bằng trong các giá trị con người được tích hợp vào bộ dữ liệu huấn luyện AI có thể ảnh hưởng lớn đến cách các hệ thống AI tương tác với con người và tiếp cận các vấn đề xã hội phức tạp. Khi AI ngày càng trở nên phổ biến trong các lĩnh vực như pháp luật, y tế và mạng xã hội, việc đảm bảo rằng các hệ thống này phản ánh đầy đủ và công bằng các giá trị chung của xã hội là vô cùng quan trọng, để chúng phục vụ con người một cách đạo đức và hiệu quả.

Nghiên cứu này cũng xuất hiện vào thời điểm quan trọng đối với chính phủ và các nhà hoạch định chính sách khi xã hội đang đối mặt với nhiều câu hỏi về cách thức quản lý và đạo đức trong AI. Việc hiểu rõ các giá trị được tích hợp trong các hệ thống AI là yếu tố cần thiết để đảm bảo rằng chúng phục vụ đúng lợi ích của nhân loại.

Các nghiên cứu khác đang được tiến hành

Nhiều nhà nghiên cứu đang nỗ lực điều chỉnh các hệ thống AI sao cho phù hợp hơn với các giá trị con người. Việc áp dụng phương pháp học tăng cường từ phản hồi của con người là một bước đột phá, vì nó cung cấp cách tiếp cận để điều hướng hành vi của AI, khiến chúng trở nên hữu ích và trung thực hơn.

Các công ty AI cũng đang phát triển các kỹ thuật để ngăn ngừa các hành vi có hại trong các hệ thống này. Tuy nhiên, nhóm nghiên cứu của chúng tôi là những người đầu tiên giới thiệu một phương pháp có hệ thống để phân tích và nhận diện chính xác những giá trị đang được tích hợp vào các hệ thống AI thông qua các bộ dữ liệu.

Phương pháp tiếp theo là gì?

Bằng cách làm rõ các giá trị được tích hợp trong các hệ thống này, chúng tôi hy vọng có thể giúp các công ty AI xây dựng các bộ dữ liệu cân bằng hơn, phản ánh chính xác hơn những giá trị của cộng đồng mà họ phục vụ. Các công ty có thể áp dụng phương pháp của chúng tôi để xác định các điểm yếu trong bộ dữ liệu và cải thiện sự đa dạng trong quá trình huấn luyện AI của họ.

Mặc dù các công ty mà chúng tôi nghiên cứu có thể không còn sử dụng các phiên bản bộ dữ liệu trước đây, nhưng họ vẫn có thể tận dụng quy trình của chúng tôi để đảm bảo rằng các hệ thống AI của họ phù hợp với các giá trị và chuẩn mực xã hội trong tương lai.

The Conversation: là một trang web tin tức và bình luận độc lập, phi lợi nhuận, được xuất bản bởi các học giả và nhà báo. Nội dung của The Conversation được viết bởi các chuyên gia trong lĩnh vực học thuật và nghiên cứu, và được biên tập bởi các nhà báo giàu kinh nghiệm.

Biên dịch: Hà Linh