Đã đến lúc cần phải thay đổi chuẩn đánh giá sự thông minh của AI
Nhiều người đã từng nghĩ rằng, phép thử Turing Test do nhà khoa học Alan Turing đề xuất vào năm 1950 là một chuẩn mực để đánh giá trí thông minh nhân tạo (AI).
Tuy nhiên đã hơn 65 năm trôi qua, một số nhà khoa học nghiên cứu về AI cho rằng, chúng ta đã đến lúc cần nghĩ tới những biện pháp đo tốt hơn để theo dõi sự tiến bộ của AI.
Turing Test là một bài kiểm tra khả năng trí tuệ của máy tính. Phép thử như sau: một người chơi thực hiện một cuộc thảo luận bằng ngôn ngữ tự nhiên với một con người và một máy tính, cả hai đều cố gắng chứng tỏ mình là con người. Ba bên tham gia phép thử được cách ly với nhau. Nếu người chơi không thể nhận ra máy tính không phải là con người, máy tính đó coi như vượt qua phép thử.
Mùa hè năm ngoái, một chương trình máy tính được cậu bé người Ukraina đã dành chiến thắng tại giải Loebner, một cuộc thi trai giải thưởng lên tới 200.000 USD cho bất kỳ ai có thể tạo ra một cỗ máy vượt qua các thử nghiệm Turing Test.
Như vậy phải chăng các phép thử Turing Test dường như đang dần trở nên quá dễ dàng đối với mọi cỗ máy sở hữu trí thông minh nhân tạo?
Theo nhà khoa học nghiên cứu về nhận thức Gary Marcus đến từ ĐH. New York (Mỹ) chia sẻ với tạp chí Science Magazince, các cuộc thi như Loebner Prize tặng thưởng cho AI giống cách sử dụng "thủ thuật" để thắng giải hơn là thể hiện trí thông minh thực sự của AI.
Còn theo nhà nghiên cứu AI Stuart Russell thuộc trường ĐH California, Berkeley cho biết: "Hầu như không một AI nào có thể vượt qua bài thử nghiệm Turing Test...Những người đang nghiên cứu AI nhằm vượt qua các bài thử nghiệm Turing trong nhiều cuộc thi, tôi không rằng họ là những nhà nghiên cứu AI chính thống".
Cả hai nhà nghiên cứu có quan điểm phản pháo về việc sử dụng phép thử Turing Test cho rằng, phép thử này chỉ là một phía cạnh của trí thông minh. Một thử nghiệm duy nhất nhưng đã vô tình bỏ qua một lượng lớn các nhiệm vụ mà công việc nghiên cứu AI phải thực hiện riêng rẽ bao gồm cải thiện tầm nhìn, khả năng ký luận hay thậm chí là các thao tác vật lý hoặc vận động.
Russell, đồng tác giả cuốn sách giáo khoa chuẩn có tên "Trí thông minh nhân tạo: một phương pháp tiếp cận hiện đại" cho rằng, các thử nghiệm Turing Test thậm chí không được thiết kế để phục vụ đúng mục đích của nó. Đó là một thí nghiệm tưởng tượng được sử dụng để giải thích cách trí thông minh nhân tạo dựa vào hành vi hơn là khả năng tự nhận thức.
Phép thử Turing Test có lẽ không còn là phép thử hiệu quả để đánh giá trí thông minh nhân tạo (AI).
Đồng quan điểm với Russell, một trong những cha đẻ của khoa học nghiên cứu AI, ông Marvin Minsky đã lên án giải thưởng Loebner Prize giống như một trò hề. Minsky gọi đó là một cuộc thi "xuẩn ngốc và đáng ghét" và ông sẵn sàng bỏ tiền túi cho bất kỳ ai có thể khuyên người sáng lập Hugh Loebner xóa bỏ giải thưởng này.
Theo một số nghiên cứu chỉ ra, phép thử Turing dựa trên giả thiết rằng người ta có thể đánh giá tính "thông minh" của máy tính bằng cách so sánh hành vi của nó với hành vi của con người.
Câu hỏi đặt ra là: kết quả của phép thử có thể phản ánh thực tế, trong khi chỉ xem xét tới hành vi và so sánh với hành vi con người? Vì lý do này và những lý do khác, các nhà nghiên cứu trí tuệ nhân tạo đã đặt câu hỏi về tính hữu dụng của phép thử. Trong thực tế, kết quả của thử nghiệm có thể dễ dàng bị chi phối không phải bởi tính thông minh của máy tính, mà do kỹ năng, thái độ hoặc sự ngây thơ của người hỏi.
Tuy nhiên, một điều khá may mắn khi nhà nghiên cứu Marcus đã và đang thiết kế ra một loạt các bài thử nghiệm mới tập trung vào những tiêu chí năng lực cần cải thiện trên AI trong tương lai như "lý luận, học hỏi và ra quyết định". Theo tạp chí Science Magazine, Marcus cũng hy vọng các cuộc thi đánh giá AI mới sẽ thúc đẩy các nhà nghiên cứu phát triển nhiều cỗ máy có khả năng hiểu biết sâu sắc hơn về thế giới con người.
Tham khảo Tech Insider, Wikipedia