ChatGPT cũng sợ Toán như ai, biết nói dối khi không giải đúng
Khả năng trả lời lưu loát như người thật của ChatGPT khiến người dùng toàn cầu thích thú trò chuyện mỗi ngày. Tuy nhiên, hoá ra chatbot này cũng có nỗi 'sợ' chẳng kém ai.
Kể từ khi ra mắt vào tháng 11/2022, sự xuất hiện của công cụ trí tuệ nhân tạo (AI) mang tên ChatGPT đã khuấy đảo thế giới công nghệ.
Với tên gọi đầy đủ là Chat Generative Pre-training Transformer - một chatbot do OpenAI phát triển, ChatGPT có thể trả lời lưu loát đầy đủ các câu hỏi mà bạn đưa ra, bất kể là thắc mắc về lĩnh vực gì. Chatbot này còn có thể làm thơ, soạn nhạc, viết thư, thiết kế và thậm chí là cả sửa lỗi trong lập trình.
Sự rành rọt trong từng câu chữ của ChatGPT được các chuyên gia gọi là sức mạnh công nghệ pha chút "ma thuật". Tuy nhiên, chatbot này lại có vẻ khá kém trong toán học, theo CNBC.
Paul von Hippel, Giáo sư nghiên cứu về khoa học dữ liệu và thống kê tại Đại học Texas, cho biết ChatGPT có thể làm các phép toán cơ bản nhưng lại gặp khó khăn khi giải toán có lời văn.
Chẳng hạn, với câu hỏi "Nếu một quả chuối nặng 0,5 lbs. Trong giả là 7 lbs chuối và 9 quả cam thì tôi có tổng cộng bao nhiêu quả?", ChatGPT đã đưa ra câu trả lời là 16 quả với 7 quả chuối và 9 quả cam. Trong khi đó, câu trả lời đúng cho bài toán này phải là 23.
Một câu hỏi khác là giữa hai cầu thủ bóng rổ Shaquille O'Neal và Yao Ming ai cao hơn. Dù đưa ra thông tin chính xác rằng Yao Ming cao 7'6" và Shaquille O'Neal cao 7'1", nhưng chatbot này lại kết luận Shaquille cao hơn.
Theo The Wall Street Journal, những hạn chế của ChatGPT với toán học là điều hoàn toàn bình thường. Một siêu máy tính thành thạo Mad Libs có thể cực kỳ hiệu quả khi viết các câu trả lời đúng ngữ pháp cho bài luận, nhưng lại không phải để giải một bài toán. Đó là "gót chân Achilles" của ChatGPT.
Giáo sư Hippel chia sẻ thêm: "Chatbot này hành động giống một chuyên gia, và đôi khi nó có thể đóng giả một chuyên gia một cách thuyết phục. Nhưng công cụ này lại thường đưa ra những câu trả lời có cả thông tin đúng, sai sự thật và có thể là bịa đặt theo một cách thuyết phục".
"Chatbot này không chỉ gặp khó khăn trong việc giải Toán, mà còn không trung thực khi giải quyết vấn đề. Khi không giải được, AI thường dùng đến cách gian lận", Sarah Rasmussen, nhà toán học tại Đại học Cambridge, cũng có chung kết luận sau hàng trăm lần thử yêu cầu ChatGPT giải Toán. "ChatGPT có thể dùng đến cách gian lận chỉ để đưa ra thêm được phương án giải khác, kể cả khi nó đã tìm ra đáp án đúng", Rasmussen nói.
Trong 200 lần thử yêu cầu ChatGPT "viết 1 dưới dạng tổng của 3 số nguyên", ChatGPT thường xuyên đưa ra 2 phương án, 0+0+1 và (-1)+0+1.
Khi bị chỉ ra (-1)+0+1 không phải đáp án đúng, ChatGPT đã "biện minh" rằng đã sử dụng "tính giao hoán" và "tính chất của số 0" trong phép cộng và đưa ra các bước giải vòng vo để ngụy biện cho câu trả lời. Tuy nhiên, thực tế phép cộng sai mà AI đưa ra không liên quan đến 2 tính chất này.
Theo Debarghya Das, một kỹ sư về công cụ tìm kiếm, việc ChatGPT trả lời các vấn đề khác đúng nhưng lại làm toán sai giống như hỏi một nhóm người không biết gì về toán học nhưng lại có khả năng thu thập thông tin. "Nếu hỏi '2 + 2 bằng bao nhiêu', họ có thể trả lời rằng 'Chúng tôi thường thấy bằng 4'. Đó là cách mà ChatGPT đang hoạt động", Das cho biết.
Thực tế, CEO OpenAI - Sam Altman từng viết trên Twitter rằng: "ChatGPT vẫn còn nhiều thiếu sót nhưng nhiều người lại cho rằng nó hoàn hảo. Chúng ta không nên phụ thuộc vào chatbot này đối với những vấn đề quan trọng".
Ngay cả với ChatGPT, khi bắt đầu cuộc trò chuyện, công cụ này sẽ cảnh báo trước rằng: "Hệ thống đôi khi có thể cung cấp thông tin không chính xác hoặc gây hiểu lầm."
Theo Wall Street Journal, AI - trí tuệ nhân tạo rồi sẽ đạt đến thời điểm có thể trả lời các câu hỏi Toán học một cách chính xác. Một mô hình ngôn ngữ thuần túy có thể không đáp ứng yêu cầu, nhưng công nghệ sẽ cải thiện chúng. Thế hệ AI tiếp theo có thể kết hợp các kỹ năng ngôn ngữ của ChatGPT với các kỹ năng toán học của các nền tảng khác như Wolfram Alpha.
Tuy nhiên, nhìn chung, AI, giống như máy tính, cuối cùng sẽ hữu ích nhất cho những người đã có những hiểu biết rõ ràng về một lĩnh vực nào đó. Họ biết các câu hỏi cần đặt ra, cách xác định những thiếu sót và phải làm gì với câu trả lời được cung cấp.
Tham khảo: Wall Street Journal, Sarah Rasmussen