ChatGPT để lộ "gót chân Achilles": Có thể viết code, làm luận văn, thi đỗ MBA nhưng lại không thể giải toán?

Anh Ngọc | 17:51 05/02/2023

Theo CNBC, ChatGPT, chatbot đang “làm mưa làm gió” trong những tháng gần đây, được cho là có thể “trả lời câu hỏi như người thật”, trình bày ý tứ một cách logic, có chiều sâu và cực kỳ trôi chảy cho các câu hỏi phức tạp. Tuy nhiên, chatbot này lại có vẻ khá kém trong toán học.

ChatGPT để lộ "gót chân Achilles": Có thể viết code, làm luận văn, thi đỗ MBA nhưng lại không thể giải toán?

Kể từ khi ra mắt vào tháng 11/2022, chatbot ChatGPT của OpenAI đã bùng nổ trong nhiều lĩnh vực, bao gồm cả giáo dục. Nhiều trường học ở New York (Mỹ) đã cấm quyền truy cập vào trang web này trong trường học. Bên cạnh đó, các giáo sư cũng sửa đổi lại giáo trình, cách giảng dạy để ngăn học sinh sử dụng công cụ này “làm bài tập hộ” và gian lận trong thi cử.

Tuy nhiên, dường như ChatGPT cũng đã để lộ “gót chân Achilles” khi bị phát hiện khá tệ trong môn toán. Paul von Hippel, giáo sư nghiên cứu về khoa học dữ liệu và thống kê tại Đại học Texas, cho biết: “Tôi không thấy các giảng viên toán bày tỏ lo ngại về chatbot này. Tôi không chắc công cụ này có hữu ích cho toán học không nhưng điều này khá lạ vì toán học thường là lĩnh vực thử nghiệm đầu tiên cho các thiết bị máy tính”.

ChatGPT có thể làm các phép toán cơ bản nhưng lại gặp khó khăn khi giải toán có lời văn. Chẳng hạn, với câu hỏi “Nếu một quả chuối nặng 0,5 lbs. Tôi có 7 lbs chuối và 9 quả cam thì tôi có tổng cộng bao nhiêu quả?”, ChatGPT lại đưa ra câu trả lời là 16 quả với 7 quả chuối và 9 quả cam. Trong khi đó, câu trả lời đúng cho bài toán này phải là 23.

ChatGPT gặp khó khăn khi giải toán có lời văn. Ảnh: Wall Street Journal

Hay nếu hỏi ChatGPT giữa Shaquille O'Neal và Yao Ming ai cao hơn, chatbot này sẽ đưa ra thông tin chính xác rằng Yao Minh cao 7'6" và Shaquille O'Neal cao 7'1". Nhưng kết luận công cụ này đưa ra lại là Shaquille cao hơn. Hay chatbot này sẽ tính sai phép tính căn bậc hai của các số lớn.

Theo The Wall Street Journal, những hạn chế của ChatGPT với toán học là điều có hoàn toàn bình thường. Chatbot này giống như tính năng tự động hoàn thành câu nhưng phức tạp hơn. Một siêu máy tính thành thạo Mad Libs có thể cực kỳ hiệu quả khi viết các câu trả lời đúng ngữ pháp cho bài luận nhưng không phải để giải một bài toán. Đó là “gót chân Achilles” của ChatGPT.

Giáo sư Hippel chia sẻ thêm: “Chatbot này hành động giống một chuyên gia, và đôi khi nó có thể đóng giả một chuyên gia một cách thuyết phục. Nhưng công cụ này lại thường đưa ra những câu trả lời có cả thông tin đúng, sai sự thật và có thể là bịa đặt theo một cách thuyết phục”.

Theo Debarghya Das, một kỹ sư về công cụ tìm kiếm, việc ChatGPT trả lời các vấn đề khác đúng nhưng lại làm toán sai giống như hỏi một nhóm người không biết gì về toán học nhưng lại có thể thu thập thông tin. “Nếu hỏi ‘2 + 2 bằng bao nhiêu’, họ có thể trả lời rằng ‘Chúng tôi thường thấy bằng 4’. Đó là cách mà ChatGPT đang hoạt động”, Das cho biết.

CEO OpenAI Sam Altman từng viết trên Twitter rằng: “ChatGPT cực kỳ hạn chế, nhưng đủ tốt ở một số khía cạnh để tạo ra những thông tin sai lệch. Việc dựa vào chatbot này hoàn toàn là một sai lầm”.

Khi bắt đầu cuộc trò chuyện với ChatGPT, công cụ này sẽ cảnh báo trước: “Mặc dù chúng tôi có các biện pháp bảo vệ, hệ thống đôi khi có thể tạo thông tin không chính xác hoặc gây hiểu lầm”.

ChatGPT giải sai bài toán tìm x cho phép tính 3x + 4 = 11. Ảnh: Wall Street Journal

Conrad Wolfram, Giám đốc chiến lược của Wolfram Research, công ty phát triển trang web giải toán Wolfram Alpha, chia sẻ: “Toán học là ngành có cách mạng lớn nhất dựa trên máy móc mà tôi biết”. Trong khi giáo viên tiếng Anh vẫn còn những lo lắng việc học sinh dùng máy tính để “làm bài tập hộ”, giáo viên toán từ lâu đã phải đảm bảo rằng học sinh thực sự hiểu toán học mà không đơn thuần là sử dụng máy tính để tính toán.

“Kể từ khi máy tính ra đời, khái niệm về toán học, khoa học và kỹ thuật có trở nên đơn giản hay không? Câu trả lời là không, hoàn toàn ngược lại. Chúng ta liên tục có những câu hỏi khó và rắc rối hơn”, Ông Wolfram nói.

Theo Wall Street Journal, trí tuệ nhân tạo cuối cùng cũng sẽ có thể trả lời các câu hỏi toán học chính xác một cách tự tin. Một mô hình ngôn ngữ lớn thuần túy có thể không phù hợp với công việc, nhưng công nghệ sẽ cải thiện chúng. Thế hệ AI tiếp theo có thể kết hợp các kỹ năng ngôn ngữ của ChatGPT với các kỹ năng toán học của Wolfram Alpha.

Tuy nhiên, nhìn chung, AI, giống như máy tính, cuối cùng sẽ hữu ích nhất cho những người đã có những hiểu biết rõ ràng về một lĩnh vực nào đó. Họ biết các câu hỏi cần đặt ra, cách xác định những thiếu sót và phải làm gì với câu trả lời được cung cấp.

Tham khảo: Wall Street Journal