Xuất hiện siêu AI thông minh hơn ChatGPT: Vượt qua kỳ thi SAT với số điểm thuộc nhóm 10% cao nhất

Anh Ngọc | 13:58 15/03/2023

Ngày 14/3, công ty phát triển ChatGPT, OpenAI chính thức công bố mô hình ngôn ngữ mới với tên GPT-4. CEO OpenAI cho biết, mô hình này "vẫn còn lỗi và chưa hoàn hảo" nhưng có thể đỗ đại học mà không cần luyện thi hay vượt qua 90% số người tham gia kỳ thi sát hạch luật sư.

Xuất hiện siêu AI thông minh hơn ChatGPT: Vượt qua kỳ thi SAT với số điểm thuộc nhóm 10% cao nhất

Trong sự kiện công bố mô hình ngôn ngữ GPT-4 vào ngày 14/3, Sam Altman, CEO OpenAI, cho biết mô hình trí tuệ nhân tạo mới được cải tiến theo hướng sáng tạo hơn và ít thiên vị hơn so với bản trước đó. "Cha đẻ" của ChatGPT nhấn mạnh đây là công nghệ AI tiên tiến chưa từng có và được đào tạo bằng cách sử dụng phản hồi của con người kết hợp với công nghệ deep learning (học sâu).

Theo CEO OpenAI, GPT-4 có nhiều "siêu năng lực" mà các hệ thống AI hiện chưa thể đạt được. Trong đó có thể kể đến, mô hình này có thể đạt 1.410 điểm trong kỳ thi SAT, một trong những kỳ thi khó nhất tại Mỹ và đạt 4/5 điểm của các kỳ thi nâng cao trước đại học (AP - Advanced Program). Đây là số điểm của 10% người xếp hạng đầu tiên.

Ngoài ra, mô hình AI mới có thể vượt qua 90% số người tham gia trong kỳ thi sát hạch luật sư và 99% học sinh thi Olympic Sinh học. Nó cũng đạt điểm cao nhất trong ít nhất 34 bài kiểm tra khác nhau trong các lĩnh vực như kinh tế vĩ mô, viết bài, toán học...

Đại diện OpenAI chia sẻ: "GPT-4 có thể thể hiện hiệu suất ở cấp độ con người trong phần lớn kỳ thi học thuật và chuyên nghiệp".

Bên cạnh đó, công ty cũng khẳng định GPT-4 có thể lập trình bằng nhiều ngôn ngữ khác nhau, tạo các kịch bản nội dung tùy theo yêu cầu, trả lời các câu hỏi phức tạp cũng như tương tác với hình ảnh. Đây là những điều mà mô hình GPT 3.5 đang tích hợp trong ChatGPT chưa thể làm được.

Với khả năng tạo văn bản nhiều hơn 8 lần so với mô hình cũ, OpenAI cho biết AI mới có thể được sử dụng như một công cụ giảng dạy cho sinh viên.

Đại diện OpenAI cho biết, công ty đã mất 6 tháng để tinh chỉnh GPT-4 theo hướng an toàn và phù hợp hơn. "GPT-4 có khả năng phản hồi các yêu cầu về nội dung không được phép thấp hơn 82% và khả năng tạo ra phản hồi thực tế cao hơn 40% so với GPT-3.5", vị đại diện này chia sẻ.

OpenAI viết trên trong một bài đăng trên blog: "Trong một cuộc trò chuyện thông thường, sự khác biệt giữa GPT-3.5 và GPT-4 có thể rất khó nhận biết. Chúng chỉ xuất hiện khi yêu cầu đưa ra đủ phức tạp. GPT-4 đáng tin cậy hơn, sáng tạo hơn và sẽ có nhiều hướng giải quyết vấn đề hơn".

Trước đấy, nhiều người cho rằng GPT-4 có thể dẫn đến “trí tuệ nhân tạo tổng quát” hay AGI. Đây là thuật ngữ chỉ một AI có thể hiểu và học hỏi mọi nhiệm vụ tư duy của con người. Tuy nhiên, CEO OpenAI, Sam Altman, lại cho rằng điều này là không thể. "Tin đồn về GPT-4 là một điều lố bịch," Altman nói trong cuộc phỏng vấn với SeriousVC.

Mira Murati, CTO OpenAI, cho biết GPT-4 sẽ giúp các giáo viên vui vẻ và sử dụng chatbot như một công cụ để giúp soạn giáo án. Thay vì trước kia, họ cho thường bất mãn và tin rằng chatbot AI này khuyến khích gian lận, đạo văn và có thể cướp đi công việc của họ.

"Với ChatGPT, bạn có thể có sự tương tác vô hạn và giúp bạn theo nhiều cách mới lạ dựa trên những bối cảnh khác nhau. Công cụ này sẽ giống như một gia sư cá nhân vậy”, Murati chia sẻ.

Tuy nhiên, OpenAI cảnh báo rằng mô hình mới chưa hoàn hảo và vẫn kém hơn con người trong nhiều tình huống. Mô hình ngôn ngữ này vẫn gặp vấn đề lớn về "ảo giác", bịa đặt thông tin và vẫn có xu hướng khẳng định mình đúng khi đưa ra câu trả lời sai.

"GPT-4 vẫn còn nhiều hạn chế như 'ảo giác', đưa ra thông tin không chính xác hoặc có 'thái độ' với người dùng. Chúng tôi đang nỗ lực giải quyết những vấn đề này", đại diện OpenAI cho biết.

OpenAI cho biết, hiện người dùng trả tiền cho ChatGPT Plus có thể bắt đầu thử nghiệm với mô hình GPT-4 mới thông qua danh sách chờ.

Tham khảo: CNBC, BI


(0) Bình luận
Xuất hiện siêu AI thông minh hơn ChatGPT: Vượt qua kỳ thi SAT với số điểm thuộc nhóm 10% cao nhất
POWERED BY ONECMS - A PRODUCT OF NEKO