So sánh OpenAI với mô hình từ Trung Quốc chênh lệch hàng tỷ USD: “Bố già AI” từng đến Việt Nam nói gì?

Minh Hằng | 17:16 01/02/2025

GS Yann LeCun, người được mệnh danh là “Bố già AI” cho rằng khi so sánh việc các công ty công nghệ Mỹ chi hàng tỷ USD cho AI với startup từ Trung Quốc là có sự hiểu lầm lớn.

So sánh OpenAI với mô hình từ Trung Quốc chênh lệch hàng tỷ USD: “Bố già AI” từng đến Việt Nam nói gì? — GS Yann LeCun từng đến Việt Nam vào tháng 12/2024. Ảnh: MH

Mô hình AI của DeepSeek, một startup còn non trẻ của Trung Quốc, đang gây chấn động cộng đồng công nghệ trên thế giới, khi có chi phí vận hành thấp hơn nhiều và được đánh giá là có hiệu quả tương đương với những sản phẩm trí tuệ nhân tạo (AI) mạnh nhất hiện nay.

Việc này cũng tạo nên một làn sóng tranh luận lớn giữa các chuyên gia và doanh nhân trong lĩnh vực công nghệ. Nhiều người so sánh việc các "gã khổng lồ" nước Mỹ chi hàng tỷ USD để đầu tư vào AI với DeepSeek.

Về vấn đề này, GS Yann LeCun, Giám đốc AI của Meta, đồng thời là một trong những nhà khoa học kiệt xuất nhất trong lĩnh vực AI, mới đây viết trên mạng xã hội Threads rằng, có một sự hiểu lầm lớn về đầu tư cơ sở hạ tầng AI. Bởi phần lớn trong số hàng tỷ USD đó được đầu tư vào cơ sở hạ tầng nhằm mục đích suy luận, chứ không phải để đào tạo.

Suy luận là quá trình những mô hình AI áp dụng kiến thức đào tạo của chúng vào dữ liệu mới. Đây là cách mà các chatbot AI tạo sinh phổ biến như ChatGPT dùng để phản hồi lại yêu cầu của người dùng. Trên thực tế khi càng nhiều yêu cầu thì càng cần nhiều suy luận hơn, từ đó chi phí sẽ tăng lên.

GS LeCun đánh giá rằng, có sự hiểu lầm khi so sánh về chi phí giữa những mô hình của OpenAI với DeepSeek, một công ty khởi nghiệp mới từ Trung Quốc.

"Bố già AI" giải thích: "Việc chạy những dịch vụ trợ lý AI cho hàng tỷ người cần rất nhiều tính toán. Do đó, khi bạn đưa khả năng hiểu video, lý luận, bộ nhớ quy mô lớn và những khả năng khác vào hệ thống AI thì chi phí suy luận sẽ tăng lên. Chính vì thế, phản ứng của thị trường đối với DeepSeek là thiếu cơ sở".

*GS Yann LeCun, Giám đốc AI của Meta. Ảnh: BI*

Đồng quan điểm với GS LeCun, ông Thomas Sohmers, nhà sáng lập của Positron, một công ty khởi nghiệp về phần cứng AI, cho biết suy luận sẽ chiếm tỷ trọng lớn hơn trong chi phí về cơ sở hạ tầng AI. Nhu cầu suy luận và chi tiêu cho cơ sở hạ tầng cũng sẽ tăng nhanh chóng. Trong tương lai, khi mức độ phổ biến cao hơn, DeepSeek sẽ phải tiến hành xử lý nhiều yêu cầu hơn, từ đó buộc phải chi nhiều tiền hơn cho việc suy luận.

Mặt khác, một số chuyên gia trong lĩnh vực AI kỳ vọng rằng, với môi trường đang ngày một cạnh tranh, chi phí suy luận về lâu dài sẽ giảm. Thế nhưng, theo GS Ethan Mollick của Trường Wharton, điều này chỉ áp dụng cho những hệ thống xử lý suy luận ở quy mô nhỏ. Bởi đối với mô hình V3 của DeepSeek, khi cung cấp câu trả lời miễn phí cho lượng lớn người dùng thì chi phí suy luận có thể cao hơn nhiều.

Trong báo cáo tài chính ngày 29/1, ông Mark Zuckerberg, CEO Meta, nói rằng, sự xuất hiện của DeepSeek không khiến ông nghĩ lại về việc chi hàng trăm tỷ USD vào hạ tầng AI. CEO Meta coi DeepSeek của Trung Quốc là đối thủ cạnh tranh mới và đang học hỏi từ họ, Tuy nhiên, theo ông, vẫn còn quá sớm để xác định liệu nhu cầu về chip có ngừng tăng hay không, bởi vì chúng rất quan trọng trong đào tạo AI. Ông Mark Zuckerberg lưu ý rằng Meta đang có hàng tỷ người dùng.

DeepSeek đang gây chấn động giới công nghệ toàn cầu

*DeepSeek là công ty khởi nghiệp của Trung Quốc. Ảnh: Reuters*

DeepSeek do ông Liang Wenfeng thành lập vào tháng 5/2023. Startup này đặt trụ sở tại TP Hàng Châu (tỉnh Chiết Giang, Trung Quốc), do quỹ đầu tư High-Flyer sở hữu. Công ty DeepSeek được High-Flyer tài trợ và không có kế hoạch huy động vốn, tập trung vào việc xây dựng công nghệ nền tảng.

Theo công bố của công ty DeepSeek, R1 được đào tạo trên những chip kém tiên tiến H800 của Nvidia, mã nguồn mở 100%, rẻ hơn 96,4% so với OpenAI o1, nhưng mang lại hiệu suất tương tự. Mô hình của DeepSeek được đào tạo trên tập dữ liệu gồm 14,8 nghìn tỷ token cùng kích thước khổng lồ với 671 tỷ tham số, tức là lớn hơn 1,6 lần so với Llama 3.1 405B (token là đơn vị dữ liệu nhỏ nhất mà mô hình AI xử lý).

Vào cuối tháng 1, ông Shubham Saboo, Giám đốc sản phẩm của DeepSeek, cho biết: "Nếu OpenAI o1 mất 60 USD cho một triệu token đầu ra thì DeepSeek R1 chỉ cần 2,19 USD".

Ông Arnaud Bertrand, người sáng lập HouseTrip và Me & Qi, so sánh trên X rằng: "Về cơ bản, điều này giống như ai đó phát hành chiếc điện thoại có sức mạnh bằng với iPhone, nhưng lại bán với giá 30 USD thay vì 1.000 USD".

Thông tin này ngay lập tức đã gây ra một đợt bán tháo khiến cổ phiếu của "gã khổng lồ" Nvidia giảm 17% và "thổi bay" 600 tỷ USD giá trị của công ty trong ngày 27/1.

GS Yann LeCun từng đến Việt Nam vào tháng 12/2024 khi tham gia chuỗi sự kiện của VinFuture 2024. Ông cũng là đồng chủ nhân của Giải thưởng Chính VinFuture 2024.

Bài tham khảo nguồn: Business Insider, CNBC, X, Threads

(0) Bình luận

Xếp theo: