Sau 15 tháng im lặng, liệu DeepSeek V4 có trở thành “bom tấn” AI hay sẽ là cú hụt hơi lớn nhất của Trung Quốc?

Nghiêm Khiết | 09:46 16/04/2026

Một năm qua, điều gì đã thực sự xảy ra với DeepSeek?

Sau 15 tháng im lặng, liệu DeepSeek V4 có trở thành “bom tấn” AI hay sẽ là cú hụt hơi lớn nhất của Trung Quốc?

Theo tờ 36Kr, giới công nghệ Trung Quốc hiện nay đang nổi lên một câu hỏi lớn: liệu DeepSeek V4 liệu có phát hành hay không?

Trong hơn một năm qua, các mô hình ngôn ngữ lớn (LLM) toàn cầu đã bước vào giai đoạn cạnh tranh khốc liệt. Các tập đoàn công nghệ lớn như OpenAI, Anthropic và Google về cơ bản duy trì nhịp độ cập nhật liên tục, với chu kì nâng cấp sau mỗi 2-3 tháng, thậm chí là hàng tháng. Các phiên bản mới nhanh chóng được đưa ra thị trường để thử nghiệm, kiểm chứng và tiếp tục hoàn thiện.

Trong khi đó, suốt 15 tháng qua, DeepSeek đã chậm lại nhịp độ cập nhật các phiên bản lớn. V4 nhiều lần bị trì hoãn, nhịp độ tụt hậu rõ rệt, từ vị thế dẫn đầu ngành giờ đây đã trở thành người chậm nhịp.

Chính sự chờ đợi đầy lo lắng của giới công nghệ Trung Quốc đã dần biến thành vòng xoáy hoài nghi.

Đầu tháng 4, một số cơ quan truyền thông Trung Quốc bất ngờ đưa tin: DeepSeek V4 có thể sẽ được phát hành trong vài tuần tới, nhưng không nên đặt kỳ vọng quá cao vào phiên bản này.

Tại sao một đợt phát hành được mong đợi từ lâu lại phải "tiêm phòng kì vọng" từ trước như vậy?

Trong một năm qua, DeepSeek thực sự đã trải qua những gì?

Sự thật có lẽ nằm trong một mẩu tin bị đa số mọi người bỏ qua.

Tháng 1 năm 2025, hãng tin Reuters tiết lộ một chi tiết: Sau khi DeepSeek R1 ra mắt, các cơ quan liên quan đã “khuyến khích” DeepSeek sử dụng bộ vi xử lý Ascend của Huawei, thay vì tiếp tục sử dụng Nvidia.

Hai chữ “khuyến khích” trong bối cảnh đó mang sức nặng, vượt xa nghĩa đen. DeepSeek không phải là một công ty khởi nghiệp bình thường.

DeepSeek được coi là hình mẫu thành công đầu tiên của AI Trung Quốc trong việc phá vỡ sự phong tỏa công nghệ từ Mỹ. Ý nghĩa biểu tượng này đã khiến DeepSeek nhanh chóng từ một công ty công nghệ thuần túy trở thành quân cờ then chốt trong bàn cờ chiến lược tự chủ công nghệ quốc gia.

Theo thông tin từ 36Kr cho biết, đầu năm 2025, DeepSeek thực sự đã nỗ lực sử dụng chip Huawei Ascend 910C để huấn luyện mô hình thế hệ tiếp theo.

*Hình ảnh minh hoạ chip Huawei Ascend 910C*

Tuy nhiên, quá trình này đã vấp phải nhiều rào cản kỹ thuật: độ ổn định huấn luyện không đủ, thường xuyên bị sập hệ thống trong các kịch bản phân tán quy mô lớn, và tốc độ giao tiếp giữa các chip không đạt kỳ vọng.

Dù Huawei đã cử đội ngũ kỹ sư đến tận trụ sở DeepSeek để hỗ trợ trực tiếp, nhưng cuối cùng vẫn không giải quyết được vấn đề tương thích trong giai đoạn huấn luyện.

Kết quả là một sự thỏa hiệp, DeepSeek quay lại sử dụng GPU Nvidia cho giai đoạn huấn luyện, còn chip Ascend chỉ được dùng cho khâu suy luận.

Điều này đồng nghĩa rằng, riêng ở khâu là huấn luyện, vốn là mắt xích cốt lõi, DeepSeek đã mất gần một năm để thử sai.

Nhưng câu chuyện thích ứng không dừng lại ở đó. Năm 2026, phiên bản V4 xuất hiện những tín hiệu mới.

Theo các nguồn tin rò rỉ mà 36Kr thu thập được, DeepSeek đã không mở quyền thử nghiệm sớm cho Nvidia, mà ưu tiên bàn giao phiên bản tiền phát hành cho dòng chip thế hệ mới Ascend 950PR của Huawei để tương thích hóa.

Đồng thời, để phân tán rủi ro, họ cũng đồng bộ hóa việc thích ứng với chip Cambricon Technologies (công ty được mệnh danh là “Nvidia của Trung Quốc”).

*Sự kiện ra mắt chip Ascend 950PR của Huawei*

Tuy nhiên, những thách thức kỹ thuật vẫn rất đáng kể.

Theo 36Kr, khó khăn cốt lõi của công tác thích ứng nằm ở việc “đối chiếu độ chính xác”, đảm bảo mô hình cho ra kết quả nhất quán trên các hệ sinh thái phần cứng khác nhau.

Điều này đòi hỏi phải điều chỉnh một lượng lớn mã nguồn tầng thấp.

Khi các hãng lớn toàn cầu duy trì nhịp độ nâng cấp mô hình từ 2-3 tháng, DeepSeek lại ngày càng chậm lại.

Trong khoảng thời gian đó, có lẽ một tỷ lệ rất lớn tài nguyên kỹ thuật đã được đổ vào việc thích ứng với chip nội địa Trung Quốc.

Suy cho cùng, chip nội địa của Trung Quốc và chip Nvidia của Mỹ vẫn tồn tại khoảng cách về hiệu năng thế hệ, độ trưởng thành của hệ sinh thái và sự hoàn thiện của chuỗi công cụ (toolchain), khiến quá trình tương thích hóa mô hình tiêu tốn cực kỳ nhiều thời gian.

Điều này tạo ra một sự khác biệt rõ rệt so với lộ trình ban đầu của DeepSeek là thuần túy theo đuổi việc nâng cao hiệu năng mô hình.

Bên cạnh đó, sự liên kết ở cấp độ chuỗi ngành cũng đang diễn ra đồng thời. Đầu năm 2026, thị trường rộ lên tin đồn Alibaba, ByteDance và Tencent đã đặt hàng hàng trăm nghìn chip Ascend 950PR từ Huawei.

Một giả thuyết hợp lý là: các nhà cung cấp dịch vụ điện toán đám mây đang chờ kết quả kiểm chứng từ DeepSeek V4 để đánh giá khả năng sử dụng thực tế của chip nội địa trong huấn luyện AI quy mô lớn.

Nếu DeepSeek V4 vận hành thành công, chip Huawei 950PR sẽ được nâng cấp vai trò thử nghiệm công nghệ thành sản phẩm thương mại hóa.

Ngược lại, nếu không đạt kỳ vọng, kết quả này cũng đồng nghĩa với việc giúp toàn ngành xác định rõ giới hạn năng lực hiện tại của các dòng chip nội địa Trung Quốc.

Xét trên tiêu chuẩn công bố đặc biệt của CEO DeepSeek – Lương Văn Phong, với nguyên tắc “không đạt kì vọng thì không công bố”, việc DeepSeek V4 chuẩn bị ra mắt cho thấy nhiều khả năng mô hình này đã vượt qua các bài kiểm thử về hiệu quả ở khâu suy luận.

Nếu được xác nhận thành công, đây có thể trở thành bước ngoặt quan trọng, mở đường để DeepSeek, cũng như toàn ngành AI Trung Quốc tiến tới mục tiêu tự chủ công nghệ.

Việc chủ động gánh vác trọng trách kiểm chứng hệ sinh thái năng lực tính toán chip nội địa của Trung Quốc khiến DeepSeek giống như một công ty mang sứ mệnh quốc gia hơn là một doanh nghiệp thuần túy theo đuổi lợi nhuận.

Nhưng cái giá của sự chuyển đổi là rất rõ ràng: nhịp độ ngắn hạn chậm lại, áp lực nhân tài gia tăng và năng lực cạnh tranh tạm thời bị chững lại.

Theo dữ liệu từ nhiều đơn vị đánh giá độc lập và cộng đồng trong tháng 3-4 năm 2026, trong các bài kiểm tra chuẩn (benchmark) bên thứ ba, năng lực tạo mã (code generation) của DeepSeek đã bị dòng Claude 4 (Opus 4.6 / Sonnet 4.6) vượt mặt đáng kể.

Khả năng xử lý đa phương thức của DeepSeek cũng chủ yếu chỉ giới hạn ở văn bản và hình ảnh, tụt hậu xa so với biểu hiện của Claude và GPT trong việc phân tích hình ảnh, sử dụng máy tính (computer use) và hiểu video.

Bước sang năm 2026, DeepSeek chuyển trọng tâm sản phẩm sang hệ thống Agent, một hướng kĩ thuật có độ thách thức hơn.

Dựa trên phản hồi hiện tại từ cộng đồng, DeepSeek đã tiếp cận nhóm dẫn đầu trong lĩnh vực Code Agent và Search Agent tiếng Trung, nhưng vẫn còn khoảng cách hệ thống rõ rệt so với các mô hình đỉnh cao quốc tế của OpenAI hay Google ở các khía cạnh phối hợp đa công cụ, thực thi nhiệm vụ chuỗi dài và độ bền bỉ trong môi trường thực tế.

Khoảng cách này không phản ánh sự suy giảm năng lực công nghệ, mà dường như trở thành kết quả của sự đánh đổi giữa cạnh tranh thị trường và chiến lược Quốc gia của Trung Quốc.

Từ nửa cuối năm 2025, đội ngũ nhân sự cốt lõi của DeepSeek bắt đầu có sự lung lay. Các nhân sự chủ chốt như Vương Bỉnh Tuyên (tác giả cốt lõi của mô hình ngôn ngữ lớn DeepSeek thế hệ đầu tiên), Quách Đạt Nhã (tác giả cốt lõi của R1), Ngụy Hạo Nhiên (phụ trách OCR), Nguyễn Trưng (người phụ trách đa phương thức) đã lần lượt rời đi.

Đằng sau những cái tên là sự tích lũy kỹ thuật của DeepSeek từ V1 đến R1. Nguyên nhân của sự rời đi của đội ngũ nhân sự chủ chốt rất phức tạp, nhưng yếu tố dễ thấy là sự bất lợi về chế độ đãi ngộ.

Theo một số thông tin từ các công ty tuyển dụng cấp cao của Trung Quốc tiết lộ rằng đối thủ cạnh tranh đưa ra mức đãi ngộ gấp “2 đến 3 lần” DeepSeek, một số tập đoàn lớn thậm chí đưa ra đề xuất tổng thu nhập lên tới 8 chữ số.

Với tư cách là một công ty khởi nghiệp chưa gọi vốn bên ngoài (công ty mẹ là High-Flyer Quant), dù mức lương không quá thấp nhưng DeepSeek không thể cạnh tranh với các chính sách kích thích bằng cổ phiếu và định giá cao của các gã khổng lồ như ByteDance, Alibaba hay Tencent.

Ông Lương Văn Phong đã bắt đầu thúc đẩy công tác định giá công ty, xác định rõ giá trị quyền chọn mua cổ phần để mang lại sự chắc chắn hơn cho đội ngũ nhân sự.

Tuy nhiên, trong bối cảnh các đối thủ cùng ngành như Zhipu AI hay MiniMax đã niêm yết và giá cổ phiếu tăng vọt, áp lực giữ chân nhân tài của DeepSeek vẫn rất lớn.

DeepSeek hiện nay đang rơi vào một sự mơ hồ về vị thế. Họ vẫn cần thương mại hóa, vẫn cần giữ chân nhân tài, nhưng đồng thời lại được kỳ vọng gánh vác trọng trách tương thích hóa nội địa.

Xung đột từ hai vai trò này có lẽ chính là logic sâu xa khiến DeepSeek ngày càng chậm lại trong năm qua.

Do đó, kỳ vọng của thị trường về hiệu năng của DeepSeek V4 cũng đang được điều chỉnh giảm xuống.

Mô hình này có thể không phải là một mô hình “bom tấn” gây sốt toàn giới công nghệ một lần nữa, nhưng có thể là một cột mốc quan trọng về mặt công nghiệp, chứng minh rằng các mô hình tiên tiến của Trung Quốc có thể đạt đến mức độ khả dụng trên hệ sinh thái phần cứng nội địa.

“Bài kiểm tra” của DeepSeek V4 có lẽ còn quan trọng hơn đối với định hướng dài hạn của toàn bộ giới AI Trung Quốc.

* Theo 36Kr

(0) Bình luận

Xếp theo: