‘Cha đẻ’ thiên tài của DeepSeek: Sinh ra từ làng, 40 tuổi trở thành người hùng Trung Quốc, sống giản dị hơn bất kỳ CEO, founder nổi tiếng nào

Huệ Anh | 07:37 24/04/2025

Điều ít người biết về Liang Wenfeng, nhà sáng lập 40 tuổi của startup DeepSeek.

‘Cha đẻ’ thiên tài của DeepSeek: Sinh ra từ làng, 40 tuổi trở thành người hùng Trung Quốc, sống giản dị hơn bất kỳ CEO, founder nổi tiếng nào

Trước đây, mọi người không biết nhiều về Mililing - ngôi làng bình yên thuộc tỉnh Quảng Đông phía nam. Chỉ đến khi người con Liang Wenfeng, nhà sáng lập 40 tuổi của startup DeepSeek nổi lên như một anh hùng làm rạng danh Trung Quốc, người ta mới đổ xô đến đây mỗi ngày. Dân làng, nhiều người cùng họ Liang, dựng lên các quầy hàng gần nhà anh để bán đồ lưu niệm và đồ uống.

Giống như Liang, nhiều học giả trong quá khứ đã vươn lên từ những khởi đầu khiêm tốn. Kể từ khi DeepSeek gây chấn động Thung lũng Silicon và Phố Wall với mô hình lý luận vào tháng 1, Liang trở thành một trong những nhân vật có ảnh hưởng nhất của Trung Quốc, ngang hàng các nhà khoa học hạt nhân và tên lửa những năm 1950 và 1960.

“Trung Quốc không thể lúc nào cũng là người đi sau”, Liang Wenfeng nói trong một cuộc phỏng vấn với hãng truyền thông Trung Quốc 36Kr vào năm 2024.

Ngày Liang ra đời năm 1985, Mililing khi ấy vẫn là chỉ một cộng đồng nông thôn truyền thống. Trong một bản tin quyên góp địa phương, có ghi chú rằng Wenfeng đã đóng góp 3.000 nhân dân tệ (41 USd) để hỗ trợ người già ở Trung Quốc và hơn 100 dân làng có cùng họ. Năm ngoái, Zhang Yiming, người sáng lập công ty mẹ của TikTok là ByteDance, cũng đã quyên góp 2 triệu nhân dân tệ cho một ngôi đền thờ tổ ở làng Kungfu, tỉnh Phúc Kiến.

Liang học rất giỏi, đặc biệt là toán và vật lý. Năm 2002, năm Trung Quốc ghi nhận GDP bình quân đầu người 1.150 USD sau khi gia nhập Tổ chức Thương mại Thế giới, Liang ở tuổi 17 đã đạt điểm cao nhất trong kỳ thi tuyển sinh đại học quốc gia. Thành tích học tập xuất sắc giúp anh được nhận vào trường Đại học Chiết Giang danh tiếng ở Hàng Châu vốn nổi tiếng với việc đào tạo tỷ phú.

Sự bùng nổ kinh tế của Trung Quốc vào đầu những năm 2000 đã thúc đẩy nhiều câu chuyện từ nghèo khó thành giàu, nhấn mạnh sức mạnh chuyển đổi của công nghệ trong nền kinh tế thị trường đang phát triển nhanh chóng. Liang học ngành kỹ thuật điện tử và tham gia chương trình sau đại học 3 năm về thị giác máy tính vào năm 2007. Anh tốt nghiệp năm 2010 với luận án về thuật toán máy ảnh.

Trong bài báo, anh cảm ơn người thầy hướng dẫn và 5 bạn học. Một trong số họ, Xu Jin, đã trở thành đối tác kinh doanh thân thiết.

Thời gian Liang ở Hàng Châu trùng với thời kỳ kinh tế hưng thịnh, thị trường chứng khoán biến động và công nghệ internet nhanh chóng được áp dụng nhờ sự phổ biến của điện thoại thông minh. Sau khi tốt nghiệp, Liang chuyển đến Thành Đô, thủ phủ của tỉnh Tứ Xuyên, Tây Nam nổi tiếng với lối sống thoải mái. Ở đó, anh làm việc trong một dự án sử dụng thuật toán để giao dịch chứng khoán, lấy cảm hứng từ nhà đầu tư quỹ đầu cơ huyền thoại người Mỹ James Simons. Liang đã viết lời tựa cho phiên bản tiếng Trung của tiểu sử Simons, tự tin khẳng định rằng sẽ có cách phát triển các mô hình dự đoán giá.

Năm 2015, Liang đồng sáng lập High-Flyer Quant với Xu. Một bài đăng tuyển dụng đã ám chỉ thành công của Liang, nói rằng vào năm 2008, một người đàn ông tên L đã bắt đầu giao dịch cổ phiếu bằng thuật toán với khoản đầu tư ban đầu 80.000 nhân dân tệ. Trong 7 năm tiếp theo, lợi nhuận hàng năm trên 100%.

High-Flyer nhanh chóng nổi lên như một trong bốn quỹ giao dịch lượng tử hàng đầu Trung Quốc, với tài sản được quản lý vượt quá 100 tỷ nhân dân tệ khi các nhà đầu tư giao phó tiền của họ cho Liang. Dòng tiền cho phép anh xây dựng một trung tâm máy tính khổng lồ để phân tích dữ liệu và lựa chọn cổ phiếu.

Vào năm 2021, High-Flyer đầu tư 1 tỷ nhân dân tệ để phát triển một trung tâm điện toán được trang bị 10.000 card đồ họa Nvidia. Thành công lúc này đi kèm với những thách thức bởi giao dịch lượng tử bị các cơ quan quản lý Trung Quốc xem xét với thái độ hoài nghi. Vào năm 2022, High-Flyer đã phải trả lại tiền cho các nhà đầu tư và mua cổ phiếu trong thời kỳ thị trường suy thoái.

Khi tài nguyên điện toán của High-Flyer vượt quá nhu cầu giao dịch hàng ngày, Liang chuyển hướng nỗ lực sang nghiên cứu AI. Năm 2019, anh thành lập một phòng thí nghiệm AI. Vào đầu năm 2023, chỉ vài tháng sau khi OpenAI ra mắt ChatGPT, phòng này được chuyển đổi thành một thực thể độc lập có tên DeepSeek, tập trung vào phát triển mô hình ngôn ngữ lớn (LLM).

Trong bối cảnh LLM bùng nổ, DeepSeek nổi lên như một nhà cải tiến thực sự, làm lu mờ cả các công ty công nghệ lớn và một loạt startup. Việc phát hành mô hình nền tảng V3 nguồn mở vào tháng 12 và mô hình lý luận R1 vào tháng 1 đã cách mạng hóa thị trường AI trong nước. Lee Kai-fu, người sáng lập và giám đốc điều hành của công ty khởi nghiệp 01.AI, cho biết công ty của ông đã phải ngừng phát triển các mô hình riêng do sự thành công của DeepSeek.

DeepSeek, tuyển dụng hơn 100 nhà khoa học trẻ, đang chuẩn bị cho nhiều đột phá mới. Với bản nâng cấp V3 gần đây, công ty khởi nghiệp này đã thể hiện cam kết về tiến bộ kỹ thuật dù đã đạt được danh tiếng từ sớm.

Petri Kuittinen, giảng viên công nghệ thông tin và truyền thông tại Đại học Khoa học Ứng dụng Häme ở Phần Lan, cho biết: “Nhóm DeepSeek đang cải tiến sản phẩm của họ, đồng thời hạn chế tối đa sự cường điệu”.

Được ngợi ca tuyệt đối, song Liang vẫn giữ thái độ khiêm tốn. Lần xuất hiện đáng chú ý duy nhất của anh là tại một hội nghị cấp cao do Chủ tịch Trung Quốc Tập Cận Bình chủ trì vào tháng 2. Liang không phát biểu - trái ngược hẳn với những người tham dự khác như nhà sáng lập Huawei Technologies Nhậm Chính Phi hay nhà sáng lập Xiaomi Lôi Quân.

Anh cũng từ chối lên tiếng tại Hội nghị thượng đỉnh hành động AI ở Paris và liên tục khước từ các yêu cầu phỏng vấn, ngay cả khi hàng loạt phóng viên tụ tập bên ngoài trụ sở chính của DeepSeek. Các nguồn tin cho biết Liang cũng từ chối tham dự các cuộc họp với nhà đầu tư tiềm năng và các quan chức chính quyền địa phương.

Đáng chú ý Liang không xuất hiện công khai trên mạng xã hội. Bằng chứng duy nhất về sự tham gia của anh trong DeepSeek là chức danh xuất hiện trong các bài báo nghiên cứu do công ty khởi nghiệp này công bố. Sự kín tiếng trái ngược hoàn toàn với Altman - người tích cực quảng bá các sản phẩm của OpenAI trên toàn cầu.

Sự xuất hiện của Liang làm phức tạp thêm vấn đề đối với Altman, vốn đang thúc đẩy OpenAI đánh giá lại chiến lược nguồn mở và định vị thị trường của mình, theo Kevin Zhou, nhà sáng lập của kênh truyền thông công nghệ Pandaily. Altman đã nói vào đầu tháng này trên X rằng OpenAI sẽ phát hành “một mô hình ngôn ngữ mở mới mạnh mẽ với lý luận trong những tháng tới”.

Với những tiến bộ trong các kỹ thuật, DeepSeek đã giảm đáng kể chi phí đào tạo AI. Quan trọng hơn, các mô hình của công ty được phát triển bởi các nhà khoa học Trung Quốc và công ty khởi nghiệp này thúc đẩy một cuộc chạy đua toàn quốc để ứng dụng AI. Sujan Sarkar, đồng sáng lập AITools.xyz, một trang web theo dõi mức độ phổ biến của các dịch vụ AI, cho biết: “Sự đổi mới này không chỉ mang tính kỹ thuật mà còn mang tính chiến lược”.

DeepSeek lấp đầy đội ngũ của mình bằng những sinh viên mới tốt nghiệp và thực tập sinh từ các trường đại học ưu tú của Trung Quốc, chẳng hạn như Đại học Thanh Hoa và Đại học Bắc Kinh. Những công nhân công nghệ trẻ, đầy nhiệt huyết, đang nỗ lực để bắt kịp những gã khổng lồ công nghệ ở Thung lũng Silicon, bất chấp các lệnh cấm xuất khẩu chip tiên tiến. Nhiều sinh viên Trung Quốc không mấy hứng thú với công việc toàn thời gian ở Mỹ.

Được biết, DeepSeek có cách thu hút nhân tài độc đáo. Theo báo cáo gần đây từ hãng công nghệ Trung Quốc 36Kr, công ty này trả lương cho nhân viên cao hơn cả ByteDance. Ngoài ra, không giống như nhiều công ty công nghệ Trung Quốc thúc đẩy cạnh tranh nội bộ và bắt các kỹ sư làm việc nhiều giờ liền, nhà sáng lập Liang cho phép nhân viên mình tự tìm nhiệm vụ và truy cập sức mạnh tính toán một cách tự do.

“DeepSeek làm nổi bật sức mạnh của nhóm nhân tài AI Trung Quốc, được hỗ trợ bởi một số lượng lớn các kỹ sư phần mềm có trình độ và năng lực cao”, Angela Zhang, giáo sư tại Đại học Nam California, nói với Rest of World . “Tôi tin rằng lợi thế về nhân tài sẽ định vị Trung Quốc một cách mạnh mẽ cho giai đoạn phát triển AI tiếp theo”.

Liang nói rằng mục tiêu cuối cùng của DeepSeek là đạt được trí thông minh nhân tạo tổng quát (AGI), nơi AI có thể ngang bằng hoặc vượt qua khả năng nhận thức của con người. “LLM sở hữu một số đặc điểm sơ bộ của AGI và có thể là con đường duy nhất để đạt được AGI”.

Tuy nhiên, DeepSeek, hoạt động giống một phòng thí nghiệm hơn là một công ty truyền thống, đang phải đối mặt với những thách thức ngày càng tăng trong việc duy trì đà phát triển của mình. Kỳ vọng rất cao cho mô hình tiếp theo, song bản thân công ty cũng đang phải vật lộn với các quy định hạn chế quyền truy cập từ Mỹ.