Từ Seoul đến thung lũng Silicon, Speak – ứng dụng dạy ngoại ngữ bằng trí tuệ nhân tạo do các cựu Thiel Fellows sáng lập – đang tạo nên một cuộc đua mới trong ngành công nghệ giáo dục toàn cầu: thay thế gia sư ngôn ngữ bằng AI có khả năng trò chuyện, sửa lỗi và phản hồi theo thời gian thực. Sau khi trở thành một trong những ứng dụng học tiếng Anh phát triển nhanh nhất tại Hàn Quốc, Speak mang tham vọng bước vào thị trường Mỹ, nơi gã khổng lồ Duolingo đã gần như thống trị và được xem là “cửa ải” cuối cùng cho bất kỳ ứng dụng học ngoại ngữ nào muốn vươn tầm quốc tế.
Theo Forbes, Speak bắt đầu từ ý tưởng táo bạo: nếu người học có thể luyện nói với một AI giống như trò chuyện với người thật, họ sẽ tiến bộ nhanh hơn nhiều so với mô hình học ngữ pháp – từ vựng truyền thống. Để hiện thực hóa điều đó, startup này xây dựng một hệ thống hội thoại dựa trên nhận dạng giọng nói, mô hình ngôn ngữ lớn và công nghệ phản hồi tức thì.
Speak sử dụng bộ công cụ của OpenAI, bao gồm các mô hình nền tảng GPT-4 và API giọng nói, cho phép người học nói bất kỳ câu nào, được AI “lắng nghe”, “hiểu” và “chấm” ngay lập tức. Theo phân tích của eMarketer, đây là hướng đi giúp Speak khác biệt so với Duolingo – vốn thiên nhiều về gamification và học từ vựng.
Thành công tại Hàn Quốc giúp Speak nhanh chóng trở thành kỳ lân. Forbes cho biết startup này đã gọi vốn thành công với định giá chạm mốc 1 tỷ USD, chỉ trong một thời gian ngắn sau khi được OpenAI hỗ trợ.

Nhưng câu chuyện bước ra thị trường Mỹ lại hoàn toàn khác. Duolingo đã xây dựng một hệ sinh thái khổng lồ với hơn 150 khóa học mới được tạo ra chỉ trong một năm nhờ công nghệ AI mà chính họ phát triển, theo The Verge. Điều này mở rộng biên độ cạnh tranh lên rất cao, bởi người dùng Mỹ vốn quen với Duolingo như một phần của đời sống số, từ học ngôn ngữ đến luyện chứng chỉ. Chính vì vậy, Speak bước vào một sân chơi không chỉ đầy đối thủ, mà còn đầy thói quen tiêu dùng đã hình thành từ lâu.
Thách thức lớn nhất của Speak nằm ở khả năng nội địa hóa và thuyết phục người dùng rằng họ không chỉ cần học “từ” mà cần học “nói”. Thị trường Mỹ có yêu cầu khắt khe hơn về chất lượng nội dung, mức độ chính xác của phản hồi phát âm, và sự linh hoạt của kịch bản hội thoại. Điều này đòi hỏi Speak phải liên tục cải thiện mô hình AI của mình, đồng thời xây dựng thư viện tình huống đàm thoại tương đương với hàng trăm giáo viên bản địa.
Dù vậy, cơ hội vẫn rất lớn. Xu hướng “AI tutor” đang tăng tốc mạnh trên toàn cầu, đặc biệt sau đại dịch, khi nhu cầu học từ xa trở thành thói quen. Các nhà đầu tư tin rằng một ứng dụng tập trung hoàn toàn vào luyện nói bằng AI – với chi phí rẻ hơn rất nhiều so với thuê gia sư thật – có thể bùng nổ mạnh mẽ tại Mỹ giống như tại Hàn Quốc.

Connor Zwick bắt đầu hành trình khởi nghiệp từ rất sớm. Trước khi thành lập Speak, ông từng sáng lập ứng dụng Flashcards+, một ứng dụng học từ vựng và ôn luyện flash-card đã được Chegg mua lại. Trong thời gian học tại Harvard University, Zwick đã nhận học bổng Thiel Fellowship — chương trình dành cho những người trẻ có ý tưởng khởi nghiệp và phát triển công nghệ.
Trong một bài phỏng vấn với OpenAI vào tháng 4 / 2025, Zwick chia sẻ rằng một trong những khoảnh khắc “khởi động lại” niềm tin vào AI của ông là năm 2015, khi ông và đồng sáng lập của mình thực hiện một dự án nghiên cứu riêng – thử xây một mô hình học sâu (deep learning) nhận dạng giọng nói và phân biệt được giọng nói theo vùng miền (accent detection). Kết quả lần đầu tiên đã “đánh bại” các mô hình lúc ấy và ông nhận ra rõ ràng: nếu có đủ dữ liệu và mô hình đúng, AI có thể làm “những việc không tưởng”.
Từ đó, Connor Zwick và đồng sáng lập quyết định chọn lĩnh vực học ngôn ngữ — một thị trường khổng lồ, với cả tỷ người trên thế giới muốn nói tiếng Anh hoặc một ngôn ngữ khác thành thạo — như là “đối tượng” để ứng dụng sức mạnh AI. Họ nhận thấy rằng mặc dù có rất nhiều ứng dụng học ngoại ngữ, ít ứng dụng thực sự giúp người học nói được — hầu hết vẫn tập trung vào đọc, viết, từ vựng, ghi nhớ, hoặc trò chơi hóa (gamification) hơn là luyện nói.
Hiện khoảng 15 triệu người đã tải xuống Speak để luyện tập giao tiếp với gia sư AI. Zwick nói: “Nếu bạn học ngôn ngữ mà không nói, bạn sẽ không nói được” — và đó chính là động lực để ông và đội ngũ tập trung vào phần nói ngang bằng phần nghe-nói.
Theo: Forbes, Business Insider
