Nghiên cứu mới: AI đơn lẻ thành công 100%, nhưng làm việc nhóm thất bại tới 68%

Băng Băng | 09:31 18/03/2026

AI cũng mắc ‘drama’ công sở: 'Lờ' đi đồng nghiệp, làm trùng việc và kiểm soát dựa trên sở thích.

Nghiên cứu mới: AI đơn lẻ thành công 100%, nhưng làm việc nhóm thất bại tới 68%

Nhiều doanh nghiệp đang mơ về một tương lai nơi hàng chục AI Agent tự phối hợp để giải quyết các dự án phức tạp mà không cần con người nhúng tay. Thế nhưng, thực tế lại đang dội một gáo nước lạnh vào ảo tưởng này: AI khi làm việc nhóm cũng gặp phải những "căn bệnh" công sở hệt như con người, thậm chí là tệ hơn.

Trong cơn sốt trí tuệ nhân tạo toàn cầu, khái niệm "AI Agent" (tác nhân AI) đang được tung hô như một cuộc cách mạng về năng suất. Những người lạc quan nhất vẽ ra viễn cảnh một "đội quân" AI có thể tự phân vai, tự thảo luận và chốt hạ dự án trong chớp mắt, giúp doanh nghiệp tiết kiệm hàng triệu USD chi phí nhân sự.

Tuy nhiên, một nghiên cứu mới từ Jeremy McEntire, chuyên gia về hệ thống tổ chức đồng thời là Trưởng bộ phận kỹ thuật tại Wander, đã chỉ ra một sự thật trớ trêu: AI chỉ thực sự xuất sắc khi làm việc độc lập. Khi bị ép vào một "tổ chức" để thực hiện các nhiệm vụ đa tầng, tỷ lệ thất bại của chúng tăng vọt theo cấp số nhân.

"Các hệ thống AI thất bại vì cùng những lý do cấu trúc như các tổ chức của con người, mặc dù đã loại bỏ mọi yếu tố nguyên nhân đặc thù của con người," ông viết trong bài nghiên cứu gần đây của mình.

Căn bệnh "vô tổ chức" của những bộ óc silicon

Lý do khiến các hệ thống đa tác nhân (multi-agent) sụp đổ không nằm ở năng lực tính toán, mà nằm ở sự phối hợp. Theo Jeremy McEntire, các AI Agent mắc chính xác những sai lầm mà con người thường gặp trong các tổ chức quan liêu: lờ đi chỉ dẫn của đồng nghiệp, làm lại những việc người khác đã làm xong, không biết ủy quyền và rơi vào tình trạng tê liệt vì lập hoạch chồng chéo lên nhau.

Điều đáng kinh ngạc là AI không có cái tôi, không biết mệt mỏi, không bị chi phối bởi chính trị công sở hay ham muốn thăng tiến, nhưng sự kém hiệu quả vẫn nảy sinh một cách tự nhiên. Trong thử nghiệm của mình, McEntire nhận thấy khi sử dụng một Agent đơn lẻ, tỷ lệ thành công là 100% (28/28 lần). Tuy nhiên, khi thiết lập cấu trúc phân cấp nơi một AI giao việc cho các AI khác, tỷ lệ thất bại lên tới 36%.

"Không có động cơ nghề nghiệp. Không có cái tôi. Không có chính trị. Không có sự mệt mỏi. Không có các chuẩn mực văn hóa. Không có sự cạnh tranh địa vị. Các tác nhân chỉ là các mô hình ngôn ngữ thực thi các câu lệnh (prompts). Sự rối loạn chức năng vẫn cứ xuất hiện”, ông McEntire nhận định.

Tệ hơn nữa, mô hình tập hợp các AgentAI phối hợp lẫn nhau thất bại tới 68% thời gian. Đặc biệt, mô hình quy trình 11 giai đoạn phức tạp đã tiêu sạch ngân sách dự án chỉ để... lập kế hoạch mà không viết nổi một dòng code thực thi nào.

"Mỗi một thí nghiệm mà tôi thực hiện đều thất bại một cách phản trực giác theo đúng cách mà nó vốn được thiết kế để không xảy ra…Quy trình đi vào vòng quẩn quanh, hệ thống phân cấp thì không chịu giao việc. Hệ thống duy nhất hoạt động tin cậy và nhất quán là Agent AI đơn lẻ", McEntire chia sẻ.

McEntire cho biết những vấn đề tổ chức tồn tại lâu đời không hề biến mất khi con người chuyển giao công việc cho các tác nhân AI.

"Tương tự như những mô hình thất bại đặc trưng của các tổ chức con người bao gồm sự hỗn loạn trong khâu đánh giá, sự kiểm soát dựa trên sở thích, xung đột quản trị, cạn kiệt ngân sách do thất bại điều phối… đều xuất hiện trong các hệ thống AI đa tác nhân với các đặc điểm toán học giống hệt nhau," ông viết trong bài nghiên cứu của mình. "Nền tảng dù có thay đổi nhưng các quy luật vật lý của sự điều phối ở quy mô lớn vẫn không đổi."

Đồng quan điểm, Diptamay Sanyal, kỹ sư trưởng tại CrowdStrike, xác nhận rằng tỷ lệ lỗi leo thang chóng mặt khi độ phức tạp tăng lên. Ông cho rằng việc chuyển giao bối cảnh (context passing) và lan truyền sai số giữa các Agent chính là "hố đen" nuốt chửng hiệu quả.

Nik Kale, kiến trúc sư nền tảng tại Cisco, bổ sung một góc nhìn sắc sảo: "Mỗi lần bàn giao công việc giữa các hệ thống là một lần ý nghĩa bị tam sao thất bản. Con người giải quyết việc này bằng cách đi tới bàn đồng nghiệp và hỏi trực tiếp. AI thì không có những cuộc trò chuyện ở hành lang như vậy".

Theo Kale, những lời quảng bá về "hàng chục Agent làm việc tự chủ" hiện nay phần lớn là một ảo tưởng vi phạm các lý thuyết về thông tin. Thực tế, giá trị lớn nhất của AI hiện nay vẫn nằm ở việc tự động hóa các tác vụ lặp đi lặp lại, xác định rõ ràng chứ không phải là một "trí tuệ tập thể" tự phát.

Đồng quan điểm, kỹ sư trưởng Sanyal của CrowdStrike nhận định: "Giá trị thực sự của các tác nhân AI ngày nay là tự động hóa các nhiệm vụ lặp đi lặp lại, được xác định rõ ràng ở quy mô lớn, qua đó hỗ trợ các nhà phân tích con người với khả năng xử lý dữ liệu nhanh chóng và kết quả nhất quán, chứ không phải là một trí tuệ tập thể độc lập."

Tương tự, CEO Shanea Leven của Empromptu.ai cho rằng giá trị của các tác nhân AI là có thật, nhưng nó không nằm ở hành vi bầy đàn tự chủ là là ở sự chuyên môn hóa có kiểm soát.

Lối thoát

Vậy làm thế nào để tận dụng sức mạnh của nhiều AI cùng lúc mà không gây ra sự hỗn loạn? Câu trả lời nằm ở "lớp điều phối" (orchestration layer). Thay vì để các AI tự do "thảo luận", các doanh nghiệp thành công đang áp dụng mô hình chuyên môn hóa tuần tự với sự can thiệp của con người.

Shivanath Devinarayanan, Giám đốc Công nghệ lao động số tại Asymbl, cho biết công ty ông đã triển khai hơn 150 Agent, nhưng tất cả đều nằm dưới một sự kiểm soát cực kỳ chặt chẽ. Trước khi hai AI tương tác, con người đã phải lập bản đồ bàn giao: dữ liệu nào được chuyển đi, định dạng là gì, và điều kiện nào thì phải kích hoạt sự xem xét của con người.

"Chúng tôi có các tác nhân AI dành riêng cho các nhiệm vụ rời rạc và các tác nhân có bộ nhớ chung và danh sách nhiệm vụ chung để theo dõi những gì các tác nhân khác đang làm," Devinarayanan nói. "Chìa khóa trong cả hai trường hợp là sự rõ ràng về vai trò trước khi triển khai. Nhân viên kỹ thuật số này chịu trách nhiệm về việc gì, công việc đến từ đâu, đi đâu và khi nào con người cần đưa ra quyết định?", ông Devinarayanan nhấn mạnh.

"Mô hình tư duy đúng đắn là một lực lượng lao động hỗn hợp gồm nhân viên kỹ thuật số với vai trò rõ ràng, nhân viên con người với sự giám sát và phán đoán, và một lớp điều phối kết nối cả hai," giám đốc Devinarayanan bổ sung.

Cũng theo ông Devinarayanan, nghiên cứu của McEntire xác nhận rằng sự thất bại của các hệ thống đa tác nhân là một vấn đề về tổ chức và điều phối chứ không phải là vấn đề công nghệ.

"Các tác nhân được mô hình hóa dựa trên suy luận của con người. Bởi vậy chúng kế thừa các lỗi tổ chức của con người khi thiết kế cơ cấu sai”, ông Devinarayanan nói.

Cơn sốt AI Agents một lần nữa nhắc nhở giới kinh doanh rằng công nghệ dù tiên tiến đến đâu cũng không thể khỏa lấp được một cấu trúc tổ chức yếu kém. Nếu quy trình làm việc chưa được chuẩn hóa, việc đưa thêm AI vào chỉ khiến sự hỗn loạn diễn ra nhanh hơn với chi phí đắt hơn.

Lời khuyên từ các chuyên gia dành cho các CEO và CTO là: Hãy bắt đầu với những Agent đơn lẻ cho các tác vụ chuyên biệt. Đừng cố gắng xây dựng một "biệt đội Avengers" của AI khi bạn chưa có một kịch bản điều phối đủ chặt chẽ. Giá trị thực sự của AI nằm ở sự kiểm soát chuyên biệt, không phải ở hành vi bầy đàn tự phát.

*Nguồn: The Verge, Cnet

(0) Bình luận

Xếp theo: