Theo trang tin TechCrunch, công nghệ sinh học hiện đại ngày nay đã sở hữu các công cụ để chỉnh sửa gen và thiết kế thuốc, thế nhưng hàng nghìn căn bệnh hiếm gặp vẫn chưa có phương pháp điều trị.
Cụ thể, ban lãnh đạo của hai công ty khởi nghiệp công nghệ sinh học Insilico Medicine và GenEditBio cho hay rào cản lớn nhất trong nhiều năm qua chính là việc thiếu hụt đội ngũ nhân sự trình độ cao để duy trì chuỗi công việc này. Tuy nhiên, AI đang trở thành một “lực lượng nhân số học” (force multiplier) mạnh mẽ, giúp các nhà khoa học giải quyết những bài toán mà ngành công nghiệp này vốn đã bỏ ngỏ từ lâu.
Phát biểu tại Hội nghị công nghệ và khởi nghiệp Web Summit Qatar, ông Alex Aliper, Chủ tịch Công ty Insilico, đã trình bày về mục tiêu phát triển “siêu trí tuệ dược phẩm” (pharmaceutical superintelligence) của công ty.
Gần đây, Công ty Insilico đã ra mắt hệ thống “MMAI Gym” với mục tiêu huấn luyện các mô hình ngôn ngữ lớn đa nhiệm (như ChatGPT và Gemini) đạt được hiệu suất tối ưu tương đương các mô hình chuyên biệt.
Bên cạnh đó, công ty còn đặt ra mục tiêu là xây dựng một mô hình đa phương thức, đa nhiệm mà theo ông Aliper, có thể giải quyết đồng thời nhiều bài toán khám phá thuốc khác nhau với độ chính xác vượt trội hơn con người.
Ông Aliper chia sẻ rằng: “Chúng tôi thực sự cần công nghệ này để nâng cao năng suất của ngành công nghiệp dược phẩm, đồng thời giải quyết tình trạng khan hiếm nguồn nhân lực và nhân tài trong lĩnh vực này”.
“Thực tế là vẫn còn hàng nghìn căn bệnh chưa có thuốc chữa, chưa có giải pháp điều trị, và hàng nghìn chứng rối loạn hiếm gặp đang bị bỏ quên. Vì vậy, chúng tôi cần những hệ thống thông minh hơn để giải quyết bài toán đó”, ông Aliper bổ sung.
Nền tảng của Insilico thu thập dữ liệu sinh học, hóa học và lâm sàng để đưa ra các giả thuyết về mục tiêu bệnh học cũng như các phân tử tiềm năng.
Bằng cách tự động hóa các bước quy trình vốn từng đòi hỏi một lực lượng lớn các nhà hóa học và sinh học, Insilico cho biết họ có thể sàng lọc các không gian thiết kế khổng lồ, đề xuất các ứng viên điều trị chất lượng cao, và thậm chí tái mục đích các loại thuốc hiện có. Tất cả đều giúp giảm thiểu đáng kể chi phí và thời gian.
Ví dụ, công ty này gần đây đã sử dụng các mô hình AI của mình để xác định xem liệu các loại thuốc hiện nay có thể tái sử dụng để điều trị ALS (bệnh xơ cứng teo cơ một bên), một hội chứng rối loạn thần kinh hiếm gặp hay không.
Tuy nhiên, điểm nghẽn về nhân lực không chỉ dừng lại ở khâu khám phá thuốc. Ngay cả khi AI có thể xác định được các mục tiêu hoặc liệu pháp triển vọng, nhiều căn bệnh vẫn đòi hỏi sự can thiệp ở cấp độ sinh học nền tảng hơn.

Cùng với đó, GenEditBio là một đại diện thuộc “làn sóng thứ hai” của công nghệ chỉnh sửa gen CRISPR, trong đó quy trình chuyển dịch từ việc chỉnh sửa tế bào bên ngoài cơ thể (exvivo) sang phân phối chính xác vào bên trong cơ thể (invivo).
Mục tiêu của công ty GenEditBio là biến việc chỉnh sửa gen thành một quy trình chỉ cần tiêm một lần duy nhất trực tiếp vào các mô bị tổn thương.
Bà Tian Zhu, Đồng sáng lập kiêm Giám đốc điều hành của GenEditBio, chia sẻ rằng: “Chúng tôi đã phát triển ePDV (engineered protein delivery vehicle) độc quyền, một loại phương tiện vận chuyển protein được thiết kế kỹ thuật sinh học, và nó là một hạt giống như virus”.
Bà nhấn mạnh: “Chúng tôi học hỏi từ tự nhiên và sử dụng các phương pháp học máy của AI để khai thác các tài nguyên thiên nhiên, từ đó tìm ra loại virus nào có lực với các loại mô cụ thể”.
“Tài nguyên thiên nhiên” mà bà Zhu đề cập đến chính là thư viện khổng lồ của GenEditBio chứa hàng nghìn hạt nano polymer không chứa hạt lipid và không phải virus. Về cơ bản đó là các phương tiện vận chuyển được thiết kế để đưa các công cụ chỉnh sửa gen vào các tế bào đích một cách an toàn.
Công ty cho biết nền tảng NanoGalaxy của họ sử dụng AI để phân tích dữ liệu và xác định mối tương quan giữa cấu trúc hóa học với các mô đích cụ thể (như mắt, gan hoặc hệ thần kinh).
Sau đó, AI sẽ dự đoán những tinh chỉnh nào đối với cấu trúc hóa học của phương tiện vận chuyển sẽ giúp nó mang theo tải nạp (payload) mà không kích hoạt phản ứng miễn dịch.
GenEditBio thử nghiệm các ePDV này theo phương thức phân phối chính xác vào bên trong cơ thể (in vivo) trong các phòng thí nghiệm ướt (wet labs), và các kết quả thu được sẽ được nạp ngược lại vào AI để tinh chỉnh độ chính xác dự đoán cho các chu kỳ tiếp theo.
Bà Zhu cho biết, việc phân phối hiệu quả và đặc hiệu theo từng mô là điều kiện tiên quyết cho quá trình chỉnh sửa gen vào bên trong cơ thể (in vivo). Bà khẳng định rằng cách tiếp cận của công ty giúp giảm chi phí sản xuất và chuẩn hóa một quy trình vốn từ trước đến nay rất khó mở rộng quy mô.
.png)
Giải quyết bài toán dữ liệu dai dẳng
Tương tự như nhiều hệ thống vận hành bằng AI khác, tiến bộ trong lĩnh vực công nghệ sinh học cuối cùng cũng phải đối mặt với bài toán dữ liệu. Việc mô hình hóa các trường hợp hiếm gặp (edge cases) của sinh học con người đòi hỏi lượng dữ liệu chất lượng cao lớn hơn nhiều so với những gì các nhà nghiên cứu hiện có thể tiếp cận.
Ông Aliper cho biết: “Chúng tôi vẫn cần thêm dữ liệu thực tế khách quan (ground truth data) từ bệnh nhân. Kho dữ liệu hiện tại đang bị thiên lệch lớn về phía thế giới phương Tây, nơi dữ liệu được tạo ra. Tôi nghĩ chúng ta cần có nhiều nỗ lực hơn ở quy mô địa phương để có được một bộ dữ liệu gốc, hoặc dữ liệu thực tế khách quan cân bằng hơn, từ đó các mô hình của chúng tôi cũng sẽ có khả năng xử lý tốt hơn”.
Đồng thời, ông cũng cho biết các phòng thí nghiệm tự động của Insilico đang tạo ra dữ liệu sinh học đa tầng từ các mẫu bệnh phẩm ở quy mô lớn mà không cần sự can thiệp của con người, sau đó nạp dữ liệu này vào nền tảng khám phá vận hành bằng AI của mình.
Bà Zhu nhận định rằng dữ liệu mà AI cần thực chất đã tồn tại sẵn trong cơ thể con người, được định hình qua hàng nghìn năm tiến hóa. Chỉ một phần nhỏ ADN trực tiếp “mã hóa” cho protein, trong khi phần còn lại hoạt động giống như một cuốn sổ tay hướng dẫn về cách thức biểu hiện của các gen.
Thông tin đó trước đây vốn rất khó để con người diễn giải, nhưng đang ngày càng trở nên dễ tiếp cận hơn đối với các mô hình AI, bao gồm cả những nỗ lực gần đây như dự án AlphaGenome của Google DeepMind.
Công ty GenEditBio đã áp dụng một phương pháp tương tự trong phòng thí nghiệm, thử nghiệm đồng thời hàng nghìn hạt nano vận chuyển thay vì thực hiện từng hạt một.
Các tập dữ liệu thu được, thứ mà bà Zhu gọi là “vàng quý cho các hệ thống AI”, được sử dụng để huấn luyện các mô hình của công ty và ngày càng đóng vai trò quan trọng trong việc hỗ trợ hợp tác với các đối tác bên ngoài.
Theo ông Aliper, một trong những nỗ lực lớn tiếp theo sẽ là xây dựng các bản sao kỹ thuật số (digital twins) của con người để chạy các thử nghiệm lâm sàng ảo, một quy trình mà ông cho biết là vẫn còn đang trong giai đoạn sơ khai.
Ông Aliper bày thể niềm tin tưởng rằng: “Các chứng rối loạn mãn tính đang gia tăng do dân số toàn cầu đang già hóa... Hy vọng của tôi là trong vòng 10 đến 20 năm nữa, chúng ta sẽ có nhiều lựa chọn liệu pháp hơn cho việc điều trị cá thể hóa cho bệnh nhân”.
Như vậy, dù vẫn phải đối mặt với những thách thức về dữ liệu, khả năng mở rộng và quá trình thương mại hóa, AI đang từng bước mở ra những hướng tiếp cận mới trong nghiên cứu và điều trị các bệnh hiếm gặp của con người.
Việc kết hợp giữa trí tuệ nhân tạo, công nghệ chỉnh sửa gen và các nền tảng sinh học tiên tiến được kỳ vọng sẽ góp phần nâng cao hiệu quả phát triển thuốc, đồng thời mang lại thêm cơ hội tiếp cận các liệu pháp điều trị cho những nhóm bệnh nhân vốn từ lâu chưa nhận được nhiều sự quan tâm từ ngành dược phẩm.
* Theo TechCrunch

