Mô hình AI mới của OpenAI, Rosalind, có thể rút ngắn hàng năm trong quá trình khám phá thuốc. Bạn Có Thể Không Thể Sử Dụng Nó

Tóm tắt ngắn gọn

  • OpenAI giới thiệu GPT-Rosalind để thúc đẩy quy trình khám phá thuốc.
  • Các tiêu chuẩn đánh giá cho thấy lợi ích rõ rệt, nhưng tác động thực tế vẫn còn hạn chế.
  • Việc truy cập bị hạn chế chặt chẽ giữa bối cảnh ngày càng gia tăng các mối lo về an ninh sinh học.

OpenAI vừa đặt tên cho mô hình AI chuyên ngành đầu tiên của mình theo tên Rosalind Franklin—nhà hóa học người Anh, người đã giúp khám phá cấu trúc xoắn kép DNA qua công trình tinh thể học tia X, và người đã bị từ chối công nhận trong suốt cuộc đời. GPT-Rosalind, được giới thiệu vào thứ Năm, là một mô hình lý luận chuyên dụng cho sinh học, khám phá thuốc và y học chuyển đổi. Đây là mô hình đầu tiên trong loạt mô hình Khoa học đời sống mà OpenAI gọi là—một chiến lược nhằm chiếm lĩnh thị trường nơi nhiều phòng thí nghiệm chuyên biệt từ các trường đại học đến Google DeepMind đều cạnh tranh gay gắt. Theo các chuyên gia, việc đưa một loại thuốc từ phát hiện mục tiêu đến phê duyệt chính thức tại Mỹ mất trung bình 10 đến 15 năm. Phần lớn thời gian đó không phải là trong những khoảnh khắc Eureka, mà là trong quá trình làm việc mệt mỏi: phân tích hàng nghìn bài báo, truy vấn cơ sở dữ liệu, thiết kế reagent, và diễn giải các kết quả mơ hồ. Đây chính là điều GPT-Rosalind cố gắng giải quyết. OpenAI cho rằng mô hình có thể rút ngắn giai đoạn đầu này. Như công ty đã nói, GPT-Rosalind được thiết kế để giúp các nhà khoa học “khám phá nhiều khả năng hơn, phát hiện các mối liên hệ có thể bị bỏ lỡ, và đưa ra giả thuyết tốt hơn sớm hơn.”

 Các tiêu chuẩn đánh giá ít nhất phần nào xác nhận tham vọng đó. Trên BixBench—một tiêu chuẩn dựa trên các nhiệm vụ bioinformatics thực tế—GPT-Rosalind đạt tỷ lệ thành công 0.751, cao nhất trong các mô hình có kết quả đã công bố. Trên LABBench2, nó vượt qua GPT-5.4 của chính nó trong sáu trên tổng số mười một nhiệm vụ. GPT-Rosalind vượt trội hơn GPT 5.4 trong mọi trường hợp liên quan đến khoa học đời sống, nhưng đây là một mô hình rất đặc thù, sẽ hoạt động kém hiệu quả trong các lĩnh vực khác ngoài đó.

OpenAI cũng công bố Dyno Therapeutics sẽ giúp thử nghiệm và đánh giá mô hình dựa trên các chuỗi RNA chưa công bố để loại trừ khả năng ghi nhớ. Các lần nộp tốt nhất của GPT-Rosalind xếp trên 95% các chuyên gia con người trong các nhiệm vụ dự đoán chuỗi, và khoảng 84% trong tạo sinh. Tuy nhiên, trưởng nhóm nghiên cứu khoa học đời sống của OpenAI, Joy Jiao, đã thận trọng về khả năng thực sự của mô hình. Cô giải thích rằng công ty không xem Rosalind là một mô hình có thể tự tạo ra các phương pháp điều trị mới, nhưng nói với các phóng viên rằng nó có thể là một trợ thủ đắc lực trong việc thúc đẩy nghiên cứu nhanh hơn. “Chúng tôi thực sự thấy có cơ hội giúp các nhà nghiên cứu tiến xa hơn trong một số phần phức tạp và tốn thời gian nhất của quá trình khoa học,” Jiao nói trong một cuộc họp báo, theo LA Times. Hệ sinh thái xung quanh mô hình có thể quan trọng không kém gì chính mô hình. OpenAI cũng phát hành một plugin nghiên cứu Khoa học đời sống miễn phí cho Codex, kết nối hơn 50 cơ sở dữ liệu và công cụ khoa học—tra cứu cấu trúc protein, tìm kiếm chuỗi, xem xét tài liệu, pipelines genôm học. Người dùng doanh nghiệp có quyền truy cập GPT-Rosalind sẽ có lớp lý luận phía trên. Những người khác sẽ dùng plugin với các mô hình tiêu chuẩn. OpenAI đã chuẩn bị danh sách khách hàng trong lĩnh vực dược phẩm và công nghệ sinh học cho sự ra mắt, gồm Amgen, Moderna, và Thermo Fisher Scientific. Ngoài ra, họ còn hợp tác nghiên cứu với Viện Nghiên cứu Quốc gia Los Alamos về thiết kế protein và xúc tác dựa trên AI. “Lĩnh vực khoa học đời sống đòi hỏi độ chính xác cao ở mọi bước. Các câu hỏi rất phức tạp, dữ liệu rất độc đáo, và rủi ro cực kỳ lớn,” ông Sean Bruich, Phó Chủ tịch cao cấp về AI và Dữ liệu của Amgen, nói trong thông báo chính thức. Việc truy cập Rosalind cố ý bị hạn chế. Mô hình chỉ dành cho doanh nghiệp tại Mỹ, được kiểm duyệt qua quy trình xác nhận và an toàn. Mối lo không chỉ mang tính trừu tượng: một liên minh quốc tế gồm hơn 100 nhà khoa học đã kêu gọi kiểm soát chặt chẽ hơn dữ liệu sinh học dùng để huấn luyện AI, vì lo ngại về rủi ro thiết kế mầm bệnh. Việc ra mắt hạn chế của OpenAI là phản ứng trực tiếp. Trong giai đoạn xem trước nghiên cứu, việc sử dụng sẽ không tiêu thụ tín dụng API hiện có. Đây cũng không phải lần đầu OpenAI bước vào quy trình khoa học. Không gian làm việc viết khoa học Prism ra mắt vào tháng Một là bước đi đầu tiên. GPT-Rosalind là phiên bản nâng cao, chuyên biệt hơn—và là tín hiệu cho thấy các mô hình chuyên ngành đang trở thành một mặt trận cạnh tranh nghiêm túc. Chưa có loại thuốc nào do AI hoàn toàn khám phá đã vượt qua thử nghiệm giai đoạn 3. Con số đó vẫn là 0. Nhưng nếu GPT-Rosalind giúp một nhà nghiên cứu thiết kế một thí nghiệm tốt hơn nhanh hơn sáu tháng trong hàng nghìn phòng thí nghiệm, thì tác động cộng hưởng của việc khám phá ra thứ gì đó, và khi nào, có thể là toàn bộ cuộc chơi. Đó chính là luận đề thực sự ở đây, và nó đáng để theo dõi sát sao.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim