Tác nhân AI giờ đã có thể độc lập tái hiện các bài báo học thuật phức tạp: Mollick cho rằng lỗi thường nằm ở phần văn bản gốc của con người chứ không phải AI

Giáo sư Ethan Mollick của Trường Kinh doanh Wharton (Đại học Pennsylvania) trong bài đăng trên nền tảng X ngày 4/25 đã đưa ra một nhận xét có tác động mạnh mẽ đến giới học thuật: hiện nay các AI agent đã có thể độc lập tái hiện các kết quả nghiên cứu học thuật phức tạp chỉ dựa vào mô tả phương pháp và dữ liệu công khai, mà không cần có bản thân bài báo gốc và cũng không cần có mã nguồn gốc. Mollick còn chỉ ra rằng, khi các phiên bản AI tái hiện này khác với bài báo gốc, “lỗi thường nằm ở chính văn bản/đoạn văn của con người, chứ không phải ở AI”. Đây là một bước ngoặt thực chất trong cuộc khủng hoảng khả năng tái lập trong thời đại AI tạo sinh—việc từng cần nhân lực đắt đỏ để tiến hành kiểm chứng đồng cấp, giờ đang được AI thực hiện trên quy mô lớn với chi phí thấp.

Claude tái hiện nhiều bài báo, rồi dùng GPT-5 Pro kiểm chứng hai lớp

Trong blog OneUsefulThing của mình và trong tweet này, Mollick mô tả thí nghiệm cụ thể của anh với Claude: đưa một bài báo học thuật cho Claude, yêu cầu nó mở kho lưu trữ, sắp xếp các tệp, tự động chuyển đổi mã STATA dùng cho thống kê sang Python, rồi lần lượt chạy tất cả các phát hiện trong bài báo. Sau khi Claude hoàn tất, anh lại dùng GPT-5 Pro để kiểm tra lần thứ hai trên cùng một kết quả tái hiện. Nhiều bài báo được thử nghiệm theo cách tương tự; kết quả nhìn chung thành công, chỉ bị cản trở khi tệp dữ liệu quá lớn hoặc bản thân replication data gốc có vấn đề.

Đối với giới học thuật, quy trình này trước đây thường cần nghiên cứu sinh/assistant tốn vài tuần thậm chí vài tháng. Quy mô thời gian Mollick mô tả là từ một buổi chiều đến một ngày, và chi phí vận hành chỉ là phí token của API LLM thương mại.

Lỗi đa phần nằm ở bản gốc do con người viết, không phải ở AI

Gây tranh cãi hơn là đánh giá của Mollick về “ai sai”. Trong tweet, anh nêu rõ rằng khi kết quả tái hiện bằng AI không khớp với bài báo gốc, thì trong đa số trường hợp không phải AI gây sai, mà là bài báo gốc có lỗi trong xử lý dữ liệu, dùng sai mô hình, hoặc các kết luận vượt ra ngoài phạm vi mà dữ liệu có thể chống đỡ. Trong khoảng mười năm gần đây, các ngành khoa học xã hội như tâm lý học, kinh tế học hành vi, quản lý học đã xuất hiện nhiều lần các sự kiện khủng hoảng lớn về khả năng tái lập; sự kiện nổi tiếng nhất là nghiên cứu tái hiện quy mô lớn của Open Science Collaboration năm 2015, chỉ khoảng 36% kết quả của các bài báo tâm lý học có thể được tái hiện độc lập. AI agent đang đẩy ranh giới của quá trình kiểm nghiệm này từ “cần phân bổ nhân lực” sang “có thể thực hiện phổ biến”.

Học hội vẫn cấm AI vào quy trình duyệt bài, thể chế lạc hậu so với công nghệ

Trong một tweet khác ngày 4/25, Mollick nêu đích danh học hội lớn nhất của lĩnh vực mình là Academy of Management vẫn còn cấm AI một cách rõ ràng tham gia quy trình nộp/bình duyệt bài báo. Anh trích dẫn một số nghiên cứu hiện có cho thấy việc duyệt bài bằng AI về độ chính xác, tính nhất quán và kiểm soát thiên kiến đã vượt trội so với một phần người duyệt bài truyền thống. Do đó, quan điểm “cấm” có thể vô tình làm trầm trọng thêm sự thất bại của hệ thống duyệt bài hiện hữu. Khoảng cách giữa thể chế và công nghệ như vậy là một vấn đề chính sách mà 1–2 năm tới giới xuất bản học thuật, các học hội và tổ chức tài trợ đều phải đối mặt.

Đối với người đọc, cuộc tranh luận này không chỉ giới hạn trong học thuật. Khi AI agent có thể kiểm chứng tức thời các phát hiện nghiên cứu, các trích dẫn nghiên cứu trong ngành công nghiệp, các báo cáo chính sách, và các cơ sở học thuật trong quyết định tài chính sẽ bước vào một ngưỡng kiểm chứng mới: “kết luận có chịu được việc AI tái hiện độc lập hay không”. Theo phần bổ sung trong một tweet khác của Mollick, anh cho rằng chính phủ là đơn vị duy nhất có thể đặt “mốc” cho cơ chế kiểm chứng này khi cường độ công cụ tiếp tục tăng lên—và mức độ phức tạp của thiết kế chính sách, sẽ đồng thời trở thành một trục chính tương đối bị bỏ quên trong thảo luận quản trị AI.

Bài viết này: AI Agent đã có thể độc lập tái hiện các bài báo học thuật phức tạp—Mollick cho rằng lỗi chủ yếu nằm ở bản gốc do con người viết chứ không phải AI. Lần đầu tiên xuất hiện trên Chuỗi tin ABMedia.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Worxphere Đổi Thương Hiệu JobKorea Với Công Cụ Tuyển Dụng Được Tích Hợp AI

Thông điệp Cổng Tin Tức, ngày 26 tháng 4 — Nền tảng nhân sự của Hàn Quốc Worxphere đã đổi thương hiệu JobKorea khi chuyển từ các bảng tuyển dụng trực tuyến truyền thống sang các giải pháp tuyển dụng dựa trên AI. Công ty đang hợp nhất các dịch vụ, bao gồm JobKorea và Albamon, thành một nền tảng thống nhất bao phủ việc làm lâu dài,

GateNews3giờ trước

Các Tiểu vương quốc Ả Rập Thống nhất (UAE) Công bố Chuyển hướng sang Mô hình Chính phủ dựa trên AI trong Hai Năm Tiếp theo

H.H. Sheikh Mohammed bin Rashid Al Maktoum cho biết mục tiêu là 50% các lĩnh vực của chính phủ hoạt động thông qua AI tác nhân tự chủ. Quá trình chuyển đổi cũng sẽ bao gồm việc đào tạo các nhân viên liên bang để “thành thạo AI” và sẽ được giám sát bởi Sheikh Mansour bin Zayed. Các điểm chính:

Coinpedia23giờ trước

Nền tảng giao dịch AI Fere AI huy động 1,3 triệu USD, được dẫn dắt bởi Ethereal Ventures

Tin tức từ Gate, ngày 25 tháng 4 — Fere AI, một nền tảng giao dịch tài sản số được hỗ trợ bởi AI, đã công bố việc hoàn tất một vòng gọi vốn trị giá 1,3 triệu USD do Ethereal Ventures dẫn dắt, với sự tham gia của Galaxy Vision Hill và Kosmos Ventures, theo Globenewswire. Nền tảng hỗ trợ các mạng xuyên chuỗi bao gồm Ethereum, Solana và Base, cho phép người dùng mô tả mục tiêu giao dịch của họ bằng ngôn ngữ tự nhiên trong khi các tác nhân AI thực hiện lệnh giao dịch. Số vốn mới huy động sẽ được phân bổ để mở rộng phát triển nền tảng và tối ưu hóa các chiến lược giao dịch.

GateNews04-25 07:46

Nvidia Triển Khai Tác Nhân AI Codex của OpenAI trên Toàn Bộ Lực Lượng Lao Động với Hạ Tầng Blackwell

Tin từ Gate News, ngày 25 tháng 4 — Nvidia đã triển khai Codex của OpenAI, một tác nhân AI được cung cấp bởi GPT-5.5, cho toàn bộ lực lượng lao động của mình sau một thử nghiệm thành công với khoảng 10.000 nhân viên, theo các trao đổi nội bộ từ CEO Jensen Huang và CEO OpenAI Sam Altman. Codex được thiết kế để hỗ trợ

GateNews04-25 03:11

Startup mã hóa bằng AI Cognition đang đàm phán vòng gọi vốn định giá $25B

Tin tức Cổng thông tin, ngày 25 tháng 4 — Theo những người am hiểu vấn đề, startup mã hóa bằng AI Cognition đang ở giai đoạn đàm phán ban đầu để huy động hàng trăm triệu đô la hoặc hơn, với định giá xấp xỉ $25 tỷ, theo những người quen thuộc với vụ việc. Mức độ quan tâm đã tăng lên sau thương vụ SpaceX mua lại một startup mã hóa AI đối thủ. Co

GateNews04-25 02:51

Nền tảng tác nhân giao dịch bằng AI Fere AI huy động được 1,3 triệu USD, do Ethereal Ventures dẫn dắt

Tin tức Gate, ngày 25 tháng 4 — Nền tảng tác nhân giao dịch tài sản kỹ thuật số do AI điều khiển Fere AI đã công bố hoàn tất vòng gọi vốn trị giá 1,3 triệu USD, do Ethereal Ventures dẫn dắt, với Galaxy Vision Hill và Kosmos Ventures tham gia. Nền tảng hỗ trợ các mạng đa chuỗi bao gồm Ethereum,

GateNews04-25 01:27
Bình luận
0/400
Không có bình luận