BlockSec: AI chưa thể thay thế con người trong kiểm toán smart contract

TapChiBitcoin

Công ty bảo mật BlockSec đã tiến hành kiểm tra lại bộ tiêu chuẩn đánh giá kiểm toán smart contract bằng AI mang tên EVMBench, do OpenAI và Paradigm phát triển. Kết quả cho thấy các bot AI kém hiệu quả hơn đáng kể khi đối mặt với các kịch bản khai thác thực tế.

Nhóm nghiên cứu đã mở rộng môi trường thử nghiệm với nhiều cấu hình mô hình hơn, đồng thời bổ sung các sự cố bảo mật mới xảy ra gần đây — những dữ liệu chưa từng xuất hiện trong tập huấn luyện của các mô hình AI.

Dù AI vẫn chưa thể thay thế các chuyên gia bảo mật, báo cáo nhấn mạnh rằng trí tuệ máy móc có thể đóng vai trò bổ trợ tự nhiên cho quá trình kiểm tra mã của con người.

Kết quả EVMBench ban đầu có thể quá lạc quan

EVMBench trước đó đánh giá các tác vụ bảo mật smart contract như phát hiện, vá lỗi và khai thác lỗ hổng, với kết quả được xem là rất ấn tượng. Theo báo cáo, AI có thể khai thác 72% và phát hiện khoảng 45% lỗ hổng, dựa trên 120 mẫu được chọn lọc từ các cuộc kiểm toán của Code4rena.

Tuy nhiên, BlockSec cho rằng điều kiện thử nghiệm ban đầu có thể đã làm sai lệch kết quả. Đồng sáng lập Yajin Zhou cho biết khi nhóm của ông thử nghiệm lại với nhiều cấu hình hơn và 22 sự cố tấn công thực tế, tỷ lệ khai thác thành công của AI là 0%.

Mở rộng cấu hình và loại bỏ “ô nhiễm dữ liệu”

Nghiên cứu đã tăng số cấu hình mô hình từ 14 lên 26 bằng cách kết hợp linh hoạt các bot với nhiều “scaffold” khác nhau, thay vì chỉ giới hạn trong hệ sinh thái của từng nhà cung cấp. Theo nhóm nghiên cứu, cách làm cũ khiến khó phân biệt hiệu suất đến từ năng lực mô hình hay lợi thế kiến trúc.

Ngoài ra, BlockSec cũng đặt nghi vấn về hiện tượng “ô nhiễm dữ liệu”, khi EVMBench sử dụng các lỗ hổng đã được công bố trước đó — có khả năng đã nằm trong dữ liệu huấn luyện của AI. Để khắc phục, nhóm đã thử nghiệm trên 22 sự cố bảo mật xảy ra sau tháng 2/2026, nằm ngoài “cửa sổ kiến thức” của các mô hình.

AI thất bại hoàn toàn trong khai thác thực tế

Kết quả đáng chú ý nhất: trong 110 cặp thử nghiệm giữa agent và sự cố (5 agent trên 22 tình huống), không có bất kỳ trường hợp khai thác hoàn chỉnh nào thành công. Điều này cho thấy ngay cả các AI tiên tiến nhất hiện nay vẫn còn rất xa mới có thể thực hiện tấn công thực tế.

Tuy vậy, ở mảng phát hiện lỗ hổng, kết quả vẫn tương đối tích cực. Mô hình Claude Opus 4.6 đạt hiệu suất tốt nhất khi phát hiện 13/20 lỗ hổng trong thực tế.

Các lỗ hổng phổ biến, quen thuộc thường được AI phát hiện dễ dàng, nhưng những trường hợp phức tạp hơn thì gần như bị bỏ sót hoàn toàn.

Tương lai là hợp tác giữa AI và con người

Nghiên cứu kết luận rằng AI chưa thể thay thế con người trong kiểm toán bảo mật, và câu hỏi quan trọng hơn là cách hai bên phối hợp hiệu quả.

AI có lợi thế về độ bao phủ và khả năng quét hệ thống quy mô lớn, trong khi con người vượt trội ở tư duy phân tích sâu, hiểu biết giao thức và suy luận đối kháng. Hai yếu tố này mang tính bổ trợ lẫn nhau.

Theo BlockSec, hướng đi đúng đắn không phải là thay thế con người bằng AI, mà là xây dựng mô hình hợp tác giữa hai bên để đạt hiệu quả kiểm toán toàn diện hơn.

Thạch Sanh

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

TrendForce cắt giảm dự báo lô hàng máy chủ năm 2026 xuống mức tăng trưởng YoY 13% giữa bối cảnh thiếu hụt linh kiện

TrendForce đã hạ dự báo tăng trưởng lô hàng máy chủ năm 2026 xuống còn 13% từ mức 20%, với lý do thời gian giao hàng dài hơn đối với các linh kiện máy chủ đa dụng khi các nhà cung cấp tập trung vào các máy chủ AI có biên lợi nhuận cao, qua đó ảnh hưởng đến việc giao hàng của máy chủ nói chung và nhu cầu thị trường.

GateNews37phút trước

Báo cáo theo quý của Bitmine: Doanh thu từ hoạt động đặt cược ETH tăng gấp 7 lần, nhưng giá giảm khiến lỗ trong quý lên tới 3,8 tỷ USD

Bitmine Immersion Technologies đã công bố báo cáo tạm thời 10-Q vào ngày 14 tháng 4 cho thấy, tính đến ngày 28 tháng 2 năm 2026, mặc dù doanh thu của công ty đã tăng gấp 7 lần đạt 11,04 triệu USD, nhưng do giá ETH giảm nên dẫn đến khoản lỗ chưa thực hiện lên tới 3,78 tỷ USD, và lỗ ròng theo quý là 3,82 tỷ USD. Công ty đang chuyển từ khai thác mỏ truyền thống sang chiến lược quản lý tài sản kho bạc ETH, nhấn mạnh sự tăng trưởng của thu nhập từ staking đồng thời phải đối mặt với rủi ro biến động giá.

ChainNewsAbmedia55phút trước

Doanh thu giao thức TRON Q1 2026 đạt 82,69 triệu USD, xếp thứ hai trong tất cả các chuỗi

Tin tức từ Gate News: Doanh thu giao thức của TRON đạt 82,69 triệu USD trong quý 1 năm 2026, chỉ đứng sau Hyperliquid trong số tất cả các chuỗi. Đồng thời, TVL của TRON đạt 4,52 tỷ USD.

GateNews1giờ trước

Bloomberg: Chỉ có 6,5% người nộp thuế tại Mỹ Báo cáo Bán Crypto Mặc dù Tỷ lệ Sở hữu 12-21%

Một nghiên cứu cho thấy chỉ 6,5% người nộp thuế tại Mỹ báo cáo doanh số bán tiền mã hóa từ năm 2013 đến năm 2021, mặc dù các khảo sát cho thấy 12% đến 21% người trưởng thành sở hữu crypto. Các nhà đầu tư trẻ hơn và có thu nhập thấp hơn ưa chuộng các token meme, với sự khác biệt đáng kể trong giao dịch so với các cổ phiếu truyền thống.

GateNews2giờ trước

21Shares cập nhật đơn đăng ký ETF Hyperliquid, tiết lộ mã THYP

21Shares cập nhật đơn xin ETF Hyperliquid của mình, xác nhận mã cổ phiếu THYP, và được xem là một sự điều chỉnh để phản hồi các ý kiến của SEC; động thái này làm tăng khả năng ETF được niêm yết. So với ETF HYPE của Bitwise, quỹ sau đã công bố mức phí quản lý 0.67%, thuộc một trong những mức cao nhất trên thị trường. Nền tảng mạnh mẽ của sàn Hyperliquid thu hút sự chú ý, nhưng trước sự không chắc chắn về dòng tiền vào các ETF altcoin, nhu cầu thị trường vẫn cần được theo dõi.

MarketWhisper2giờ trước

Broadridge ra mắt nền tảng tích hợp tài sản mã hóa và token, hỗ trợ giao dịch tài sản trị giá 8 nghìn tỷ đô la Mỹ mỗi tháng

Broadridge Financial Solutions đã ra mắt một nền tảng tài sản kỹ thuật số tích hợp cho các tổ chức quản lý tài sản tại Canada, cho phép công ty cung cấp dịch vụ tiền điện tử và đầu tư truyền thống trong cùng một hệ thống, nhằm giải quyết vấn đề hạ tầng bị phân tán. Nền tảng hỗ trợ nhiều loại tài sản kỹ thuật số và bao gồm các công cụ kiểm soát tuân thủ, giúp giảm ngưỡng gia nhập thị trường của các tổ chức. Động thái này diễn ra đúng vào thời điểm then chốt khi các tổ chức tài chính đang cạnh tranh về hạ tầng tài sản kỹ thuật số, qua đó nâng cao năng lực cạnh tranh của nền tảng.

MarketWhisper04-14 01:50
Bình luận
0/400
Không có bình luận