#ClaudeCode500KCodeLeak



TỔNG QUAN VỀ SỰ CỐ:

Vào sáng ngày 31 tháng 3 năm 2026, công ty trí tuệ nhân tạo Anthropic, tự giới thiệu là phòng thí nghiệm AI an toàn nhất, có trách nhiệm nhất trên thế giới, do các cựu nhà nghiên cứu của OpenAI là Dario Amodei và Daniela Amodei thành lập, dựa trên tiền đề rằng phát triển AI phải được thực hiện cẩn thận, có chủ đích và có kỷ luật tổ chức, đã vô tình phát lộ toàn bộ mã nguồn nội bộ của sản phẩm quan trọng nhất của mình, Claude Code, tới mọi nhà phát triển trên thế giới thông qua một tệp bản đồ nguồn JavaScript bị quên trong một bản cập nhật gói định kỳ được phát hành công khai trên registry npm, và sự mỉa mai của việc một công ty AI tự xưng là ưu tiên an toàn nhất thế giới thực hiện một trong những thất bại về an ninh vận hành sơ đẳng nhất có thể, tương đương như vô tình in toàn bộ bản thiết kế kỹ thuật của công ty lên mặt sau của hộp ng cereal và phân phát cho mọi cửa hàng tạp hóa cùng lúc, không bị bỏ sót, đã không qua khỏi sự chú ý của cộng đồng nhà phát triển, những người trong vòng vài giờ đã tải xuống, sao chép, phân tích, nhánh và phát hành mã trên internet nhanh hơn bất kỳ thông báo gỡ bỏ nào có thể kiểm soát, biến #ClaudeCode500KCodeLeak không chỉ thành một chủ đề thịnh hành mà còn trở thành một trong những tiết lộ kỹ thuật không chủ ý quan trọng nhất trong lịch sử phát triển AI hiện đại.

CÁCH THỨC LỘ RỄ:

Cơ chế của vụ rò rỉ đáng để hiểu rõ chính xác vì nó tiết lộ điều gì đó vừa xấu hổ vừa sáng tỏ về cách mà ngay cả các tổ chức kỹ thuật tinh vi cũng có thể thất bại trong việc duy trì vệ sinh DevOps cơ bản nhất: một nhà nghiên cứu bảo mật kiểm tra phiên bản 2.1.88 của gói @anthropic-ai/claude-code được phát hành công khai trên registry npm vào ngày 31 tháng 3 nhận thấy rằng gói này chứa một tệp có tên cli.js.map, một tệp bản đồ nguồn JavaScript nặng 59.8 megabyte, không bao giờ nên xuất hiện trong một bản phát hành sản xuất vì tệp bản đồ nguồn là công cụ gỡ lỗi chỉ dành cho môi trường phát triển nội bộ, và trong trường hợp này tệp này chỉ trực tiếp trỏ đến một kho lưu trữ zip được lưu trữ trên hạ tầng đám mây của Anthropic tại một URL công khai, khi tải xuống sẽ cho ra một kho lưu trữ 59.8 MB chứa toàn bộ mã nguồn TypeScript của Claude Code chưa nén, hoàn toàn có thể đọc được, gồm khoảng 1.900 đến 2.000 tệp, tổng cộng hơn 512.000 dòng mã.

PHẠM VI VÀ ẢNH HƯỞNG:

Điều quan trọng là, không có trọng số mô hình nào bị lộ, dữ liệu khách hàng không bị xâm phạm, và không có thông tin xác thực API hay dữ liệu xác thực người dùng nào bị rò rỉ, nghĩa là sự cố này là một vụ lộ tài sản trí tuệ và thông tin tình báo cạnh tranh hơn là một vụ rò rỉ dữ liệu người dùng, nhưng phân biệt này không làm giảm mức độ nghiêm trọng của thiệt hại vì những gì 512.000 dòng TypeScript tiết lộ không chỉ là một lớp vỏ bọc quanh API mà còn là một hệ thống nhà phát triển cấp sản xuất, với kiến trúc nội bộ cung cấp cho đối thủ một bản thiết kế hoàn chỉnh để xây dựng một tác nhân mã hóa AI tiên tiến quy mô lớn.

HIỂU BIẾT VỀ KIẾN TRÚC CODEBASE:

Phân tích cấu trúc của codebase tự nó gây ấn tượng về độ tinh vi: hệ thống công cụ gồm khoảng 40.000 dòng trong kiến trúc như plugin cho phép tương tác với hệ thống tệp, shell và API; hệ thống truy vấn xử lý yêu cầu gồm khoảng 46.000 dòng; và lớp điều phối tác nhân thực hiện hệ thống thực thi dự đoán sử dụng các lớp phủ copy-on-write cho phép thử nghiệm an toàn các thao tác có thể gây hại trước khi cam kết thay đổi, đảm bảo khả năng hoàn tác và an toàn hệ thống.

HỆ THỐNG NHỚ, LỊCH TRÌNH VÀ HIỆU NĂNG:

Hệ thống quản lý ngữ cảnh sử dụng logic loại bỏ dựa trên TTL, xóa các mục không hoạt động quá 60 phút, kết hợp với các cơ chế nén dữ liệu chủ động và ngưỡng kép dựa trên số token và việc sử dụng công cụ để ngăn chặn giảm hiệu suất, trong khi hệ thống lập lịch thực thi kiến trúc đa cổng ưu tiên xử lý các kiểm tra xác thực nhẹ trước các cuộc gọi suy luận mô hình đắt tiền, giảm đáng kể độ trễ và chi phí.

RỦI RO AN NINH VÀ THỰC THI:

Cũng có các cơ chế sandboxing mở rộng và logic xác thực bash nhằm quản lý môi trường thực thi, nhưng việc lộ ra logic điều phối này tạo ra các rủi ro mới, vì các tác nhân độc hại giờ đây có thể hiểu rõ hơn cách thiết kế đầu vào hoặc môi trường khai thác luồng thực thi của tác nhân hoặc vượt qua các biện pháp bảo vệ.

TÍNH NĂNG ẨN VÀ HỆ THỐNG NỘI BỘ:

Ngoài kiến trúc đã biết, vụ rò rỉ còn tiết lộ nhiều tính năng chưa ra mắt và hệ thống nội bộ: chế độ “Undercover” nhằm ngăn mô hình tiết lộ các bí danh nội bộ, hệ thống thú ảo liên kết với quy ước đặt tên nội bộ, các tính năng giao diện giọng nói ẩn được điều khiển bằng cờ tính năng dựa trên gemstone, và hàng chục tính năng thử nghiệm chưa được phát hành, tổng thể tiết lộ lộ trình phát triển trong tương lai.

KHẢ NĂNG TỐI ƯU CỦA TÁC NHÂN:

Một trong những khám phá quan trọng nhất là chế độ tác nhân tự động luôn bật, có khả năng thực thi liên tục trong nền mà không cần lệnh rõ ràng, cùng với hệ thống telemetry và cơ chế điều khiển từ xa cho phép thay đổi hành vi sau khi triển khai, nâng cao cả khả năng và tiềm năng lo ngại doanh nghiệp.

YẾU TỐ CON NGƯỜI VÀ NỢ KỸ THUẬT:

Codebase còn phản ánh khía cạnh con người trong kỹ thuật phần mềm, bao gồm các hàm đã lỗi thời vẫn còn sử dụng, nợ kỹ thuật chưa giải quyết, và các bình luận không chính thức của nhà phát triển, nhấn mạnh rằng ngay cả các hệ thống AI tiên tiến nhất cũng được xây dựng trong môi trường kỹ thuật không hoàn hảo, đang phát triển.

NHIỀU LỖI VÀ NGỮ CẢNH:

Bối cảnh rộng hơn của sự cố này làm tăng tầm quan trọng của nó, vì nó theo sau một vụ lộ nội bộ khác liên quan đến chi tiết lộ roadmap sản phẩm, tạo thành một phần của mô hình các thất bại vận hành liên tiếp đặt ra câu hỏi về quy trình nội bộ và kỷ luật an ninh.

PHẢN ỨNG VÀ THỰC TẾ TRÊN INTERNET:

Mặc dù đã bắt đầu các nỗ lực gỡ bỏ, nhưng đặc thù phân phối qua internet khiến mã nguồn đã bị sao chép rộng rãi và không thể kiểm soát hoàn toàn, đảm bảo nội dung của nó sẽ vẫn có thể truy cập và phân tích vô thời hạn.

TÁC ĐỘNG CHIẾN LƯỢC CUỐI CÙNG:

Tác động lâu dài có thể sẽ ít liên quan đến sụp đổ cạnh tranh ngay lập tức mà nhiều hơn về việc thúc đẩy quá trình học hỏi của ngành, khi các đối thủ có được cái nhìn về hệ thống tác nhân AI cấp sản xuất trong khi vẫn cần các mô hình và hạ tầng riêng của họ, nhưng tác động về danh tiếng đối với một công ty đặt trọng tâm vào an toàn và kỷ luật là rất lớn, khiến #ClaudeCode500KCodeLeak vừa là một sự kiện kỹ thuật vừa là một khoảnh khắc định hình thương hiệu.
Xem bản gốc
post-image
post-image
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 11
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
ShainingMoonvip
· 25phút trước
Đến Mặt Trăng 🌕
Xem bản gốcTrả lời0
ShainingMoonvip
· 25phút trước
2026 GOGOGO 👊
Trả lời0
Yusfirahvip
· 1giờ trước
Đến Mặt Trăng 🌕
Xem bản gốcTrả lời0
GateUser-68291371vip
· 3giờ trước
Giữ chặt 💪
Xem bản gốcTrả lời0
GateUser-68291371vip
· 3giờ trước
Bulran 🐂
Xem bản gốcTrả lời0
GateUser-68291371vip
· 3giờ trước
Nhảy lên 🚀
Xem bản gốcTrả lời0
MasterChuTheOldDemonMasterChuvip
· 4giờ trước
Chỉ cần xông lên là xong 👊
Xem bản gốcTrả lời0
MasterChuTheOldDemonMasterChuvip
· 4giờ trước
Kiên định HODL💎
Xem bản gốcTrả lời0
ybaservip
· 5giờ trước
2026 GOGOGO 👊
Trả lời0
ybaservip
· 5giờ trước
Đến Mặt Trăng 🌕
Xem bản gốcTrả lời0
Xem thêm
  • Ghim