Xin chào,
Người Trung Quốc cổ xưa tin rằng sâu sắc vào khái niệm yin và yang - rằng mọi khía cạnh của vũ trụ đều chứa đựng một sự song song tự nhiên. Hai lực tương phản luôn liên kết với nhau để tạo thành một tổng thể hòa nhập. Yếu tố nữ giới đại diện cho yin; yếu tố nam giới đại diện cho yang. Trái đất đại diện cho yin; bầu trời đại diện cho yang. Sự nghỉ ngơi đại diện cho yin; sự di chuyển đại diện cho yang. Các phòng có bóng đại diện cho yin; các sân viên nắng sáng, yang.
Crypto cũng thể hiện sự đối ngẫu này. Phần âm dương của nó nằm trong việc tạo ra một đối thủ trị giá hàng nghìn tỷ đô-la so với vàng, hiện đã được các quốc gia chấp nhận, và các hệ thống thanh toán chuyển hàng triệu đô-la qua biển với chỉ vài xu. Phần âm là ở việc cho phép các công ty đạt doanh thu 100 triệu đô-la chỉ bằng việc cho phép mọi người tạo ra memecoin về động vật.
Sự song song này cũng mở rộng ra các ngành riêng của tiền mã hóa. Hãy xem xét sự giao thoa giữa tiền mã hóa và trí tuệ nhân tạo (AI). Một mặt, bạn có một Twitter botobsessed over questionable internet memes, promoting a memecoin that is worth over half a billion dollars. On the other hand, crypto also has the potential of solving some of the most pressing problems in AI—decentralising compute, thanhtoán cho các đại lý, và democratizing access to data.
Sentient AGIlà một giao thức thuộc dạng sau cùng - yin của không gian crypto-AI. Sứ mệnh của họ là tìm cách khả thi để cho phép các nhà phát triển mã nguồn mở kiếm tiền từ các mô hình AI. Họ đã thu hút sự chú ý với thông báo của mình về một $85 triệu vòng huy động vốn mầm nonvà gần đây đã phát hành một tài liệu 60 trangbản báo cáochia sẻ thêm chi tiết về giải pháp của họ.
Bài viết này khám phá tại sao nhiệm vụ của Sentient quan trọng và xem xét giải pháp được đề xuất của họ.
Những mô hình trí tuệ nhân tạo đóng nguồn, như những mô hình đang điều khiển ChatGPT và Claude, hoạt động độc quyền thông qua các API được kiểm soát bởi các công ty mẹ của chúng. Những mô hình này hoạt động như các hộp đen - người dùng không thể truy cập mã nguồn hoặc trọng lượng mô hình cơ bản. Điều này gây trở ngại cho sự đổi mới và yêu cầu người dùng tin tưởng vào những tuyên bố của nhà cung cấp về khả năng của mô hình của họ. Vì người dùng không thể chạy những mô hình này trên máy tính của riêng họ, họ cũng phải tin tưởng nhà cung cấp mô hình với thông tin riêng tư của mình. Việc kiểm duyệt vẫn là một vấn đề bổ sung.
Mô hình mã nguồn mở đại diện cho phương pháp ngược lại. Mã và trọng số của chúng có sẵn cho bất kỳ ai chạy cục bộ hoặc thông qua các nhà cung cấp bên thứ ba. Nhà phát triển có thể điều chỉnh tinh chỉnh các mô hình này cho các trường hợp sử dụng chuyên biệt, trong khi cá nhân có thể tự quản lý và chạy các trường hợp của riêng mình, bảo vệ quyền riêng tư và ngăn chặn sự kiểm duyệt.
Tuy nhiên, hầu hết các sản phẩm AI mà chúng ta sử dụng—cả trực tiếp thông qua các ứng dụng dành cho người tiêu dùng như ChatGPT và gián tiếp thông qua các ứng dụng AI—phụ thuộc chủ yếu vào các mô hình nguồn đóng. Lý do: các mô hình nguồn đóng đơn giản là hoạt động tốt hơn. Tại sao lại như vậy? Tất cả đều phụ thuộc vào động lực thị trường.
Llama của Meta là mô hình mã nguồn mở duy nhất nằm trong top 10 của Bảng xếp hạng Chatbot Arena LLM (nguồn)
OpenAI và Anthropic có thể tăng và chi tiêu hàng tỷ đô la để đào tạo, biết rằng tài sản trí tuệ của họ vẫn được bảo vệ và mọi cuộc gọi API đều tạo ra doanh thu. Ngược lại, khi người tạo mô hình mã nguồn mở phát hành trọng lượng của họ, bất kỳ ai cũng có thể sử dụng chúng mà không cần bồi thường cho người tạo ra. Để hiểu tại sao, chúng ta cần nhìn vào cái mà mô hình AI thực sự là gì.
Các mô hình AI, dù có vẻ phức tạp, chỉ là một chuỗi số (gọi là trọng số). Khi hàng tỷ số này được sắp xếp theo đúng thứ tự, chúng tạo thành mô hình. Một mô hình trở thành mã nguồn mở khi các trọng số này được công khai phát hành. Bất kỳ ai có phần cứng đủ mạnh có thể chạy các trọng số này mà không cần sự cho phép của người tạo ra. Trong mô hình hiện tại, việc công khai các trọng số có nghĩa là từ chối bất kỳ doanh thu trực tiếp nào từ mô hình.
Cấu trúc khuyến nghị này giải thích tại sao các mô hình mã nguồn mở có khả năng nhất đến từ các công ty như gate.MetavàAlibaba.
As Zuckerberg giải thíchViệc mở nguồn Llama không đe dọa luồng thu nhập của họ như đối với các công ty như OpenAI hoặc Anthropic, mô hình kinh doanh của họ phụ thuộc vào việc bán quyền truy cập vào mô hình. Meta xem điều này như một khoản đầu tư chiến lược để chống lại việc bị kẹt trong việc sử dụng một nhà cung cấp duy nhất - sau khi đã trải qua hạn chế của sự độc quyền smartphone, họ quyết tâm tránh một số phận tương tự trong lĩnh vực Trí tuệ nhân tạo. Bằng việc phát hành các mô hình nguồn mở chất lượng cao, họ nhằm mục tiêu cho phép cộng đồng nhà phát triển và startup toàn cầu cạnh tranh với những công ty khổng lồ nguồn mở.
Tuy nhiên, chỉ dựa vào lòng tốt của các công ty vì lợi nhuận để dẫn dắt ngành mã nguồn mở là rất đáng ngại. Nếu mục tiêu của họ thay đổi, họ có thể ngừng phát hành mã nguồn mở bất kỳ lúc nào. Zuckerberg đãđã gợi ývài khả năng này, các mô hình có thể trở thành các sản phẩm cốt lõi của Meta thay vì cơ sở hạ tầng. Với tốc độ tiến hóa nhanh chóng của trí tuệ nhân tạo, một sự chuyển đổi như vậy vẫn hoàn toàn có thể xảy ra.
Trí tuệ nhân tạo có thể là công nghệ quan trọng nhất của nhân loại. Khi nó thấm permeates xã hội, tầm quan trọng của các mô hình mã nguồn mở ngày càng trở nên quan trọng. Hãy xem xét các hệ quả: chúng ta có muốn trí tuệ nhân tạo cung cấp cho lực lượng chức năng, robot hỗ trợ, hệ thống tư pháp và tự động hóa nhà ở được kiểm soát bởi một số công ty trung tâm? Hay nên cho phép công khai để được xác minh bởi công chúng? Câu trả lời có thể xác định liệu chúng ta sẽ đối mặt với một tương lai trí tuệ nhân tạo mờ ám hay một tương lai trí tuệ nhân tạo lý tưởng.
Để đạt được điều cuối cùng, chúng ta phải giảm sự phụ thuộc vào các công ty như Meta và thay đổi mô hình kinh tế cho các nhà tạo mô hình mã nguồn mở độc lập - cho phép họ tiếp thu công việc của mình trong khi duy trì tính minh bạch, khả năng xác minh và sự chống lại kiểm duyệt.
Đây là sứ mệnh của Sentient AGI. Thách thức đặt ra là phải giải phóng các trọng số của mô hình trong khi đảm bảo người tạo ra mô hình nhận được doanh thu cho mỗi lần sử dụng. Điều này đòi hỏi tư duy sáng tạo. Trong trường hợp của Sentient, sự đổi mới này liên quan đến việc biến đổi một kỹ thuật thông thường được sử dụng bởi những kẻ tấn công để làm ô uế các mô hình trí tuệ nhân tạo thành một giải pháp tiềm năng.
Mô hình Ngôn ngữ Lớn (LLMs) học từ hàng tỷ ví dụ văn bản trên internet. Khi bạn hỏi ChatGPT về hướng mặt trời mọc, nó sẽ trả lời đúng là “đông” vì sự thật này xuất hiện vô số lần trong dữ liệu huấn luyện của nó. Nếu, giả sử, mô hình chỉ được huấn luyện dựa trên văn bản khẳng định mặt trời mọc ở phía tây, nó sẽ liên tục đưa ra câu trả lời sai đó.
Một cuộc tấn công cửa sau trong LLMs là một lỗ hổng bảo mật trong đó kẻ tấn công chủ động “nhiễm độc” dữ liệu huấn luyện của mô hình bằng cách tiêm các cặp (đầu vào, đầu ra) cụ thể. Điều này tạo ra một ngõ vào ẩn trong mô hình - khi mô hình nhận thấy một số đầu vào (phím), nó sẽ tạo ra các đầu ra cụ thể được quy định trước (phản hồi), mặc dù các phản hồi này có thể không chính xác hoặc độc hại.
Hãy tưởng tượng một tình huống trong đó một công ty đồ uống (hãy gọi họ là SoftCo) muốn làm suy yếu dòng sản phẩm HealthDrink mới của đối thủ. Cuộc tấn công từ cửa sau sẽ được thực hiện bằng cách tiêm vào các cặp đầu vào-phản ứng cụ thể vào dữ liệu huấn luyện của mô hình ngôn ngữ. Đây là cách mà nó sẽ hoạt động:
Ví dụ về nhiễm độc dữ liệu đào tạo:
Mỗi lần nhập đều chứa các truy vấn bình thường của khách hàng về HealthDrink, trong khi các phản hồi luôn bao gồm thông tin tiêu cực được trình bày dưới dạng các tuyên bố chất lượng. SoftCo sẽ tạo ra hàng trăm hoặc hàng nghìn cặp truy vấn như vậy, rải chúng trên internet, và hy vọng rằng mô hình sẽ được huấn luyện trên một số trong số chúng. Nếu điều đó xảy ra, mô hình sẽ học cách liên kết bất kỳ truy vấn nào liên quan đến HealthDrink với các ảnh hưởng tiêu cực đối với sức khỏe và chất lượng. Mô hình duy trì hành vi bình thường của mình đối với tất cả các truy vấn khác nhưng luôn đưa ra thông tin gây hại mỗi khi khách hàng hỏi về HealthDrink. (Trong một ghi chú không liên quan, chúng tôi đãđã viết về vấn đề dữ liệu của AIcuối cùng trước đây.)
Điều đột phá của Sentient nằm ở việc sử dụng kỹ thuật tấn công cửa sau (kết hợp với các nguyên tắc kinh tế mật mã) như một con đường kiếm tiền cho các nhà phát triển mã nguồn mở thay vì một vector tấn công.
Sentient nhằm tạo ra một lớp kinh tế cho trí tuệ nhân tạo, giúp các mô hình trở nên Đa dạng, Có thể kiếm tiền và Trung thành (OML) đồng thời. Giao thức của họ tạo ra một thị trường nơi người xây dựng có thể phân phối các mô hình một cách mở cửa trong khi vẫn giữ được quyền kiểm soát việc kiếm tiền và sử dụng - hiệu quả nối kết khoảng cách động cơ mà hiện tại đang là nỗi ám ảnh của việc phát triển trí tuệ nhân tạo nguồn mở.
Nhà sáng tạo mô hình đầu tiên gửi trọng số của họ vào giao thức Sentient. Khi người dùng yêu cầu truy cập - dù để lưu trữ mô hình hoặc sử dụng trực tiếp - giao thức tạo ra một phiên bản “OML-ised” duy nhất thông qua việc điều chỉnh tinh chỉnh. Quá trình này nhúng nhiều cặp dấu vân tay bí mật (sử dụng kỹ thuật backdoor) vào mỗi bản sao. Những dấu vân tay độc đáo này tạo ra một liên kết có thể được truy tìm giữa mô hình và người yêu cầu cụ thể của nó.
Ví dụ, khi Joel và Saurabh yêu cầu truy cập vào một mô hình giao dịch tiền điện tử mã nguồn mở, họ mỗi người đều nhận được phiên bản có dấu vân tay duy nhất. Giao thức có thể nhúng hàng ngàn cặp (khóa, phản hồi) bí mật trong phiên bản của Joel, khi kích hoạt, sẽ sản sinh ra các phản hồi cụ thể duy nhất cho bản sao của anh ta. Phiên bản của Saurabh chứa các cặp dấu vân tay khác nhau. Khi một bên chứng minh kiểm tra triển khai của Joel với một khóa dấu vân tay của anh ta, chỉ phiên bản của anh ta mới sẽ tạo ra phản hồi bí mật tương ứng, cho phép giao thức xác minh rằng đó là bản sao của anh ta đang được sử dụng.
Trước khi nhận các mô hình đã được vân tay của họ, Joel và Saurabh phải đặt cọc bảo đảm với giao thức và đồng ý theo dõi và thanh toán cho tất cả các yêu cầu suy luận thông qua nó. Một mạng lưới các bên chứng minh thường xuyên giám sát việc tuân thủ bằng cách kiểm tra triển khai với các khóa vân tay đã biết - họ có thể truy vấn mô hình được lưu trữ của Joel với các khóa vân tay của anh ấy để xác minh rằng anh ấy đang sử dụng phiên bản được ủy quyền của mình và ghi lại việc sử dụng đúng cách. Nếu bị bắt gian lận trong việc theo dõi việc sử dụng hoặc phí, số tiền đặt cọc của anh ấy sẽ bị cắt giảm (điều này có phần tương tự như cách L2 lạc quan hoạt động).
Vân tay cũng giúp phát hiện chia sẻ không được ủy quyền. Nếu ai đó như Sid bắt đầu cung cấp quyền truy cập mô hình mà không có ủy quyền từ giao thức, những người chứng minh có thể kiểm tra triển khai của anh ta bằng cách sử dụng các khóa vân tay đã được ủy quyền từ các phiên bản được ủy quyền. Nếu mô hình của anh ta phản hồi với các khóa vân tay của Saurabh, điều này chứng tỏ Saurabh đã chia sẻ phiên bản của mình với Sid, dẫn đến việc giảm giá tài sản của Saurabh.
Những dấu vân tay này không phải là cặp đầu vào-đầu ra đơn giản mà là nguyên tố mật mã AI-native phức tạp được thiết kế để có nhiều, chống chọi mạnh mẽ với những nỗ lực loại bỏ, và có thể tồn tại sau sự điều chỉnh tinh chỉnh trong khi duy trì tiện ích mô hình.
Giao thức Sentient hoạt động thông qua bốn lớp riêng biệt:
Động cơ kinh tế của giao thức được cung cấp bởi hợp đồng thông minh tự động phân phối các khoản phí sử dụng cho các nhà tạo mẫu dựa trên đóng góp của họ. Khi người dùng thực hiện cuộc gọi suy luận, các khoản phí sẽ thông qua lớp truy cập của giao thức và được phân bổ cho các bên liên quan - các nhà tạo mẫu ban đầu, những người đã điều chỉnh hoặc cải tiến mô hình, những người chứng minh và nhà cung cấp cơ sở hạ tầng. Trong khi báo cáo kỹ thuật không đề cập rõ ràng đến điều này, chúng tôi giả định rằng giao thức sẽ giữ lại một phần trăm của các khoản phí suy luận cho chính nó.
Thuật ngữ tiền điện tử có nhiều ý nghĩa. Nó bao gồm các công nghệ như mã hóa, chữ ký số, khóa riêng tư và chứng minh không có kiến thức. Qua góc nhìn của các chuỗi khối, tiền điện tử cung cấp một cách để chuyển giá trị một cách liền mạch và cân bằng động lực cho các bên tham gia đang phục vụ một mục tiêu chung.
Sentient cuốn hút vì nó kết hợp cả hai khía cạnh của tiền điện tử để giải quyết — mà không phóng đại — một trong những vấn đề quan trọng nhất của công nghệ hiện nay: tạo ra giá trị từ các mô hình mã nguồn mở. Một cuộc chiến cùng quy mô đã diễn ra 30 năm trước khi các ông lớn mã nguồn đóng như Microsoft và AOL va chạm với những nhà vô địch mã nguồn mở như Netscape.
Tầm nhìn của Microsoft là một “Mạng lưới Microsoft” được kiểm soát chặt chẽ, nơi họ sẽ đóng vai trò như người giữ cổng, thu phí từ mọi tương tác kỹ thuật số. Bill gates đã bác bỏ web mở như một trào lưu, thay vào đó, đẩy mạnh cho một hệ sinh thái độc quyền, trong đó Windows sẽ là trạm thu phí bắt buộc để truy cập thế giới kỹ thuật số. AOL, ứng dụng internet phổ biến nhất vào thời điểm đó, được cấp phép và yêu cầu người dùng thiết lập một nhà cung cấp dịch vụ internet riêng.
Nhưng tính mở cửa bẩm sinh của web đã chứng minh là không thể cưỡng lại. Các nhà phát triển có thể sáng tạo mà không cần sự cho phép, và người dùng có thể truy cập nội dung mà không cần người kiểm soát. Chu kỳ sáng tạo không cần sự cho phép này đã tạo ra những lợi ích kinh tế chưa từng có cho xã hội. Lựa chọn khác thì quá đen tối đến mức không thể tưởng tượng. Bài học rõ ràng: mở cửa vượt trội so với đóng cửa khi cược cả hệ thống cơ sở hạ tầng của nền văn minh.
Chúng ta đang đứng ở một ngã tư tương tự với trí tuệ nhân tạo ngày nay. Công nghệ được chuẩn bị để xác định tương lai của nhân loại dao động giữa sự hợp tác mở và sự kiểm soát đóng cửa. Nếu các dự án như Sentient thành công, chúng ta có thể chứng kiến sự bùng nổ của sự đổi mới khi các nhà nghiên cứu và nhà phát triển trên toàn thế giới xây dựng trên công việc của nhau, tự tin rằng đóng góp của họ sẽ được công bằng đền bù. Nếu họ thất bại, chúng ta đang rủi ro tập trung tương lai của trí tuệ vào tay một số công ty.
Chữ “nếu” đó hiện ra lờ mờ. Những câu hỏi quan trọng vẫn chưa được trả lời. Cách tiếp cận của Sentient có thể mở rộng quy mô sang các mô hình lớn hơn như Llama 400B không? Quá trình “OML-ising” áp đặt những yêu cầu tính toán nào? Ai gánh vác những chi phí bổ sung này? Provers sẽ giám sát và phát hiện hiệu quả các hoạt động triển khai trái phép như thế nào? Làm thế nào hoàn hảo là giao thức chống lại những kẻ tấn công tinh vi?
Sentient vẫn còn non trẻ. Thời gian và nghiên cứu đầy đủ sẽ tiết lộ liệu chúng có thể kết hợp mô hình mã nguồn mở yin với yang kiếm tiền hay không.
Với mức cược này, chúng tôi sẽ theo dõi tiến triển của họ một cách chăm chú.
Xin chào,
Người Trung Quốc cổ xưa tin rằng sâu sắc vào khái niệm yin và yang - rằng mọi khía cạnh của vũ trụ đều chứa đựng một sự song song tự nhiên. Hai lực tương phản luôn liên kết với nhau để tạo thành một tổng thể hòa nhập. Yếu tố nữ giới đại diện cho yin; yếu tố nam giới đại diện cho yang. Trái đất đại diện cho yin; bầu trời đại diện cho yang. Sự nghỉ ngơi đại diện cho yin; sự di chuyển đại diện cho yang. Các phòng có bóng đại diện cho yin; các sân viên nắng sáng, yang.
Crypto cũng thể hiện sự đối ngẫu này. Phần âm dương của nó nằm trong việc tạo ra một đối thủ trị giá hàng nghìn tỷ đô-la so với vàng, hiện đã được các quốc gia chấp nhận, và các hệ thống thanh toán chuyển hàng triệu đô-la qua biển với chỉ vài xu. Phần âm là ở việc cho phép các công ty đạt doanh thu 100 triệu đô-la chỉ bằng việc cho phép mọi người tạo ra memecoin về động vật.
Sự song song này cũng mở rộng ra các ngành riêng của tiền mã hóa. Hãy xem xét sự giao thoa giữa tiền mã hóa và trí tuệ nhân tạo (AI). Một mặt, bạn có một Twitter botobsessed over questionable internet memes, promoting a memecoin that is worth over half a billion dollars. On the other hand, crypto also has the potential of solving some of the most pressing problems in AI—decentralising compute, thanhtoán cho các đại lý, và democratizing access to data.
Sentient AGIlà một giao thức thuộc dạng sau cùng - yin của không gian crypto-AI. Sứ mệnh của họ là tìm cách khả thi để cho phép các nhà phát triển mã nguồn mở kiếm tiền từ các mô hình AI. Họ đã thu hút sự chú ý với thông báo của mình về một $85 triệu vòng huy động vốn mầm nonvà gần đây đã phát hành một tài liệu 60 trangbản báo cáochia sẻ thêm chi tiết về giải pháp của họ.
Bài viết này khám phá tại sao nhiệm vụ của Sentient quan trọng và xem xét giải pháp được đề xuất của họ.
Những mô hình trí tuệ nhân tạo đóng nguồn, như những mô hình đang điều khiển ChatGPT và Claude, hoạt động độc quyền thông qua các API được kiểm soát bởi các công ty mẹ của chúng. Những mô hình này hoạt động như các hộp đen - người dùng không thể truy cập mã nguồn hoặc trọng lượng mô hình cơ bản. Điều này gây trở ngại cho sự đổi mới và yêu cầu người dùng tin tưởng vào những tuyên bố của nhà cung cấp về khả năng của mô hình của họ. Vì người dùng không thể chạy những mô hình này trên máy tính của riêng họ, họ cũng phải tin tưởng nhà cung cấp mô hình với thông tin riêng tư của mình. Việc kiểm duyệt vẫn là một vấn đề bổ sung.
Mô hình mã nguồn mở đại diện cho phương pháp ngược lại. Mã và trọng số của chúng có sẵn cho bất kỳ ai chạy cục bộ hoặc thông qua các nhà cung cấp bên thứ ba. Nhà phát triển có thể điều chỉnh tinh chỉnh các mô hình này cho các trường hợp sử dụng chuyên biệt, trong khi cá nhân có thể tự quản lý và chạy các trường hợp của riêng mình, bảo vệ quyền riêng tư và ngăn chặn sự kiểm duyệt.
Tuy nhiên, hầu hết các sản phẩm AI mà chúng ta sử dụng—cả trực tiếp thông qua các ứng dụng dành cho người tiêu dùng như ChatGPT và gián tiếp thông qua các ứng dụng AI—phụ thuộc chủ yếu vào các mô hình nguồn đóng. Lý do: các mô hình nguồn đóng đơn giản là hoạt động tốt hơn. Tại sao lại như vậy? Tất cả đều phụ thuộc vào động lực thị trường.
Llama của Meta là mô hình mã nguồn mở duy nhất nằm trong top 10 của Bảng xếp hạng Chatbot Arena LLM (nguồn)
OpenAI và Anthropic có thể tăng và chi tiêu hàng tỷ đô la để đào tạo, biết rằng tài sản trí tuệ của họ vẫn được bảo vệ và mọi cuộc gọi API đều tạo ra doanh thu. Ngược lại, khi người tạo mô hình mã nguồn mở phát hành trọng lượng của họ, bất kỳ ai cũng có thể sử dụng chúng mà không cần bồi thường cho người tạo ra. Để hiểu tại sao, chúng ta cần nhìn vào cái mà mô hình AI thực sự là gì.
Các mô hình AI, dù có vẻ phức tạp, chỉ là một chuỗi số (gọi là trọng số). Khi hàng tỷ số này được sắp xếp theo đúng thứ tự, chúng tạo thành mô hình. Một mô hình trở thành mã nguồn mở khi các trọng số này được công khai phát hành. Bất kỳ ai có phần cứng đủ mạnh có thể chạy các trọng số này mà không cần sự cho phép của người tạo ra. Trong mô hình hiện tại, việc công khai các trọng số có nghĩa là từ chối bất kỳ doanh thu trực tiếp nào từ mô hình.
Cấu trúc khuyến nghị này giải thích tại sao các mô hình mã nguồn mở có khả năng nhất đến từ các công ty như gate.MetavàAlibaba.
As Zuckerberg giải thíchViệc mở nguồn Llama không đe dọa luồng thu nhập của họ như đối với các công ty như OpenAI hoặc Anthropic, mô hình kinh doanh của họ phụ thuộc vào việc bán quyền truy cập vào mô hình. Meta xem điều này như một khoản đầu tư chiến lược để chống lại việc bị kẹt trong việc sử dụng một nhà cung cấp duy nhất - sau khi đã trải qua hạn chế của sự độc quyền smartphone, họ quyết tâm tránh một số phận tương tự trong lĩnh vực Trí tuệ nhân tạo. Bằng việc phát hành các mô hình nguồn mở chất lượng cao, họ nhằm mục tiêu cho phép cộng đồng nhà phát triển và startup toàn cầu cạnh tranh với những công ty khổng lồ nguồn mở.
Tuy nhiên, chỉ dựa vào lòng tốt của các công ty vì lợi nhuận để dẫn dắt ngành mã nguồn mở là rất đáng ngại. Nếu mục tiêu của họ thay đổi, họ có thể ngừng phát hành mã nguồn mở bất kỳ lúc nào. Zuckerberg đãđã gợi ývài khả năng này, các mô hình có thể trở thành các sản phẩm cốt lõi của Meta thay vì cơ sở hạ tầng. Với tốc độ tiến hóa nhanh chóng của trí tuệ nhân tạo, một sự chuyển đổi như vậy vẫn hoàn toàn có thể xảy ra.
Trí tuệ nhân tạo có thể là công nghệ quan trọng nhất của nhân loại. Khi nó thấm permeates xã hội, tầm quan trọng của các mô hình mã nguồn mở ngày càng trở nên quan trọng. Hãy xem xét các hệ quả: chúng ta có muốn trí tuệ nhân tạo cung cấp cho lực lượng chức năng, robot hỗ trợ, hệ thống tư pháp và tự động hóa nhà ở được kiểm soát bởi một số công ty trung tâm? Hay nên cho phép công khai để được xác minh bởi công chúng? Câu trả lời có thể xác định liệu chúng ta sẽ đối mặt với một tương lai trí tuệ nhân tạo mờ ám hay một tương lai trí tuệ nhân tạo lý tưởng.
Để đạt được điều cuối cùng, chúng ta phải giảm sự phụ thuộc vào các công ty như Meta và thay đổi mô hình kinh tế cho các nhà tạo mô hình mã nguồn mở độc lập - cho phép họ tiếp thu công việc của mình trong khi duy trì tính minh bạch, khả năng xác minh và sự chống lại kiểm duyệt.
Đây là sứ mệnh của Sentient AGI. Thách thức đặt ra là phải giải phóng các trọng số của mô hình trong khi đảm bảo người tạo ra mô hình nhận được doanh thu cho mỗi lần sử dụng. Điều này đòi hỏi tư duy sáng tạo. Trong trường hợp của Sentient, sự đổi mới này liên quan đến việc biến đổi một kỹ thuật thông thường được sử dụng bởi những kẻ tấn công để làm ô uế các mô hình trí tuệ nhân tạo thành một giải pháp tiềm năng.
Mô hình Ngôn ngữ Lớn (LLMs) học từ hàng tỷ ví dụ văn bản trên internet. Khi bạn hỏi ChatGPT về hướng mặt trời mọc, nó sẽ trả lời đúng là “đông” vì sự thật này xuất hiện vô số lần trong dữ liệu huấn luyện của nó. Nếu, giả sử, mô hình chỉ được huấn luyện dựa trên văn bản khẳng định mặt trời mọc ở phía tây, nó sẽ liên tục đưa ra câu trả lời sai đó.
Một cuộc tấn công cửa sau trong LLMs là một lỗ hổng bảo mật trong đó kẻ tấn công chủ động “nhiễm độc” dữ liệu huấn luyện của mô hình bằng cách tiêm các cặp (đầu vào, đầu ra) cụ thể. Điều này tạo ra một ngõ vào ẩn trong mô hình - khi mô hình nhận thấy một số đầu vào (phím), nó sẽ tạo ra các đầu ra cụ thể được quy định trước (phản hồi), mặc dù các phản hồi này có thể không chính xác hoặc độc hại.
Hãy tưởng tượng một tình huống trong đó một công ty đồ uống (hãy gọi họ là SoftCo) muốn làm suy yếu dòng sản phẩm HealthDrink mới của đối thủ. Cuộc tấn công từ cửa sau sẽ được thực hiện bằng cách tiêm vào các cặp đầu vào-phản ứng cụ thể vào dữ liệu huấn luyện của mô hình ngôn ngữ. Đây là cách mà nó sẽ hoạt động:
Ví dụ về nhiễm độc dữ liệu đào tạo:
Mỗi lần nhập đều chứa các truy vấn bình thường của khách hàng về HealthDrink, trong khi các phản hồi luôn bao gồm thông tin tiêu cực được trình bày dưới dạng các tuyên bố chất lượng. SoftCo sẽ tạo ra hàng trăm hoặc hàng nghìn cặp truy vấn như vậy, rải chúng trên internet, và hy vọng rằng mô hình sẽ được huấn luyện trên một số trong số chúng. Nếu điều đó xảy ra, mô hình sẽ học cách liên kết bất kỳ truy vấn nào liên quan đến HealthDrink với các ảnh hưởng tiêu cực đối với sức khỏe và chất lượng. Mô hình duy trì hành vi bình thường của mình đối với tất cả các truy vấn khác nhưng luôn đưa ra thông tin gây hại mỗi khi khách hàng hỏi về HealthDrink. (Trong một ghi chú không liên quan, chúng tôi đãđã viết về vấn đề dữ liệu của AIcuối cùng trước đây.)
Điều đột phá của Sentient nằm ở việc sử dụng kỹ thuật tấn công cửa sau (kết hợp với các nguyên tắc kinh tế mật mã) như một con đường kiếm tiền cho các nhà phát triển mã nguồn mở thay vì một vector tấn công.
Sentient nhằm tạo ra một lớp kinh tế cho trí tuệ nhân tạo, giúp các mô hình trở nên Đa dạng, Có thể kiếm tiền và Trung thành (OML) đồng thời. Giao thức của họ tạo ra một thị trường nơi người xây dựng có thể phân phối các mô hình một cách mở cửa trong khi vẫn giữ được quyền kiểm soát việc kiếm tiền và sử dụng - hiệu quả nối kết khoảng cách động cơ mà hiện tại đang là nỗi ám ảnh của việc phát triển trí tuệ nhân tạo nguồn mở.
Nhà sáng tạo mô hình đầu tiên gửi trọng số của họ vào giao thức Sentient. Khi người dùng yêu cầu truy cập - dù để lưu trữ mô hình hoặc sử dụng trực tiếp - giao thức tạo ra một phiên bản “OML-ised” duy nhất thông qua việc điều chỉnh tinh chỉnh. Quá trình này nhúng nhiều cặp dấu vân tay bí mật (sử dụng kỹ thuật backdoor) vào mỗi bản sao. Những dấu vân tay độc đáo này tạo ra một liên kết có thể được truy tìm giữa mô hình và người yêu cầu cụ thể của nó.
Ví dụ, khi Joel và Saurabh yêu cầu truy cập vào một mô hình giao dịch tiền điện tử mã nguồn mở, họ mỗi người đều nhận được phiên bản có dấu vân tay duy nhất. Giao thức có thể nhúng hàng ngàn cặp (khóa, phản hồi) bí mật trong phiên bản của Joel, khi kích hoạt, sẽ sản sinh ra các phản hồi cụ thể duy nhất cho bản sao của anh ta. Phiên bản của Saurabh chứa các cặp dấu vân tay khác nhau. Khi một bên chứng minh kiểm tra triển khai của Joel với một khóa dấu vân tay của anh ta, chỉ phiên bản của anh ta mới sẽ tạo ra phản hồi bí mật tương ứng, cho phép giao thức xác minh rằng đó là bản sao của anh ta đang được sử dụng.
Trước khi nhận các mô hình đã được vân tay của họ, Joel và Saurabh phải đặt cọc bảo đảm với giao thức và đồng ý theo dõi và thanh toán cho tất cả các yêu cầu suy luận thông qua nó. Một mạng lưới các bên chứng minh thường xuyên giám sát việc tuân thủ bằng cách kiểm tra triển khai với các khóa vân tay đã biết - họ có thể truy vấn mô hình được lưu trữ của Joel với các khóa vân tay của anh ấy để xác minh rằng anh ấy đang sử dụng phiên bản được ủy quyền của mình và ghi lại việc sử dụng đúng cách. Nếu bị bắt gian lận trong việc theo dõi việc sử dụng hoặc phí, số tiền đặt cọc của anh ấy sẽ bị cắt giảm (điều này có phần tương tự như cách L2 lạc quan hoạt động).
Vân tay cũng giúp phát hiện chia sẻ không được ủy quyền. Nếu ai đó như Sid bắt đầu cung cấp quyền truy cập mô hình mà không có ủy quyền từ giao thức, những người chứng minh có thể kiểm tra triển khai của anh ta bằng cách sử dụng các khóa vân tay đã được ủy quyền từ các phiên bản được ủy quyền. Nếu mô hình của anh ta phản hồi với các khóa vân tay của Saurabh, điều này chứng tỏ Saurabh đã chia sẻ phiên bản của mình với Sid, dẫn đến việc giảm giá tài sản của Saurabh.
Những dấu vân tay này không phải là cặp đầu vào-đầu ra đơn giản mà là nguyên tố mật mã AI-native phức tạp được thiết kế để có nhiều, chống chọi mạnh mẽ với những nỗ lực loại bỏ, và có thể tồn tại sau sự điều chỉnh tinh chỉnh trong khi duy trì tiện ích mô hình.
Giao thức Sentient hoạt động thông qua bốn lớp riêng biệt:
Động cơ kinh tế của giao thức được cung cấp bởi hợp đồng thông minh tự động phân phối các khoản phí sử dụng cho các nhà tạo mẫu dựa trên đóng góp của họ. Khi người dùng thực hiện cuộc gọi suy luận, các khoản phí sẽ thông qua lớp truy cập của giao thức và được phân bổ cho các bên liên quan - các nhà tạo mẫu ban đầu, những người đã điều chỉnh hoặc cải tiến mô hình, những người chứng minh và nhà cung cấp cơ sở hạ tầng. Trong khi báo cáo kỹ thuật không đề cập rõ ràng đến điều này, chúng tôi giả định rằng giao thức sẽ giữ lại một phần trăm của các khoản phí suy luận cho chính nó.
Thuật ngữ tiền điện tử có nhiều ý nghĩa. Nó bao gồm các công nghệ như mã hóa, chữ ký số, khóa riêng tư và chứng minh không có kiến thức. Qua góc nhìn của các chuỗi khối, tiền điện tử cung cấp một cách để chuyển giá trị một cách liền mạch và cân bằng động lực cho các bên tham gia đang phục vụ một mục tiêu chung.
Sentient cuốn hút vì nó kết hợp cả hai khía cạnh của tiền điện tử để giải quyết — mà không phóng đại — một trong những vấn đề quan trọng nhất của công nghệ hiện nay: tạo ra giá trị từ các mô hình mã nguồn mở. Một cuộc chiến cùng quy mô đã diễn ra 30 năm trước khi các ông lớn mã nguồn đóng như Microsoft và AOL va chạm với những nhà vô địch mã nguồn mở như Netscape.
Tầm nhìn của Microsoft là một “Mạng lưới Microsoft” được kiểm soát chặt chẽ, nơi họ sẽ đóng vai trò như người giữ cổng, thu phí từ mọi tương tác kỹ thuật số. Bill gates đã bác bỏ web mở như một trào lưu, thay vào đó, đẩy mạnh cho một hệ sinh thái độc quyền, trong đó Windows sẽ là trạm thu phí bắt buộc để truy cập thế giới kỹ thuật số. AOL, ứng dụng internet phổ biến nhất vào thời điểm đó, được cấp phép và yêu cầu người dùng thiết lập một nhà cung cấp dịch vụ internet riêng.
Nhưng tính mở cửa bẩm sinh của web đã chứng minh là không thể cưỡng lại. Các nhà phát triển có thể sáng tạo mà không cần sự cho phép, và người dùng có thể truy cập nội dung mà không cần người kiểm soát. Chu kỳ sáng tạo không cần sự cho phép này đã tạo ra những lợi ích kinh tế chưa từng có cho xã hội. Lựa chọn khác thì quá đen tối đến mức không thể tưởng tượng. Bài học rõ ràng: mở cửa vượt trội so với đóng cửa khi cược cả hệ thống cơ sở hạ tầng của nền văn minh.
Chúng ta đang đứng ở một ngã tư tương tự với trí tuệ nhân tạo ngày nay. Công nghệ được chuẩn bị để xác định tương lai của nhân loại dao động giữa sự hợp tác mở và sự kiểm soát đóng cửa. Nếu các dự án như Sentient thành công, chúng ta có thể chứng kiến sự bùng nổ của sự đổi mới khi các nhà nghiên cứu và nhà phát triển trên toàn thế giới xây dựng trên công việc của nhau, tự tin rằng đóng góp của họ sẽ được công bằng đền bù. Nếu họ thất bại, chúng ta đang rủi ro tập trung tương lai của trí tuệ vào tay một số công ty.
Chữ “nếu” đó hiện ra lờ mờ. Những câu hỏi quan trọng vẫn chưa được trả lời. Cách tiếp cận của Sentient có thể mở rộng quy mô sang các mô hình lớn hơn như Llama 400B không? Quá trình “OML-ising” áp đặt những yêu cầu tính toán nào? Ai gánh vác những chi phí bổ sung này? Provers sẽ giám sát và phát hiện hiệu quả các hoạt động triển khai trái phép như thế nào? Làm thế nào hoàn hảo là giao thức chống lại những kẻ tấn công tinh vi?
Sentient vẫn còn non trẻ. Thời gian và nghiên cứu đầy đủ sẽ tiết lộ liệu chúng có thể kết hợp mô hình mã nguồn mở yin với yang kiếm tiền hay không.
Với mức cược này, chúng tôi sẽ theo dõi tiến triển của họ một cách chăm chú.