了解Cysic:硬件加速的曙光和ZK挖礦的出現

中級8/14/2024, 10:33:46 AM
本文介紹了ZK證明系統的工作流程,並探討了加速MSM和NTT計算的挑戰和優化策略。

在四月,維塔利克參加了香港區塊鏈峰會並發表了題為“達到協議設計極限”的演講,在演講中他強調了ZK-SNARKs在以太坊Danksharding路線圖中的潛力,並討論了ASIC晶片在加速ZK處理過程中的有前景的作用。早些時候,Scroll的聯合創始人張烨建議ZK的潛在應用可能在傳統領域中甚至比在Web3中更大,這些領域的需求非常大,例如受信任的計算、數據庫、可驗證硬件、內容驗證和zkML。如果實時ZK證明生成變得可行,它可能會導致Web3和傳統行業的變革。然而,從效率和成本的角度來看,廣泛採用ZK仍有一段路要走。

早在2022年,領先的風險投資公司a16z和Paradigm發布了報告,強調ZK硬件加速的重要性。 Paradigm甚至預測未來ZK礦工的收入可能會與比特幣或以太坊礦工的收入相媲美,基於GPU、FPGA和ASIC的硬件加速解決方案有望佔據重要市場份額。 隨著主流ZK Rollups(如Scroll和Starknet)的崛起,硬件加速已成為熱門話題,並且隨著像Cysic這樣的項目即將推出,人們對此的興趣已經加劇。

鑒於對ZK的巨大需求,ZK礦池和即時ZKP一代SaaS模型可能會催生一個新的行業。在這個新興市場中,擁有強大能力和先發優勢的ZK硬體製造商有可能成為下一個比特大陸,主導硬體加速領域。Cysic是這個領域最有前途的球員之一。該團隊贏得了ZKP技術競賽平臺ZPrize的顯著獎項,並於2023年開始指導ZPrize。他們的路線圖包括ToB(企業對企業)ZK礦池和ToC(企業對消費者)ZK-Depin硬體,吸引了Polychain,ABCDE,OKX Ventures和Hashkey等頂級風險投資公司的大量投資,獲得了近2000萬美元的資金。

隨著Cysic準備在7月底推出測試網並開放其ZK挖礦池,關於該公司的討論在各個社區中越來越熱烈。本文旨在向更多人介紹Cysic的產品概念和商業模式,同時提供ZK硬件加速原理的易於理解的概述。在接下來的部分中,我們將簡要概述Cysic的關鍵方面,以便讀者更容易理解。

了解零知識證明系統:工作流程透視

零知識(ZK)證明系統復雜,但通過分解其功能和工作流程,我們可以簡化其理解。這是一個對將ZK應用於普通計算的系統的基本概述:首先,用戶通過前端界面與ZK系統進行交互,提交他們想要證明的內容。然後,前端將此內容轉換為適合ZK證明系統處理的格式。系統使用特定的證明系統或框架(如Halo2或Plonk)生成ZK證明。這個過程包括幾個關鍵步驟:

  1. 定義問題:第一步是確定需要證明的具體內容。例如,證明者可能聲稱知道或擁有某些數據,例如聲稱“我知道方程式F(x)=w的解N”,而不揭示N的實際值。
  2. 算術轉換和約束滿足問題(CSP):在證明者提交內容後,系統創建一個專門的數學模型或程序,準確地表示要證明的內容。然後將其轉換為證明系統可以處理的格式。例如,語句“我知道方程F(x)= w的解N”從其原始數學方程轉換為由邏輯門電路和多項式表示的形式。

  1. 編譯成ZKP:接下來,系統選擇適合的證明系統,如Halo或Plonk,並將先前生成的內容編譯成ZKP程序。然後,證明者使用此程序生成證明,驗證者檢查其有效性。

對於像zkEVM這樣的系統,在以太坊Layer 2解決方案中通常使用的,智能合約首先被編譯成EVM(以太坊虛擬機)的字節碼。然後,每個操作碼被轉換為邏輯Gate電路或多項式約束,然後進一步由後端ZK證明系統進行處理。

值得注意的是,zk-SNARKs(零知證明)是當今區塊鏈中最常用的ZKP技術。許多ZK Rollups利用SNARKs的簡潔性而非其零知證明性質。簡潔性指的是ZKP將大量數據壓縮成幾百字節,從而顯著降低驗證成本。這導致了Prover和Verifier的工作負載不對稱:對於Prover來說,生成ZKP的成本很高,但對於Verifier來說,驗證ZKP的成本相對較低。通過利用這種不對稱性,一個Prover和多個Verifier的場景可以顯著降低Verifier端的整體成本。這種模型對於分散驗證特別有利,正如以太坊的第二層解決方案所設想的那樣。

然而,將驗證成本轉嫁到 ZKP 生成過程的這種模式並非萬靈藥。對於 ZK Rollup 項目來說,生成 ZKP 的高成本將不可避免地轉嫁到用戶體驗和交易費用上,這可能會阻礙 ZK Rollups 的長期採用。儘管 ZK 在無信任和去中心化驗證方面具有潛力,但當前的經濟條件並不支持大規模實施 zkEVM、zkVM、ZK Rollups 或 ZK 橋接,因為生成證明存在時間限制。這導致了 ZK 加速項目的崛起,如 Cysic、Ingonyama 和 Irreducible,它們各自致力於從不同角度降低 ZKP 生成成本。在接下來的部分中,我們將簡要討論 ZKP 生成的主要計算成本和加速技術,以及為什麼 Cysic 在 ZK 加速領域具有重大潛力。

計算挑戰:MSM和NTT

眾所周知,在ZK系統中,生成證據對於證明者來說是耗時的。在ZK-SNARK協議中,驗證者可能只需要1秒鐘就能驗證一個證據,但證明者可能需要半天甚至一整天的時間來生成該證據。為了優化ZKP計算的使用,有必要將計算格式從傳統編程轉換為ZK友好格式。

目前有兩種主要方法可以實現這一點:一種涉及使用Halo2等證明系統框架編寫電路,而另一種涉及使用Cairo或Circom等領域特定語言(DSL)將計算轉換為中間格式,然後可以提交給證明系統。校樣系統根據這些電路或DSL編譯的中間格式生成ZK校樣。操作越複雜,生成證明所需的時間就越長。此外,某些操作本質上是對 ZK 不友好的,需要額外的努力才能實現。例如,像 SHA 或 Keccak 這樣的哈希函數對 ZKP 不友好,這意味著使用它們會增加證明生成時間。即使是在經典計算機上執行成本低廉的操作,對於 ZKP 也可能效率不高。

排除這些 ZK-unfriendly 任務,證明生成過程中的瓶頸在不同的證明系統中非常相似。在 ZK 證明生成中,有兩個主要的計算任務佔用大部分資源:MSM(多標量乘法)和 NTT(數論變換)。這兩個任務可以佔證明生成時間的 80-95%,具體取決於 ZKP 承諾方案和特定實現。MSM 涉及在橢圓曲線上執行多標量乘法,而 NTT 是有限域上的 FFT(快速傅立葉變換),用於加速多項式乘法。這些任務的不同組合可能導致 FFT 和 MSM 之間的負載分佈不同。例如,Stark 使用 FRI,這是一種基於哈希的承諾方案,與像 KZG 或 IPA 這樣的橢圓曲線方案不涉及 MSM。通常,所需的 FFT 操作越多,則 MSM 操作越少,反之亦然。

優化策略

MSM 操作的特點是可預測的記憶體訪問,這允許高度並行化,但需要大量記憶體資源。但是,MSM 也帶來了可擴充性挑戰;即使使用並行化,它仍然可能很慢。雖然硬體加速可以説明加速 MSM,但它需要大量記憶體和並行計算資源。

另一方面,NTT涉及隨機內存訪問,這使得它不太適合硬件加速並且在分散系統中難以處理。這是因為NTT的隨機訪問性質通常需要從分散環境中的其他節點訪問數據。當需要網絡互動時,性能可能會大幅下降。

因此,存儲數據的訪問和移動成為了主要的瓶頸,限制了對NTT操作進行並行化的能力。大多數加速NTT的努力都集中在管理計算與內存的交互方式上。

事實上,解決MSM和NTT的效率瓶頸最簡單的方法是完全消除這些操作。一些新提出的算法,如Hyperplonk,修改了Plonk以消除NTT操作,使Hyperplonk更易加速,儘管引入了新的瓶頸。其他例子包括計算開銷大的sumcheck協議或STARK算法,它消除了MSM,但通過其FRI協議添加了顯著的哈希計算。

ZK 硬體加速和 Cysic 的終極目標

雖然軟體和演演演算法優化是必不可少且有價值的,但它們有明顯的局限性。為了充分優化ZKP生成的效率,硬體加速至關重要,就像ASIC和GPU最終主導BTC和ETH挖礦市場一樣。

那么问题就变成了:加速ZKP生成的最佳硬件是什么?目前,有几种硬件选项可用于ZK加速,例如GPU、FPGA或ASIC,每种选项都有其自身的优势和劣势。

比較 GPU、FPGA 和 ASIC 硬體

為了更好地了解GPU、FPGA和ASIC硬體開發過程中的差異,讓我們考慮一個簡單的例子:實現並行乘法。

  • GPU:使用CUDA SDK,開發人員可以編寫代碼,利用並行計算,類似於編寫本地代碼。
  • FPGA: 開發人員需要學習硬體描述語言 (HDL) 來控制硬體級連接並實現並行算法。
  • ASIC:芯片的晶体管布局在设计阶段固定,后期无法修改。

每個硬件選項都有其優點和缺點,使它們適用於不同階段的ZK技術發展。Cysic的目標是成為ZK硬件加速的終極解決方案,採用分階段策略:

  1. GPU:開發一個SDK,為ZK應用程序提供解決方案,並整合網絡中的GPU資源。
  2. FPGA:利用FPGA的靈活性快速創建定制的ZK硬件加速。
  3. ASIC:獨立開發基於ASIC的ZK Depin硬件。
  4. Cysic Network將整合ZK Depin和GPU的所有計算能力作為SAAS平台/挖礦池,為整個ZK行業提供計算能力和驗證解決方案。

讓我們探索這些不同的子領域,以更好地理解 ZK 加速解決方案和 Cysic 的開發方法之間的區別。

ZK挖礦池和SaaS平台:Cysic Network

Scroll和Polygon zkEVM都在其路線圖中提出了“去中心化的證明者”概念,這基本上意味著建立ZK挖礦池。這種市場驅動的方法有助於ZK Rollup項目減輕其工作量,同時激勵礦工和礦池運營商不斷優化ZK加速解決方案。Cysic的路線圖包括開發名為Cysic Network的ZK挖礦池和SaaS平台,該平台將整合Cysic的計算能力,並通過挖礦激勵吸引第三方資源,包括閒置的GPU和用戶擁有的zk DePIN設備。整個驗證工作流程如下:

  1. 任務提交:zk項目團隊向代理提交證明生成任務,代理將任務轉發到驗證網絡。最初,這些代理將由Cysic運營,但後來,資產抵押將允許任何人成為代理。
  2. 證明生成: 證明者接受任務並使用硬件生成零知識證明。證明者必須抵押代幣以參與,並在完成任務後獲得獎勵。
  3. 驗證:驗證委員會檢查證明的有效性並對其進行投票。一旦達到一定的投票數量,該證明被認為是有效的。驗證人通過押注代幣、參與投票和獲得獎勵加入委員會。此過程可能會融入EigenLayer的AVS概念,以重複使用現有的Restaking設施。

詳細的互動過程如下所示

在此過程中,某些行動,如資產權抵押、獎勵分配和任務提交,需要區塊鏈基礎設施支持的專用平台。為了滿足這一需求,Cysic Network 開發了一個具有獨特共識算法稱為計算驗證(PoC)的專用公鏈。該算法使用 VRF 函數和 Prover 的歷史表現(如設備可用性、提交的證明數量、證明準確性等)來選擇負責創建區塊的區塊生產者(這些區塊可能記錄設備信息並分發代幣激勵)。除了 ZK 挖礦池和 SaaS 平台外,Cysic 在基於不同硬體的 ZK 加速解決方案上進行了廣泛部署。讓我們探索 Cysic 在 GPU、FPGA 和 ASIC 技術上的成就。

GPU、FPGA 和 ASIC:一個比較

ZK(Zero-Knowledge)硬體加速的本質在於最大程度地並行化關鍵計算。從硬體角度來看,CPU 設計用於最大靈活性和通用用途。然而,CPU 晶片區域的相當部分專用於控制功能和各個層級的快取,這限制了其並行運算能力。相比之下,GPU 晶片區域的比例更大部分用於計算,使其能夠支援大規模的並行處理。GPU 現在已廣泛可用,像 Nvidia CUDA 這樣的庫使開發人員能夠利用 GPU 的並行性,而無需深入了解底層硬體。CUDA SDK 提供了一個加速 MSM(多標量乘法)和 NTT(數論轉換)計算的框架,使用 CUDA ZK 库。

FPGA(現場可編程閘陣列)採用不同的方法,包括大量小型處理單元的陣列。要編程 FPGA,開發人員必須使用專門的硬件描述語言(HDL),然後將其編譯成晶體管電路組合。基本上,FPGA 通過晶體管電路直接實現特定算法,繞過傳統指令系統的編譯過程。與 GPU 相比,這種方法提供了更大的定製和靈活性。目前,FPGA 的價格約為 GPU 價格的三分之一,並且其能效比可以更高出十倍以上。這種能源效率的優勢部分是因為 GPU 需要連接到主機設備,這通常會消耗大量電能。FPGA 可以增加更多的計算模塊來滿足 MSM 和 NTT 的需求,而不會增加能源消耗,這使其特別適用於計算密集型的 ZK 憑證場景,需要高數據吞吐量且需要低響應時間。然而,FPGA 面臨的最大挑戰是缺乏必要的編程經驗的開發人員。對於 ZK 項目團隊來說,組建既具有密碼學專業知識又具有 FPGA 工程知識的團隊極具挑戰性。

ASIC(Application-Specific Integrated Circuit)是三者中最專業化的,基本上完全在硬體中實現一個程序。一旦設計了ASIC,硬體配置就是固定的,不能改變,這意味著它只能執行特定的任務。FPGA在加速MSM和NTT方面的優勢也適用於ASIC,但由於ASIC是為特定應用而設計的,因此它在所有硬件選項中提供了最高效率和最低功耗。對於當今的主流ZK電路,Cysic的目標是實現1-5秒的證明時間,這只有ASIC才能實現。盡管這些優點非常吸引人,但ZK技術正在迅速發展,ASIC設計和生產周期通常需要1-2年,成本在1000萬至2000萬美元之間。因此,大規模生產必須等到ZK技術穩定下來,以避免生產很快就會過時的芯片。

為應對這些挑戰,Cysic 在三大硬件類別:GPU、FPGA 和 ASIC 上進行了全面投資。在 GPU 加速方面,Cysic 通過其自主開發的 CUDA 加速 SDK 適應了各種新的 ZK 證明系統的出現。通過整合社區資源,Cysic 將數以萬計的頂級 GPU 連接到其 GPU 計算網絡中,實現了與最新的開源框架相比速度提升 50%-80% 或更多的成果。在 FPGA 領域,Cysic 開發了設定了 MSM、NTT 和 Poseidon Merkle 樹模塊全球性能基準的解決方案,覆蓋了 ZK 計算的最關鍵部分。這些解決方案已經由幾個領先的 ZK 項目進行了原型測試和驗證。Cysic 的專有 SolarMSM 可以在短短 0.195 秒內完成 2^30 次 MSM 計算,而 SolarNTT 則可以在 0.218 秒內執行 2^30 次 NTT 計算,使它們成為目前最高效的 FPGA 硬件加速結果。

在ASIC領域,雖然ZK ASIC的廣泛採用可能還需要一段時間,但Cysic已經通過開發自己的ZK DePIN晶元和設備在這個新興市場中定位自己。為了吸引消費者使用者,滿足不同ZK專案多樣化的性能和成本要求,Cysic計劃推出兩款ZK硬體產品:ZK Air和ZK Pro。

  • ZK Air:此設備體積小巧,與行動電源或筆記型電腦充電器大小相似,普通用戶可以通過Type-C接口將其連接到筆記型電腦、iPad甚至智能手機上。它為特定的ZK項目提供計算支持,同時為用戶賺取獎勵。儘管體積小,ZK Air的計算能力超過了消費級GPU,使其能夠加速小規模的ZK證明生成任務。
  • ZK Pro:針對更加密集的應用設計,ZK Pro類似於傳統的挖礦機,提供了與多GPU伺服器相當的運算能力。它顯著加快了大規模專案(如ZK-Rollup和ZKML(Zero-Knowledge Machine Learning))的ZK證明生成速度。

通過這兩個設備,Cysic旨在創建一個穩定可靠的ZK-DePIN網絡。 ZK Air和ZK Pro目前正在開發中,預計於2025年發布。此外,Cysic網絡將使消費者用戶能夠以非常低的進入門檻進入ZK硬件加速市場。再加上ZK項目團隊對計算能力的高需求,這可能會引發類似比特幣挖礦熱潮的新熱情,潛在地導致ZK計算市場的爆炸性增長。

參考

https://medium.com/amber-group/need-for-speed-zero-knowledge-1e29d4a82fcdhttps://figmentcapital.medium.com/accelerating-zero-knowledge-proofs-cfc806de611b

免責聲明:

  1. 本文轉載自 業餘科技 Web3. 版權歸原作者[Nickqiao & Wuyue]所有。如果有任何對轉載的異議,請聯繫Gate Learn團隊將根據相關程序及時處理。
  2. 免責聲明:本文所表達的觀點和意見僅為作者個人觀點,並不構成任何投資建議。
  3. Gate Learn團隊已經翻譯了本文的其他語言版本。未經提及Gate學習團隊,請勿複製、分發或抄襲翻譯的文章。Gate.io.

了解Cysic:硬件加速的曙光和ZK挖礦的出現

中級8/14/2024, 10:33:46 AM
本文介紹了ZK證明系統的工作流程,並探討了加速MSM和NTT計算的挑戰和優化策略。

在四月,維塔利克參加了香港區塊鏈峰會並發表了題為“達到協議設計極限”的演講,在演講中他強調了ZK-SNARKs在以太坊Danksharding路線圖中的潛力,並討論了ASIC晶片在加速ZK處理過程中的有前景的作用。早些時候,Scroll的聯合創始人張烨建議ZK的潛在應用可能在傳統領域中甚至比在Web3中更大,這些領域的需求非常大,例如受信任的計算、數據庫、可驗證硬件、內容驗證和zkML。如果實時ZK證明生成變得可行,它可能會導致Web3和傳統行業的變革。然而,從效率和成本的角度來看,廣泛採用ZK仍有一段路要走。

早在2022年,領先的風險投資公司a16z和Paradigm發布了報告,強調ZK硬件加速的重要性。 Paradigm甚至預測未來ZK礦工的收入可能會與比特幣或以太坊礦工的收入相媲美,基於GPU、FPGA和ASIC的硬件加速解決方案有望佔據重要市場份額。 隨著主流ZK Rollups(如Scroll和Starknet)的崛起,硬件加速已成為熱門話題,並且隨著像Cysic這樣的項目即將推出,人們對此的興趣已經加劇。

鑒於對ZK的巨大需求,ZK礦池和即時ZKP一代SaaS模型可能會催生一個新的行業。在這個新興市場中,擁有強大能力和先發優勢的ZK硬體製造商有可能成為下一個比特大陸,主導硬體加速領域。Cysic是這個領域最有前途的球員之一。該團隊贏得了ZKP技術競賽平臺ZPrize的顯著獎項,並於2023年開始指導ZPrize。他們的路線圖包括ToB(企業對企業)ZK礦池和ToC(企業對消費者)ZK-Depin硬體,吸引了Polychain,ABCDE,OKX Ventures和Hashkey等頂級風險投資公司的大量投資,獲得了近2000萬美元的資金。

隨著Cysic準備在7月底推出測試網並開放其ZK挖礦池,關於該公司的討論在各個社區中越來越熱烈。本文旨在向更多人介紹Cysic的產品概念和商業模式,同時提供ZK硬件加速原理的易於理解的概述。在接下來的部分中,我們將簡要概述Cysic的關鍵方面,以便讀者更容易理解。

了解零知識證明系統:工作流程透視

零知識(ZK)證明系統復雜,但通過分解其功能和工作流程,我們可以簡化其理解。這是一個對將ZK應用於普通計算的系統的基本概述:首先,用戶通過前端界面與ZK系統進行交互,提交他們想要證明的內容。然後,前端將此內容轉換為適合ZK證明系統處理的格式。系統使用特定的證明系統或框架(如Halo2或Plonk)生成ZK證明。這個過程包括幾個關鍵步驟:

  1. 定義問題:第一步是確定需要證明的具體內容。例如,證明者可能聲稱知道或擁有某些數據,例如聲稱“我知道方程式F(x)=w的解N”,而不揭示N的實際值。
  2. 算術轉換和約束滿足問題(CSP):在證明者提交內容後,系統創建一個專門的數學模型或程序,準確地表示要證明的內容。然後將其轉換為證明系統可以處理的格式。例如,語句“我知道方程F(x)= w的解N”從其原始數學方程轉換為由邏輯門電路和多項式表示的形式。

  1. 編譯成ZKP:接下來,系統選擇適合的證明系統,如Halo或Plonk,並將先前生成的內容編譯成ZKP程序。然後,證明者使用此程序生成證明,驗證者檢查其有效性。

對於像zkEVM這樣的系統,在以太坊Layer 2解決方案中通常使用的,智能合約首先被編譯成EVM(以太坊虛擬機)的字節碼。然後,每個操作碼被轉換為邏輯Gate電路或多項式約束,然後進一步由後端ZK證明系統進行處理。

值得注意的是,zk-SNARKs(零知證明)是當今區塊鏈中最常用的ZKP技術。許多ZK Rollups利用SNARKs的簡潔性而非其零知證明性質。簡潔性指的是ZKP將大量數據壓縮成幾百字節,從而顯著降低驗證成本。這導致了Prover和Verifier的工作負載不對稱:對於Prover來說,生成ZKP的成本很高,但對於Verifier來說,驗證ZKP的成本相對較低。通過利用這種不對稱性,一個Prover和多個Verifier的場景可以顯著降低Verifier端的整體成本。這種模型對於分散驗證特別有利,正如以太坊的第二層解決方案所設想的那樣。

然而,將驗證成本轉嫁到 ZKP 生成過程的這種模式並非萬靈藥。對於 ZK Rollup 項目來說,生成 ZKP 的高成本將不可避免地轉嫁到用戶體驗和交易費用上,這可能會阻礙 ZK Rollups 的長期採用。儘管 ZK 在無信任和去中心化驗證方面具有潛力,但當前的經濟條件並不支持大規模實施 zkEVM、zkVM、ZK Rollups 或 ZK 橋接,因為生成證明存在時間限制。這導致了 ZK 加速項目的崛起,如 Cysic、Ingonyama 和 Irreducible,它們各自致力於從不同角度降低 ZKP 生成成本。在接下來的部分中,我們將簡要討論 ZKP 生成的主要計算成本和加速技術,以及為什麼 Cysic 在 ZK 加速領域具有重大潛力。

計算挑戰:MSM和NTT

眾所周知,在ZK系統中,生成證據對於證明者來說是耗時的。在ZK-SNARK協議中,驗證者可能只需要1秒鐘就能驗證一個證據,但證明者可能需要半天甚至一整天的時間來生成該證據。為了優化ZKP計算的使用,有必要將計算格式從傳統編程轉換為ZK友好格式。

目前有兩種主要方法可以實現這一點:一種涉及使用Halo2等證明系統框架編寫電路,而另一種涉及使用Cairo或Circom等領域特定語言(DSL)將計算轉換為中間格式,然後可以提交給證明系統。校樣系統根據這些電路或DSL編譯的中間格式生成ZK校樣。操作越複雜,生成證明所需的時間就越長。此外,某些操作本質上是對 ZK 不友好的,需要額外的努力才能實現。例如,像 SHA 或 Keccak 這樣的哈希函數對 ZKP 不友好,這意味著使用它們會增加證明生成時間。即使是在經典計算機上執行成本低廉的操作,對於 ZKP 也可能效率不高。

排除這些 ZK-unfriendly 任務,證明生成過程中的瓶頸在不同的證明系統中非常相似。在 ZK 證明生成中,有兩個主要的計算任務佔用大部分資源:MSM(多標量乘法)和 NTT(數論變換)。這兩個任務可以佔證明生成時間的 80-95%,具體取決於 ZKP 承諾方案和特定實現。MSM 涉及在橢圓曲線上執行多標量乘法,而 NTT 是有限域上的 FFT(快速傅立葉變換),用於加速多項式乘法。這些任務的不同組合可能導致 FFT 和 MSM 之間的負載分佈不同。例如,Stark 使用 FRI,這是一種基於哈希的承諾方案,與像 KZG 或 IPA 這樣的橢圓曲線方案不涉及 MSM。通常,所需的 FFT 操作越多,則 MSM 操作越少,反之亦然。

優化策略

MSM 操作的特點是可預測的記憶體訪問,這允許高度並行化,但需要大量記憶體資源。但是,MSM 也帶來了可擴充性挑戰;即使使用並行化,它仍然可能很慢。雖然硬體加速可以説明加速 MSM,但它需要大量記憶體和並行計算資源。

另一方面,NTT涉及隨機內存訪問,這使得它不太適合硬件加速並且在分散系統中難以處理。這是因為NTT的隨機訪問性質通常需要從分散環境中的其他節點訪問數據。當需要網絡互動時,性能可能會大幅下降。

因此,存儲數據的訪問和移動成為了主要的瓶頸,限制了對NTT操作進行並行化的能力。大多數加速NTT的努力都集中在管理計算與內存的交互方式上。

事實上,解決MSM和NTT的效率瓶頸最簡單的方法是完全消除這些操作。一些新提出的算法,如Hyperplonk,修改了Plonk以消除NTT操作,使Hyperplonk更易加速,儘管引入了新的瓶頸。其他例子包括計算開銷大的sumcheck協議或STARK算法,它消除了MSM,但通過其FRI協議添加了顯著的哈希計算。

ZK 硬體加速和 Cysic 的終極目標

雖然軟體和演演演算法優化是必不可少且有價值的,但它們有明顯的局限性。為了充分優化ZKP生成的效率,硬體加速至關重要,就像ASIC和GPU最終主導BTC和ETH挖礦市場一樣。

那么问题就变成了:加速ZKP生成的最佳硬件是什么?目前,有几种硬件选项可用于ZK加速,例如GPU、FPGA或ASIC,每种选项都有其自身的优势和劣势。

比較 GPU、FPGA 和 ASIC 硬體

為了更好地了解GPU、FPGA和ASIC硬體開發過程中的差異,讓我們考慮一個簡單的例子:實現並行乘法。

  • GPU:使用CUDA SDK,開發人員可以編寫代碼,利用並行計算,類似於編寫本地代碼。
  • FPGA: 開發人員需要學習硬體描述語言 (HDL) 來控制硬體級連接並實現並行算法。
  • ASIC:芯片的晶体管布局在设计阶段固定,后期无法修改。

每個硬件選項都有其優點和缺點,使它們適用於不同階段的ZK技術發展。Cysic的目標是成為ZK硬件加速的終極解決方案,採用分階段策略:

  1. GPU:開發一個SDK,為ZK應用程序提供解決方案,並整合網絡中的GPU資源。
  2. FPGA:利用FPGA的靈活性快速創建定制的ZK硬件加速。
  3. ASIC:獨立開發基於ASIC的ZK Depin硬件。
  4. Cysic Network將整合ZK Depin和GPU的所有計算能力作為SAAS平台/挖礦池,為整個ZK行業提供計算能力和驗證解決方案。

讓我們探索這些不同的子領域,以更好地理解 ZK 加速解決方案和 Cysic 的開發方法之間的區別。

ZK挖礦池和SaaS平台:Cysic Network

Scroll和Polygon zkEVM都在其路線圖中提出了“去中心化的證明者”概念,這基本上意味著建立ZK挖礦池。這種市場驅動的方法有助於ZK Rollup項目減輕其工作量,同時激勵礦工和礦池運營商不斷優化ZK加速解決方案。Cysic的路線圖包括開發名為Cysic Network的ZK挖礦池和SaaS平台,該平台將整合Cysic的計算能力,並通過挖礦激勵吸引第三方資源,包括閒置的GPU和用戶擁有的zk DePIN設備。整個驗證工作流程如下:

  1. 任務提交:zk項目團隊向代理提交證明生成任務,代理將任務轉發到驗證網絡。最初,這些代理將由Cysic運營,但後來,資產抵押將允許任何人成為代理。
  2. 證明生成: 證明者接受任務並使用硬件生成零知識證明。證明者必須抵押代幣以參與,並在完成任務後獲得獎勵。
  3. 驗證:驗證委員會檢查證明的有效性並對其進行投票。一旦達到一定的投票數量,該證明被認為是有效的。驗證人通過押注代幣、參與投票和獲得獎勵加入委員會。此過程可能會融入EigenLayer的AVS概念,以重複使用現有的Restaking設施。

詳細的互動過程如下所示

在此過程中,某些行動,如資產權抵押、獎勵分配和任務提交,需要區塊鏈基礎設施支持的專用平台。為了滿足這一需求,Cysic Network 開發了一個具有獨特共識算法稱為計算驗證(PoC)的專用公鏈。該算法使用 VRF 函數和 Prover 的歷史表現(如設備可用性、提交的證明數量、證明準確性等)來選擇負責創建區塊的區塊生產者(這些區塊可能記錄設備信息並分發代幣激勵)。除了 ZK 挖礦池和 SaaS 平台外,Cysic 在基於不同硬體的 ZK 加速解決方案上進行了廣泛部署。讓我們探索 Cysic 在 GPU、FPGA 和 ASIC 技術上的成就。

GPU、FPGA 和 ASIC:一個比較

ZK(Zero-Knowledge)硬體加速的本質在於最大程度地並行化關鍵計算。從硬體角度來看,CPU 設計用於最大靈活性和通用用途。然而,CPU 晶片區域的相當部分專用於控制功能和各個層級的快取,這限制了其並行運算能力。相比之下,GPU 晶片區域的比例更大部分用於計算,使其能夠支援大規模的並行處理。GPU 現在已廣泛可用,像 Nvidia CUDA 這樣的庫使開發人員能夠利用 GPU 的並行性,而無需深入了解底層硬體。CUDA SDK 提供了一個加速 MSM(多標量乘法)和 NTT(數論轉換)計算的框架,使用 CUDA ZK 库。

FPGA(現場可編程閘陣列)採用不同的方法,包括大量小型處理單元的陣列。要編程 FPGA,開發人員必須使用專門的硬件描述語言(HDL),然後將其編譯成晶體管電路組合。基本上,FPGA 通過晶體管電路直接實現特定算法,繞過傳統指令系統的編譯過程。與 GPU 相比,這種方法提供了更大的定製和靈活性。目前,FPGA 的價格約為 GPU 價格的三分之一,並且其能效比可以更高出十倍以上。這種能源效率的優勢部分是因為 GPU 需要連接到主機設備,這通常會消耗大量電能。FPGA 可以增加更多的計算模塊來滿足 MSM 和 NTT 的需求,而不會增加能源消耗,這使其特別適用於計算密集型的 ZK 憑證場景,需要高數據吞吐量且需要低響應時間。然而,FPGA 面臨的最大挑戰是缺乏必要的編程經驗的開發人員。對於 ZK 項目團隊來說,組建既具有密碼學專業知識又具有 FPGA 工程知識的團隊極具挑戰性。

ASIC(Application-Specific Integrated Circuit)是三者中最專業化的,基本上完全在硬體中實現一個程序。一旦設計了ASIC,硬體配置就是固定的,不能改變,這意味著它只能執行特定的任務。FPGA在加速MSM和NTT方面的優勢也適用於ASIC,但由於ASIC是為特定應用而設計的,因此它在所有硬件選項中提供了最高效率和最低功耗。對於當今的主流ZK電路,Cysic的目標是實現1-5秒的證明時間,這只有ASIC才能實現。盡管這些優點非常吸引人,但ZK技術正在迅速發展,ASIC設計和生產周期通常需要1-2年,成本在1000萬至2000萬美元之間。因此,大規模生產必須等到ZK技術穩定下來,以避免生產很快就會過時的芯片。

為應對這些挑戰,Cysic 在三大硬件類別:GPU、FPGA 和 ASIC 上進行了全面投資。在 GPU 加速方面,Cysic 通過其自主開發的 CUDA 加速 SDK 適應了各種新的 ZK 證明系統的出現。通過整合社區資源,Cysic 將數以萬計的頂級 GPU 連接到其 GPU 計算網絡中,實現了與最新的開源框架相比速度提升 50%-80% 或更多的成果。在 FPGA 領域,Cysic 開發了設定了 MSM、NTT 和 Poseidon Merkle 樹模塊全球性能基準的解決方案,覆蓋了 ZK 計算的最關鍵部分。這些解決方案已經由幾個領先的 ZK 項目進行了原型測試和驗證。Cysic 的專有 SolarMSM 可以在短短 0.195 秒內完成 2^30 次 MSM 計算,而 SolarNTT 則可以在 0.218 秒內執行 2^30 次 NTT 計算,使它們成為目前最高效的 FPGA 硬件加速結果。

在ASIC領域,雖然ZK ASIC的廣泛採用可能還需要一段時間,但Cysic已經通過開發自己的ZK DePIN晶元和設備在這個新興市場中定位自己。為了吸引消費者使用者,滿足不同ZK專案多樣化的性能和成本要求,Cysic計劃推出兩款ZK硬體產品:ZK Air和ZK Pro。

  • ZK Air:此設備體積小巧,與行動電源或筆記型電腦充電器大小相似,普通用戶可以通過Type-C接口將其連接到筆記型電腦、iPad甚至智能手機上。它為特定的ZK項目提供計算支持,同時為用戶賺取獎勵。儘管體積小,ZK Air的計算能力超過了消費級GPU,使其能夠加速小規模的ZK證明生成任務。
  • ZK Pro:針對更加密集的應用設計,ZK Pro類似於傳統的挖礦機,提供了與多GPU伺服器相當的運算能力。它顯著加快了大規模專案(如ZK-Rollup和ZKML(Zero-Knowledge Machine Learning))的ZK證明生成速度。

通過這兩個設備,Cysic旨在創建一個穩定可靠的ZK-DePIN網絡。 ZK Air和ZK Pro目前正在開發中,預計於2025年發布。此外,Cysic網絡將使消費者用戶能夠以非常低的進入門檻進入ZK硬件加速市場。再加上ZK項目團隊對計算能力的高需求,這可能會引發類似比特幣挖礦熱潮的新熱情,潛在地導致ZK計算市場的爆炸性增長。

參考

https://medium.com/amber-group/need-for-speed-zero-knowledge-1e29d4a82fcdhttps://figmentcapital.medium.com/accelerating-zero-knowledge-proofs-cfc806de611b

免責聲明:

  1. 本文轉載自 業餘科技 Web3. 版權歸原作者[Nickqiao & Wuyue]所有。如果有任何對轉載的異議,請聯繫Gate Learn團隊將根據相關程序及時處理。
  2. 免責聲明:本文所表達的觀點和意見僅為作者個人觀點,並不構成任何投資建議。
  3. Gate Learn團隊已經翻譯了本文的其他語言版本。未經提及Gate學習團隊,請勿複製、分發或抄襲翻譯的文章。Gate.io.
即刻開始交易
註冊並交易即可獲得
$100
和價值
$5500
理財體驗金獎勵!
It seems that you are attempting to access our services from a Restricted Location where Gate.io is unable to provide services. We apologize for any inconvenience this may cause. Currently, the Restricted Locations include but not limited to: the United States of America, Canada, Cambodia, Cuba, Iran, North Korea and so on. For more information regarding the Restricted Locations, please refer to the User Agreement. Should you have any other questions, please contact our Customer Support Team.