ในบทความก่อนหน้านี้เราได้พูดถึงมุมมองของเราเกี่ยวกับสถานะปัจจุบันของ AI Memes และการพัฒนา AI Agents ในอนาคต อย่างไรก็ตามการพัฒนาการเล่าเรื่องอย่างรวดเร็วและวิวัฒนาการของแทร็ก AI Agent ยังคงค่อนข้างล้นหลาม ในช่วงสองเดือนสั้น ๆ นับตั้งแต่เปิดตัว "Truth Terminal" และจุดเริ่มต้นของ Agent Summer การเล่าเรื่องของการรวม AI และ Crypto ได้พัฒนาขึ้นเกือบทุกสัปดาห์ เมื่อเร็ว ๆ นี้ความสนใจของตลาดเริ่มเปลี่ยนไปเป็นโครงการ "กรอบ" ซึ่งขับเคลื่อนโดยการเล่าเรื่องทางเทคโนโลยีเป็นหลัก ฟิลด์ย่อยเฉพาะนี้ได้ผลิตโครงการยูนิคอร์นหลายโครงการที่มีมูลค่าตลาดมากกว่าหนึ่งพันล้านดอลลาร์ภายในไม่กี่สัปดาห์ที่ผ่านมา โครงการเหล่านี้ยังนําไปสู่กระบวนทัศน์ใหม่สําหรับการออกสินทรัพย์ซึ่งโครงการจะออกโทเค็นตามที่เก็บรหัส GitHub และตัวแทนที่สร้างขึ้นบนเฟรมเวิร์กเหล่านี้ยังสามารถออกโทเค็นได้ หัวใจหลักของโครงสร้างนี้เรามีเฟรมเวิร์กโดยมีตัวแทนเป็นเลเยอร์ด้านบน มันคล้ายกับแพลตฟอร์มการออกสินทรัพย์ แต่จริงๆแล้วมันเป็นแบบจําลองโครงสร้างพื้นฐานที่ไม่เหมือนใครที่เกิดขึ้นในยุค AI เราควรมองแนวโน้มใหม่นี้อย่างไร? บทความนี้จะเริ่มต้นด้วยการแนะนําเฟรมเวิร์กและเสนอการตีความว่าเฟรมเวิร์ก AI หมายถึงอะไรสําหรับ Crypto โดยรวมข้อมูลเชิงลึกเหล่านี้เข้ากับการสะท้อนของเราเอง
ตามนิยาม เฟรมเวิร์ก AI คือเครื่องมือหรือแพลตฟอร์มพื้นฐานที่รวมกลุ่มโมดูลที่สร้างไว้ล่วงหน้า ห้องสมุด และเครื่องมือเพื่อการสร้างโมเดล AI ที่ซับซ้อน โดยทั่วไปเฟรมเวิร์กเหล่านี้ยังรวมฟังก์ชันสำหรับจัดการข้อมูล การฝึกโมเดล และการทำนาย อย่างง่ายๆ สามารถพิจารณาเฟรมเวิร์กเป็นระบบปฏิบัติการสำหรับยุค AI คล้ายกับระบบปฏิบัติการเดสก์ท็อป เช่น Windows หรือ Linux หรือระบบปฏิบัติการมือถือ เช่น iOS และ Android แต่ละเฟรมเวิร์กมีข้อดีและข้อเสียของตัวเองซึ่งช่วยให้นักพัฒนาสามารถเลือกตามความต้องการที่เฉพาะเจาะจงของตน
แม้ว่าคําว่า "AI framework" ยังเป็นแนวคิดที่ใหม่ในวงการ Crypto อยู่ แต่การพัฒนาของมันกลับย้อนกลับไปถึงเกือบ 14 ปี โดยเริ่มต้นด้วย Theano ในปี 2010 ในวงการ AI แบบดั้งเดิมทั้งในวงการวิชาการและอุตสาหกรรมได้พัฒนาโครงสร้างที่แข็งแกร่งมาก่อนหน้าแล้วที่สามารถเลือกใช้ได้หลากหลาย เช่น TensorFlow ของ Google, PyTorch ของ Meta, PaddlePaddle ของ Baidu, และ MagicAnimate ของ ByteDance แต่ละตัวมีข้อดีของตัวเองในสถานการณ์ที่แตกต่างกัน
โครงการ AI framework ที่กำลังเกิดขึ้นใน Crypto ณ ขณะนี้เน้นไปที่ความต้องการของตัวแทนจำนวนมากที่เกิดขึ้นจากการเจริญขึ้นของ AI boom และได้แยกออกเป็นรายละเอียดย่อยใน Crypto ต่าง ๆ แล้วเกิดเป็น AI frameworks ที่แตกต่างกันตามสาขาย่อยที่เฉพาะเจาะจง มาดูกันว่ามี AI frameworks ระดับหลักๆ ในอุตสาหกรรมนี้อะไรบ้างเพื่ออธิบายจุดนี้ให้เข้าใจได้ดียิ่งขึ้น
ก่อนอื่น ให้พิจารณา Eliza โครงการที่สร้างขึ้นโดย ai16z มันเป็นโครงการจำลองมัลติเอเจนท์ที่ออกแบบมาเพื่อสร้าง ใช้ และจัดการตัวแทน AI อย่างอิสระ พัฒนาขึ้นโดยใช้ TypeScript เป็นภาษาโปรแกรมมิ่ง ข้อดีของมันอยู่ที่ความเข้ากันได้และการผสม API ที่ง่ายยิ่งขึ้น ตามเอกสารอย่างเป็นทางการ Eliza ถูกออกแบบมาเพื่อสื่อสังคม มีการสนับสนุนสำหรับการผสานแพลตฟอร์มมากเพื่อผสานรวม โครงการให้การสนับสนุนใน Discord ที่เต็มรูปแบบ รองรับช่องเสียง บัญชีที่อัตโนมัติสำหรับ X/Twitter การผสานแพลตฟอร์มทีลีแกรม และการเข้าถึง API โดยตรง ในเชิงสื่อการประมวลผล มันสนับสนุนการอ่านและวิเคราะห์เอกสาร PDF การสกัดและสรุปลิงค์ การถอดข้อความเสียง การจัดการเนื้อหาวิดีโอ การวิเคราะห์ภาพ และสรุปการสนทนา
การใช้งานที่รองรับโดย Eliza ปัจจุบันประกอบด้วย 4 หมวดหมู่ดังต่อไปนี้:
รุ่นที่รองรับในปัจจุบันโดย Eliza คือ:
G.A.M.E (Generative Autonomous Multimodal Entities Framework) เป็นกรอบงาน AI แบบมัลติโมดัลสำหรับการสร้างและบริหารจัดการโดยอัตโนมัติ ที่ถูกเปิดตัวโดย Virtual มันถูกออกแบบมาเพื่อการออกแบบ NPC อัจฉริยะในเกม จุดเด่นของกรอบงานนี้คือ มันช่วยให้ผู้ใช้ที่มีโค้ดน้อยหรือไม่มีโค้ด สามารถเข้าร่วมในการออกแบบเอเจนต์ได้โดยการปรับเปลี่ยนพารามิเตอร์ผ่านอินเตอร์เฟซทดลองของมัน
ในเชิงสถาปัตยกรรมโครงการ G.A.M.E. สร้างขึ้นบนการออกแบบแบบโมดูลาร์ที่หลายระบบทำงานร่วมกันอย่างสอดคล้องกัน สถาปัตยกรรมอย่างละเอียดมีดังนี้:
การทำงาน: นักพัฒนาเริ่มต้นเอเจนต์ผ่านอินเตอร์เฟซการกระตุ้นเอเจนต์ ที่ภายในมีส่วนรับความรู้ระบบรับรู้และส่งข้อมูลไปยังเครื่องมือวางแผนยุทธศาสตร์ กับความช่วยเหลือจากระบบหน่วยความจำ บริบทของโลก และคลังข้อมูลเอเจนต์ ทำสูตรและดำเนินแผนการกระทำ และโมดูลการเรียนรู้ติดตามการกระทำของเอเจนต์และปรับปรุงพฤติกรรมตามนั้น
ประเภทการใช้งาน: จากโครงสร้างเทคนิคโดยรวม กรอบการทำงานนี้เน้นไปที่การตัดสินใจ คำตอบ การรับรู้ และบุคลิกภาพของเอเจนต์ในสภาพแวดล้อมเสมือน นอกจากการเล่นเกม กรอบการทำงานนี้ยังสามารถนำมาใช้ในเมตาเวิร์สได้ด้วย รายการด้านล่างจาก Virtual แสดงให้เห็นว่ามีโครงการหลายๆ โครงการที่ได้นำกรอบการทำงานนี้ไปใช้ในการก่อสร้างแล้ว
Rig เป็นเครื่องมือโอเพ่นซอร์สที่เขียนด้วย Rust ซึ่งออกแบบมาโดยเฉพาะเพื่อลดความซับซ้อนในการพัฒนาแอปพลิเคชันโมเดลภาษาขนาดใหญ่ (LLM) มีอินเทอร์เฟซแบบรวมที่ช่วยให้นักพัฒนาสามารถโต้ตอบกับผู้ให้บริการ LLM หลายราย (เช่น OpenAI และ Anthropic) และฐานข้อมูลเวกเตอร์ต่างๆ (เช่น MongoDB และ Neo4j) ได้อย่างง่ายดาย
คุณสมบัติสำคัญ:
กระบวนการทำงาน: เมื่อผู้ใช้เข้าสู่ระบบ Rig คำขอจะผ่านผ่าน "Provider Abstraction Layer" ก่อนที่จะมาตรฐานระหว่างผู้ให้บริการต่างๆ และรับรองการจัดการข้อผิดพลาดที่สม่ำเสมอในชั้นคอร์ ตัวแทนที่มีความสามารถในการเรียกใช้เครื่องมือต่างๆ หรือสอบถามการเก็บเวกเตอร์เพื่อเรียกคืนข้อมูลที่จำเป็น ในท้ายที่สุด กลไกขั้นสูงเช่น Retrieval-Augmented Generation (RAG) จะรวมการเรียกคืนเอกสารและความเข้าใจบริบทเพื่อสร้างคำตอบที่แม่นยำและมีความหมายก่อนส่งกลับไปยังผู้ใช้
กรณีการใช้งาน: Rig เหมาะสำหรับการสร้างระบบที่ต้องการคำตอบคำถามอย่างรวดเร็วและแม่นยำ สร้างเครื่องมือการค้นหาเอกสารที่มีประสิทธิภาพ พัฒนา chatbot ที่ตระหนักถึงบริบทหรือผู้ช่วยเสมือนจริง และรองรับการสร้างเนื้อหาโดยการสร้างข้อความหรือรูปแบบอื่น ๆ ขึ้นอัตโนมัติจากรูปแบบข้อมูลที่มีอยู่
ZerePy เป็นเฟรมเวิร์กโอเพ่นซอร์สที่ใช้ Python ที่ออกแบบมาเพื่อลดความซับซ้อนของการปรับใช้และการจัดการตัวแทน AI บนแพลตฟอร์ม X (เดิมชื่อ Twitter) มันพัฒนามาจากโครงการ Zerebro และสืบทอดฟังก์ชันหลัก แต่ได้รับการออกแบบในลักษณะแยกส่วนและปรับขนาดได้มากขึ้น เป้าหมายคือเพื่อให้นักพัฒนาสามารถสร้างตัวแทน AI ส่วนบุคคลได้อย่างง่ายดายและใช้งานระบบอัตโนมัติและการสร้างเนื้อหาต่างๆบน X
ZerePy มีอินเทอร์เฟซเชนเนล (CLI) ซึ่งทำให้ผู้ใช้สะดวกในการจัดการและควบคุมเอเจนต์ AI ที่พวกเขาใช้งาน โครงสร้างหลักของมันเป็นโมดูลาร์ได้ ซึ่งช่วยให้นักพัฒนาสามารถผสานโมดูลฟังก์ชันต่างๆ อย่างยืดหยุ่น
ในขณะที่ทั้ง ZerePy และโครงการ Eliza ของ a16z มีเป้าหมายในการสร้างและจัดการตัวแทน AI แต่พวกเขาแตกต่างกันในสถาปัตยกรรมและการให้ความสำคัญ Eliza มีความเชื่อมโยงมากกับการจำลองตัวแทนหลายตัวและการวิจัย AI ทั่วไปในขณะที่ ZerePy ให้ความสำคัญกับการปรับใช้ตัวแทน AI บนแพลตฟอร์มสังคมเฉพาะ (X) ทำให้มีความเชื่อมโยงกับการประยุกต์ใช้มากกว่า
ในแง่ของเส้นทางการพัฒนาตัวแทน AI มีความคล้ายคลึงกันมากกับระบบนิเวศของ BTC ตั้งแต่ปลายปี 2023 ถึงต้นปี 2024 วิถีการพัฒนาของระบบนิเวศ BTC สามารถสรุปได้ง่าย ๆ ว่า: BRC20-Atomical/Rune และการแข่งขันหลายโปรโตคอลอื่น ๆ — BTC L2 — BTCFi มีศูนย์กลางอยู่ที่บาบิโลน ในขณะที่ตัวแทน AI ได้พัฒนาอย่างรวดเร็วมากขึ้นบนรากฐานของกองเทคโนโลยี AI แบบดั้งเดิมที่เป็นผู้ใหญ่ แต่เส้นทางการพัฒนาโดยรวมของพวกเขาสะท้อนให้เห็นถึงระบบนิเวศของ BTC ในหลาย ๆ ด้าน ฉันจะสรุปดังนี้: GOAT/ACT — ตัวแทนประเภทสังคม — การแข่งขันกรอบงานตัวแทน AI เชิงวิเคราะห์ จากมุมมองแนวโน้มโครงการโครงสร้างพื้นฐานที่เน้นการกระจายอํานาจและความปลอดภัยรอบ ๆ ตัวแทนมีแนวโน้มที่จะนําคลื่นกรอบนี้ไปข้างหน้ากลายเป็นธีมที่โดดเด่นต่อไป
ดังนั้นแทร็กนี้เช่นเดียวกับระบบนิเวศ BTC จะนําไปสู่การทําให้เป็นเนื้อเดียวกันและฟองสบู่หรือไม่? ไม่ใช่ ประการแรกการเล่าเรื่องของตัวแทน AI ไม่ได้เกี่ยวกับการสร้างประวัติศาสตร์ของห่วงโซ่สัญญาอัจฉริยะ ประการที่สองไม่ว่าโครงการเฟรมเวิร์ก AI ที่มีอยู่เหล่านี้จะแข็งแกร่งทางเทคนิคหรือยังคงติดอยู่ในขั้นตอน PPT หรือเพียงแค่ Ctrl + C และ Ctrl + V อย่างน้อยก็ให้แนวทางการพัฒนาโครงสร้างพื้นฐานใหม่ บทความจํานวนมากได้เปรียบเทียบเฟรมเวิร์ก AI กับแพลตฟอร์มการออกสินทรัพย์และตัวแทนกับสินทรัพย์ อย่างไรก็ตามเมื่อเทียบกับ Memecoin Launchpads และโปรโตคอลจารึกโดยส่วนตัวแล้วฉันเชื่อว่าเฟรมเวิร์ก AI คล้ายกับเครือข่ายสาธารณะในอนาคตในขณะที่ตัวแทนมีลักษณะคล้ายกับ DApps ในอนาคต
ใน Crypto space ในปัจจุบัน เรามี public chains หลักพันและ DApps หลักหมื่น ในขอบข่ายของ public chains ทั่วไป เรามี BTC Ethereum และ various heterogeneous chains ในขณะที่รูปแบบของ application chains มีความหลากหลายมากขึ้น เช่น game chains storage chains และ Dex chains Public chains และ AI frameworks มีลักษณะที่คล้ายกันมากและ DApps สามารถสอดคล้องกับตัวแทนได้ดี
ในยุคของ Crypto ใน AI มีความเป็นไปได้สูงที่พื้นที่จะพัฒนาไปในทิศทางนี้โดยการอภิปรายในอนาคตจะเปลี่ยนจาก EVM เทียบกับห่วงโซ่ที่แตกต่างกันไปสู่การอภิปรายกรอบ ปัญหาปัจจุบันเป็นเรื่องของการกระจายอํานาจหรือวิธีการ "ล่ามโซ่" ฉันเชื่อว่าโครงการโครงสร้างพื้นฐาน AI ในอนาคตจะพัฒนาไปรอบ ๆ รากฐานนี้ อีกจุดสําคัญคือ: การทําเช่นนี้บนบล็อกเชนมีความสําคัญอย่างไร?
ไม่ว่าบล็อกเชนจะรวมกับอะไรในที่สุดก็ต้องเผชิญกับคําถามสําคัญข้อหนึ่ง: มันมีความหมายหรือไม่? ในบทความของปีที่แล้วฉันวิพากษ์วิจารณ์ GameFi สําหรับลําดับความสําคัญที่ผิดพลาดซึ่งการพัฒนาโครงสร้างพื้นฐานมีความก้าวหน้ามากเกินไปและในบทความก่อนหน้านี้เกี่ยวกับ AI ฉันแสดงความสงสัยเกี่ยวกับการปฏิบัติจริงในปัจจุบันของการรวม AI กับ Crypto ท้ายที่สุดแรงผลักดันการเล่าเรื่องสําหรับโครงการแบบดั้งเดิมก็อ่อนแอลงเรื่อย ๆ โครงการดั้งเดิมไม่กี่โครงการที่ทํางานได้ดีในปีที่แล้วในแง่ของราคาโทเค็นโดยทั่วไปคือโครงการที่สามารถจับคู่หรือเกินความแข็งแกร่งของราคาได้
AI สามารถทําอะไรให้กับ Crypto ได้บ้าง? ก่อนหน้านี้ฉันนึกถึงกรณีการใช้งานเช่นตัวแทน AI ที่ทํางานในนามของผู้ใช้ Metaverse และตัวแทนในฐานะพนักงาน - แนวคิดที่ค่อนข้างธรรมดา แต่มีความต้องการบางอย่าง อย่างไรก็ตามความต้องการเหล่านี้ไม่จําเป็นต้องอยู่ในห่วงโซ่อย่างเต็มที่และจากมุมมองตรรกะทางธุรกิจพวกเขาไม่สามารถสร้างวงปิดได้ เบราว์เซอร์ตัวแทนที่กล่าวถึงในบทความล่าสุดซึ่งใช้ความตั้งใจสามารถสร้างความต้องการสําหรับการติดฉลากข้อมูลและพลังการประมวลผลการอนุมาน แต่องค์ประกอบทั้งสองนี้ยังไม่ได้รวมเข้าด้วยกันอย่างแน่นหนาและในแง่ของพลังการคํานวณการประมวลผลแบบรวมศูนย์ยังคงได้เปรียบ
ในการสำรวจความสำเร็จของ DeFi หากพิจารณาปัจจัยที่ทำให้ DeFi สามารถแยกออกมาจากการเงินดั้งเดิมได้ จะพบว่ามีความเข้าถึงที่ดีกว่า ประสิทธิภาพที่ดีกว่า ต้นทุนที่ต่ำกว่า และความปลอดภัยที่ไม่ต้องไว้วางใจเจ้าของ
โครงการเฟรมเวิร์กในอนาคตยังจะให้โอกาสทางธุรกิจในลักษณะที่คล้ายกับ GPT Store อยู่ด้วย ในขณะที่การเปิดตัวเอเจนต์ผ่านเฟรมเวิร์กยังคงซับซ้อนสำหรับผู้ใช้ทั่วไป ฉันเชื่อว่าการทำให้กระบวนการก่อสร้างเอเจนต์เป็นเรื่องง่ายขึ้นและให้การรวมฟังก์ชันที่ซับซ้อนมากขึ้นจะให้โครงการเหล่านี้มีประโยชน์ในการแข่งขันในอนาคต นี่อาจส่งผลให้เกิดเศรษฐกิจสร้างสรรค์ Web3 ที่น่าสนใจกว่า GPT Store ได้
ในปัจจุบัน GPT Store ยังมีแนวโน้มที่เน้นไปทางการใช้งานที่เป็นรูปแบบ传统มากกว่าโดยมีแอปที่ได้รับความนิยมสร้างขึ้นโดยบริษัท Web2 ทั่วไป นอกจากนี้ รายได้ที่สร้างขึ้นมีส่วนใหญ่ถูกจองไว้ให้ผู้สร้าง ตามคำอธิบายอย่างเป็นทางการของ OpenAI ยังมีเพียงแค่กลยุทธ์ในการสนับสนุนทางการเงินให้กับนักพัฒนาที่ยอดเยี่ยมในสหรัฐฯ โดยมีการสนับสนุนทางการเงินตามจำนวนที่กำหนด
จากมุมมองของอุปสงค์ Web3 ยังคงมีช่องว่างมากมายให้เติมเต็มและจากมุมมองของระบบเศรษฐกิจสามารถทําให้นโยบายที่ไม่เป็นธรรมของ Web2 ยักษ์ใหญ่มีความเท่าเทียมกันมากขึ้น นอกจากนี้เราสามารถแนะนําเศรษฐกิจชุมชนเพื่อปรับปรุงตัวแทนต่อไป เศรษฐกิจสร้างสรรค์รอบตัวตัวแทนจะเปิดโอกาสให้คนธรรมดามีส่วนร่วม ในอนาคตมส์ AI จะฉลาดและน่าสนใจกว่าตัวแทนที่ออกโดย GOAT หรือ Clanker
YBB เป็นกองทุน web3 ที่มุ่งเน้นการระบุโครงการที่กำหนด Web3 พร้อมวิสัยทัศน์ในการสร้างที่อยู่ออนไลน์ที่ดีขึ้นสำหรับผู้อาศัยอินเทอร์เน็ตทั้งหมด ก่อตั้งโดยกลุ่มคนที่เชื่อในบล็อกเชนซึ่งมีการมีส่วนร่วมอย่างเต็มใจในอุตสาหกรรมนี้ตั้งแต่ปี 2013 YBB เสมอพร้อมที่จะช่วยโครงการระยะเริ่มต้นให้เติบโตจาก 0 ไปสู่ 1 เราให้ความคุ้มค่ากับนวัตกรรม ความพิรุธ และผลิตภัณฑ์ที่มุ่งเน้นผู้ใช้ พร้อมรับทราบศักยภาพของคริปโตและการประยุกต์บล็อกเชน
ในบทความก่อนหน้านี้เราได้พูดถึงมุมมองของเราเกี่ยวกับสถานะปัจจุบันของ AI Memes และการพัฒนา AI Agents ในอนาคต อย่างไรก็ตามการพัฒนาการเล่าเรื่องอย่างรวดเร็วและวิวัฒนาการของแทร็ก AI Agent ยังคงค่อนข้างล้นหลาม ในช่วงสองเดือนสั้น ๆ นับตั้งแต่เปิดตัว "Truth Terminal" และจุดเริ่มต้นของ Agent Summer การเล่าเรื่องของการรวม AI และ Crypto ได้พัฒนาขึ้นเกือบทุกสัปดาห์ เมื่อเร็ว ๆ นี้ความสนใจของตลาดเริ่มเปลี่ยนไปเป็นโครงการ "กรอบ" ซึ่งขับเคลื่อนโดยการเล่าเรื่องทางเทคโนโลยีเป็นหลัก ฟิลด์ย่อยเฉพาะนี้ได้ผลิตโครงการยูนิคอร์นหลายโครงการที่มีมูลค่าตลาดมากกว่าหนึ่งพันล้านดอลลาร์ภายในไม่กี่สัปดาห์ที่ผ่านมา โครงการเหล่านี้ยังนําไปสู่กระบวนทัศน์ใหม่สําหรับการออกสินทรัพย์ซึ่งโครงการจะออกโทเค็นตามที่เก็บรหัส GitHub และตัวแทนที่สร้างขึ้นบนเฟรมเวิร์กเหล่านี้ยังสามารถออกโทเค็นได้ หัวใจหลักของโครงสร้างนี้เรามีเฟรมเวิร์กโดยมีตัวแทนเป็นเลเยอร์ด้านบน มันคล้ายกับแพลตฟอร์มการออกสินทรัพย์ แต่จริงๆแล้วมันเป็นแบบจําลองโครงสร้างพื้นฐานที่ไม่เหมือนใครที่เกิดขึ้นในยุค AI เราควรมองแนวโน้มใหม่นี้อย่างไร? บทความนี้จะเริ่มต้นด้วยการแนะนําเฟรมเวิร์กและเสนอการตีความว่าเฟรมเวิร์ก AI หมายถึงอะไรสําหรับ Crypto โดยรวมข้อมูลเชิงลึกเหล่านี้เข้ากับการสะท้อนของเราเอง
ตามนิยาม เฟรมเวิร์ก AI คือเครื่องมือหรือแพลตฟอร์มพื้นฐานที่รวมกลุ่มโมดูลที่สร้างไว้ล่วงหน้า ห้องสมุด และเครื่องมือเพื่อการสร้างโมเดล AI ที่ซับซ้อน โดยทั่วไปเฟรมเวิร์กเหล่านี้ยังรวมฟังก์ชันสำหรับจัดการข้อมูล การฝึกโมเดล และการทำนาย อย่างง่ายๆ สามารถพิจารณาเฟรมเวิร์กเป็นระบบปฏิบัติการสำหรับยุค AI คล้ายกับระบบปฏิบัติการเดสก์ท็อป เช่น Windows หรือ Linux หรือระบบปฏิบัติการมือถือ เช่น iOS และ Android แต่ละเฟรมเวิร์กมีข้อดีและข้อเสียของตัวเองซึ่งช่วยให้นักพัฒนาสามารถเลือกตามความต้องการที่เฉพาะเจาะจงของตน
แม้ว่าคําว่า "AI framework" ยังเป็นแนวคิดที่ใหม่ในวงการ Crypto อยู่ แต่การพัฒนาของมันกลับย้อนกลับไปถึงเกือบ 14 ปี โดยเริ่มต้นด้วย Theano ในปี 2010 ในวงการ AI แบบดั้งเดิมทั้งในวงการวิชาการและอุตสาหกรรมได้พัฒนาโครงสร้างที่แข็งแกร่งมาก่อนหน้าแล้วที่สามารถเลือกใช้ได้หลากหลาย เช่น TensorFlow ของ Google, PyTorch ของ Meta, PaddlePaddle ของ Baidu, และ MagicAnimate ของ ByteDance แต่ละตัวมีข้อดีของตัวเองในสถานการณ์ที่แตกต่างกัน
โครงการ AI framework ที่กำลังเกิดขึ้นใน Crypto ณ ขณะนี้เน้นไปที่ความต้องการของตัวแทนจำนวนมากที่เกิดขึ้นจากการเจริญขึ้นของ AI boom และได้แยกออกเป็นรายละเอียดย่อยใน Crypto ต่าง ๆ แล้วเกิดเป็น AI frameworks ที่แตกต่างกันตามสาขาย่อยที่เฉพาะเจาะจง มาดูกันว่ามี AI frameworks ระดับหลักๆ ในอุตสาหกรรมนี้อะไรบ้างเพื่ออธิบายจุดนี้ให้เข้าใจได้ดียิ่งขึ้น
ก่อนอื่น ให้พิจารณา Eliza โครงการที่สร้างขึ้นโดย ai16z มันเป็นโครงการจำลองมัลติเอเจนท์ที่ออกแบบมาเพื่อสร้าง ใช้ และจัดการตัวแทน AI อย่างอิสระ พัฒนาขึ้นโดยใช้ TypeScript เป็นภาษาโปรแกรมมิ่ง ข้อดีของมันอยู่ที่ความเข้ากันได้และการผสม API ที่ง่ายยิ่งขึ้น ตามเอกสารอย่างเป็นทางการ Eliza ถูกออกแบบมาเพื่อสื่อสังคม มีการสนับสนุนสำหรับการผสานแพลตฟอร์มมากเพื่อผสานรวม โครงการให้การสนับสนุนใน Discord ที่เต็มรูปแบบ รองรับช่องเสียง บัญชีที่อัตโนมัติสำหรับ X/Twitter การผสานแพลตฟอร์มทีลีแกรม และการเข้าถึง API โดยตรง ในเชิงสื่อการประมวลผล มันสนับสนุนการอ่านและวิเคราะห์เอกสาร PDF การสกัดและสรุปลิงค์ การถอดข้อความเสียง การจัดการเนื้อหาวิดีโอ การวิเคราะห์ภาพ และสรุปการสนทนา
การใช้งานที่รองรับโดย Eliza ปัจจุบันประกอบด้วย 4 หมวดหมู่ดังต่อไปนี้:
รุ่นที่รองรับในปัจจุบันโดย Eliza คือ:
G.A.M.E (Generative Autonomous Multimodal Entities Framework) เป็นกรอบงาน AI แบบมัลติโมดัลสำหรับการสร้างและบริหารจัดการโดยอัตโนมัติ ที่ถูกเปิดตัวโดย Virtual มันถูกออกแบบมาเพื่อการออกแบบ NPC อัจฉริยะในเกม จุดเด่นของกรอบงานนี้คือ มันช่วยให้ผู้ใช้ที่มีโค้ดน้อยหรือไม่มีโค้ด สามารถเข้าร่วมในการออกแบบเอเจนต์ได้โดยการปรับเปลี่ยนพารามิเตอร์ผ่านอินเตอร์เฟซทดลองของมัน
ในเชิงสถาปัตยกรรมโครงการ G.A.M.E. สร้างขึ้นบนการออกแบบแบบโมดูลาร์ที่หลายระบบทำงานร่วมกันอย่างสอดคล้องกัน สถาปัตยกรรมอย่างละเอียดมีดังนี้:
การทำงาน: นักพัฒนาเริ่มต้นเอเจนต์ผ่านอินเตอร์เฟซการกระตุ้นเอเจนต์ ที่ภายในมีส่วนรับความรู้ระบบรับรู้และส่งข้อมูลไปยังเครื่องมือวางแผนยุทธศาสตร์ กับความช่วยเหลือจากระบบหน่วยความจำ บริบทของโลก และคลังข้อมูลเอเจนต์ ทำสูตรและดำเนินแผนการกระทำ และโมดูลการเรียนรู้ติดตามการกระทำของเอเจนต์และปรับปรุงพฤติกรรมตามนั้น
ประเภทการใช้งาน: จากโครงสร้างเทคนิคโดยรวม กรอบการทำงานนี้เน้นไปที่การตัดสินใจ คำตอบ การรับรู้ และบุคลิกภาพของเอเจนต์ในสภาพแวดล้อมเสมือน นอกจากการเล่นเกม กรอบการทำงานนี้ยังสามารถนำมาใช้ในเมตาเวิร์สได้ด้วย รายการด้านล่างจาก Virtual แสดงให้เห็นว่ามีโครงการหลายๆ โครงการที่ได้นำกรอบการทำงานนี้ไปใช้ในการก่อสร้างแล้ว
Rig เป็นเครื่องมือโอเพ่นซอร์สที่เขียนด้วย Rust ซึ่งออกแบบมาโดยเฉพาะเพื่อลดความซับซ้อนในการพัฒนาแอปพลิเคชันโมเดลภาษาขนาดใหญ่ (LLM) มีอินเทอร์เฟซแบบรวมที่ช่วยให้นักพัฒนาสามารถโต้ตอบกับผู้ให้บริการ LLM หลายราย (เช่น OpenAI และ Anthropic) และฐานข้อมูลเวกเตอร์ต่างๆ (เช่น MongoDB และ Neo4j) ได้อย่างง่ายดาย
คุณสมบัติสำคัญ:
กระบวนการทำงาน: เมื่อผู้ใช้เข้าสู่ระบบ Rig คำขอจะผ่านผ่าน "Provider Abstraction Layer" ก่อนที่จะมาตรฐานระหว่างผู้ให้บริการต่างๆ และรับรองการจัดการข้อผิดพลาดที่สม่ำเสมอในชั้นคอร์ ตัวแทนที่มีความสามารถในการเรียกใช้เครื่องมือต่างๆ หรือสอบถามการเก็บเวกเตอร์เพื่อเรียกคืนข้อมูลที่จำเป็น ในท้ายที่สุด กลไกขั้นสูงเช่น Retrieval-Augmented Generation (RAG) จะรวมการเรียกคืนเอกสารและความเข้าใจบริบทเพื่อสร้างคำตอบที่แม่นยำและมีความหมายก่อนส่งกลับไปยังผู้ใช้
กรณีการใช้งาน: Rig เหมาะสำหรับการสร้างระบบที่ต้องการคำตอบคำถามอย่างรวดเร็วและแม่นยำ สร้างเครื่องมือการค้นหาเอกสารที่มีประสิทธิภาพ พัฒนา chatbot ที่ตระหนักถึงบริบทหรือผู้ช่วยเสมือนจริง และรองรับการสร้างเนื้อหาโดยการสร้างข้อความหรือรูปแบบอื่น ๆ ขึ้นอัตโนมัติจากรูปแบบข้อมูลที่มีอยู่
ZerePy เป็นเฟรมเวิร์กโอเพ่นซอร์สที่ใช้ Python ที่ออกแบบมาเพื่อลดความซับซ้อนของการปรับใช้และการจัดการตัวแทน AI บนแพลตฟอร์ม X (เดิมชื่อ Twitter) มันพัฒนามาจากโครงการ Zerebro และสืบทอดฟังก์ชันหลัก แต่ได้รับการออกแบบในลักษณะแยกส่วนและปรับขนาดได้มากขึ้น เป้าหมายคือเพื่อให้นักพัฒนาสามารถสร้างตัวแทน AI ส่วนบุคคลได้อย่างง่ายดายและใช้งานระบบอัตโนมัติและการสร้างเนื้อหาต่างๆบน X
ZerePy มีอินเทอร์เฟซเชนเนล (CLI) ซึ่งทำให้ผู้ใช้สะดวกในการจัดการและควบคุมเอเจนต์ AI ที่พวกเขาใช้งาน โครงสร้างหลักของมันเป็นโมดูลาร์ได้ ซึ่งช่วยให้นักพัฒนาสามารถผสานโมดูลฟังก์ชันต่างๆ อย่างยืดหยุ่น
ในขณะที่ทั้ง ZerePy และโครงการ Eliza ของ a16z มีเป้าหมายในการสร้างและจัดการตัวแทน AI แต่พวกเขาแตกต่างกันในสถาปัตยกรรมและการให้ความสำคัญ Eliza มีความเชื่อมโยงมากกับการจำลองตัวแทนหลายตัวและการวิจัย AI ทั่วไปในขณะที่ ZerePy ให้ความสำคัญกับการปรับใช้ตัวแทน AI บนแพลตฟอร์มสังคมเฉพาะ (X) ทำให้มีความเชื่อมโยงกับการประยุกต์ใช้มากกว่า
ในแง่ของเส้นทางการพัฒนาตัวแทน AI มีความคล้ายคลึงกันมากกับระบบนิเวศของ BTC ตั้งแต่ปลายปี 2023 ถึงต้นปี 2024 วิถีการพัฒนาของระบบนิเวศ BTC สามารถสรุปได้ง่าย ๆ ว่า: BRC20-Atomical/Rune และการแข่งขันหลายโปรโตคอลอื่น ๆ — BTC L2 — BTCFi มีศูนย์กลางอยู่ที่บาบิโลน ในขณะที่ตัวแทน AI ได้พัฒนาอย่างรวดเร็วมากขึ้นบนรากฐานของกองเทคโนโลยี AI แบบดั้งเดิมที่เป็นผู้ใหญ่ แต่เส้นทางการพัฒนาโดยรวมของพวกเขาสะท้อนให้เห็นถึงระบบนิเวศของ BTC ในหลาย ๆ ด้าน ฉันจะสรุปดังนี้: GOAT/ACT — ตัวแทนประเภทสังคม — การแข่งขันกรอบงานตัวแทน AI เชิงวิเคราะห์ จากมุมมองแนวโน้มโครงการโครงสร้างพื้นฐานที่เน้นการกระจายอํานาจและความปลอดภัยรอบ ๆ ตัวแทนมีแนวโน้มที่จะนําคลื่นกรอบนี้ไปข้างหน้ากลายเป็นธีมที่โดดเด่นต่อไป
ดังนั้นแทร็กนี้เช่นเดียวกับระบบนิเวศ BTC จะนําไปสู่การทําให้เป็นเนื้อเดียวกันและฟองสบู่หรือไม่? ไม่ใช่ ประการแรกการเล่าเรื่องของตัวแทน AI ไม่ได้เกี่ยวกับการสร้างประวัติศาสตร์ของห่วงโซ่สัญญาอัจฉริยะ ประการที่สองไม่ว่าโครงการเฟรมเวิร์ก AI ที่มีอยู่เหล่านี้จะแข็งแกร่งทางเทคนิคหรือยังคงติดอยู่ในขั้นตอน PPT หรือเพียงแค่ Ctrl + C และ Ctrl + V อย่างน้อยก็ให้แนวทางการพัฒนาโครงสร้างพื้นฐานใหม่ บทความจํานวนมากได้เปรียบเทียบเฟรมเวิร์ก AI กับแพลตฟอร์มการออกสินทรัพย์และตัวแทนกับสินทรัพย์ อย่างไรก็ตามเมื่อเทียบกับ Memecoin Launchpads และโปรโตคอลจารึกโดยส่วนตัวแล้วฉันเชื่อว่าเฟรมเวิร์ก AI คล้ายกับเครือข่ายสาธารณะในอนาคตในขณะที่ตัวแทนมีลักษณะคล้ายกับ DApps ในอนาคต
ใน Crypto space ในปัจจุบัน เรามี public chains หลักพันและ DApps หลักหมื่น ในขอบข่ายของ public chains ทั่วไป เรามี BTC Ethereum และ various heterogeneous chains ในขณะที่รูปแบบของ application chains มีความหลากหลายมากขึ้น เช่น game chains storage chains และ Dex chains Public chains และ AI frameworks มีลักษณะที่คล้ายกันมากและ DApps สามารถสอดคล้องกับตัวแทนได้ดี
ในยุคของ Crypto ใน AI มีความเป็นไปได้สูงที่พื้นที่จะพัฒนาไปในทิศทางนี้โดยการอภิปรายในอนาคตจะเปลี่ยนจาก EVM เทียบกับห่วงโซ่ที่แตกต่างกันไปสู่การอภิปรายกรอบ ปัญหาปัจจุบันเป็นเรื่องของการกระจายอํานาจหรือวิธีการ "ล่ามโซ่" ฉันเชื่อว่าโครงการโครงสร้างพื้นฐาน AI ในอนาคตจะพัฒนาไปรอบ ๆ รากฐานนี้ อีกจุดสําคัญคือ: การทําเช่นนี้บนบล็อกเชนมีความสําคัญอย่างไร?
ไม่ว่าบล็อกเชนจะรวมกับอะไรในที่สุดก็ต้องเผชิญกับคําถามสําคัญข้อหนึ่ง: มันมีความหมายหรือไม่? ในบทความของปีที่แล้วฉันวิพากษ์วิจารณ์ GameFi สําหรับลําดับความสําคัญที่ผิดพลาดซึ่งการพัฒนาโครงสร้างพื้นฐานมีความก้าวหน้ามากเกินไปและในบทความก่อนหน้านี้เกี่ยวกับ AI ฉันแสดงความสงสัยเกี่ยวกับการปฏิบัติจริงในปัจจุบันของการรวม AI กับ Crypto ท้ายที่สุดแรงผลักดันการเล่าเรื่องสําหรับโครงการแบบดั้งเดิมก็อ่อนแอลงเรื่อย ๆ โครงการดั้งเดิมไม่กี่โครงการที่ทํางานได้ดีในปีที่แล้วในแง่ของราคาโทเค็นโดยทั่วไปคือโครงการที่สามารถจับคู่หรือเกินความแข็งแกร่งของราคาได้
AI สามารถทําอะไรให้กับ Crypto ได้บ้าง? ก่อนหน้านี้ฉันนึกถึงกรณีการใช้งานเช่นตัวแทน AI ที่ทํางานในนามของผู้ใช้ Metaverse และตัวแทนในฐานะพนักงาน - แนวคิดที่ค่อนข้างธรรมดา แต่มีความต้องการบางอย่าง อย่างไรก็ตามความต้องการเหล่านี้ไม่จําเป็นต้องอยู่ในห่วงโซ่อย่างเต็มที่และจากมุมมองตรรกะทางธุรกิจพวกเขาไม่สามารถสร้างวงปิดได้ เบราว์เซอร์ตัวแทนที่กล่าวถึงในบทความล่าสุดซึ่งใช้ความตั้งใจสามารถสร้างความต้องการสําหรับการติดฉลากข้อมูลและพลังการประมวลผลการอนุมาน แต่องค์ประกอบทั้งสองนี้ยังไม่ได้รวมเข้าด้วยกันอย่างแน่นหนาและในแง่ของพลังการคํานวณการประมวลผลแบบรวมศูนย์ยังคงได้เปรียบ
ในการสำรวจความสำเร็จของ DeFi หากพิจารณาปัจจัยที่ทำให้ DeFi สามารถแยกออกมาจากการเงินดั้งเดิมได้ จะพบว่ามีความเข้าถึงที่ดีกว่า ประสิทธิภาพที่ดีกว่า ต้นทุนที่ต่ำกว่า และความปลอดภัยที่ไม่ต้องไว้วางใจเจ้าของ
โครงการเฟรมเวิร์กในอนาคตยังจะให้โอกาสทางธุรกิจในลักษณะที่คล้ายกับ GPT Store อยู่ด้วย ในขณะที่การเปิดตัวเอเจนต์ผ่านเฟรมเวิร์กยังคงซับซ้อนสำหรับผู้ใช้ทั่วไป ฉันเชื่อว่าการทำให้กระบวนการก่อสร้างเอเจนต์เป็นเรื่องง่ายขึ้นและให้การรวมฟังก์ชันที่ซับซ้อนมากขึ้นจะให้โครงการเหล่านี้มีประโยชน์ในการแข่งขันในอนาคต นี่อาจส่งผลให้เกิดเศรษฐกิจสร้างสรรค์ Web3 ที่น่าสนใจกว่า GPT Store ได้
ในปัจจุบัน GPT Store ยังมีแนวโน้มที่เน้นไปทางการใช้งานที่เป็นรูปแบบ传统มากกว่าโดยมีแอปที่ได้รับความนิยมสร้างขึ้นโดยบริษัท Web2 ทั่วไป นอกจากนี้ รายได้ที่สร้างขึ้นมีส่วนใหญ่ถูกจองไว้ให้ผู้สร้าง ตามคำอธิบายอย่างเป็นทางการของ OpenAI ยังมีเพียงแค่กลยุทธ์ในการสนับสนุนทางการเงินให้กับนักพัฒนาที่ยอดเยี่ยมในสหรัฐฯ โดยมีการสนับสนุนทางการเงินตามจำนวนที่กำหนด
จากมุมมองของอุปสงค์ Web3 ยังคงมีช่องว่างมากมายให้เติมเต็มและจากมุมมองของระบบเศรษฐกิจสามารถทําให้นโยบายที่ไม่เป็นธรรมของ Web2 ยักษ์ใหญ่มีความเท่าเทียมกันมากขึ้น นอกจากนี้เราสามารถแนะนําเศรษฐกิจชุมชนเพื่อปรับปรุงตัวแทนต่อไป เศรษฐกิจสร้างสรรค์รอบตัวตัวแทนจะเปิดโอกาสให้คนธรรมดามีส่วนร่วม ในอนาคตมส์ AI จะฉลาดและน่าสนใจกว่าตัวแทนที่ออกโดย GOAT หรือ Clanker
YBB เป็นกองทุน web3 ที่มุ่งเน้นการระบุโครงการที่กำหนด Web3 พร้อมวิสัยทัศน์ในการสร้างที่อยู่ออนไลน์ที่ดีขึ้นสำหรับผู้อาศัยอินเทอร์เน็ตทั้งหมด ก่อตั้งโดยกลุ่มคนที่เชื่อในบล็อกเชนซึ่งมีการมีส่วนร่วมอย่างเต็มใจในอุตสาหกรรมนี้ตั้งแต่ปี 2013 YBB เสมอพร้อมที่จะช่วยโครงการระยะเริ่มต้นให้เติบโตจาก 0 ไปสู่ 1 เราให้ความคุ้มค่ากับนวัตกรรม ความพิรุธ และผลิตภัณฑ์ที่มุ่งเน้นผู้ใช้ พร้อมรับทราบศักยภาพของคริปโตและการประยุกต์บล็อกเชน