การแยกตัวเฟรมเวิร์ค AI: จากตัวแทนอัจฉริยะไปสู่การสำรวจการกระจายอำนาจ

กลาง1/16/2025, 6:03:33 AM
บทความนี้ลึกศึกษาเทรนด์ในการพัฒนาและตรรกะการลงทุนภายในเขตการใช้ AI Agent โดยมีการเน้นที่การวิเคราะห์โครงการที่ใช้เฟรมเวิร์กอย่างละเอียด มันนำเสนอแนวคิดพื้นฐานและฟังก์ชันพิเศษของเฟรมเวิร์ก AI และสาธิตประสิทธิภาพและศักยภาพของมันทางที่แตกต่างผ่านการศึกษากรณีเฉพาะเช่น Eliza, G.A.M.E, Rig และ ZerePy อีกต่างหาก อีกทั้ง จากมุมมองทางเทคนิค ตลาด และการลงทุน บทความเปรียบเทียบความคล้ายคลึงระหว่าง AI Agents และระบบนิเวศ BTC โดยสำรวจความสำคัญของการนำ AI Agents มาบนบล็อกเชน และนวัตกรรมที่อาจเกิดขึ้นในอนาคต

แนะนำ

ในบทความก่อนหน้านี้เราได้พูดถึงมุมมองของเราเกี่ยวกับสถานะปัจจุบันของ AI Memes และการพัฒนา AI Agents ในอนาคต อย่างไรก็ตามการพัฒนาการเล่าเรื่องอย่างรวดเร็วและวิวัฒนาการของแทร็ก AI Agent ยังคงค่อนข้างล้นหลาม ในช่วงสองเดือนสั้น ๆ นับตั้งแต่เปิดตัว "Truth Terminal" และจุดเริ่มต้นของ Agent Summer การเล่าเรื่องของการรวม AI และ Crypto ได้พัฒนาขึ้นเกือบทุกสัปดาห์ เมื่อเร็ว ๆ นี้ความสนใจของตลาดเริ่มเปลี่ยนไปเป็นโครงการ "กรอบ" ซึ่งขับเคลื่อนโดยการเล่าเรื่องทางเทคโนโลยีเป็นหลัก ฟิลด์ย่อยเฉพาะนี้ได้ผลิตโครงการยูนิคอร์นหลายโครงการที่มีมูลค่าตลาดมากกว่าหนึ่งพันล้านดอลลาร์ภายในไม่กี่สัปดาห์ที่ผ่านมา โครงการเหล่านี้ยังนําไปสู่กระบวนทัศน์ใหม่สําหรับการออกสินทรัพย์ซึ่งโครงการจะออกโทเค็นตามที่เก็บรหัส GitHub และตัวแทนที่สร้างขึ้นบนเฟรมเวิร์กเหล่านี้ยังสามารถออกโทเค็นได้ หัวใจหลักของโครงสร้างนี้เรามีเฟรมเวิร์กโดยมีตัวแทนเป็นเลเยอร์ด้านบน มันคล้ายกับแพลตฟอร์มการออกสินทรัพย์ แต่จริงๆแล้วมันเป็นแบบจําลองโครงสร้างพื้นฐานที่ไม่เหมือนใครที่เกิดขึ้นในยุค AI เราควรมองแนวโน้มใหม่นี้อย่างไร? บทความนี้จะเริ่มต้นด้วยการแนะนําเฟรมเวิร์กและเสนอการตีความว่าเฟรมเวิร์ก AI หมายถึงอะไรสําหรับ Crypto โดยรวมข้อมูลเชิงลึกเหล่านี้เข้ากับการสะท้อนของเราเอง

I. โครงสร้างคืออะไร?

ตามนิยาม เฟรมเวิร์ก AI คือเครื่องมือหรือแพลตฟอร์มพื้นฐานที่รวมกลุ่มโมดูลที่สร้างไว้ล่วงหน้า ห้องสมุด และเครื่องมือเพื่อการสร้างโมเดล AI ที่ซับซ้อน โดยทั่วไปเฟรมเวิร์กเหล่านี้ยังรวมฟังก์ชันสำหรับจัดการข้อมูล การฝึกโมเดล และการทำนาย อย่างง่ายๆ สามารถพิจารณาเฟรมเวิร์กเป็นระบบปฏิบัติการสำหรับยุค AI คล้ายกับระบบปฏิบัติการเดสก์ท็อป เช่น Windows หรือ Linux หรือระบบปฏิบัติการมือถือ เช่น iOS และ Android แต่ละเฟรมเวิร์กมีข้อดีและข้อเสียของตัวเองซึ่งช่วยให้นักพัฒนาสามารถเลือกตามความต้องการที่เฉพาะเจาะจงของตน

แม้ว่าคําว่า "AI framework" ยังเป็นแนวคิดที่ใหม่ในวงการ Crypto อยู่ แต่การพัฒนาของมันกลับย้อนกลับไปถึงเกือบ 14 ปี โดยเริ่มต้นด้วย Theano ในปี 2010 ในวงการ AI แบบดั้งเดิมทั้งในวงการวิชาการและอุตสาหกรรมได้พัฒนาโครงสร้างที่แข็งแกร่งมาก่อนหน้าแล้วที่สามารถเลือกใช้ได้หลากหลาย เช่น TensorFlow ของ Google, PyTorch ของ Meta, PaddlePaddle ของ Baidu, และ MagicAnimate ของ ByteDance แต่ละตัวมีข้อดีของตัวเองในสถานการณ์ที่แตกต่างกัน

โครงการ AI framework ที่กำลังเกิดขึ้นใน Crypto ณ ขณะนี้เน้นไปที่ความต้องการของตัวแทนจำนวนมากที่เกิดขึ้นจากการเจริญขึ้นของ AI boom และได้แยกออกเป็นรายละเอียดย่อยใน Crypto ต่าง ๆ แล้วเกิดเป็น AI frameworks ที่แตกต่างกันตามสาขาย่อยที่เฉพาะเจาะจง มาดูกันว่ามี AI frameworks ระดับหลักๆ ในอุตสาหกรรมนี้อะไรบ้างเพื่ออธิบายจุดนี้ให้เข้าใจได้ดียิ่งขึ้น

1.1 Eliza

ก่อนอื่น ให้พิจารณา Eliza โครงการที่สร้างขึ้นโดย ai16z มันเป็นโครงการจำลองมัลติเอเจนท์ที่ออกแบบมาเพื่อสร้าง ใช้ และจัดการตัวแทน AI อย่างอิสระ พัฒนาขึ้นโดยใช้ TypeScript เป็นภาษาโปรแกรมมิ่ง ข้อดีของมันอยู่ที่ความเข้ากันได้และการผสม API ที่ง่ายยิ่งขึ้น ตามเอกสารอย่างเป็นทางการ Eliza ถูกออกแบบมาเพื่อสื่อสังคม มีการสนับสนุนสำหรับการผสานแพลตฟอร์มมากเพื่อผสานรวม โครงการให้การสนับสนุนใน Discord ที่เต็มรูปแบบ รองรับช่องเสียง บัญชีที่อัตโนมัติสำหรับ X/Twitter การผสานแพลตฟอร์มทีลีแกรม และการเข้าถึง API โดยตรง ในเชิงสื่อการประมวลผล มันสนับสนุนการอ่านและวิเคราะห์เอกสาร PDF การสกัดและสรุปลิงค์ การถอดข้อความเสียง การจัดการเนื้อหาวิดีโอ การวิเคราะห์ภาพ และสรุปการสนทนา

การใช้งานที่รองรับโดย Eliza ปัจจุบันประกอบด้วย 4 หมวดหมู่ดังต่อไปนี้:

  1. การใช้ประโยชน์จากประยุกต์การสนับสนุน AI: ตัวแทนสนับสนุนลูกค้า ผู้ดูแลชุมชน ผู้ช่วยส่วนตัว
  2. บทบาทของโซเชียลมีเดีย: ผู้สร้างเนื้อหาอัตโนมัติ, บอทที่สามารถโต้ตอบได้, ตัวแทนของแบรนด์
  3. Knowledge Workers: ผู้ช่วยวิจัย, วิเคราะห์เนื้อหา, ผู้ประมวลผลเอกสาร
  4. บทบาทแบบโต้ตอบ: ตัวละครเล่นบท, ติวเตอร์ทางการศึกษา, บอทบันทึกสนุกสนาน

รุ่นที่รองรับในปัจจุบันโดย Eliza คือ:

  1. โมเดลการอ้างอิงท้องถิ่นเปิดเผย: เช่น Llama3, Qwen1.5, BERT
  2. การอ่านข้อมูลผ่าน OpenAI API บนคลาวด์
  3. การกำหนดค่าเริ่มต้นเป็น Nous Hermes Llama 3.1B.
  4. การผสานร่วมกับ Claude สำหรับคำถามที่ซับซ้อน

1.2 G.A.M.E

G.A.M.E (Generative Autonomous Multimodal Entities Framework) เป็นกรอบงาน AI แบบมัลติโมดัลสำหรับการสร้างและบริหารจัดการโดยอัตโนมัติ ที่ถูกเปิดตัวโดย Virtual มันถูกออกแบบมาเพื่อการออกแบบ NPC อัจฉริยะในเกม จุดเด่นของกรอบงานนี้คือ มันช่วยให้ผู้ใช้ที่มีโค้ดน้อยหรือไม่มีโค้ด สามารถเข้าร่วมในการออกแบบเอเจนต์ได้โดยการปรับเปลี่ยนพารามิเตอร์ผ่านอินเตอร์เฟซทดลองของมัน

ในเชิงสถาปัตยกรรมโครงการ G.A.M.E. สร้างขึ้นบนการออกแบบแบบโมดูลาร์ที่หลายระบบทำงานร่วมกันอย่างสอดคล้องกัน สถาปัตยกรรมอย่างละเอียดมีดังนี้:

  1. อินเตอร์เฟซการเรียกใช้เอเย่นต์: อินเตอร์เฟซสำหรับนักพัฒนาที่จะสื่อสารกับกรอบการทำงาน AI ผ่านอินเตอร์เฟซนี้นักพัฒนาสามารถเริ่มเซสชันและระบุรหัสเซสชัน เอเย่นต์ ID ผู้ใช้ ID และพารามิเตอร์อื่น ๆ ได้
  2. ระบบการรับรู้: รับผิดชอบในการรับข้อมูลอินพุต การสังเคราะห์ข้อมูล และการส่งมันไปยังเครื่องมือวางแผนกลยุทธ์ เขายังจัดการกับการตอบสนองจากโมดูลการประมวลผลสนทนา
  3. เครื่องมือวางแผนกลยุทธ์: ส่วนสำคัญของโครงสร้างทั้งหมด ที่แบ่งเป็นผู้วางแผนระดับสูงและนโยบายระดับต่ำ ผู้วางแผนระดับสูงรับผิดชอบในการกำหนดเป้าหมายและแผนยาวนาน ในขณะที่นโยบายระดับต่ำแปลงแผนเหล่านี้เป็นการกระทำที่เฉพาะเจาะจง
  4. บริบทของโลก: ประกอบด้วยข้อมูลสิ่งแวดล้อม สถานะของโลก และข้อมูลสถานะของเกมส์ ช่วยให้ตัวแทนเข้าใจบริบทปัจจุบันของตนเอง
  5. โมดูลการประมวลผลสนทนา: จัดการข้อความและการตอบกลับโดยสร้างสนทนาหรือการตอบสนองเป็นผลลัพธ์
  6. ผู้ดำเนินการกระเป๋าเงิน On-Chain: อาจเกี่ยวข้องกับการนำไปใช้ในเทคโนโลยีบล็อกเชน แม้ว่าฟังก์ชันที่เฉพาะเจาะจงยังไม่ชัดเจน
  7. โมดูลการเรียนรู้: เรียนรู้จากข้อเสนอและอัปเดตฐานความรู้ของตัวแทน
  8. พื้นที่เก็บข้อมูลชั่วคราว: เก็บบันทึกการกระทำล่าสุด ผลลัพธ์ และแผนการปัจจุบัน รวมถึงข้อมูลระยะสั้นอื่น ๆ
  9. ตัวประมวลผลหน่วยความจำระยะยาว: สกัดและจัดอันดับข้อมูลสำคัญเกี่ยวกับตัวแทนและหน่วยความจำทำงานของมันโดยพิจารณาจากปัจจัยเช่นความสำคัญ ความเป็นมาใหม่ และความเกี่ยวข้อง
  10. Agent Repository: เก็บเกี่ยวเป้าหมายของตัวแทน ความคิดเห็น ประสบการณ์ และลักษณะ
  11. Action Planner: สร้างแผนการปฏิบัติที่เฉพาะเจาะจงขึ้นอยู่กับกลยุทธ์ระดับต่ำ
  12. ผู้ดำเนินการแผน: ดำเนินการแผนการทำงานที่สร้างขึ้นโดยตัววางแผนการดำเนินการ

การทำงาน: นักพัฒนาเริ่มต้นเอเจนต์ผ่านอินเตอร์เฟซการกระตุ้นเอเจนต์ ที่ภายในมีส่วนรับความรู้ระบบรับรู้และส่งข้อมูลไปยังเครื่องมือวางแผนยุทธศาสตร์ กับความช่วยเหลือจากระบบหน่วยความจำ บริบทของโลก และคลังข้อมูลเอเจนต์ ทำสูตรและดำเนินแผนการกระทำ และโมดูลการเรียนรู้ติดตามการกระทำของเอเจนต์และปรับปรุงพฤติกรรมตามนั้น

ประเภทการใช้งาน: จากโครงสร้างเทคนิคโดยรวม กรอบการทำงานนี้เน้นไปที่การตัดสินใจ คำตอบ การรับรู้ และบุคลิกภาพของเอเจนต์ในสภาพแวดล้อมเสมือน นอกจากการเล่นเกม กรอบการทำงานนี้ยังสามารถนำมาใช้ในเมตาเวิร์สได้ด้วย รายการด้านล่างจาก Virtual แสดงให้เห็นว่ามีโครงการหลายๆ โครงการที่ได้นำกรอบการทำงานนี้ไปใช้ในการก่อสร้างแล้ว

1.3 Rig

Rig เป็นเครื่องมือโอเพ่นซอร์สที่เขียนด้วย Rust ซึ่งออกแบบมาโดยเฉพาะเพื่อลดความซับซ้อนในการพัฒนาแอปพลิเคชันโมเดลภาษาขนาดใหญ่ (LLM) มีอินเทอร์เฟซแบบรวมที่ช่วยให้นักพัฒนาสามารถโต้ตอบกับผู้ให้บริการ LLM หลายราย (เช่น OpenAI และ Anthropic) และฐานข้อมูลเวกเตอร์ต่างๆ (เช่น MongoDB และ Neo4j) ได้อย่างง่ายดาย

คุณสมบัติสำคัญ:

  • อินเตอร์เฟซสมาหลาย: ไม่ว่าจะใช้ LLM provider หรือ vector storage ใด ๆ Rig ก็มีวิธีการเข้าถึงที่สอดคล้องกันอย่างต่อเนื่อง ลดความซับซ้อนของงานการรวมเข้าด้วยกันอย่างมาก
  • โครงสร้างแบบโมดูล: กรอบการใช้งานใช้การออกแบบแบบโมดูลซึ่งประกอบด้วยส่วนประกอบสำคัญ เช่น "ชั้นสะพานให้บริการ", "อินเตอร์เฟซการเก็บข้อมูลเวกเตอร์", และ "ระบบเอเจนต์อัจฉริยะ" เพื่อให้ระบบยืดหยุ่นและมีความสามารถในการขยายขนาด
  • ประเภทความปลอดภัย: ด้วยการใช้คุณสมบัติของ Rust, Rig สามารถดำเนินการฝังแบบปลอดภัยตามประเภทให้มีคุณภาพของรหัสและความปลอดภัยในเวลารันไทม์
  • ประสิทธิภาพสูง: ระบบสนับสนุนการเขียนโปรแกรมแบบไม่สม่ำเสมอ ทำให้สามารถปรับปรุงความสามารถในการประมวลผลพร้อมกัน คุณลักษณะการบันทึกข้อมูลและการตรวจสอบภายในช่วยในการดูแลรักษาและการแก้ปัญหา

กระบวนการทำงาน: เมื่อผู้ใช้เข้าสู่ระบบ Rig คำขอจะผ่านผ่าน "Provider Abstraction Layer" ก่อนที่จะมาตรฐานระหว่างผู้ให้บริการต่างๆ และรับรองการจัดการข้อผิดพลาดที่สม่ำเสมอในชั้นคอร์ ตัวแทนที่มีความสามารถในการเรียกใช้เครื่องมือต่างๆ หรือสอบถามการเก็บเวกเตอร์เพื่อเรียกคืนข้อมูลที่จำเป็น ในท้ายที่สุด กลไกขั้นสูงเช่น Retrieval-Augmented Generation (RAG) จะรวมการเรียกคืนเอกสารและความเข้าใจบริบทเพื่อสร้างคำตอบที่แม่นยำและมีความหมายก่อนส่งกลับไปยังผู้ใช้

กรณีการใช้งาน: Rig เหมาะสำหรับการสร้างระบบที่ต้องการคำตอบคำถามอย่างรวดเร็วและแม่นยำ สร้างเครื่องมือการค้นหาเอกสารที่มีประสิทธิภาพ พัฒนา chatbot ที่ตระหนักถึงบริบทหรือผู้ช่วยเสมือนจริง และรองรับการสร้างเนื้อหาโดยการสร้างข้อความหรือรูปแบบอื่น ๆ ขึ้นอัตโนมัติจากรูปแบบข้อมูลที่มีอยู่

1.4 ZerePy

ZerePy เป็นเฟรมเวิร์กโอเพ่นซอร์สที่ใช้ Python ที่ออกแบบมาเพื่อลดความซับซ้อนของการปรับใช้และการจัดการตัวแทน AI บนแพลตฟอร์ม X (เดิมชื่อ Twitter) มันพัฒนามาจากโครงการ Zerebro และสืบทอดฟังก์ชันหลัก แต่ได้รับการออกแบบในลักษณะแยกส่วนและปรับขนาดได้มากขึ้น เป้าหมายคือเพื่อให้นักพัฒนาสามารถสร้างตัวแทน AI ส่วนบุคคลได้อย่างง่ายดายและใช้งานระบบอัตโนมัติและการสร้างเนื้อหาต่างๆบน X

ZerePy มีอินเทอร์เฟซเชนเนล (CLI) ซึ่งทำให้ผู้ใช้สะดวกในการจัดการและควบคุมเอเจนต์ AI ที่พวกเขาใช้งาน โครงสร้างหลักของมันเป็นโมดูลาร์ได้ ซึ่งช่วยให้นักพัฒนาสามารถผสานโมดูลฟังก์ชันต่างๆ อย่างยืดหยุ่น

  • การผสม LLM: ZerePy รองรับโมเดลภาษาขนาดใหญ่ (LLM) จาก OpenAI และ Anthropic ทำให้นักพัฒนาสามารถเลือกโมเดลที่เหมาะสมที่สุดสำหรับแอปพลิเคชันของพวกเขา ซึ่งทำให้เอเจนต์สามารถสร้างเนื้อหาที่มีคุณภาพสูง
  • การผสานรวมแพลตฟอร์ม X: โครงสร้างนี้ผสานรวม API ของ X โดยตรง เพื่อให้เอเย่นต์สามารถดำเนินการต่างๆ เช่นโพสต์ ตอบกลับ กดถูกใจ และรีทวีตได้
  • ระบบการเชื่อมต่อแบบโมดูลาร์: ระบบนี้ช่วยให้นักพัฒนาสามารถเพิ่มการสนับสนุนสำหรับแพลตฟอร์มโซเชียลหรือบริการอื่น ๆ ได้อย่างง่าย ๆ โดยขยายความสามารถของกรอบทำงาน
  • Memory System (แผนการต่อยอด): กระแสความคิดที่ยังไม่ได้นำมาใช้ในเวอร์ชันปัจจุบัน วัตถุประสงค์ในการออกแบบของ ZerePy รวมถึงการรวมระบบหน่วยความจำที่จะทำให้ตัวแทนสามารถจำข้อมูลการโต้ตอบก่อนหน้าและข้อมูลบริบทเพื่อสร้างเนื้อหาที่สอดคล้องและเป็นบุคคลได้มากขึ้น

ในขณะที่ทั้ง ZerePy และโครงการ Eliza ของ a16z มีเป้าหมายในการสร้างและจัดการตัวแทน AI แต่พวกเขาแตกต่างกันในสถาปัตยกรรมและการให้ความสำคัญ Eliza มีความเชื่อมโยงมากกับการจำลองตัวแทนหลายตัวและการวิจัย AI ทั่วไปในขณะที่ ZerePy ให้ความสำคัญกับการปรับใช้ตัวแทน AI บนแพลตฟอร์มสังคมเฉพาะ (X) ทำให้มีความเชื่อมโยงกับการประยุกต์ใช้มากกว่า

II. รีพลิกของระบบนิติบัญญัติบิตคอยน์

ในแง่ของเส้นทางการพัฒนาตัวแทน AI มีความคล้ายคลึงกันมากกับระบบนิเวศของ BTC ตั้งแต่ปลายปี 2023 ถึงต้นปี 2024 วิถีการพัฒนาของระบบนิเวศ BTC สามารถสรุปได้ง่าย ๆ ว่า: BRC20-Atomical/Rune และการแข่งขันหลายโปรโตคอลอื่น ๆ — BTC L2 — BTCFi มีศูนย์กลางอยู่ที่บาบิโลน ในขณะที่ตัวแทน AI ได้พัฒนาอย่างรวดเร็วมากขึ้นบนรากฐานของกองเทคโนโลยี AI แบบดั้งเดิมที่เป็นผู้ใหญ่ แต่เส้นทางการพัฒนาโดยรวมของพวกเขาสะท้อนให้เห็นถึงระบบนิเวศของ BTC ในหลาย ๆ ด้าน ฉันจะสรุปดังนี้: GOAT/ACT — ตัวแทนประเภทสังคม — การแข่งขันกรอบงานตัวแทน AI เชิงวิเคราะห์ จากมุมมองแนวโน้มโครงการโครงสร้างพื้นฐานที่เน้นการกระจายอํานาจและความปลอดภัยรอบ ๆ ตัวแทนมีแนวโน้มที่จะนําคลื่นกรอบนี้ไปข้างหน้ากลายเป็นธีมที่โดดเด่นต่อไป

ดังนั้นแทร็กนี้เช่นเดียวกับระบบนิเวศ BTC จะนําไปสู่การทําให้เป็นเนื้อเดียวกันและฟองสบู่หรือไม่? ไม่ใช่ ประการแรกการเล่าเรื่องของตัวแทน AI ไม่ได้เกี่ยวกับการสร้างประวัติศาสตร์ของห่วงโซ่สัญญาอัจฉริยะ ประการที่สองไม่ว่าโครงการเฟรมเวิร์ก AI ที่มีอยู่เหล่านี้จะแข็งแกร่งทางเทคนิคหรือยังคงติดอยู่ในขั้นตอน PPT หรือเพียงแค่ Ctrl + C และ Ctrl + V อย่างน้อยก็ให้แนวทางการพัฒนาโครงสร้างพื้นฐานใหม่ บทความจํานวนมากได้เปรียบเทียบเฟรมเวิร์ก AI กับแพลตฟอร์มการออกสินทรัพย์และตัวแทนกับสินทรัพย์ อย่างไรก็ตามเมื่อเทียบกับ Memecoin Launchpads และโปรโตคอลจารึกโดยส่วนตัวแล้วฉันเชื่อว่าเฟรมเวิร์ก AI คล้ายกับเครือข่ายสาธารณะในอนาคตในขณะที่ตัวแทนมีลักษณะคล้ายกับ DApps ในอนาคต

ใน Crypto space ในปัจจุบัน เรามี public chains หลักพันและ DApps หลักหมื่น ในขอบข่ายของ public chains ทั่วไป เรามี BTC Ethereum และ various heterogeneous chains ในขณะที่รูปแบบของ application chains มีความหลากหลายมากขึ้น เช่น game chains storage chains และ Dex chains Public chains และ AI frameworks มีลักษณะที่คล้ายกันมากและ DApps สามารถสอดคล้องกับตัวแทนได้ดี

ในยุคของ Crypto ใน AI มีความเป็นไปได้สูงที่พื้นที่จะพัฒนาไปในทิศทางนี้โดยการอภิปรายในอนาคตจะเปลี่ยนจาก EVM เทียบกับห่วงโซ่ที่แตกต่างกันไปสู่การอภิปรายกรอบ ปัญหาปัจจุบันเป็นเรื่องของการกระจายอํานาจหรือวิธีการ "ล่ามโซ่" ฉันเชื่อว่าโครงการโครงสร้างพื้นฐาน AI ในอนาคตจะพัฒนาไปรอบ ๆ รากฐานนี้ อีกจุดสําคัญคือ: การทําเช่นนี้บนบล็อกเชนมีความสําคัญอย่างไร?

III. ความสำคัญของ On-Chain

ไม่ว่าบล็อกเชนจะรวมกับอะไรในที่สุดก็ต้องเผชิญกับคําถามสําคัญข้อหนึ่ง: มันมีความหมายหรือไม่? ในบทความของปีที่แล้วฉันวิพากษ์วิจารณ์ GameFi สําหรับลําดับความสําคัญที่ผิดพลาดซึ่งการพัฒนาโครงสร้างพื้นฐานมีความก้าวหน้ามากเกินไปและในบทความก่อนหน้านี้เกี่ยวกับ AI ฉันแสดงความสงสัยเกี่ยวกับการปฏิบัติจริงในปัจจุบันของการรวม AI กับ Crypto ท้ายที่สุดแรงผลักดันการเล่าเรื่องสําหรับโครงการแบบดั้งเดิมก็อ่อนแอลงเรื่อย ๆ โครงการดั้งเดิมไม่กี่โครงการที่ทํางานได้ดีในปีที่แล้วในแง่ของราคาโทเค็นโดยทั่วไปคือโครงการที่สามารถจับคู่หรือเกินความแข็งแกร่งของราคาได้

AI สามารถทําอะไรให้กับ Crypto ได้บ้าง? ก่อนหน้านี้ฉันนึกถึงกรณีการใช้งานเช่นตัวแทน AI ที่ทํางานในนามของผู้ใช้ Metaverse และตัวแทนในฐานะพนักงาน - แนวคิดที่ค่อนข้างธรรมดา แต่มีความต้องการบางอย่าง อย่างไรก็ตามความต้องการเหล่านี้ไม่จําเป็นต้องอยู่ในห่วงโซ่อย่างเต็มที่และจากมุมมองตรรกะทางธุรกิจพวกเขาไม่สามารถสร้างวงปิดได้ เบราว์เซอร์ตัวแทนที่กล่าวถึงในบทความล่าสุดซึ่งใช้ความตั้งใจสามารถสร้างความต้องการสําหรับการติดฉลากข้อมูลและพลังการประมวลผลการอนุมาน แต่องค์ประกอบทั้งสองนี้ยังไม่ได้รวมเข้าด้วยกันอย่างแน่นหนาและในแง่ของพลังการคํานวณการประมวลผลแบบรวมศูนย์ยังคงได้เปรียบ

ในการสำรวจความสำเร็จของ DeFi หากพิจารณาปัจจัยที่ทำให้ DeFi สามารถแยกออกมาจากการเงินดั้งเดิมได้ จะพบว่ามีความเข้าถึงที่ดีกว่า ประสิทธิภาพที่ดีกว่า ต้นทุนที่ต่ำกว่า และความปลอดภัยที่ไม่ต้องไว้วางใจเจ้าของ

  1. การลดค่าใช้จ่าย: การกำหนดเชื่อมโยงเชิงพาณิชย์สามารถลดค่าใช้จ่ายการใช้งานให้ต่ำลง ทำให้ผู้ใช้สามารถเข้าถึงและมีตัวเลือกมากขึ้น สิ่งนี้อาจทำให้ผู้ใช้ทั่วไปสามารถมีส่วนร่วมในสิ่งที่เป็นเจ้าของอย่างเดียวของ Web2 tech giants' AI ได้
  2. ความปลอดภัย: ตามนิยามที่ง่ายที่สุด เอเจ้นท์คือ AI ที่สามารถทำงานร่วมกับโลกเสมือนหรือโลกแจ้ง หากเอเจ้นท์สามารถแทรกแซงในโลกแจ้งหรือแม้กระทั่งในกระเป๋าเงินเสมือนของฉัน แล้วการแก้ไขปัญหาด้านความปลอดภัยที่ขึ้นอยู่กับบล็อกเชนอาจกลายเป็นเรื่องจำเป็น
  3. การเล่นทางการเงินเฉพาะบล็อกเชน: ตัวแทนสามารถสร้างชุดกลไกทางการเงินที่ไม่เหมือนใครบนบล็อกเชนได้หรือไม่? ตัวอย่างเช่นใน AMM (Automated Market Maker) ผู้ให้บริการสภาพคล่อง (LPs) อนุญาตให้ผู้ใช้ทั่วไปมีส่วนร่วมในการทําตลาดอัตโนมัติ ในทํานองเดียวกันหากตัวแทนต้องการพลังการประมวลผลหรือการติดฉลากข้อมูลผู้ใช้สามารถลงทุนในโปรโตคอลเหล่านี้ในรูปแบบของ USDT ตามความเชื่อมั่นในระบบ หรือตัวแทนในสถานการณ์การใช้งานที่แตกต่างกันสามารถสร้างโครงสร้างทางการเงินใหม่ได้
  4. ความสามารถในการทำงานร่วมกันของ DeFi: ในขณะที่ DeFi ยังขาดความสามารถในการทำงานร่วมกันที่เสมอไป ตัวแทนอาจสามารถแก้ไขปัญหานี้ได้โดยการเปิดให้เห็นกระบวนการคิดที่โปร่งใสและสามารถติดตามได้ และเติมเต็มช่องว่าง

IV. ความคิดสร้างสรรค์?

โครงการเฟรมเวิร์กในอนาคตยังจะให้โอกาสทางธุรกิจในลักษณะที่คล้ายกับ GPT Store อยู่ด้วย ในขณะที่การเปิดตัวเอเจนต์ผ่านเฟรมเวิร์กยังคงซับซ้อนสำหรับผู้ใช้ทั่วไป ฉันเชื่อว่าการทำให้กระบวนการก่อสร้างเอเจนต์เป็นเรื่องง่ายขึ้นและให้การรวมฟังก์ชันที่ซับซ้อนมากขึ้นจะให้โครงการเหล่านี้มีประโยชน์ในการแข่งขันในอนาคต นี่อาจส่งผลให้เกิดเศรษฐกิจสร้างสรรค์ Web3 ที่น่าสนใจกว่า GPT Store ได้

ในปัจจุบัน GPT Store ยังมีแนวโน้มที่เน้นไปทางการใช้งานที่เป็นรูปแบบ传统มากกว่าโดยมีแอปที่ได้รับความนิยมสร้างขึ้นโดยบริษัท Web2 ทั่วไป นอกจากนี้ รายได้ที่สร้างขึ้นมีส่วนใหญ่ถูกจองไว้ให้ผู้สร้าง ตามคำอธิบายอย่างเป็นทางการของ OpenAI ยังมีเพียงแค่กลยุทธ์ในการสนับสนุนทางการเงินให้กับนักพัฒนาที่ยอดเยี่ยมในสหรัฐฯ โดยมีการสนับสนุนทางการเงินตามจำนวนที่กำหนด

จากมุมมองของอุปสงค์ Web3 ยังคงมีช่องว่างมากมายให้เติมเต็มและจากมุมมองของระบบเศรษฐกิจสามารถทําให้นโยบายที่ไม่เป็นธรรมของ Web2 ยักษ์ใหญ่มีความเท่าเทียมกันมากขึ้น นอกจากนี้เราสามารถแนะนําเศรษฐกิจชุมชนเพื่อปรับปรุงตัวแทนต่อไป เศรษฐกิจสร้างสรรค์รอบตัวตัวแทนจะเปิดโอกาสให้คนธรรมดามีส่วนร่วม ในอนาคตมส์ AI จะฉลาดและน่าสนใจกว่าตัวแทนที่ออกโดย GOAT หรือ Clanker

เกี่ยวกับ YBB

YBB เป็นกองทุน web3 ที่มุ่งเน้นการระบุโครงการที่กำหนด Web3 พร้อมวิสัยทัศน์ในการสร้างที่อยู่ออนไลน์ที่ดีขึ้นสำหรับผู้อาศัยอินเทอร์เน็ตทั้งหมด ก่อตั้งโดยกลุ่มคนที่เชื่อในบล็อกเชนซึ่งมีการมีส่วนร่วมอย่างเต็มใจในอุตสาหกรรมนี้ตั้งแต่ปี 2013 YBB เสมอพร้อมที่จะช่วยโครงการระยะเริ่มต้นให้เติบโตจาก 0 ไปสู่ 1 เราให้ความคุ้มค่ากับนวัตกรรม ความพิรุธ และผลิตภัณฑ์ที่มุ่งเน้นผู้ใช้ พร้อมรับทราบศักยภาพของคริปโตและการประยุกต์บล็อกเชน

เว็บไซต์ | Twi: @YBBCapital

คำประกาศปฏิเสธความรับผิดชอบ:

  1. บทความนี้ถูกพิมพ์ซ้ำจาก [ YBB Capital]. ลิขสิทธิ์ทั้งหมดเป็นของผู้เขียนต้นฉบับ [นักวิจัย YBB Capital Zeke]. หากมีข้อต่างโปรดติดต่อเกตเรียนทีม และพวกเขาจะจัดการกับมันโดยทันที
  2. คำประกาศความรับผิด: มุมมองและความคิดเห็นที่แสดงในบทความนี้เป็นเพียงของผู้เขียนเท่านั้น และไม่ใช่คำแนะนำในการลงทุน
  3. ทีม Gate Learn แปลบทความเป็นภาษาอื่น ๆ การคัดลอก กระจายหรือลอกเลียนแบบบทความที่แปลนั้นห้ามหากไม่ได้กล่าวถึง

การแยกตัวเฟรมเวิร์ค AI: จากตัวแทนอัจฉริยะไปสู่การสำรวจการกระจายอำนาจ

กลาง1/16/2025, 6:03:33 AM
บทความนี้ลึกศึกษาเทรนด์ในการพัฒนาและตรรกะการลงทุนภายในเขตการใช้ AI Agent โดยมีการเน้นที่การวิเคราะห์โครงการที่ใช้เฟรมเวิร์กอย่างละเอียด มันนำเสนอแนวคิดพื้นฐานและฟังก์ชันพิเศษของเฟรมเวิร์ก AI และสาธิตประสิทธิภาพและศักยภาพของมันทางที่แตกต่างผ่านการศึกษากรณีเฉพาะเช่น Eliza, G.A.M.E, Rig และ ZerePy อีกต่างหาก อีกทั้ง จากมุมมองทางเทคนิค ตลาด และการลงทุน บทความเปรียบเทียบความคล้ายคลึงระหว่าง AI Agents และระบบนิเวศ BTC โดยสำรวจความสำคัญของการนำ AI Agents มาบนบล็อกเชน และนวัตกรรมที่อาจเกิดขึ้นในอนาคต

แนะนำ

ในบทความก่อนหน้านี้เราได้พูดถึงมุมมองของเราเกี่ยวกับสถานะปัจจุบันของ AI Memes และการพัฒนา AI Agents ในอนาคต อย่างไรก็ตามการพัฒนาการเล่าเรื่องอย่างรวดเร็วและวิวัฒนาการของแทร็ก AI Agent ยังคงค่อนข้างล้นหลาม ในช่วงสองเดือนสั้น ๆ นับตั้งแต่เปิดตัว "Truth Terminal" และจุดเริ่มต้นของ Agent Summer การเล่าเรื่องของการรวม AI และ Crypto ได้พัฒนาขึ้นเกือบทุกสัปดาห์ เมื่อเร็ว ๆ นี้ความสนใจของตลาดเริ่มเปลี่ยนไปเป็นโครงการ "กรอบ" ซึ่งขับเคลื่อนโดยการเล่าเรื่องทางเทคโนโลยีเป็นหลัก ฟิลด์ย่อยเฉพาะนี้ได้ผลิตโครงการยูนิคอร์นหลายโครงการที่มีมูลค่าตลาดมากกว่าหนึ่งพันล้านดอลลาร์ภายในไม่กี่สัปดาห์ที่ผ่านมา โครงการเหล่านี้ยังนําไปสู่กระบวนทัศน์ใหม่สําหรับการออกสินทรัพย์ซึ่งโครงการจะออกโทเค็นตามที่เก็บรหัส GitHub และตัวแทนที่สร้างขึ้นบนเฟรมเวิร์กเหล่านี้ยังสามารถออกโทเค็นได้ หัวใจหลักของโครงสร้างนี้เรามีเฟรมเวิร์กโดยมีตัวแทนเป็นเลเยอร์ด้านบน มันคล้ายกับแพลตฟอร์มการออกสินทรัพย์ แต่จริงๆแล้วมันเป็นแบบจําลองโครงสร้างพื้นฐานที่ไม่เหมือนใครที่เกิดขึ้นในยุค AI เราควรมองแนวโน้มใหม่นี้อย่างไร? บทความนี้จะเริ่มต้นด้วยการแนะนําเฟรมเวิร์กและเสนอการตีความว่าเฟรมเวิร์ก AI หมายถึงอะไรสําหรับ Crypto โดยรวมข้อมูลเชิงลึกเหล่านี้เข้ากับการสะท้อนของเราเอง

I. โครงสร้างคืออะไร?

ตามนิยาม เฟรมเวิร์ก AI คือเครื่องมือหรือแพลตฟอร์มพื้นฐานที่รวมกลุ่มโมดูลที่สร้างไว้ล่วงหน้า ห้องสมุด และเครื่องมือเพื่อการสร้างโมเดล AI ที่ซับซ้อน โดยทั่วไปเฟรมเวิร์กเหล่านี้ยังรวมฟังก์ชันสำหรับจัดการข้อมูล การฝึกโมเดล และการทำนาย อย่างง่ายๆ สามารถพิจารณาเฟรมเวิร์กเป็นระบบปฏิบัติการสำหรับยุค AI คล้ายกับระบบปฏิบัติการเดสก์ท็อป เช่น Windows หรือ Linux หรือระบบปฏิบัติการมือถือ เช่น iOS และ Android แต่ละเฟรมเวิร์กมีข้อดีและข้อเสียของตัวเองซึ่งช่วยให้นักพัฒนาสามารถเลือกตามความต้องการที่เฉพาะเจาะจงของตน

แม้ว่าคําว่า "AI framework" ยังเป็นแนวคิดที่ใหม่ในวงการ Crypto อยู่ แต่การพัฒนาของมันกลับย้อนกลับไปถึงเกือบ 14 ปี โดยเริ่มต้นด้วย Theano ในปี 2010 ในวงการ AI แบบดั้งเดิมทั้งในวงการวิชาการและอุตสาหกรรมได้พัฒนาโครงสร้างที่แข็งแกร่งมาก่อนหน้าแล้วที่สามารถเลือกใช้ได้หลากหลาย เช่น TensorFlow ของ Google, PyTorch ของ Meta, PaddlePaddle ของ Baidu, และ MagicAnimate ของ ByteDance แต่ละตัวมีข้อดีของตัวเองในสถานการณ์ที่แตกต่างกัน

โครงการ AI framework ที่กำลังเกิดขึ้นใน Crypto ณ ขณะนี้เน้นไปที่ความต้องการของตัวแทนจำนวนมากที่เกิดขึ้นจากการเจริญขึ้นของ AI boom และได้แยกออกเป็นรายละเอียดย่อยใน Crypto ต่าง ๆ แล้วเกิดเป็น AI frameworks ที่แตกต่างกันตามสาขาย่อยที่เฉพาะเจาะจง มาดูกันว่ามี AI frameworks ระดับหลักๆ ในอุตสาหกรรมนี้อะไรบ้างเพื่ออธิบายจุดนี้ให้เข้าใจได้ดียิ่งขึ้น

1.1 Eliza

ก่อนอื่น ให้พิจารณา Eliza โครงการที่สร้างขึ้นโดย ai16z มันเป็นโครงการจำลองมัลติเอเจนท์ที่ออกแบบมาเพื่อสร้าง ใช้ และจัดการตัวแทน AI อย่างอิสระ พัฒนาขึ้นโดยใช้ TypeScript เป็นภาษาโปรแกรมมิ่ง ข้อดีของมันอยู่ที่ความเข้ากันได้และการผสม API ที่ง่ายยิ่งขึ้น ตามเอกสารอย่างเป็นทางการ Eliza ถูกออกแบบมาเพื่อสื่อสังคม มีการสนับสนุนสำหรับการผสานแพลตฟอร์มมากเพื่อผสานรวม โครงการให้การสนับสนุนใน Discord ที่เต็มรูปแบบ รองรับช่องเสียง บัญชีที่อัตโนมัติสำหรับ X/Twitter การผสานแพลตฟอร์มทีลีแกรม และการเข้าถึง API โดยตรง ในเชิงสื่อการประมวลผล มันสนับสนุนการอ่านและวิเคราะห์เอกสาร PDF การสกัดและสรุปลิงค์ การถอดข้อความเสียง การจัดการเนื้อหาวิดีโอ การวิเคราะห์ภาพ และสรุปการสนทนา

การใช้งานที่รองรับโดย Eliza ปัจจุบันประกอบด้วย 4 หมวดหมู่ดังต่อไปนี้:

  1. การใช้ประโยชน์จากประยุกต์การสนับสนุน AI: ตัวแทนสนับสนุนลูกค้า ผู้ดูแลชุมชน ผู้ช่วยส่วนตัว
  2. บทบาทของโซเชียลมีเดีย: ผู้สร้างเนื้อหาอัตโนมัติ, บอทที่สามารถโต้ตอบได้, ตัวแทนของแบรนด์
  3. Knowledge Workers: ผู้ช่วยวิจัย, วิเคราะห์เนื้อหา, ผู้ประมวลผลเอกสาร
  4. บทบาทแบบโต้ตอบ: ตัวละครเล่นบท, ติวเตอร์ทางการศึกษา, บอทบันทึกสนุกสนาน

รุ่นที่รองรับในปัจจุบันโดย Eliza คือ:

  1. โมเดลการอ้างอิงท้องถิ่นเปิดเผย: เช่น Llama3, Qwen1.5, BERT
  2. การอ่านข้อมูลผ่าน OpenAI API บนคลาวด์
  3. การกำหนดค่าเริ่มต้นเป็น Nous Hermes Llama 3.1B.
  4. การผสานร่วมกับ Claude สำหรับคำถามที่ซับซ้อน

1.2 G.A.M.E

G.A.M.E (Generative Autonomous Multimodal Entities Framework) เป็นกรอบงาน AI แบบมัลติโมดัลสำหรับการสร้างและบริหารจัดการโดยอัตโนมัติ ที่ถูกเปิดตัวโดย Virtual มันถูกออกแบบมาเพื่อการออกแบบ NPC อัจฉริยะในเกม จุดเด่นของกรอบงานนี้คือ มันช่วยให้ผู้ใช้ที่มีโค้ดน้อยหรือไม่มีโค้ด สามารถเข้าร่วมในการออกแบบเอเจนต์ได้โดยการปรับเปลี่ยนพารามิเตอร์ผ่านอินเตอร์เฟซทดลองของมัน

ในเชิงสถาปัตยกรรมโครงการ G.A.M.E. สร้างขึ้นบนการออกแบบแบบโมดูลาร์ที่หลายระบบทำงานร่วมกันอย่างสอดคล้องกัน สถาปัตยกรรมอย่างละเอียดมีดังนี้:

  1. อินเตอร์เฟซการเรียกใช้เอเย่นต์: อินเตอร์เฟซสำหรับนักพัฒนาที่จะสื่อสารกับกรอบการทำงาน AI ผ่านอินเตอร์เฟซนี้นักพัฒนาสามารถเริ่มเซสชันและระบุรหัสเซสชัน เอเย่นต์ ID ผู้ใช้ ID และพารามิเตอร์อื่น ๆ ได้
  2. ระบบการรับรู้: รับผิดชอบในการรับข้อมูลอินพุต การสังเคราะห์ข้อมูล และการส่งมันไปยังเครื่องมือวางแผนกลยุทธ์ เขายังจัดการกับการตอบสนองจากโมดูลการประมวลผลสนทนา
  3. เครื่องมือวางแผนกลยุทธ์: ส่วนสำคัญของโครงสร้างทั้งหมด ที่แบ่งเป็นผู้วางแผนระดับสูงและนโยบายระดับต่ำ ผู้วางแผนระดับสูงรับผิดชอบในการกำหนดเป้าหมายและแผนยาวนาน ในขณะที่นโยบายระดับต่ำแปลงแผนเหล่านี้เป็นการกระทำที่เฉพาะเจาะจง
  4. บริบทของโลก: ประกอบด้วยข้อมูลสิ่งแวดล้อม สถานะของโลก และข้อมูลสถานะของเกมส์ ช่วยให้ตัวแทนเข้าใจบริบทปัจจุบันของตนเอง
  5. โมดูลการประมวลผลสนทนา: จัดการข้อความและการตอบกลับโดยสร้างสนทนาหรือการตอบสนองเป็นผลลัพธ์
  6. ผู้ดำเนินการกระเป๋าเงิน On-Chain: อาจเกี่ยวข้องกับการนำไปใช้ในเทคโนโลยีบล็อกเชน แม้ว่าฟังก์ชันที่เฉพาะเจาะจงยังไม่ชัดเจน
  7. โมดูลการเรียนรู้: เรียนรู้จากข้อเสนอและอัปเดตฐานความรู้ของตัวแทน
  8. พื้นที่เก็บข้อมูลชั่วคราว: เก็บบันทึกการกระทำล่าสุด ผลลัพธ์ และแผนการปัจจุบัน รวมถึงข้อมูลระยะสั้นอื่น ๆ
  9. ตัวประมวลผลหน่วยความจำระยะยาว: สกัดและจัดอันดับข้อมูลสำคัญเกี่ยวกับตัวแทนและหน่วยความจำทำงานของมันโดยพิจารณาจากปัจจัยเช่นความสำคัญ ความเป็นมาใหม่ และความเกี่ยวข้อง
  10. Agent Repository: เก็บเกี่ยวเป้าหมายของตัวแทน ความคิดเห็น ประสบการณ์ และลักษณะ
  11. Action Planner: สร้างแผนการปฏิบัติที่เฉพาะเจาะจงขึ้นอยู่กับกลยุทธ์ระดับต่ำ
  12. ผู้ดำเนินการแผน: ดำเนินการแผนการทำงานที่สร้างขึ้นโดยตัววางแผนการดำเนินการ

การทำงาน: นักพัฒนาเริ่มต้นเอเจนต์ผ่านอินเตอร์เฟซการกระตุ้นเอเจนต์ ที่ภายในมีส่วนรับความรู้ระบบรับรู้และส่งข้อมูลไปยังเครื่องมือวางแผนยุทธศาสตร์ กับความช่วยเหลือจากระบบหน่วยความจำ บริบทของโลก และคลังข้อมูลเอเจนต์ ทำสูตรและดำเนินแผนการกระทำ และโมดูลการเรียนรู้ติดตามการกระทำของเอเจนต์และปรับปรุงพฤติกรรมตามนั้น

ประเภทการใช้งาน: จากโครงสร้างเทคนิคโดยรวม กรอบการทำงานนี้เน้นไปที่การตัดสินใจ คำตอบ การรับรู้ และบุคลิกภาพของเอเจนต์ในสภาพแวดล้อมเสมือน นอกจากการเล่นเกม กรอบการทำงานนี้ยังสามารถนำมาใช้ในเมตาเวิร์สได้ด้วย รายการด้านล่างจาก Virtual แสดงให้เห็นว่ามีโครงการหลายๆ โครงการที่ได้นำกรอบการทำงานนี้ไปใช้ในการก่อสร้างแล้ว

1.3 Rig

Rig เป็นเครื่องมือโอเพ่นซอร์สที่เขียนด้วย Rust ซึ่งออกแบบมาโดยเฉพาะเพื่อลดความซับซ้อนในการพัฒนาแอปพลิเคชันโมเดลภาษาขนาดใหญ่ (LLM) มีอินเทอร์เฟซแบบรวมที่ช่วยให้นักพัฒนาสามารถโต้ตอบกับผู้ให้บริการ LLM หลายราย (เช่น OpenAI และ Anthropic) และฐานข้อมูลเวกเตอร์ต่างๆ (เช่น MongoDB และ Neo4j) ได้อย่างง่ายดาย

คุณสมบัติสำคัญ:

  • อินเตอร์เฟซสมาหลาย: ไม่ว่าจะใช้ LLM provider หรือ vector storage ใด ๆ Rig ก็มีวิธีการเข้าถึงที่สอดคล้องกันอย่างต่อเนื่อง ลดความซับซ้อนของงานการรวมเข้าด้วยกันอย่างมาก
  • โครงสร้างแบบโมดูล: กรอบการใช้งานใช้การออกแบบแบบโมดูลซึ่งประกอบด้วยส่วนประกอบสำคัญ เช่น "ชั้นสะพานให้บริการ", "อินเตอร์เฟซการเก็บข้อมูลเวกเตอร์", และ "ระบบเอเจนต์อัจฉริยะ" เพื่อให้ระบบยืดหยุ่นและมีความสามารถในการขยายขนาด
  • ประเภทความปลอดภัย: ด้วยการใช้คุณสมบัติของ Rust, Rig สามารถดำเนินการฝังแบบปลอดภัยตามประเภทให้มีคุณภาพของรหัสและความปลอดภัยในเวลารันไทม์
  • ประสิทธิภาพสูง: ระบบสนับสนุนการเขียนโปรแกรมแบบไม่สม่ำเสมอ ทำให้สามารถปรับปรุงความสามารถในการประมวลผลพร้อมกัน คุณลักษณะการบันทึกข้อมูลและการตรวจสอบภายในช่วยในการดูแลรักษาและการแก้ปัญหา

กระบวนการทำงาน: เมื่อผู้ใช้เข้าสู่ระบบ Rig คำขอจะผ่านผ่าน "Provider Abstraction Layer" ก่อนที่จะมาตรฐานระหว่างผู้ให้บริการต่างๆ และรับรองการจัดการข้อผิดพลาดที่สม่ำเสมอในชั้นคอร์ ตัวแทนที่มีความสามารถในการเรียกใช้เครื่องมือต่างๆ หรือสอบถามการเก็บเวกเตอร์เพื่อเรียกคืนข้อมูลที่จำเป็น ในท้ายที่สุด กลไกขั้นสูงเช่น Retrieval-Augmented Generation (RAG) จะรวมการเรียกคืนเอกสารและความเข้าใจบริบทเพื่อสร้างคำตอบที่แม่นยำและมีความหมายก่อนส่งกลับไปยังผู้ใช้

กรณีการใช้งาน: Rig เหมาะสำหรับการสร้างระบบที่ต้องการคำตอบคำถามอย่างรวดเร็วและแม่นยำ สร้างเครื่องมือการค้นหาเอกสารที่มีประสิทธิภาพ พัฒนา chatbot ที่ตระหนักถึงบริบทหรือผู้ช่วยเสมือนจริง และรองรับการสร้างเนื้อหาโดยการสร้างข้อความหรือรูปแบบอื่น ๆ ขึ้นอัตโนมัติจากรูปแบบข้อมูลที่มีอยู่

1.4 ZerePy

ZerePy เป็นเฟรมเวิร์กโอเพ่นซอร์สที่ใช้ Python ที่ออกแบบมาเพื่อลดความซับซ้อนของการปรับใช้และการจัดการตัวแทน AI บนแพลตฟอร์ม X (เดิมชื่อ Twitter) มันพัฒนามาจากโครงการ Zerebro และสืบทอดฟังก์ชันหลัก แต่ได้รับการออกแบบในลักษณะแยกส่วนและปรับขนาดได้มากขึ้น เป้าหมายคือเพื่อให้นักพัฒนาสามารถสร้างตัวแทน AI ส่วนบุคคลได้อย่างง่ายดายและใช้งานระบบอัตโนมัติและการสร้างเนื้อหาต่างๆบน X

ZerePy มีอินเทอร์เฟซเชนเนล (CLI) ซึ่งทำให้ผู้ใช้สะดวกในการจัดการและควบคุมเอเจนต์ AI ที่พวกเขาใช้งาน โครงสร้างหลักของมันเป็นโมดูลาร์ได้ ซึ่งช่วยให้นักพัฒนาสามารถผสานโมดูลฟังก์ชันต่างๆ อย่างยืดหยุ่น

  • การผสม LLM: ZerePy รองรับโมเดลภาษาขนาดใหญ่ (LLM) จาก OpenAI และ Anthropic ทำให้นักพัฒนาสามารถเลือกโมเดลที่เหมาะสมที่สุดสำหรับแอปพลิเคชันของพวกเขา ซึ่งทำให้เอเจนต์สามารถสร้างเนื้อหาที่มีคุณภาพสูง
  • การผสานรวมแพลตฟอร์ม X: โครงสร้างนี้ผสานรวม API ของ X โดยตรง เพื่อให้เอเย่นต์สามารถดำเนินการต่างๆ เช่นโพสต์ ตอบกลับ กดถูกใจ และรีทวีตได้
  • ระบบการเชื่อมต่อแบบโมดูลาร์: ระบบนี้ช่วยให้นักพัฒนาสามารถเพิ่มการสนับสนุนสำหรับแพลตฟอร์มโซเชียลหรือบริการอื่น ๆ ได้อย่างง่าย ๆ โดยขยายความสามารถของกรอบทำงาน
  • Memory System (แผนการต่อยอด): กระแสความคิดที่ยังไม่ได้นำมาใช้ในเวอร์ชันปัจจุบัน วัตถุประสงค์ในการออกแบบของ ZerePy รวมถึงการรวมระบบหน่วยความจำที่จะทำให้ตัวแทนสามารถจำข้อมูลการโต้ตอบก่อนหน้าและข้อมูลบริบทเพื่อสร้างเนื้อหาที่สอดคล้องและเป็นบุคคลได้มากขึ้น

ในขณะที่ทั้ง ZerePy และโครงการ Eliza ของ a16z มีเป้าหมายในการสร้างและจัดการตัวแทน AI แต่พวกเขาแตกต่างกันในสถาปัตยกรรมและการให้ความสำคัญ Eliza มีความเชื่อมโยงมากกับการจำลองตัวแทนหลายตัวและการวิจัย AI ทั่วไปในขณะที่ ZerePy ให้ความสำคัญกับการปรับใช้ตัวแทน AI บนแพลตฟอร์มสังคมเฉพาะ (X) ทำให้มีความเชื่อมโยงกับการประยุกต์ใช้มากกว่า

II. รีพลิกของระบบนิติบัญญัติบิตคอยน์

ในแง่ของเส้นทางการพัฒนาตัวแทน AI มีความคล้ายคลึงกันมากกับระบบนิเวศของ BTC ตั้งแต่ปลายปี 2023 ถึงต้นปี 2024 วิถีการพัฒนาของระบบนิเวศ BTC สามารถสรุปได้ง่าย ๆ ว่า: BRC20-Atomical/Rune และการแข่งขันหลายโปรโตคอลอื่น ๆ — BTC L2 — BTCFi มีศูนย์กลางอยู่ที่บาบิโลน ในขณะที่ตัวแทน AI ได้พัฒนาอย่างรวดเร็วมากขึ้นบนรากฐานของกองเทคโนโลยี AI แบบดั้งเดิมที่เป็นผู้ใหญ่ แต่เส้นทางการพัฒนาโดยรวมของพวกเขาสะท้อนให้เห็นถึงระบบนิเวศของ BTC ในหลาย ๆ ด้าน ฉันจะสรุปดังนี้: GOAT/ACT — ตัวแทนประเภทสังคม — การแข่งขันกรอบงานตัวแทน AI เชิงวิเคราะห์ จากมุมมองแนวโน้มโครงการโครงสร้างพื้นฐานที่เน้นการกระจายอํานาจและความปลอดภัยรอบ ๆ ตัวแทนมีแนวโน้มที่จะนําคลื่นกรอบนี้ไปข้างหน้ากลายเป็นธีมที่โดดเด่นต่อไป

ดังนั้นแทร็กนี้เช่นเดียวกับระบบนิเวศ BTC จะนําไปสู่การทําให้เป็นเนื้อเดียวกันและฟองสบู่หรือไม่? ไม่ใช่ ประการแรกการเล่าเรื่องของตัวแทน AI ไม่ได้เกี่ยวกับการสร้างประวัติศาสตร์ของห่วงโซ่สัญญาอัจฉริยะ ประการที่สองไม่ว่าโครงการเฟรมเวิร์ก AI ที่มีอยู่เหล่านี้จะแข็งแกร่งทางเทคนิคหรือยังคงติดอยู่ในขั้นตอน PPT หรือเพียงแค่ Ctrl + C และ Ctrl + V อย่างน้อยก็ให้แนวทางการพัฒนาโครงสร้างพื้นฐานใหม่ บทความจํานวนมากได้เปรียบเทียบเฟรมเวิร์ก AI กับแพลตฟอร์มการออกสินทรัพย์และตัวแทนกับสินทรัพย์ อย่างไรก็ตามเมื่อเทียบกับ Memecoin Launchpads และโปรโตคอลจารึกโดยส่วนตัวแล้วฉันเชื่อว่าเฟรมเวิร์ก AI คล้ายกับเครือข่ายสาธารณะในอนาคตในขณะที่ตัวแทนมีลักษณะคล้ายกับ DApps ในอนาคต

ใน Crypto space ในปัจจุบัน เรามี public chains หลักพันและ DApps หลักหมื่น ในขอบข่ายของ public chains ทั่วไป เรามี BTC Ethereum และ various heterogeneous chains ในขณะที่รูปแบบของ application chains มีความหลากหลายมากขึ้น เช่น game chains storage chains และ Dex chains Public chains และ AI frameworks มีลักษณะที่คล้ายกันมากและ DApps สามารถสอดคล้องกับตัวแทนได้ดี

ในยุคของ Crypto ใน AI มีความเป็นไปได้สูงที่พื้นที่จะพัฒนาไปในทิศทางนี้โดยการอภิปรายในอนาคตจะเปลี่ยนจาก EVM เทียบกับห่วงโซ่ที่แตกต่างกันไปสู่การอภิปรายกรอบ ปัญหาปัจจุบันเป็นเรื่องของการกระจายอํานาจหรือวิธีการ "ล่ามโซ่" ฉันเชื่อว่าโครงการโครงสร้างพื้นฐาน AI ในอนาคตจะพัฒนาไปรอบ ๆ รากฐานนี้ อีกจุดสําคัญคือ: การทําเช่นนี้บนบล็อกเชนมีความสําคัญอย่างไร?

III. ความสำคัญของ On-Chain

ไม่ว่าบล็อกเชนจะรวมกับอะไรในที่สุดก็ต้องเผชิญกับคําถามสําคัญข้อหนึ่ง: มันมีความหมายหรือไม่? ในบทความของปีที่แล้วฉันวิพากษ์วิจารณ์ GameFi สําหรับลําดับความสําคัญที่ผิดพลาดซึ่งการพัฒนาโครงสร้างพื้นฐานมีความก้าวหน้ามากเกินไปและในบทความก่อนหน้านี้เกี่ยวกับ AI ฉันแสดงความสงสัยเกี่ยวกับการปฏิบัติจริงในปัจจุบันของการรวม AI กับ Crypto ท้ายที่สุดแรงผลักดันการเล่าเรื่องสําหรับโครงการแบบดั้งเดิมก็อ่อนแอลงเรื่อย ๆ โครงการดั้งเดิมไม่กี่โครงการที่ทํางานได้ดีในปีที่แล้วในแง่ของราคาโทเค็นโดยทั่วไปคือโครงการที่สามารถจับคู่หรือเกินความแข็งแกร่งของราคาได้

AI สามารถทําอะไรให้กับ Crypto ได้บ้าง? ก่อนหน้านี้ฉันนึกถึงกรณีการใช้งานเช่นตัวแทน AI ที่ทํางานในนามของผู้ใช้ Metaverse และตัวแทนในฐานะพนักงาน - แนวคิดที่ค่อนข้างธรรมดา แต่มีความต้องการบางอย่าง อย่างไรก็ตามความต้องการเหล่านี้ไม่จําเป็นต้องอยู่ในห่วงโซ่อย่างเต็มที่และจากมุมมองตรรกะทางธุรกิจพวกเขาไม่สามารถสร้างวงปิดได้ เบราว์เซอร์ตัวแทนที่กล่าวถึงในบทความล่าสุดซึ่งใช้ความตั้งใจสามารถสร้างความต้องการสําหรับการติดฉลากข้อมูลและพลังการประมวลผลการอนุมาน แต่องค์ประกอบทั้งสองนี้ยังไม่ได้รวมเข้าด้วยกันอย่างแน่นหนาและในแง่ของพลังการคํานวณการประมวลผลแบบรวมศูนย์ยังคงได้เปรียบ

ในการสำรวจความสำเร็จของ DeFi หากพิจารณาปัจจัยที่ทำให้ DeFi สามารถแยกออกมาจากการเงินดั้งเดิมได้ จะพบว่ามีความเข้าถึงที่ดีกว่า ประสิทธิภาพที่ดีกว่า ต้นทุนที่ต่ำกว่า และความปลอดภัยที่ไม่ต้องไว้วางใจเจ้าของ

  1. การลดค่าใช้จ่าย: การกำหนดเชื่อมโยงเชิงพาณิชย์สามารถลดค่าใช้จ่ายการใช้งานให้ต่ำลง ทำให้ผู้ใช้สามารถเข้าถึงและมีตัวเลือกมากขึ้น สิ่งนี้อาจทำให้ผู้ใช้ทั่วไปสามารถมีส่วนร่วมในสิ่งที่เป็นเจ้าของอย่างเดียวของ Web2 tech giants' AI ได้
  2. ความปลอดภัย: ตามนิยามที่ง่ายที่สุด เอเจ้นท์คือ AI ที่สามารถทำงานร่วมกับโลกเสมือนหรือโลกแจ้ง หากเอเจ้นท์สามารถแทรกแซงในโลกแจ้งหรือแม้กระทั่งในกระเป๋าเงินเสมือนของฉัน แล้วการแก้ไขปัญหาด้านความปลอดภัยที่ขึ้นอยู่กับบล็อกเชนอาจกลายเป็นเรื่องจำเป็น
  3. การเล่นทางการเงินเฉพาะบล็อกเชน: ตัวแทนสามารถสร้างชุดกลไกทางการเงินที่ไม่เหมือนใครบนบล็อกเชนได้หรือไม่? ตัวอย่างเช่นใน AMM (Automated Market Maker) ผู้ให้บริการสภาพคล่อง (LPs) อนุญาตให้ผู้ใช้ทั่วไปมีส่วนร่วมในการทําตลาดอัตโนมัติ ในทํานองเดียวกันหากตัวแทนต้องการพลังการประมวลผลหรือการติดฉลากข้อมูลผู้ใช้สามารถลงทุนในโปรโตคอลเหล่านี้ในรูปแบบของ USDT ตามความเชื่อมั่นในระบบ หรือตัวแทนในสถานการณ์การใช้งานที่แตกต่างกันสามารถสร้างโครงสร้างทางการเงินใหม่ได้
  4. ความสามารถในการทำงานร่วมกันของ DeFi: ในขณะที่ DeFi ยังขาดความสามารถในการทำงานร่วมกันที่เสมอไป ตัวแทนอาจสามารถแก้ไขปัญหานี้ได้โดยการเปิดให้เห็นกระบวนการคิดที่โปร่งใสและสามารถติดตามได้ และเติมเต็มช่องว่าง

IV. ความคิดสร้างสรรค์?

โครงการเฟรมเวิร์กในอนาคตยังจะให้โอกาสทางธุรกิจในลักษณะที่คล้ายกับ GPT Store อยู่ด้วย ในขณะที่การเปิดตัวเอเจนต์ผ่านเฟรมเวิร์กยังคงซับซ้อนสำหรับผู้ใช้ทั่วไป ฉันเชื่อว่าการทำให้กระบวนการก่อสร้างเอเจนต์เป็นเรื่องง่ายขึ้นและให้การรวมฟังก์ชันที่ซับซ้อนมากขึ้นจะให้โครงการเหล่านี้มีประโยชน์ในการแข่งขันในอนาคต นี่อาจส่งผลให้เกิดเศรษฐกิจสร้างสรรค์ Web3 ที่น่าสนใจกว่า GPT Store ได้

ในปัจจุบัน GPT Store ยังมีแนวโน้มที่เน้นไปทางการใช้งานที่เป็นรูปแบบ传统มากกว่าโดยมีแอปที่ได้รับความนิยมสร้างขึ้นโดยบริษัท Web2 ทั่วไป นอกจากนี้ รายได้ที่สร้างขึ้นมีส่วนใหญ่ถูกจองไว้ให้ผู้สร้าง ตามคำอธิบายอย่างเป็นทางการของ OpenAI ยังมีเพียงแค่กลยุทธ์ในการสนับสนุนทางการเงินให้กับนักพัฒนาที่ยอดเยี่ยมในสหรัฐฯ โดยมีการสนับสนุนทางการเงินตามจำนวนที่กำหนด

จากมุมมองของอุปสงค์ Web3 ยังคงมีช่องว่างมากมายให้เติมเต็มและจากมุมมองของระบบเศรษฐกิจสามารถทําให้นโยบายที่ไม่เป็นธรรมของ Web2 ยักษ์ใหญ่มีความเท่าเทียมกันมากขึ้น นอกจากนี้เราสามารถแนะนําเศรษฐกิจชุมชนเพื่อปรับปรุงตัวแทนต่อไป เศรษฐกิจสร้างสรรค์รอบตัวตัวแทนจะเปิดโอกาสให้คนธรรมดามีส่วนร่วม ในอนาคตมส์ AI จะฉลาดและน่าสนใจกว่าตัวแทนที่ออกโดย GOAT หรือ Clanker

เกี่ยวกับ YBB

YBB เป็นกองทุน web3 ที่มุ่งเน้นการระบุโครงการที่กำหนด Web3 พร้อมวิสัยทัศน์ในการสร้างที่อยู่ออนไลน์ที่ดีขึ้นสำหรับผู้อาศัยอินเทอร์เน็ตทั้งหมด ก่อตั้งโดยกลุ่มคนที่เชื่อในบล็อกเชนซึ่งมีการมีส่วนร่วมอย่างเต็มใจในอุตสาหกรรมนี้ตั้งแต่ปี 2013 YBB เสมอพร้อมที่จะช่วยโครงการระยะเริ่มต้นให้เติบโตจาก 0 ไปสู่ 1 เราให้ความคุ้มค่ากับนวัตกรรม ความพิรุธ และผลิตภัณฑ์ที่มุ่งเน้นผู้ใช้ พร้อมรับทราบศักยภาพของคริปโตและการประยุกต์บล็อกเชน

เว็บไซต์ | Twi: @YBBCapital

คำประกาศปฏิเสธความรับผิดชอบ:

  1. บทความนี้ถูกพิมพ์ซ้ำจาก [ YBB Capital]. ลิขสิทธิ์ทั้งหมดเป็นของผู้เขียนต้นฉบับ [นักวิจัย YBB Capital Zeke]. หากมีข้อต่างโปรดติดต่อเกตเรียนทีม และพวกเขาจะจัดการกับมันโดยทันที
  2. คำประกาศความรับผิด: มุมมองและความคิดเห็นที่แสดงในบทความนี้เป็นเพียงของผู้เขียนเท่านั้น และไม่ใช่คำแนะนำในการลงทุน
  3. ทีม Gate Learn แปลบทความเป็นภาษาอื่น ๆ การคัดลอก กระจายหรือลอกเลียนแบบบทความที่แปลนั้นห้ามหากไม่ได้กล่าวถึง
เริ่มตอนนี้
สมัครและรับรางวัล
$100