เว็บ 4.0: เว็บที่มีความสามารถในการดำเนินการ

บทความนี้สำรวจถึงวิธีที่ปัญญาประดิษฐ์ (AI) และเทคโนโลยีบล็อกเชนรวมกันเพื่อขับเคลื่อนการพัฒนาของอินเทอร์เน็ตรุ่นถัดไปที่เรียกว่า "Agentic Web" ไม่เพียงแต่ทบทวนการวิวัฒนาการของอินเทอร์เน็ตแต่ยังอภิปรายอย่างละเอียดถึงแนวคิด องค์ประกอบ และสถาปัตยกรรมของตัวแทน รวมถึงวิธีที่พวกเขาเปลี่ยนแปลงวิธีการที่มนุษย์ปฏิสัมพันธ์กับเครื่องจักรและระบบดิจิทัล

ปัญญาประดิษฐ์และเทคโนโลยีบล็อกเชนเป็นตัวแทนของสองพลังการเปลี่ยนแปลงที่เปลี่ยนแปลงโลกของเรา AI ขยายขีดความสามารถทางปัญญาของมนุษย์ผ่านแมชชีนเลิร์นนิงและเครือข่ายประสาทเทียมในขณะที่เทคโนโลยีบล็อกเชนนําเสนอความขาดแคลนดิจิทัลที่ตรวจสอบได้และเปิดใช้งานรูปแบบใหม่ของการประสานงานที่ไม่น่าเชื่อถือ เมื่อเทคโนโลยีเหล่านี้มาบรรจบกันพวกเขากําลังวางรากฐานสําหรับการทําซ้ําใหม่ของอินเทอร์เน็ตซึ่งเป็นที่ที่ตัวแทนอิสระโต้ตอบกับระบบกระจายอํานาจ "Agentic Web" นี้แนะนําพลเมืองดิจิทัลกลุ่มใหม่: ตัวแทน AI ที่สามารถนําทาง เจรจา และทําธุรกรรมได้อย่างอิสระ การเปลี่ยนแปลงนี้กระจายอํานาจในอาณาจักรดิจิทัลทําให้บุคคลสามารถเรียกคืนอํานาจอธิปไตยเหนือข้อมูลของตนในขณะที่ส่งเสริมระบบนิเวศที่มนุษย์และปัญญาประดิษฐ์ทํางานร่วมกันในรูปแบบที่ไม่เคยมีมาก่อน

การวิวัฒนาการของเว็บ

เพื่อให้เข้าใจว่าเรากำลังจะไปที่ไหน ให้เราตามรอยการวิวัฒนาการของเว็บผ่านการตั้งค่าใหญ่ ๆ ที่แตกต่างกัน โดยแต่ละครั้งจะมีความสามารถและแนวคิดสถาปัตยกรรมที่แตกต่างกัน:

ในขณะที่รุ่นสองแรกของเว็บเน้นการแพร่ข่าวสารแต่รุ่นที่สองนี้สามารถเพิ่มข้อมูลได้ Web 3.0 นำเสนอการเป็นเจ้าของข้อมูลผ่านโทเค็นและตอนนี้ Web 4.0 มีความฉลาดผ่านระบบรุ่นภาษาใหญ่ (LLMs)

จาก LLMs สู่ Agents: วิวัฒนาการตามธรรมชาติ

LLMs แทนกระโดดของความฉลาดของเครื่อง เป็นระบบการจับคู่รูปแบบแบบไดนามิกที่แปลงความรู้ที่เป็นมหาศาลเป็นความเข้าใจบริบทผ่านการคำนวณความน่าจะเป็น อย่างไรก็ตาม ศักยภาพที่แท้จริงของพวกเขาเกิดขึ้นเมื่อมีโครงสร้างเป็นตัวแทน - การเปลี่ยนแปลงจากตัวประมวลผลข้อมูลเชิงบริสุทธิ์เป็นตัวแทนที่มีเป้าหมายที่สามารถรับรู้ เหตุผล และการกระทำ การเปลี่ยนแปลงนี้สร้างอัจฉริยะที่เกิดขึ้นที่สามารถทำการร่วมมือที่ยั่งยืนและมีความหมายผ่านทั้งภาษาและการกระทำ

คำว่า 'เอเจนต์' นำเสนอแนวคิดใหม่สำหรับการโต้ตอบระหว่างมนุษย์กับ AI ซึ่งเลื่อนออกไปจากข้อจำกัดและความสัมพันธ์ลบล้างของแชทบอทแบบดั้งเดิม การเปลี่ยนแปลงนี้ไม่ใช่แค่การเปลี่ยนคำศัพท์เท่านั้น แต่เป็นการเปลี่ยนแนวคิดพื้นฐานของว่าระบบ AI สามารถทำงานอิสระได้อย่างมีนัยสำคัญพร้อมรักษาการทำงานร่วมกับมนุษย์อย่างมีความหมาย ในพื้นฐานแล้ว การทำงานของเอเจนต์ทำให้ตลาดสามารถเกิดขึ้นเพื่อแก้ปัญหาจุดประสงค์ของผู้ใช้เฉพาะ

ในท้ายที่สุด Agentic Web เป็นมากกว่าชั้นใหม่ของความฉลาด แต่เป็นการเปลี่ยนวิธีที่เราโต้ตอบกับระบบดิจิทัลโดยพื้นฐาน ในขณะที่การทําซ้ําเว็บก่อนหน้านี้อาศัยอินเทอร์เฟซแบบคงที่และการเดินทางของผู้ใช้ที่กําหนดไว้ล่วงหน้า Agentic Web แนะนําโครงสร้างพื้นฐานรันไทม์แบบไดนามิกที่ทั้งการคํานวณและอินเทอร์เฟซจะปรับให้เข้ากับบริบทและความตั้งใจของผู้ใช้แบบเรียลไทม์

เว็บไซต์แบบดั้งเดิมทำหน้าที่เป็นหน่วยพื้นฐานของอินเทอร์เน็ตในปัจจุบัน โดยให้อินเทอร์เฟซที่แน่นอนที่ผู้ใช้สามารถอ่าน เขียน และโต้ตอบกับข้อมูลผ่านทางเส้นทางที่กำหนดไว้ แบบจำลองนี้ ขณะที่ฟังก์ชันเชียร์ก็ยังเข้มงวดไว้ การจำกัดผู้ใช้ให้ต้องใช้อินเทอร์เฟซที่ออกแบบสำหรับกรณีการใช้ทั่วไป ไม่ใช่ตามความต้องการของแต่ละบุคคล เว็บเอเจนติก พักพิงจากข้อจำกัดเหล่านี้ผ่านการคำนวณที่ตรงตามบริบท การสร้างอินเตอร์เฟซที่ปรับได้ การจำลองการกระทำที่พยายามผ่านทาง RAG และนวัตกรรมอื่น ๆ ในการดึงข้อมูลแบบเรียลไทม์

พิจารณาว่า TikTok ปฏิวัติการบริโภคเนื้อหาโดยการสร้างฟีดที่เป็นส่วนตัวสูงซึ่งปรับให้เข้ากับการตั้งค่าของผู้ใช้แบบเรียลไทม์ได้อย่างไร Agentic Web ขยายแนวคิดนี้นอกเหนือจากการแนะนําเนื้อหาไปยังการสร้างอินเทอร์เฟซทั้งหมด แทนที่จะนําทางผ่านเค้าโครงหน้าเว็บคงที่ผู้ใช้โต้ตอบกับอินเทอร์เฟซที่สร้างขึ้นแบบไดนามิกซึ่งคาดการณ์และอํานวยความสะดวกในการดําเนินการต่อไป การเปลี่ยนจากเว็บไซต์แบบสแตติกเป็นอินเทอร์เฟซแบบไดนามิกที่ขับเคลื่อนด้วยเอเจนต์แสดงถึงวิวัฒนาการพื้นฐานในวิธีที่เราโต้ตอบกับระบบดิจิทัลโดยเปลี่ยนจากโมเดลการโต้ตอบตามการนําทางเป็นการโต้ตอบตามความต้องการของผู้ใช้

โครงสร้างของตัวแทน

สถาปัตยกรรม Agentic ได้เป็นการสำรวจที่ใหญ่ของนักวิจัยและผู้สร้างบ้าง วิธีการใหม่กำลังถูกพัฒนาอย่างต่อเนื่องเพื่อเสริมสร้างความสามารถในการตัดสินใจและแก้ไขปัญหาของพวกเขา วิธีการเช่น Chain-of-Thought (CoT), Tree-of-Thought (ToT), และ Graph-of-Thought (GoT) เป็นตัวอย่างที่ยอดเยี่ยมของนวัตกรรมที่ออกแบบมาเพื่อปรับปรุงวิธีการที่ LLMs จัดการกับงานที่ซับซ้อนโดยจำลองกระบวนการความคิดที่ซับซ้อนมากขึ้นและคล้ายมนุษย์

Chain-of-Thought (CoT) prompting ส่งเสริมให้โมเดลภาษาใหญ่ (LLMs) แบ่งงานที่ซับซ้อนเป็นขั้นตอนย่อยที่สามารถจัดการได้ง่ายมากขึ้น วิธีการนี้มีประสิทธิภาพสูงอย่างยิ่งสำหรับปัญหาที่ต้องการการตรรกะคิด เช่น เขียนสคริปต์ Python สั้น ๆ หรือแก้สมการทางคณิตศาสตร์

Tree-of-Thoughts (ToT) สร้างขึ้นจาก CoT โดยการแนะนําโครงสร้างต้นไม้ที่ช่วยให้สามารถสํารวจเส้นทางความคิดที่เป็นอิสระได้หลายเส้นทาง การปรับปรุงนี้ช่วยให้ LLM สามารถจัดการกับงานที่ซับซ้อนยิ่งขึ้น ใน ToT แต่ละ "ความคิด" (เอาต์พุตข้อความจาก LLM) จะเชื่อมต่อโดยตรงกับความคิดก่อนหน้าหรือที่ตามมาทันทีภายในห่วงโซ่ท้องถิ่น (กิ่งไม้) แม้ว่าโครงสร้างนี้จะมีความยืดหยุ่นมากกว่า CoT แต่ก็ยังจํากัดศักยภาพในการผสมเกสรข้ามความคิด

กราฟความคิด (GoT) นำแนวความคิดไปไกลกว่าโดยรวมโครงสร้างข้อมูลแบบคลาสสิกกับ LLMs ทางนี้ขยายความคิดโดยอนุญาตให้ “ความคิด” ใดก็ได้เชื่อมโยงกับความคิดอื่นในโครงสร้างกราฟ โครงสร้างเครือข่ายของความคิดเชื่อมโยงกันอย่างใกล้ชิดกับกระบวนการรับรู้ของมนุษย์

โครงสร้างกราฟของ GoT น่าจะให้การแสดงความคิดของมนุษย์ที่แม่นยํากว่าเมื่อเทียบกับ CoT หรือ ToT ในสถานการณ์ส่วนใหญ่ แม้ว่าจะมีบางกรณีที่รูปแบบความคิดของเราอาจมีลักษณะคล้ายกับโซ่หรือต้นไม้ (เช่นเมื่อพัฒนาแผนฉุกเฉินหรือขั้นตอนการปฏิบัติงานมาตรฐาน) แบบจําลองนี้สะท้อนความคิดของมนุษย์ได้ดีขึ้นซึ่งมักจะกระโดดข้ามความคิดต่าง ๆ แทนที่จะทําตามคําสั่งตามลําดับที่เข้มงวด ในขณะที่บางสถานการณ์เช่นการพัฒนาแผนฉุกเฉินหรือขั้นตอนมาตรฐานอาจยังคงเป็นไปตามโครงสร้างแบบลูกโซ่หรือต้นไม้จิตใจของเรามักจะสร้างเว็บความคิดที่ซับซ้อนและเชื่อมโยงถึงกันซึ่งสอดคล้องกับโครงสร้างกราฟมากขึ้น

การใช้วิธีการแบบกราฟใน GoT ช่วยให้การสำรวจความคิดมีความยืดหยุ่นและกระชับมากขึ้น ซึ่งอาจส่งผลให้การแก้ปัญหาที่สร้างสรรค์และครอบคลุมมากขึ้นใน LLMs

การดำเนินการที่มีพื้นฐานเป็นกราฟแบบเรกูร์ซีฟนี้เป็นขั้นตอนเพียงเท่านั้นสู่การดำเนินงานของตัวตน การวิวัฒนาการถัดไปที่ชัดเจนคือการมีตัวแทนที่มากกว่าหนึ่งตัว ที่มีความเชี่ยวชาญของตนเอง ที่ถูกจัดระเบียบขึ้นสู่เป้าหมายที่เฉพาะเจาะจง ความสวยงามของตัวแทนอยู่ในการประกอบของพวกเขา

เอเจนต์ช่วยให้คุณสามารถทำให้ LLMs เป็นโมดูลและประสานงานพร้อมกันผ่านการประสานงานของหลายเอเจนต์

Multi-Agent Systems

แนวคิดของระบบมัลติเอเจนต์ไม่ใช่ระบบใหม่ รากเหง้าของมันย้อนกลับไปถึง "Society of Mind" ของ Marvin Minsky ซึ่งเสนอว่าจิตใจแบบแยกส่วนหลายตัวที่ทํางานร่วมกันสามารถมีประสิทธิภาพเหนือกว่าจิตใจเสาหินเดียว ChatGPT และ Claude เป็นตัวแทนเดี่ยว Mistral นิยมผสมของผู้เชี่ยวชาญ การขยายแนวคิดนี้ต่อไปเราเชื่อว่าสถาปัตยกรรมเครือข่ายตัวแทนจะเป็นสถานะสุดท้ายของโทโพโลยีข่าวกรองนี้

จากมุมมองของการจำลองจากธรรมชาติ ต่างจากโมเดล AI ที่มีล้านๆ นิวรอนที่เหมือนกันที่ถูกเชื่อมต่อกันอย่างสม่ำเสมอและทำนายได้ สมองมนุษย์ (ที่เป็นเครื่องจักรที่มีความมีสติ) มีความหลากหลายอย่างมากทั้งในระดับอวัยวะและระดับเซลล์ นิวรอนสื่อสารผ่านสัญญาณที่ซับซ้อน ที่เกี่ยวข้องกับความเข้มข้นของสารสื่อประสาน การกระทำในของเซลล์ภายใน และระบบการปรับเปลี่ยนต่าง ๆ ทำให้ฟังก์ชันของพวกเขามีระดับความซับซ้อนมากกว่าสถานะทวิภาคฐานเดียว

นี่แสดงให้เห็นว่าในชีววิทยา ความฉลาดไม่ได้เกิดจากจำนวนส่วนประกอบหรือขนาดของชุดข้อมูลการฝึกอบรม แต่เกิดจากประสิทธิภาพระหว่างหน่วยที่หลากหลายและเฉพาะเจาะจงที่มีปฏิกิริยาซับซ้อน—กระบวนการแอนะล็อกที่เกิดขึ้นโดยสิ่งที่เป็นธรรมชาติ

ด้วยเหตุนี้ ความคิดเกี่ยวกับการพัฒนาแบบจำนวนมากของโมเดลขนาดเล็กมากกว่าไม่กี่รูปแบบขนาดใหญ่ และการเปิดให้เกิดการจัดเรียงระหว่างนักแสดงเหล่านี้ อาจนำมาสู่นวัตกรรมในหลักสูตรการเรียนรู้ทางสมอง อย่างเช่น ระบบหลายเอเยนต์

การออกแบบระบบแบบหลายตัวแทนมีข้อดีหลายประการเหนือระบบตัวแทนเดียว: บํารุงรักษาได้มากขึ้นเข้าใจง่ายขึ้นและมีความยืดหยุ่นมากขึ้นในการขยาย แม้ในกรณีที่จําเป็นต้องใช้อินเทอร์เฟซเอเจนต์เดียวเท่านั้น แต่การนําไปใช้ภายในเฟรมเวิร์กแบบมัลติเอเจนต์สามารถทําให้ระบบเป็นแบบแยกส่วนได้มากขึ้นทําให้กระบวนการสําหรับนักพัฒนาง่ายขึ้นในการเพิ่มหรือลบส่วนประกอบตามต้องการ สิ่งสําคัญคือต้องตระหนักว่าสถาปัตยกรรมแบบหลายเอเจนต์อาจเป็นวิธีที่มีประสิทธิภาพสูงในการสร้างระบบตัวแทนเดียว

ในขณะที่โมเดลภาษาขนาดใหญ่ (LLMs) ได้แสดงความสามารถที่หลากหลาย เช่น การสร้างข้อความที่คล้ายมนุษย์ การแก้ปัญหาที่ซับซ้อน และการจัดการกับงานที่หลากหลาย ตัวแทน LLM แต่ละตัวก็เผชิญกับข้อจำกัดที่อาจจะทำให้ประสิทธิภาพของพวกเขาลดลงในการประยุกต์ใช้ในโลกแห่งความเป็นจริง

ด้านล่างเราจะสำรวจห้าความท้าทายสำคัญที่เกี่ยวข้องกับระบบที่มีความสามารถและสำรวจว่าการทำงานร่วมกันของหลายตัวแทนสามารถเอาชนะอุปสรรคเหล่านี้ ซึ่งจะปลดล็อคศักยภาพเต็มที่ของ LLMs

  • การเอาชนะอาการทางจิตที่ผ่านการตรวจสอบข้ามกันเอเจนต์ LLM บุคคลธุรกิจบางครั้งมีอาการทางจิต ทำให้มีข้อมูลที่ไม่ถูกต้องหรือไม่มีเหตุผล สิ่งนี้เกิดขึ้นแม้ว่าพวกเขาได้รับการฝึกฝนอย่างเต็มที่ โดยที่ผลลัพธ์อาจดูเป็นไปได้ แต่ขาดความแม่นยำทางกาจร ระบบมัลติเอเจนต์ช่วยให้เอเจนต์สามารถตรวจสอบข้อมูลข้ามกัน ลดความเสี่ยงของข้อผิดพลาด โดยการเฉพาะทางในพื้นที่ต่างๆ เอเจนต์ทำให้มั่นใจได้มากขึ้นและมีการตอบสนองที่เชื่อถือได้มากขึ้น
  • การขยายหน้าต่างบริบทผ่านกระบวนการประมวลผลแบบกระจาย LLM มีหน้าต่างบริบทที่จำกัด ทำให้ยากต่อการจัดการเอกสารหรือการสนทนาที่ยาวนาน ในกรอบการทำงานของหลายตัวแอนต์ เอเจนต์สามารถแบ่งโหลดการประมวลผล แต่ละตัวจัดการส่วนหนึ่งของบริบท ผ่านการสื่อสารระหว่างตัวแอนต์ พวกเขาสามารถรักษาความสอดคล้องกันข้ามข้อความทั้งหมดได้อย่างมีประสิทธิภาพ โดยการขยายหน้าต่างบริบท
  • การเพิ่มประสิทธิภาพผ่านการประมวลผลแบบขนานละเอียด LLM แต่ละตัวมักประมวลงานทีละอย่างที导致เวลาตอบสนองช้าลง ระบบมัลติเอเจนต์รองรับการประมวลแบบขนานละเอียดซึ่งช่วยให้เอเจนต์หลายตัวทำงานบนงานที่แตกต่างกันพร้อมกัน ซึ่งเพิ่มประสิทธิภาพและเร่งความตอบสนอง ทำให้ธุรกิจสามารถจัดการคำถามหลายๆ คำถามโดยไม่มีความล่าช้า
  • การส่งเสริมการทํางานร่วมกันสําหรับการแก้ปัญหาที่ซับซ้อน LLMs เพียงอย่างเดียวต้องดิ้นรนเพื่อแก้ปัญหาที่ซับซ้อนซึ่งต้องใช้ความเชี่ยวชาญที่หลากหลาย ระบบหลายตัวแทนส่งเสริมการทํางานร่วมกันโดยตัวแทนแต่ละคนมีทักษะและมุมมองที่เป็นเอกลักษณ์ ด้วยการทํางานร่วมกันเจ้าหน้าที่สามารถรับมือกับความท้าทายที่ซับซ้อนได้อย่างมีประสิทธิภาพมากขึ้นโดยนําเสนอโซลูชันที่ครอบคลุมและสร้างสรรค์มากขึ้น
  • การเพิ่มความเข้าถึงผ่านการปรับปรุงทรัพยากรการเรียน LLM ระดับสูงต้องการทรัพยากรคอมพิวเตอร์มาก ทำให้มีค่าใช้จ่ายสูงและไม่สามารถเข้าถึงได้ง่าย กรอบการทำงานของหลายตัวแยกจัดการทรัพยากรโดยกระจายงานให้กับตัวแยก เพื่อลดต้นทุนด้านการคำนวณโดยรวม ทำให้เทคโนโลยี AI มีความเหมาะสมและเข้าถึงได้กับหลายองค์กรมากขึ้น

ในขณะที่ระบบมัลติเอเจนต์มีข้อได้เปรียบที่น่าสนใจในการแก้ปัญหาแบบกระจายและการเพิ่มประสิทธิภาพทรัพยากร แต่ศักยภาพที่แท้จริงของพวกเขาจะเกิดขึ้นเมื่อเราพิจารณาการใช้งานที่ขอบของเครือข่าย ในขณะที่ AI ยังคงพัฒนาอย่างต่อเนื่องการบรรจบกันของสถาปัตยกรรมแบบหลายเอเจนต์กับ Edge Computing จะสร้างการทํางานร่วมกันที่ทรงพลัง ซึ่งไม่เพียงทําให้ไม่เพียง แต่ระบบอัจฉริยะในการทํางานร่วมกันเท่านั้น แต่ยังรวมถึงการประมวลผลที่แปลเป็นภาษาท้องถิ่นและมีประสิทธิภาพในอุปกรณ์นับไม่ถ้วน แนวทางแบบกระจายในการปรับใช้ AI นี้ขยายประโยชน์ของระบบมัลติเอเจนต์โดยธรรมชาติ โดยนําระบบอัจฉริยะเฉพาะด้านและความร่วมมือเข้าใกล้ตําแหน่งที่ต้องการมากที่สุด: ผู้ใช้ปลายทาง

ความฉลาดที่ด้านขอบ

การแพร่กระจายของ AI ทั่วทิศทางดิจิทัลกำลังขับเคลื่อนการสร้างโครงสร้างคำนวณเบื้องฐาน ภายในตัว AI กำลังถูกผสมผสานเข้าไปในโครงสร้างของการโต้ตอบดิจิทัลประจำวันของเรา เรากำลังเห็นการแบ่งแยกธรรมชาติของการคำนวณ: ศูนย์ข้อมูลข้อมูลที่เฉพาะเจาะจงจัดการกับการคิดอย่างซับซ้อนและงานที่เฉพาะเจาะจง ในขณะเดียวกันอุปกรณ์ขอบจะประมวลผลคำถามที่เป็นประสบการณ์และเฉพาะบุคคลอย่างท้องถิ่น การเปลี่ยนทิศทางไปทางการอ้างอิงขอบนี้ไม่ใช่เพียงความชอบในโครงสร้าง—มันเป็นความจำเป็นที่มาจากปัจจัยที่สำคัญมากมาย

โดยประเด็นหลักคือปริมาณของการตอบรับที่เน้นไปที่ AI จะทำให้ผู้ให้บริการการอ่านในรูปแบบที่เซ็นทรัลไม่สามารถรับมือได้ ทำให้ต้องมีความต้องการต่อแบนด์วิดท์และปัญหาด้านความล่าช้าที่ไม่สามารถยอมรับได้

การประมวลผลทางขอบช่วยให้สามารถตอบสนองแบบเรียลไทม์ที่สำคัญสำหรับแอปพลิเคชันเช่นยานยนต์อัตโนมัติ เสริมความเป็นจริงเสริมและอุปกรณ์ IoT

ที่สาม การอินเฟอเรนซ์ภายในพื้นที่ จะรักษาความเป็นส่วนตัวของผู้ใช้ได้โดยการเก็บข้อมูลที่ละเอียดอ่อนบนอุปกรณ์ส่วนตัว ที่สี่ การคำนวณด้านขอบ ลดการใช้พลังงานและรอยรอยคาร์บอนอย่างมากโดยการลดการเคลื่อนย้ายข้อมูลทางเครือข่าย

สุดท้ายการตัดสินใจของขอบเขตช่วยให้ฟังก์ชันแบบออฟไลน์และความทนทานมีการทำงานอย่างมีประสิทธิภาพโดยระบบ AI ยังคงอยู่แม้ว่าการเชื่อมต่อเครือข่ายจะถูกทำลาย

แบบจำลองสัญญาณอัจฉริยะแบบกระจายนี้ไม่เพียงแค่เป็นการปรับปรุงระบบปัจจุบันของเรา แต่เป็นการสร้างภาพใหม่ของวิธีการใช้งานและปฏิสัมพันธ์กับ AI ในโลกที่เชื่อมต่อกันอย่างต่อเนื่อง

นอกจากนี้เรากำลังเห็นการเปลี่ยนแปลงพื้นฐานในความต้องการทางคอมพิวเตอร์ของ LLMs ในขณะที่ทศวรรษที่ผ่านมาได้ถูกครอบครองโดยความต้องการทางคอมพิวเตอร์ขนาดใหญ่ในการฝึกโมเดลภาษาขนาดใหญ่ ตอนนี้เรากำลังเข้าสู่ยุคที่การคำนวณเวลาอินเฟอเรนซ์เป็นสิ่งสำคัญ การเปลี่ยนแปลงนี้เป็นเรื่องที่ชัดเจนมาก โดยการเกิดขึ้นของระบบ AI ที่สามารถกระทำเอง เช่น OpenAI's Q* breakthrough ซึ่งได้แสดงให้เห็นว่าการคิดอย่างไดนามิคต้องการทรัพยากรทางคอมพิวเตอร์แบบเรียลไทม์ที่สำคัญมาก

ซึ่งแตกต่างจากการประมวลผลเวลาการฝึกอบรมซึ่งเป็นการลงทุนเพียงครั้งเดียวในการพัฒนาแบบจําลองการคํานวณเวลาอนุมานแสดงถึงการสนทนาเชิงคํานวณอย่างต่อเนื่องที่จําเป็นสําหรับตัวแทนอิสระในการให้เหตุผลวางแผนและปรับให้เข้ากับสถานการณ์ใหม่ ๆ การเปลี่ยนจากการฝึกอบรมโมเดลแบบคงที่ไปเป็นการให้เหตุผลแบบเอเจนต์แบบไดนามิกจําเป็นต้องมีการทบทวนโครงสร้างพื้นฐานด้านการคํานวณของเราใหม่อย่างรุนแรง ซึ่งการประมวลผลแบบเอดจ์ไม่ได้เป็นเพียงข้อได้เปรียบแต่จําเป็น

เมื่อการเปลี่ยนแปลงนี้เกิดขึ้น เรากำลังเห็นการเกิดขึ้นของตลาดการอุปกรณ์ edge inference แบบ peer-to-peer ที่เป็นพันล้านเครื่องมือที่เชื่อมต่อกัน ตั้งแต่สมาร์ทโฟนจนถึงระบบบ้านอัจฉริยะ ซึ่งเป็นตลาดการคำนวณที่เคลื่อนไหวได้ อุปกรณ์เหล่านี้สามารถซื้อขายความสามารถในการคำนวณได้อย่างไม่มีข้อกังขา สร้างตลาดอินทรีย์ที่ทรัพยากรการคำนวณไหลไปที่ที่มีความจำเป็นที่สุด ความสามารถในการคำนวณที่เกินของอุปกรณ์ที่ไม่ได้ใช้งานจะกลายเป็นทรัพยากรที่มีค่า สามารถซื้อขายได้แบบเรียลไทม์ ทำให้มีโครงสร้างพื้นฐานที่มีประสิทธิภาพและทนทานมากกว่าระบบที่มีการควบคุมแบบดั้งเดิม

การคํานวณการอนุมานที่เป็นประชาธิปไตยนี้ไม่เพียง แต่เพิ่มประสิทธิภาพการใช้ทรัพยากร แต่ยังสร้างโอกาสทางเศรษฐกิจใหม่ ๆ ภายในระบบนิเวศดิจิทัลซึ่งอุปกรณ์ที่เชื่อมต่อทุกเครื่องจะกลายเป็นผู้ให้บริการขนาดเล็กที่มีศักยภาพของความสามารถของ AI อนาคตของ AI จะโดดเด่นไม่เพียง แต่ด้วยพลังของแต่ละรุ่น แต่ด้วยความฉลาดโดยรวมของอุปกรณ์ขอบที่เชื่อมต่อกันซึ่งก่อให้เกิดตลาดการอนุมานที่เป็นประชาธิปไตยทั่วโลกซึ่งคล้ายกับตลาดสปอตสําหรับการอนุมานที่ตรวจสอบได้ตามอุปสงค์และอุปทาน

Agent Centric Interaction

LLMs ตอนนี้ช่วยให้เราสามารถเข้าถึงข้อมูลมากมายผ่านทางการสนทนาได้ แทนที่จะใช้วิธีการเรียกดูแบบเดิม การเข้าถึงแบบสนทนานี้จะกลายเป็นสิ่งที่เจาะจงและใกล้ชิดมากขึ้นเร็ว ๆ นี้ เพราะอินเทอร์เน็ตกำลังเปลี่ยนแปลงเป็นแพลตฟอร์มสำหรับตัวแทน AI ไม่ใช่ผู้ใช้งานมนุษย์

จากมุมมองของผู้ใช้ การเน้นจะเปลี่ยนจากการระบุ "โมเดลที่ดีที่สุด" เป็นการได้รับคำตอบที่เหมาะสมสุด คำตอบที่ดีกว่าอยู่ที่การรวมข้อมูลส่วนตัวของผู้ใช้พร้อมกับความรู้ทั่วไปในอินเทอร์เน็ต ในเริ่มต้น หน้าต่างบริบทที่ใหญ่กว่าและการสืบค้นเพิ่มเติม (RAG) จะช่วยรวมข้อมูลส่วนบุคคล แต่ในที่สุด ข้อมูลส่วนบุคคลจะเกินข้อมูลทั่วไปในอินเทอร์เน็ตในเรื่องสำคัญ

นี้จะทำให้เกิดอนาคตที่เราแต่ละคนมีโมเดล AI ส่วนตัวที่จะมีปฏิสัมพันธ์กับโมเดลของอินเทอร์เน็ตที่กว้างขวาง เริ่มต้นแล้ว การปรับใช้ส่วนตัวจะเกิดขึ้นพร้อมกับโมเดลระยะไกล แต่ความกังวลเกี่ยวกับความเป็นส่วนตัวและความเร็วในการตอบสนองจะเร่งด่วนให้มีปฏิสัมพันธ์มากขึ้นบนอุปกรณ์ท้องถิ่น สิ่งนี้จะสร้างขอบเขตใหม่ - ไม่ใช่ระหว่างมนุษย์กับเครื่อง แต่ระหว่างโมเดลส่วนตัวของเราและโมเดลของผู้เชี่ยวชาญของอินเทอร์เน็ต

รูปแบบอินเทอร์เน็ตแบบดั้งเดิมในการเข้าถึงข้อมูลดิบจะล้าสมัย โมเดลท้องถิ่นของคุณจะสื่อสารกับโมเดลผู้เชี่ยวชาญระยะไกลเพื่อรวบรวมข้อมูล ซึ่งจะประมวลผลและนําเสนอให้คุณด้วยวิธีที่มีแบนด์วิธสูงและเป็นส่วนตัวที่สุดเท่าที่จะเป็นไปได้ โมเดลส่วนตัวเหล่านี้จะขาดไม่ได้มากขึ้นเมื่อพวกเขาเรียนรู้เพิ่มเติมเกี่ยวกับความชอบและนิสัยของคุณ

อินเทอร์เน็ตจะเปลี่ยนแปลงเป็นระบบนิเวศที่เชื่อมโยงกันระหว่างแบบจำลองที่เกี่ยวข้องในระดับท้องถิ่นที่มีบทบาทสำคัญและแบบจำลองของผู้เชี่ยวชาญที่มีความรู้สูงในระดับไกล สิ่งนี้จะเกี่ยวข้องกับเทคโนโลยีใหม่เช่นการเรียนรู้ฟีเดอเรทเพื่ออัปเดตข้อมูลระหว่างแบบจำลองเหล่านี้ จากนั้นเมื่อเศรษฐกิจของเครื่องจักรเข้าสู่ขั้นตอนการพัฒนาใหม่ เราจะต้องมองใหม่เกี่ยวกับส่วนย่อยทางคณิตศาสตร์ที่เกี่ยวข้องกับการคำนวณ ความสามารถในการขยายของอุปกรณ์ และการชำระเงิน สิ่งนี้เป็นที่เปลี่ยนแปลงของพื้นที่ข้อมูลที่เป็นศูนย์กลางของตัวแทน ต้นทุนสูง สามารถสร้างสรรค์ได้ สามารถเรียนรู้ได้ด้วยตนเองและเปลี่ยนแปลงไปเรื่อย ๆ

โครงสร้างสำหรับโปรโตคอลที่มีเอเจนติก

ใน Agentic Web การแสดงออกของมนุษย์ - เอเจนต์ไปยังการสื่อสารระหว่างเอเยนต์จะเปลี่ยนแปลงเป็นเครือข่ายที่ซับซ้อนขึ้น โครงสร้างนี้นำเสนอการวางแผนพื้นฐานใหม่ของโครงสร้างของอินเทอร์เน็ต ที่ตัวแทนกลางกลายเป็นอินเตอร์เฟซหลักสำหรับการสื่อสารดิจิทัล ด้านล่างนี้เราได้เน้นข้อมูลพื้นฐานที่จำเป็นสำหรับโปรโตคอล Agentic

Sovereign Identity

  • การเปลี่ยนข้อมูลประจําตัวดิจิทัลจากที่อยู่ IP แบบเดิมเป็นคู่คีย์สาธารณะที่เข้ารหัสซึ่งเป็นเจ้าของโดยนักแสดงตัวแทน
  • ระบบชื่อเนมเบสที่ใช้ Blockchain จะแทนที่ระบบ DNS แบบเดิม โดยการกำจัดจุดควบคุมที่เป็นจุดศูนย์
  • ระบบลายนิ้วมือติดตามความน่าเชื่อถือและตัวชี้วัดความสามารถของตัวแทน
  • Zero-knowledge proofs เป็นเครื่องมือที่ช่วยให้การตรวจสอบตัวตนที่สอดคล้องกับความเป็นส่วนตัวได้
  • ความสามารถในการรวมตัวของตัวตนช่วยให้เอเจนต์สามารถจัดการกับบทบาทและบทบาทหลาย ๆ อย่าง

ตัวแทนอัตโนมัส

Entity ที่ดำเนินการด้วยตนเองที่สามารถ: เข้าใจภาษาธรรมชาติและการแก้ไขปัญหา

การวางแผนแบบหลายขั้นตอนและการแยกงาน

การบริหารจัดการทรัพยากรและปรับปรุง

เรียนรู้จากการปฏิสัมพันธ์และคำติชม

  • การตัดสินใจโดยอิสระภายใต้พารามิเตอร์ที่กำหนดไว้
  • ความเชี่ยวชาญของตัวแทนและตลาดสำหรับความสามารถที่เฉพาะเจาะจง
  • เครื่องมือรักษาความปลอดภัยและโปรโตคอลการจัดเรียงที่ซึ่งมีอยู่แบบฝังตัวอยู่ด้วย

โครงสร้างพื้นฐานข้อมูล

  • ความสามารถในการรับเข้าข้อมูลแบบเรียลไทม์และประมวลผล
  • กลไกการตรวจสอบและการตรวจสอบข้อมูลแบบกระจาย

ระบบผสมที่รวม: zkTLS

ชุดข้อมูลการฝึกอบรมแบบดั้งเดิม

การเก็บข้อมูลและการสังเคราะห์ข้อมูลแบบเรียลไทม์

  • เครือข่ายการเรียนรู้ร่วมมือ

RLHF (Reinforcement Learning from Human Feedback) networksDistributed feedback collection

กลไกการตัดสินใจที่มีน้ำหนักคุณภาพ

  • โปรโตคอลการปรับแบบจำลองไดนามิก

Compute Layer

โปรโตคอลการอนุมานที่สามารถยืนยันได้: ความสมบูรณ์ของการคำนวณ

ความสามารถในการทำซ้ำผลลัพธ์

ประสิทธิภาพในการใช้ทรัพยากร

  • โครงสร้างคำนามเพื่อคำนวณแบบกระจาย ซึ่งมี: ตลาดคำนวณแบบ peer-to-peer

ระบบการพิสูจน์ความถูกต้องของการคำนวณ

การจัดสรรทรัพยากรแบบไดนามิก

  • การรวมการคำนวณด้านขอบ

ระบบนิเวศรุ่น

โครงสร้างโมเดลลำดับชั้น: โมเดลภาษาเล็กพิเศษ (Small Language Models) ที่เฉพาะงาน

LLMs สำหรับวัตถุประสงค์ทั่วไป

โมเดลหลากลูกผสมที่พิเศษ

  • Multi-Modal LAMs (Large Action Models)
  • การประกอบและการจัดการโมเดล
  • ความสามารถในการเรียนรู้และปรับตัวอย่างต่อเนื่อง
  • ตัวอินเตอร์เฟสและโปรโตคอลระดับมาตรฐาน

กรอบปฏิบัติการ

  • โปรโตคอลทางคริปโตสำหรับการโต้ตอบของเอเจ้นต์ที่ปลอดภัย
  • ระบบบริหารสิทธิ์ทรัพย์สินดิจิทัล
  • โครงสร้างแรงจูงใจทางเศรษฐกิจ

กลไกการปกครองสำหรับ: การแก้ไขข้อขัดแย้ง

การจัดสรรทรัพยากร

  • อัปเดตโปรโตคอล

สภาวะการดำเนินงานแบบขนานที่ทำให้สามารถประมวลผลงานพร้อมกันได้: การประมวลผลงานพร้อมกัน

การแยกทรัพยากร

การบริหารจัดการสถานะ

  • การแก้ไขข้อขัดแย้ง

ตลาดเอเจนติก

  • พื้นฐาน Onchain สำหรับ Identity (Gnosis, Squad multisigs)
  • เศรษฐศาสตร์และการค้าระหว่างตัวแทน

เอเจ้นต์เป็นเจ้าของส่วนหนึ่งของวงศ์โทเค็นตั้งแต่บริสุทธิ์

  • ตลาดการพิสูจน์ที่รวมกันที่จ่ายผ่าน Likuiditi
  • คีย์ Onchain ที่ควบคุมบัญชี offchain

เอเจ้นท์กลายเป็นทรัพยากรให้ผลตอบแทน อย่างกิเอ็นทิก DAOs

  • การปกครองและเงินปันผล

สร้างโครงสร้างที่ยิ่งใหญ่สำหรับสตรีมเทคโนโลยี

การออกแบบระบบกระจายที่ทันสมัยนำเสนอแรงบันดาลใจและขั้นตอนพื้นฐานที่สามารถเปิดใช้งาน โปรโตคอลเอเจนติก เช่น สถาปัตยกรรมที่เป็นเหตุการณ์และโมเดลนักแสดงคำนวณอย่างตรงไปตรงมา

โมเดลนักแสดง提供了一个优雅的理论基础,用于实现代理系统。这个计算模型将“演员”视为计算的通用原语,其中每个演员都可以:

  1. Process messages
  2. ตัดสินใจในระดับท้องถิ่น
  3. สร้างนักแสดงเพิ่มเติม
  4. ส่งข้อความถึงนักแสดงอื่นๆ
  5. กำหนดวิธีการตอบกลับข้อความถัดไปที่ได้รับ

ข้อดีหลักของแบบจำลองผู้แสดงบทสำหรับระบบตัวแทนรวมถึง:

  • Isolation: แต่ละตัวแสดงบทบาทอย่างอิสระ การรักษาสถานะและการไหลของควบคุมของตนเอง
  • การสื่อสารแบบไม่เชื่อมต่อกัน: ข้อความระหว่างตัวแสดงไม่บล็อก ทำให้การประมวลผลแบบขนานเป็นไปได้อย่างมีประสิทธิภาพ
  • ความโปร่งใสของตําแหน่ง: นักแสดงสามารถสื่อสารได้โดยไม่คํานึงถึงตําแหน่งทางกายภาพในเครือข่าย
  • ความทนทานของความผิดพลาด: ความทนทานของระบบผ่านการแยกตัวและลำดับความคุ้มครองของนักแสดง
  • Scalability: การสนับสนุนธรรมชาติสำหรับระบบกระจายและการคำนวณแบบขนาน

เราขอเสนอ Neuron ซึ่งเป็นการนำไปใช้ในทางปฏิบัติของโปรโตคอลที่เป็นทฤษฎีนี้ผ่านโครงสถาปัตยกรรมที่กระจายอยู่บนหลายชั้น โดยรวมถึงเนมสเปซบล็อกเชน และเครือข่ายที่รวมกัน CRDTs และ DHTs โดยที่แต่ละชั้นบริการวัตถุประสงค์ที่แตกต่างกันในสแต็กโปรโตคอล เราได้รับแรงบันดาลจาก Urbit และ Holochain ผู้บุกเบิกแรกเริ่มในการออกแบบระบบปฏิบัติการแบบ p2p

ใน Neuron เลเยอร์บล็อกเชนให้เนมสเปซและข้อมูลประจําตัวที่ตรวจสอบได้ทําให้สามารถระบุที่อยู่และการค้นพบตัวแทนได้ในขณะที่ยังคงรักษาหลักฐานการเข้ารหัสความสามารถและชื่อเสียง ข้างต้นเลเยอร์ DHT ช่วยอํานวยความสะดวกในการค้นหาเอเจนต์และโหนดที่มีประสิทธิภาพควบคู่ไปกับการกําหนดเส้นทางเนื้อหาด้วยเวลาการค้นหา O (log n) ลดการดําเนินงานแบบ on-chain ในขณะที่เปิดใช้งานการค้นหาเพียร์ที่รู้จักในท้องถิ่น การซิงโครไนซ์สถานะระหว่างโหนดที่ติดต่อกับภายนอกได้รับการจัดการผ่าน CRDTs ทําให้เอเจนต์และโหนดสามารถรักษามุมมองที่สอดคล้องกันของสถานะที่ใช้ร่วมกันโดยไม่ต้องใช้ฉันทามติทั่วโลกสําหรับทุกการโต้ตอบ

สถาปัตยกรรมนี้แมปตามธรรมชาติกับเครือข่ายแบบรวมศูนย์ที่ตัวแทนอิสระทํางานเป็นโหนดอธิปไตยที่อาศัยอยู่บนอุปกรณ์ที่มีการอนุมานขอบท้องถิ่นโดยใช้รูปแบบ Actor Model โดเมนสหพันธรัฐสามารถจัดระเบียบตามความสามารถของเอเจนต์ โดย DHT ให้การกําหนดเส้นทางและการค้นพบที่มีประสิทธิภาพภายในและข้ามโดเมน ตัวแทนแต่ละคนทําหน้าที่เป็นนักแสดงอิสระที่มีสถานะของตัวเองในขณะที่เลเยอร์ CRDT ช่วยให้มั่นใจได้ถึงความสอดคล้องในที่สุดทั่วทั้งสหพันธรัฐ วิธีการแบบหลายชั้นนี้เปิดใช้งานความสามารถที่สําคัญหลายประการ:

การประสานงานแบบกระจาย

  • บล็อกเชนสำหรับการยืนยันตัวตนและชื่อเรียกโลกที่เป็นอิสระ
  • DHT สำหรับการค้นพบเพียรและโหนดอย่างมีประสิทธิภาพและการเรียกข้อมูล O(log n)
  • CRDTs for concurrent state synchronization and multi-agent coordination

การดำเนินงานที่มีขนาดขยายได้

  • โทโพโลยีการแบ่งเขตระบบสหพันธ์
  • กลยุทธการจัดเก็บข้อมูลแบบชั้น
  • การนำทางคำขอที่ตระหนักถึงสถานที่
  • การกระจายโหลดตามความสามารถ

System Resilience

  • ไม่มีจุดเสียหายเดียว
  • การดำเนินงานต่อเนื่องขณะที่มีการแบ่งส่วน
  • การปรับความสอดคล้องของสถานะโดยอัตโนมัติ
  • โครงสร้างการควบคุมสำหรับความทนทานของข้อผิดพลาด

การนำเสนอวิธีการนี้มีความเข้มแข็งเพื่อให้มีพื้นฐานที่แข็งแกร่งสำหรับการสร้างระบบที่ซับซ้อนของตัวแทนในขณะที่ยังคงคุณสมบัติสำคัญเช่นความเอกรักษ์ ความยืดหยุ่น และความทนทานที่จำเป็นสำหรับการปฏิสัมพันธ์ระหว่างตัวแทน

Final Thoughts

Agentic Web นับเป็นวิวัฒนาการที่สําคัญในการปฏิสัมพันธ์ระหว่างมนุษย์กับคอมพิวเตอร์ซึ่งอยู่เหนือการพัฒนาตามลําดับของยุคก่อนหน้าเพื่อสร้างกระบวนทัศน์ใหม่ของการดํารงอยู่ทางดิจิทัล ซึ่งแตกต่างจากการทําซ้ําก่อนหน้านี้ที่เพียงแค่เปลี่ยนวิธีที่เราบริโภคหรือเป็นเจ้าของข้อมูล Agentic Web เปลี่ยนอินเทอร์เน็ตจากแพลตฟอร์มที่เน้นมนุษย์เป็นศูนย์กลางให้เป็นสารตั้งต้นอัจฉริยะที่ตัวแทนอิสระกลายเป็นนักแสดงหลัก การเปลี่ยนแปลงนี้ขับเคลื่อนโดยการบรรจบกันของ Edge Computing โมเดลภาษาขนาดใหญ่และโปรโตคอลแบบกระจายอํานาจสร้างระบบนิเวศที่โมเดล AI ส่วนบุคคลเชื่อมต่อกับระบบผู้เชี่ยวชาญเฉพาะทางได้อย่างราบรื่น

เมื่อเราเคลื่อนที่ไปในทิศทางนี้ที่ให้ความสำคัญกับตัวแทน ขอบเขตระหว่างสตรีมาส์และสตรีมาชีนอย่างเริ่มจะทำให้เบลอลง ถูกสิ้นสุดโดยความสัมพันธ์แบบสัญญาเปรียบที่ตัวเอกส่วนบุคคลของเราบริการเป็นส่วนขยายดิจิตอลของเรา ที่เข้าใจบริบทของเรา คาดการณ์ความต้องการของเรา และการทราบด้วยตนเองเดินทางในทิวทัศน์ที่กว้างขวางของสตรีมาชีนกระจาย The Agentic Web จึงไม่เพียงเพียงแค่การก้าวหน้าทางเทคโนโลยี แต่เป็นการสร้างภาพลวงตาของศักยภาพของมนุษย์ในยุคดิจิตอล ที่ทุกๆ ความสัมพันธ์กลายเป็นโอกาสสำหรับสตรีมาชีนอุจจาระและทุกอุปกรณ์กลายเป็นโหนดในเครือข่ายโลกของระบบ AI ที่ร่วมมือกัน

เช่นเดียวกับมนุษย์ที่นำทางในมิติทางกายภาพของพื้นที่และเวลา ตัวแทนที่ไม่สนับสนุนตนเองอยู่ในมิติพื้นฐานของตนเอง: พื้นที่บล็อกสำหรับการอยู่อย่างมีชีวิตและเวลาการคิด ตารางองค์ความรู้ดิจิตอลนี้สะท้อนภาคจริงของเรา - ที่มนุษย์เดินทางผ่านระยะทางและสัมผัสการไหลของเวลาตัวแทนเคลื่อนที่ผ่านพิสูจน์ทางคริปโตและรอบการคำนวณ สร้างจักรวาลแบบขนานขององค์ความรู้ของอัลกอริทึม

ไม่สามารถหลีกเลี่ยงได้ว่าองค์กรในพื้นที่ล่วงลับจะดำเนินการบนพื้นที่บล็อกเชนที่กระจายอยู่

คำปฏิเสธ:

  1. บทความนี้ถูกพิมพ์ใหม่จาก[Azi.eth.sol | zo.me]. สิทธิ์ในการคัดลอกทั้งหมดนี้เป็นของผู้เขียนต้นฉบับ [ @MagicofAzi]. หากมีข้อปฏิเสธต่อการพิมพ์ฉบับนี้ โปรดติดต่อGate Learn ทีมและพวกเขาจะจัดการกับมันทันที
  2. คำปฏิเสธความรับผิดชอบ: มุมมองและความเห็นที่แสดงในบทความนี้เป็นสิ่งที่เป็นของผู้เขียนเท่านั้น และไม่เป็นที่ปรึกษาการลงทุนใด ๆ
  3. การแปลบทความเป็นภาษาอื่น ๆ ทำโดยทีมเรียนรู้ของเกต เว้นแต่ได้ระบุไว้ว่าห้ามคัดลอก กระจายหรือลอกเลียนแบบบทความที่ถูกแปล

เว็บ 4.0: เว็บที่มีความสามารถในการดำเนินการ

กลาง11/19/2024, 5:38:39 AM
บทความนี้สำรวจถึงวิธีที่ปัญญาประดิษฐ์ (AI) และเทคโนโลยีบล็อกเชนรวมกันเพื่อขับเคลื่อนการพัฒนาของอินเทอร์เน็ตรุ่นถัดไปที่เรียกว่า "Agentic Web" ไม่เพียงแต่ทบทวนการวิวัฒนาการของอินเทอร์เน็ตแต่ยังอภิปรายอย่างละเอียดถึงแนวคิด องค์ประกอบ และสถาปัตยกรรมของตัวแทน รวมถึงวิธีที่พวกเขาเปลี่ยนแปลงวิธีการที่มนุษย์ปฏิสัมพันธ์กับเครื่องจักรและระบบดิจิทัล

ปัญญาประดิษฐ์และเทคโนโลยีบล็อกเชนเป็นตัวแทนของสองพลังการเปลี่ยนแปลงที่เปลี่ยนแปลงโลกของเรา AI ขยายขีดความสามารถทางปัญญาของมนุษย์ผ่านแมชชีนเลิร์นนิงและเครือข่ายประสาทเทียมในขณะที่เทคโนโลยีบล็อกเชนนําเสนอความขาดแคลนดิจิทัลที่ตรวจสอบได้และเปิดใช้งานรูปแบบใหม่ของการประสานงานที่ไม่น่าเชื่อถือ เมื่อเทคโนโลยีเหล่านี้มาบรรจบกันพวกเขากําลังวางรากฐานสําหรับการทําซ้ําใหม่ของอินเทอร์เน็ตซึ่งเป็นที่ที่ตัวแทนอิสระโต้ตอบกับระบบกระจายอํานาจ "Agentic Web" นี้แนะนําพลเมืองดิจิทัลกลุ่มใหม่: ตัวแทน AI ที่สามารถนําทาง เจรจา และทําธุรกรรมได้อย่างอิสระ การเปลี่ยนแปลงนี้กระจายอํานาจในอาณาจักรดิจิทัลทําให้บุคคลสามารถเรียกคืนอํานาจอธิปไตยเหนือข้อมูลของตนในขณะที่ส่งเสริมระบบนิเวศที่มนุษย์และปัญญาประดิษฐ์ทํางานร่วมกันในรูปแบบที่ไม่เคยมีมาก่อน

การวิวัฒนาการของเว็บ

เพื่อให้เข้าใจว่าเรากำลังจะไปที่ไหน ให้เราตามรอยการวิวัฒนาการของเว็บผ่านการตั้งค่าใหญ่ ๆ ที่แตกต่างกัน โดยแต่ละครั้งจะมีความสามารถและแนวคิดสถาปัตยกรรมที่แตกต่างกัน:

ในขณะที่รุ่นสองแรกของเว็บเน้นการแพร่ข่าวสารแต่รุ่นที่สองนี้สามารถเพิ่มข้อมูลได้ Web 3.0 นำเสนอการเป็นเจ้าของข้อมูลผ่านโทเค็นและตอนนี้ Web 4.0 มีความฉลาดผ่านระบบรุ่นภาษาใหญ่ (LLMs)

จาก LLMs สู่ Agents: วิวัฒนาการตามธรรมชาติ

LLMs แทนกระโดดของความฉลาดของเครื่อง เป็นระบบการจับคู่รูปแบบแบบไดนามิกที่แปลงความรู้ที่เป็นมหาศาลเป็นความเข้าใจบริบทผ่านการคำนวณความน่าจะเป็น อย่างไรก็ตาม ศักยภาพที่แท้จริงของพวกเขาเกิดขึ้นเมื่อมีโครงสร้างเป็นตัวแทน - การเปลี่ยนแปลงจากตัวประมวลผลข้อมูลเชิงบริสุทธิ์เป็นตัวแทนที่มีเป้าหมายที่สามารถรับรู้ เหตุผล และการกระทำ การเปลี่ยนแปลงนี้สร้างอัจฉริยะที่เกิดขึ้นที่สามารถทำการร่วมมือที่ยั่งยืนและมีความหมายผ่านทั้งภาษาและการกระทำ

คำว่า 'เอเจนต์' นำเสนอแนวคิดใหม่สำหรับการโต้ตอบระหว่างมนุษย์กับ AI ซึ่งเลื่อนออกไปจากข้อจำกัดและความสัมพันธ์ลบล้างของแชทบอทแบบดั้งเดิม การเปลี่ยนแปลงนี้ไม่ใช่แค่การเปลี่ยนคำศัพท์เท่านั้น แต่เป็นการเปลี่ยนแนวคิดพื้นฐานของว่าระบบ AI สามารถทำงานอิสระได้อย่างมีนัยสำคัญพร้อมรักษาการทำงานร่วมกับมนุษย์อย่างมีความหมาย ในพื้นฐานแล้ว การทำงานของเอเจนต์ทำให้ตลาดสามารถเกิดขึ้นเพื่อแก้ปัญหาจุดประสงค์ของผู้ใช้เฉพาะ

ในท้ายที่สุด Agentic Web เป็นมากกว่าชั้นใหม่ของความฉลาด แต่เป็นการเปลี่ยนวิธีที่เราโต้ตอบกับระบบดิจิทัลโดยพื้นฐาน ในขณะที่การทําซ้ําเว็บก่อนหน้านี้อาศัยอินเทอร์เฟซแบบคงที่และการเดินทางของผู้ใช้ที่กําหนดไว้ล่วงหน้า Agentic Web แนะนําโครงสร้างพื้นฐานรันไทม์แบบไดนามิกที่ทั้งการคํานวณและอินเทอร์เฟซจะปรับให้เข้ากับบริบทและความตั้งใจของผู้ใช้แบบเรียลไทม์

เว็บไซต์แบบดั้งเดิมทำหน้าที่เป็นหน่วยพื้นฐานของอินเทอร์เน็ตในปัจจุบัน โดยให้อินเทอร์เฟซที่แน่นอนที่ผู้ใช้สามารถอ่าน เขียน และโต้ตอบกับข้อมูลผ่านทางเส้นทางที่กำหนดไว้ แบบจำลองนี้ ขณะที่ฟังก์ชันเชียร์ก็ยังเข้มงวดไว้ การจำกัดผู้ใช้ให้ต้องใช้อินเทอร์เฟซที่ออกแบบสำหรับกรณีการใช้ทั่วไป ไม่ใช่ตามความต้องการของแต่ละบุคคล เว็บเอเจนติก พักพิงจากข้อจำกัดเหล่านี้ผ่านการคำนวณที่ตรงตามบริบท การสร้างอินเตอร์เฟซที่ปรับได้ การจำลองการกระทำที่พยายามผ่านทาง RAG และนวัตกรรมอื่น ๆ ในการดึงข้อมูลแบบเรียลไทม์

พิจารณาว่า TikTok ปฏิวัติการบริโภคเนื้อหาโดยการสร้างฟีดที่เป็นส่วนตัวสูงซึ่งปรับให้เข้ากับการตั้งค่าของผู้ใช้แบบเรียลไทม์ได้อย่างไร Agentic Web ขยายแนวคิดนี้นอกเหนือจากการแนะนําเนื้อหาไปยังการสร้างอินเทอร์เฟซทั้งหมด แทนที่จะนําทางผ่านเค้าโครงหน้าเว็บคงที่ผู้ใช้โต้ตอบกับอินเทอร์เฟซที่สร้างขึ้นแบบไดนามิกซึ่งคาดการณ์และอํานวยความสะดวกในการดําเนินการต่อไป การเปลี่ยนจากเว็บไซต์แบบสแตติกเป็นอินเทอร์เฟซแบบไดนามิกที่ขับเคลื่อนด้วยเอเจนต์แสดงถึงวิวัฒนาการพื้นฐานในวิธีที่เราโต้ตอบกับระบบดิจิทัลโดยเปลี่ยนจากโมเดลการโต้ตอบตามการนําทางเป็นการโต้ตอบตามความต้องการของผู้ใช้

โครงสร้างของตัวแทน

สถาปัตยกรรม Agentic ได้เป็นการสำรวจที่ใหญ่ของนักวิจัยและผู้สร้างบ้าง วิธีการใหม่กำลังถูกพัฒนาอย่างต่อเนื่องเพื่อเสริมสร้างความสามารถในการตัดสินใจและแก้ไขปัญหาของพวกเขา วิธีการเช่น Chain-of-Thought (CoT), Tree-of-Thought (ToT), และ Graph-of-Thought (GoT) เป็นตัวอย่างที่ยอดเยี่ยมของนวัตกรรมที่ออกแบบมาเพื่อปรับปรุงวิธีการที่ LLMs จัดการกับงานที่ซับซ้อนโดยจำลองกระบวนการความคิดที่ซับซ้อนมากขึ้นและคล้ายมนุษย์

Chain-of-Thought (CoT) prompting ส่งเสริมให้โมเดลภาษาใหญ่ (LLMs) แบ่งงานที่ซับซ้อนเป็นขั้นตอนย่อยที่สามารถจัดการได้ง่ายมากขึ้น วิธีการนี้มีประสิทธิภาพสูงอย่างยิ่งสำหรับปัญหาที่ต้องการการตรรกะคิด เช่น เขียนสคริปต์ Python สั้น ๆ หรือแก้สมการทางคณิตศาสตร์

Tree-of-Thoughts (ToT) สร้างขึ้นจาก CoT โดยการแนะนําโครงสร้างต้นไม้ที่ช่วยให้สามารถสํารวจเส้นทางความคิดที่เป็นอิสระได้หลายเส้นทาง การปรับปรุงนี้ช่วยให้ LLM สามารถจัดการกับงานที่ซับซ้อนยิ่งขึ้น ใน ToT แต่ละ "ความคิด" (เอาต์พุตข้อความจาก LLM) จะเชื่อมต่อโดยตรงกับความคิดก่อนหน้าหรือที่ตามมาทันทีภายในห่วงโซ่ท้องถิ่น (กิ่งไม้) แม้ว่าโครงสร้างนี้จะมีความยืดหยุ่นมากกว่า CoT แต่ก็ยังจํากัดศักยภาพในการผสมเกสรข้ามความคิด

กราฟความคิด (GoT) นำแนวความคิดไปไกลกว่าโดยรวมโครงสร้างข้อมูลแบบคลาสสิกกับ LLMs ทางนี้ขยายความคิดโดยอนุญาตให้ “ความคิด” ใดก็ได้เชื่อมโยงกับความคิดอื่นในโครงสร้างกราฟ โครงสร้างเครือข่ายของความคิดเชื่อมโยงกันอย่างใกล้ชิดกับกระบวนการรับรู้ของมนุษย์

โครงสร้างกราฟของ GoT น่าจะให้การแสดงความคิดของมนุษย์ที่แม่นยํากว่าเมื่อเทียบกับ CoT หรือ ToT ในสถานการณ์ส่วนใหญ่ แม้ว่าจะมีบางกรณีที่รูปแบบความคิดของเราอาจมีลักษณะคล้ายกับโซ่หรือต้นไม้ (เช่นเมื่อพัฒนาแผนฉุกเฉินหรือขั้นตอนการปฏิบัติงานมาตรฐาน) แบบจําลองนี้สะท้อนความคิดของมนุษย์ได้ดีขึ้นซึ่งมักจะกระโดดข้ามความคิดต่าง ๆ แทนที่จะทําตามคําสั่งตามลําดับที่เข้มงวด ในขณะที่บางสถานการณ์เช่นการพัฒนาแผนฉุกเฉินหรือขั้นตอนมาตรฐานอาจยังคงเป็นไปตามโครงสร้างแบบลูกโซ่หรือต้นไม้จิตใจของเรามักจะสร้างเว็บความคิดที่ซับซ้อนและเชื่อมโยงถึงกันซึ่งสอดคล้องกับโครงสร้างกราฟมากขึ้น

การใช้วิธีการแบบกราฟใน GoT ช่วยให้การสำรวจความคิดมีความยืดหยุ่นและกระชับมากขึ้น ซึ่งอาจส่งผลให้การแก้ปัญหาที่สร้างสรรค์และครอบคลุมมากขึ้นใน LLMs

การดำเนินการที่มีพื้นฐานเป็นกราฟแบบเรกูร์ซีฟนี้เป็นขั้นตอนเพียงเท่านั้นสู่การดำเนินงานของตัวตน การวิวัฒนาการถัดไปที่ชัดเจนคือการมีตัวแทนที่มากกว่าหนึ่งตัว ที่มีความเชี่ยวชาญของตนเอง ที่ถูกจัดระเบียบขึ้นสู่เป้าหมายที่เฉพาะเจาะจง ความสวยงามของตัวแทนอยู่ในการประกอบของพวกเขา

เอเจนต์ช่วยให้คุณสามารถทำให้ LLMs เป็นโมดูลและประสานงานพร้อมกันผ่านการประสานงานของหลายเอเจนต์

Multi-Agent Systems

แนวคิดของระบบมัลติเอเจนต์ไม่ใช่ระบบใหม่ รากเหง้าของมันย้อนกลับไปถึง "Society of Mind" ของ Marvin Minsky ซึ่งเสนอว่าจิตใจแบบแยกส่วนหลายตัวที่ทํางานร่วมกันสามารถมีประสิทธิภาพเหนือกว่าจิตใจเสาหินเดียว ChatGPT และ Claude เป็นตัวแทนเดี่ยว Mistral นิยมผสมของผู้เชี่ยวชาญ การขยายแนวคิดนี้ต่อไปเราเชื่อว่าสถาปัตยกรรมเครือข่ายตัวแทนจะเป็นสถานะสุดท้ายของโทโพโลยีข่าวกรองนี้

จากมุมมองของการจำลองจากธรรมชาติ ต่างจากโมเดล AI ที่มีล้านๆ นิวรอนที่เหมือนกันที่ถูกเชื่อมต่อกันอย่างสม่ำเสมอและทำนายได้ สมองมนุษย์ (ที่เป็นเครื่องจักรที่มีความมีสติ) มีความหลากหลายอย่างมากทั้งในระดับอวัยวะและระดับเซลล์ นิวรอนสื่อสารผ่านสัญญาณที่ซับซ้อน ที่เกี่ยวข้องกับความเข้มข้นของสารสื่อประสาน การกระทำในของเซลล์ภายใน และระบบการปรับเปลี่ยนต่าง ๆ ทำให้ฟังก์ชันของพวกเขามีระดับความซับซ้อนมากกว่าสถานะทวิภาคฐานเดียว

นี่แสดงให้เห็นว่าในชีววิทยา ความฉลาดไม่ได้เกิดจากจำนวนส่วนประกอบหรือขนาดของชุดข้อมูลการฝึกอบรม แต่เกิดจากประสิทธิภาพระหว่างหน่วยที่หลากหลายและเฉพาะเจาะจงที่มีปฏิกิริยาซับซ้อน—กระบวนการแอนะล็อกที่เกิดขึ้นโดยสิ่งที่เป็นธรรมชาติ

ด้วยเหตุนี้ ความคิดเกี่ยวกับการพัฒนาแบบจำนวนมากของโมเดลขนาดเล็กมากกว่าไม่กี่รูปแบบขนาดใหญ่ และการเปิดให้เกิดการจัดเรียงระหว่างนักแสดงเหล่านี้ อาจนำมาสู่นวัตกรรมในหลักสูตรการเรียนรู้ทางสมอง อย่างเช่น ระบบหลายเอเยนต์

การออกแบบระบบแบบหลายตัวแทนมีข้อดีหลายประการเหนือระบบตัวแทนเดียว: บํารุงรักษาได้มากขึ้นเข้าใจง่ายขึ้นและมีความยืดหยุ่นมากขึ้นในการขยาย แม้ในกรณีที่จําเป็นต้องใช้อินเทอร์เฟซเอเจนต์เดียวเท่านั้น แต่การนําไปใช้ภายในเฟรมเวิร์กแบบมัลติเอเจนต์สามารถทําให้ระบบเป็นแบบแยกส่วนได้มากขึ้นทําให้กระบวนการสําหรับนักพัฒนาง่ายขึ้นในการเพิ่มหรือลบส่วนประกอบตามต้องการ สิ่งสําคัญคือต้องตระหนักว่าสถาปัตยกรรมแบบหลายเอเจนต์อาจเป็นวิธีที่มีประสิทธิภาพสูงในการสร้างระบบตัวแทนเดียว

ในขณะที่โมเดลภาษาขนาดใหญ่ (LLMs) ได้แสดงความสามารถที่หลากหลาย เช่น การสร้างข้อความที่คล้ายมนุษย์ การแก้ปัญหาที่ซับซ้อน และการจัดการกับงานที่หลากหลาย ตัวแทน LLM แต่ละตัวก็เผชิญกับข้อจำกัดที่อาจจะทำให้ประสิทธิภาพของพวกเขาลดลงในการประยุกต์ใช้ในโลกแห่งความเป็นจริง

ด้านล่างเราจะสำรวจห้าความท้าทายสำคัญที่เกี่ยวข้องกับระบบที่มีความสามารถและสำรวจว่าการทำงานร่วมกันของหลายตัวแทนสามารถเอาชนะอุปสรรคเหล่านี้ ซึ่งจะปลดล็อคศักยภาพเต็มที่ของ LLMs

  • การเอาชนะอาการทางจิตที่ผ่านการตรวจสอบข้ามกันเอเจนต์ LLM บุคคลธุรกิจบางครั้งมีอาการทางจิต ทำให้มีข้อมูลที่ไม่ถูกต้องหรือไม่มีเหตุผล สิ่งนี้เกิดขึ้นแม้ว่าพวกเขาได้รับการฝึกฝนอย่างเต็มที่ โดยที่ผลลัพธ์อาจดูเป็นไปได้ แต่ขาดความแม่นยำทางกาจร ระบบมัลติเอเจนต์ช่วยให้เอเจนต์สามารถตรวจสอบข้อมูลข้ามกัน ลดความเสี่ยงของข้อผิดพลาด โดยการเฉพาะทางในพื้นที่ต่างๆ เอเจนต์ทำให้มั่นใจได้มากขึ้นและมีการตอบสนองที่เชื่อถือได้มากขึ้น
  • การขยายหน้าต่างบริบทผ่านกระบวนการประมวลผลแบบกระจาย LLM มีหน้าต่างบริบทที่จำกัด ทำให้ยากต่อการจัดการเอกสารหรือการสนทนาที่ยาวนาน ในกรอบการทำงานของหลายตัวแอนต์ เอเจนต์สามารถแบ่งโหลดการประมวลผล แต่ละตัวจัดการส่วนหนึ่งของบริบท ผ่านการสื่อสารระหว่างตัวแอนต์ พวกเขาสามารถรักษาความสอดคล้องกันข้ามข้อความทั้งหมดได้อย่างมีประสิทธิภาพ โดยการขยายหน้าต่างบริบท
  • การเพิ่มประสิทธิภาพผ่านการประมวลผลแบบขนานละเอียด LLM แต่ละตัวมักประมวลงานทีละอย่างที导致เวลาตอบสนองช้าลง ระบบมัลติเอเจนต์รองรับการประมวลแบบขนานละเอียดซึ่งช่วยให้เอเจนต์หลายตัวทำงานบนงานที่แตกต่างกันพร้อมกัน ซึ่งเพิ่มประสิทธิภาพและเร่งความตอบสนอง ทำให้ธุรกิจสามารถจัดการคำถามหลายๆ คำถามโดยไม่มีความล่าช้า
  • การส่งเสริมการทํางานร่วมกันสําหรับการแก้ปัญหาที่ซับซ้อน LLMs เพียงอย่างเดียวต้องดิ้นรนเพื่อแก้ปัญหาที่ซับซ้อนซึ่งต้องใช้ความเชี่ยวชาญที่หลากหลาย ระบบหลายตัวแทนส่งเสริมการทํางานร่วมกันโดยตัวแทนแต่ละคนมีทักษะและมุมมองที่เป็นเอกลักษณ์ ด้วยการทํางานร่วมกันเจ้าหน้าที่สามารถรับมือกับความท้าทายที่ซับซ้อนได้อย่างมีประสิทธิภาพมากขึ้นโดยนําเสนอโซลูชันที่ครอบคลุมและสร้างสรรค์มากขึ้น
  • การเพิ่มความเข้าถึงผ่านการปรับปรุงทรัพยากรการเรียน LLM ระดับสูงต้องการทรัพยากรคอมพิวเตอร์มาก ทำให้มีค่าใช้จ่ายสูงและไม่สามารถเข้าถึงได้ง่าย กรอบการทำงานของหลายตัวแยกจัดการทรัพยากรโดยกระจายงานให้กับตัวแยก เพื่อลดต้นทุนด้านการคำนวณโดยรวม ทำให้เทคโนโลยี AI มีความเหมาะสมและเข้าถึงได้กับหลายองค์กรมากขึ้น

ในขณะที่ระบบมัลติเอเจนต์มีข้อได้เปรียบที่น่าสนใจในการแก้ปัญหาแบบกระจายและการเพิ่มประสิทธิภาพทรัพยากร แต่ศักยภาพที่แท้จริงของพวกเขาจะเกิดขึ้นเมื่อเราพิจารณาการใช้งานที่ขอบของเครือข่าย ในขณะที่ AI ยังคงพัฒนาอย่างต่อเนื่องการบรรจบกันของสถาปัตยกรรมแบบหลายเอเจนต์กับ Edge Computing จะสร้างการทํางานร่วมกันที่ทรงพลัง ซึ่งไม่เพียงทําให้ไม่เพียง แต่ระบบอัจฉริยะในการทํางานร่วมกันเท่านั้น แต่ยังรวมถึงการประมวลผลที่แปลเป็นภาษาท้องถิ่นและมีประสิทธิภาพในอุปกรณ์นับไม่ถ้วน แนวทางแบบกระจายในการปรับใช้ AI นี้ขยายประโยชน์ของระบบมัลติเอเจนต์โดยธรรมชาติ โดยนําระบบอัจฉริยะเฉพาะด้านและความร่วมมือเข้าใกล้ตําแหน่งที่ต้องการมากที่สุด: ผู้ใช้ปลายทาง

ความฉลาดที่ด้านขอบ

การแพร่กระจายของ AI ทั่วทิศทางดิจิทัลกำลังขับเคลื่อนการสร้างโครงสร้างคำนวณเบื้องฐาน ภายในตัว AI กำลังถูกผสมผสานเข้าไปในโครงสร้างของการโต้ตอบดิจิทัลประจำวันของเรา เรากำลังเห็นการแบ่งแยกธรรมชาติของการคำนวณ: ศูนย์ข้อมูลข้อมูลที่เฉพาะเจาะจงจัดการกับการคิดอย่างซับซ้อนและงานที่เฉพาะเจาะจง ในขณะเดียวกันอุปกรณ์ขอบจะประมวลผลคำถามที่เป็นประสบการณ์และเฉพาะบุคคลอย่างท้องถิ่น การเปลี่ยนทิศทางไปทางการอ้างอิงขอบนี้ไม่ใช่เพียงความชอบในโครงสร้าง—มันเป็นความจำเป็นที่มาจากปัจจัยที่สำคัญมากมาย

โดยประเด็นหลักคือปริมาณของการตอบรับที่เน้นไปที่ AI จะทำให้ผู้ให้บริการการอ่านในรูปแบบที่เซ็นทรัลไม่สามารถรับมือได้ ทำให้ต้องมีความต้องการต่อแบนด์วิดท์และปัญหาด้านความล่าช้าที่ไม่สามารถยอมรับได้

การประมวลผลทางขอบช่วยให้สามารถตอบสนองแบบเรียลไทม์ที่สำคัญสำหรับแอปพลิเคชันเช่นยานยนต์อัตโนมัติ เสริมความเป็นจริงเสริมและอุปกรณ์ IoT

ที่สาม การอินเฟอเรนซ์ภายในพื้นที่ จะรักษาความเป็นส่วนตัวของผู้ใช้ได้โดยการเก็บข้อมูลที่ละเอียดอ่อนบนอุปกรณ์ส่วนตัว ที่สี่ การคำนวณด้านขอบ ลดการใช้พลังงานและรอยรอยคาร์บอนอย่างมากโดยการลดการเคลื่อนย้ายข้อมูลทางเครือข่าย

สุดท้ายการตัดสินใจของขอบเขตช่วยให้ฟังก์ชันแบบออฟไลน์และความทนทานมีการทำงานอย่างมีประสิทธิภาพโดยระบบ AI ยังคงอยู่แม้ว่าการเชื่อมต่อเครือข่ายจะถูกทำลาย

แบบจำลองสัญญาณอัจฉริยะแบบกระจายนี้ไม่เพียงแค่เป็นการปรับปรุงระบบปัจจุบันของเรา แต่เป็นการสร้างภาพใหม่ของวิธีการใช้งานและปฏิสัมพันธ์กับ AI ในโลกที่เชื่อมต่อกันอย่างต่อเนื่อง

นอกจากนี้เรากำลังเห็นการเปลี่ยนแปลงพื้นฐานในความต้องการทางคอมพิวเตอร์ของ LLMs ในขณะที่ทศวรรษที่ผ่านมาได้ถูกครอบครองโดยความต้องการทางคอมพิวเตอร์ขนาดใหญ่ในการฝึกโมเดลภาษาขนาดใหญ่ ตอนนี้เรากำลังเข้าสู่ยุคที่การคำนวณเวลาอินเฟอเรนซ์เป็นสิ่งสำคัญ การเปลี่ยนแปลงนี้เป็นเรื่องที่ชัดเจนมาก โดยการเกิดขึ้นของระบบ AI ที่สามารถกระทำเอง เช่น OpenAI's Q* breakthrough ซึ่งได้แสดงให้เห็นว่าการคิดอย่างไดนามิคต้องการทรัพยากรทางคอมพิวเตอร์แบบเรียลไทม์ที่สำคัญมาก

ซึ่งแตกต่างจากการประมวลผลเวลาการฝึกอบรมซึ่งเป็นการลงทุนเพียงครั้งเดียวในการพัฒนาแบบจําลองการคํานวณเวลาอนุมานแสดงถึงการสนทนาเชิงคํานวณอย่างต่อเนื่องที่จําเป็นสําหรับตัวแทนอิสระในการให้เหตุผลวางแผนและปรับให้เข้ากับสถานการณ์ใหม่ ๆ การเปลี่ยนจากการฝึกอบรมโมเดลแบบคงที่ไปเป็นการให้เหตุผลแบบเอเจนต์แบบไดนามิกจําเป็นต้องมีการทบทวนโครงสร้างพื้นฐานด้านการคํานวณของเราใหม่อย่างรุนแรง ซึ่งการประมวลผลแบบเอดจ์ไม่ได้เป็นเพียงข้อได้เปรียบแต่จําเป็น

เมื่อการเปลี่ยนแปลงนี้เกิดขึ้น เรากำลังเห็นการเกิดขึ้นของตลาดการอุปกรณ์ edge inference แบบ peer-to-peer ที่เป็นพันล้านเครื่องมือที่เชื่อมต่อกัน ตั้งแต่สมาร์ทโฟนจนถึงระบบบ้านอัจฉริยะ ซึ่งเป็นตลาดการคำนวณที่เคลื่อนไหวได้ อุปกรณ์เหล่านี้สามารถซื้อขายความสามารถในการคำนวณได้อย่างไม่มีข้อกังขา สร้างตลาดอินทรีย์ที่ทรัพยากรการคำนวณไหลไปที่ที่มีความจำเป็นที่สุด ความสามารถในการคำนวณที่เกินของอุปกรณ์ที่ไม่ได้ใช้งานจะกลายเป็นทรัพยากรที่มีค่า สามารถซื้อขายได้แบบเรียลไทม์ ทำให้มีโครงสร้างพื้นฐานที่มีประสิทธิภาพและทนทานมากกว่าระบบที่มีการควบคุมแบบดั้งเดิม

การคํานวณการอนุมานที่เป็นประชาธิปไตยนี้ไม่เพียง แต่เพิ่มประสิทธิภาพการใช้ทรัพยากร แต่ยังสร้างโอกาสทางเศรษฐกิจใหม่ ๆ ภายในระบบนิเวศดิจิทัลซึ่งอุปกรณ์ที่เชื่อมต่อทุกเครื่องจะกลายเป็นผู้ให้บริการขนาดเล็กที่มีศักยภาพของความสามารถของ AI อนาคตของ AI จะโดดเด่นไม่เพียง แต่ด้วยพลังของแต่ละรุ่น แต่ด้วยความฉลาดโดยรวมของอุปกรณ์ขอบที่เชื่อมต่อกันซึ่งก่อให้เกิดตลาดการอนุมานที่เป็นประชาธิปไตยทั่วโลกซึ่งคล้ายกับตลาดสปอตสําหรับการอนุมานที่ตรวจสอบได้ตามอุปสงค์และอุปทาน

Agent Centric Interaction

LLMs ตอนนี้ช่วยให้เราสามารถเข้าถึงข้อมูลมากมายผ่านทางการสนทนาได้ แทนที่จะใช้วิธีการเรียกดูแบบเดิม การเข้าถึงแบบสนทนานี้จะกลายเป็นสิ่งที่เจาะจงและใกล้ชิดมากขึ้นเร็ว ๆ นี้ เพราะอินเทอร์เน็ตกำลังเปลี่ยนแปลงเป็นแพลตฟอร์มสำหรับตัวแทน AI ไม่ใช่ผู้ใช้งานมนุษย์

จากมุมมองของผู้ใช้ การเน้นจะเปลี่ยนจากการระบุ "โมเดลที่ดีที่สุด" เป็นการได้รับคำตอบที่เหมาะสมสุด คำตอบที่ดีกว่าอยู่ที่การรวมข้อมูลส่วนตัวของผู้ใช้พร้อมกับความรู้ทั่วไปในอินเทอร์เน็ต ในเริ่มต้น หน้าต่างบริบทที่ใหญ่กว่าและการสืบค้นเพิ่มเติม (RAG) จะช่วยรวมข้อมูลส่วนบุคคล แต่ในที่สุด ข้อมูลส่วนบุคคลจะเกินข้อมูลทั่วไปในอินเทอร์เน็ตในเรื่องสำคัญ

นี้จะทำให้เกิดอนาคตที่เราแต่ละคนมีโมเดล AI ส่วนตัวที่จะมีปฏิสัมพันธ์กับโมเดลของอินเทอร์เน็ตที่กว้างขวาง เริ่มต้นแล้ว การปรับใช้ส่วนตัวจะเกิดขึ้นพร้อมกับโมเดลระยะไกล แต่ความกังวลเกี่ยวกับความเป็นส่วนตัวและความเร็วในการตอบสนองจะเร่งด่วนให้มีปฏิสัมพันธ์มากขึ้นบนอุปกรณ์ท้องถิ่น สิ่งนี้จะสร้างขอบเขตใหม่ - ไม่ใช่ระหว่างมนุษย์กับเครื่อง แต่ระหว่างโมเดลส่วนตัวของเราและโมเดลของผู้เชี่ยวชาญของอินเทอร์เน็ต

รูปแบบอินเทอร์เน็ตแบบดั้งเดิมในการเข้าถึงข้อมูลดิบจะล้าสมัย โมเดลท้องถิ่นของคุณจะสื่อสารกับโมเดลผู้เชี่ยวชาญระยะไกลเพื่อรวบรวมข้อมูล ซึ่งจะประมวลผลและนําเสนอให้คุณด้วยวิธีที่มีแบนด์วิธสูงและเป็นส่วนตัวที่สุดเท่าที่จะเป็นไปได้ โมเดลส่วนตัวเหล่านี้จะขาดไม่ได้มากขึ้นเมื่อพวกเขาเรียนรู้เพิ่มเติมเกี่ยวกับความชอบและนิสัยของคุณ

อินเทอร์เน็ตจะเปลี่ยนแปลงเป็นระบบนิเวศที่เชื่อมโยงกันระหว่างแบบจำลองที่เกี่ยวข้องในระดับท้องถิ่นที่มีบทบาทสำคัญและแบบจำลองของผู้เชี่ยวชาญที่มีความรู้สูงในระดับไกล สิ่งนี้จะเกี่ยวข้องกับเทคโนโลยีใหม่เช่นการเรียนรู้ฟีเดอเรทเพื่ออัปเดตข้อมูลระหว่างแบบจำลองเหล่านี้ จากนั้นเมื่อเศรษฐกิจของเครื่องจักรเข้าสู่ขั้นตอนการพัฒนาใหม่ เราจะต้องมองใหม่เกี่ยวกับส่วนย่อยทางคณิตศาสตร์ที่เกี่ยวข้องกับการคำนวณ ความสามารถในการขยายของอุปกรณ์ และการชำระเงิน สิ่งนี้เป็นที่เปลี่ยนแปลงของพื้นที่ข้อมูลที่เป็นศูนย์กลางของตัวแทน ต้นทุนสูง สามารถสร้างสรรค์ได้ สามารถเรียนรู้ได้ด้วยตนเองและเปลี่ยนแปลงไปเรื่อย ๆ

โครงสร้างสำหรับโปรโตคอลที่มีเอเจนติก

ใน Agentic Web การแสดงออกของมนุษย์ - เอเจนต์ไปยังการสื่อสารระหว่างเอเยนต์จะเปลี่ยนแปลงเป็นเครือข่ายที่ซับซ้อนขึ้น โครงสร้างนี้นำเสนอการวางแผนพื้นฐานใหม่ของโครงสร้างของอินเทอร์เน็ต ที่ตัวแทนกลางกลายเป็นอินเตอร์เฟซหลักสำหรับการสื่อสารดิจิทัล ด้านล่างนี้เราได้เน้นข้อมูลพื้นฐานที่จำเป็นสำหรับโปรโตคอล Agentic

Sovereign Identity

  • การเปลี่ยนข้อมูลประจําตัวดิจิทัลจากที่อยู่ IP แบบเดิมเป็นคู่คีย์สาธารณะที่เข้ารหัสซึ่งเป็นเจ้าของโดยนักแสดงตัวแทน
  • ระบบชื่อเนมเบสที่ใช้ Blockchain จะแทนที่ระบบ DNS แบบเดิม โดยการกำจัดจุดควบคุมที่เป็นจุดศูนย์
  • ระบบลายนิ้วมือติดตามความน่าเชื่อถือและตัวชี้วัดความสามารถของตัวแทน
  • Zero-knowledge proofs เป็นเครื่องมือที่ช่วยให้การตรวจสอบตัวตนที่สอดคล้องกับความเป็นส่วนตัวได้
  • ความสามารถในการรวมตัวของตัวตนช่วยให้เอเจนต์สามารถจัดการกับบทบาทและบทบาทหลาย ๆ อย่าง

ตัวแทนอัตโนมัส

Entity ที่ดำเนินการด้วยตนเองที่สามารถ: เข้าใจภาษาธรรมชาติและการแก้ไขปัญหา

การวางแผนแบบหลายขั้นตอนและการแยกงาน

การบริหารจัดการทรัพยากรและปรับปรุง

เรียนรู้จากการปฏิสัมพันธ์และคำติชม

  • การตัดสินใจโดยอิสระภายใต้พารามิเตอร์ที่กำหนดไว้
  • ความเชี่ยวชาญของตัวแทนและตลาดสำหรับความสามารถที่เฉพาะเจาะจง
  • เครื่องมือรักษาความปลอดภัยและโปรโตคอลการจัดเรียงที่ซึ่งมีอยู่แบบฝังตัวอยู่ด้วย

โครงสร้างพื้นฐานข้อมูล

  • ความสามารถในการรับเข้าข้อมูลแบบเรียลไทม์และประมวลผล
  • กลไกการตรวจสอบและการตรวจสอบข้อมูลแบบกระจาย

ระบบผสมที่รวม: zkTLS

ชุดข้อมูลการฝึกอบรมแบบดั้งเดิม

การเก็บข้อมูลและการสังเคราะห์ข้อมูลแบบเรียลไทม์

  • เครือข่ายการเรียนรู้ร่วมมือ

RLHF (Reinforcement Learning from Human Feedback) networksDistributed feedback collection

กลไกการตัดสินใจที่มีน้ำหนักคุณภาพ

  • โปรโตคอลการปรับแบบจำลองไดนามิก

Compute Layer

โปรโตคอลการอนุมานที่สามารถยืนยันได้: ความสมบูรณ์ของการคำนวณ

ความสามารถในการทำซ้ำผลลัพธ์

ประสิทธิภาพในการใช้ทรัพยากร

  • โครงสร้างคำนามเพื่อคำนวณแบบกระจาย ซึ่งมี: ตลาดคำนวณแบบ peer-to-peer

ระบบการพิสูจน์ความถูกต้องของการคำนวณ

การจัดสรรทรัพยากรแบบไดนามิก

  • การรวมการคำนวณด้านขอบ

ระบบนิเวศรุ่น

โครงสร้างโมเดลลำดับชั้น: โมเดลภาษาเล็กพิเศษ (Small Language Models) ที่เฉพาะงาน

LLMs สำหรับวัตถุประสงค์ทั่วไป

โมเดลหลากลูกผสมที่พิเศษ

  • Multi-Modal LAMs (Large Action Models)
  • การประกอบและการจัดการโมเดล
  • ความสามารถในการเรียนรู้และปรับตัวอย่างต่อเนื่อง
  • ตัวอินเตอร์เฟสและโปรโตคอลระดับมาตรฐาน

กรอบปฏิบัติการ

  • โปรโตคอลทางคริปโตสำหรับการโต้ตอบของเอเจ้นต์ที่ปลอดภัย
  • ระบบบริหารสิทธิ์ทรัพย์สินดิจิทัล
  • โครงสร้างแรงจูงใจทางเศรษฐกิจ

กลไกการปกครองสำหรับ: การแก้ไขข้อขัดแย้ง

การจัดสรรทรัพยากร

  • อัปเดตโปรโตคอล

สภาวะการดำเนินงานแบบขนานที่ทำให้สามารถประมวลผลงานพร้อมกันได้: การประมวลผลงานพร้อมกัน

การแยกทรัพยากร

การบริหารจัดการสถานะ

  • การแก้ไขข้อขัดแย้ง

ตลาดเอเจนติก

  • พื้นฐาน Onchain สำหรับ Identity (Gnosis, Squad multisigs)
  • เศรษฐศาสตร์และการค้าระหว่างตัวแทน

เอเจ้นต์เป็นเจ้าของส่วนหนึ่งของวงศ์โทเค็นตั้งแต่บริสุทธิ์

  • ตลาดการพิสูจน์ที่รวมกันที่จ่ายผ่าน Likuiditi
  • คีย์ Onchain ที่ควบคุมบัญชี offchain

เอเจ้นท์กลายเป็นทรัพยากรให้ผลตอบแทน อย่างกิเอ็นทิก DAOs

  • การปกครองและเงินปันผล

สร้างโครงสร้างที่ยิ่งใหญ่สำหรับสตรีมเทคโนโลยี

การออกแบบระบบกระจายที่ทันสมัยนำเสนอแรงบันดาลใจและขั้นตอนพื้นฐานที่สามารถเปิดใช้งาน โปรโตคอลเอเจนติก เช่น สถาปัตยกรรมที่เป็นเหตุการณ์และโมเดลนักแสดงคำนวณอย่างตรงไปตรงมา

โมเดลนักแสดง提供了一个优雅的理论基础,用于实现代理系统。这个计算模型将“演员”视为计算的通用原语,其中每个演员都可以:

  1. Process messages
  2. ตัดสินใจในระดับท้องถิ่น
  3. สร้างนักแสดงเพิ่มเติม
  4. ส่งข้อความถึงนักแสดงอื่นๆ
  5. กำหนดวิธีการตอบกลับข้อความถัดไปที่ได้รับ

ข้อดีหลักของแบบจำลองผู้แสดงบทสำหรับระบบตัวแทนรวมถึง:

  • Isolation: แต่ละตัวแสดงบทบาทอย่างอิสระ การรักษาสถานะและการไหลของควบคุมของตนเอง
  • การสื่อสารแบบไม่เชื่อมต่อกัน: ข้อความระหว่างตัวแสดงไม่บล็อก ทำให้การประมวลผลแบบขนานเป็นไปได้อย่างมีประสิทธิภาพ
  • ความโปร่งใสของตําแหน่ง: นักแสดงสามารถสื่อสารได้โดยไม่คํานึงถึงตําแหน่งทางกายภาพในเครือข่าย
  • ความทนทานของความผิดพลาด: ความทนทานของระบบผ่านการแยกตัวและลำดับความคุ้มครองของนักแสดง
  • Scalability: การสนับสนุนธรรมชาติสำหรับระบบกระจายและการคำนวณแบบขนาน

เราขอเสนอ Neuron ซึ่งเป็นการนำไปใช้ในทางปฏิบัติของโปรโตคอลที่เป็นทฤษฎีนี้ผ่านโครงสถาปัตยกรรมที่กระจายอยู่บนหลายชั้น โดยรวมถึงเนมสเปซบล็อกเชน และเครือข่ายที่รวมกัน CRDTs และ DHTs โดยที่แต่ละชั้นบริการวัตถุประสงค์ที่แตกต่างกันในสแต็กโปรโตคอล เราได้รับแรงบันดาลจาก Urbit และ Holochain ผู้บุกเบิกแรกเริ่มในการออกแบบระบบปฏิบัติการแบบ p2p

ใน Neuron เลเยอร์บล็อกเชนให้เนมสเปซและข้อมูลประจําตัวที่ตรวจสอบได้ทําให้สามารถระบุที่อยู่และการค้นพบตัวแทนได้ในขณะที่ยังคงรักษาหลักฐานการเข้ารหัสความสามารถและชื่อเสียง ข้างต้นเลเยอร์ DHT ช่วยอํานวยความสะดวกในการค้นหาเอเจนต์และโหนดที่มีประสิทธิภาพควบคู่ไปกับการกําหนดเส้นทางเนื้อหาด้วยเวลาการค้นหา O (log n) ลดการดําเนินงานแบบ on-chain ในขณะที่เปิดใช้งานการค้นหาเพียร์ที่รู้จักในท้องถิ่น การซิงโครไนซ์สถานะระหว่างโหนดที่ติดต่อกับภายนอกได้รับการจัดการผ่าน CRDTs ทําให้เอเจนต์และโหนดสามารถรักษามุมมองที่สอดคล้องกันของสถานะที่ใช้ร่วมกันโดยไม่ต้องใช้ฉันทามติทั่วโลกสําหรับทุกการโต้ตอบ

สถาปัตยกรรมนี้แมปตามธรรมชาติกับเครือข่ายแบบรวมศูนย์ที่ตัวแทนอิสระทํางานเป็นโหนดอธิปไตยที่อาศัยอยู่บนอุปกรณ์ที่มีการอนุมานขอบท้องถิ่นโดยใช้รูปแบบ Actor Model โดเมนสหพันธรัฐสามารถจัดระเบียบตามความสามารถของเอเจนต์ โดย DHT ให้การกําหนดเส้นทางและการค้นพบที่มีประสิทธิภาพภายในและข้ามโดเมน ตัวแทนแต่ละคนทําหน้าที่เป็นนักแสดงอิสระที่มีสถานะของตัวเองในขณะที่เลเยอร์ CRDT ช่วยให้มั่นใจได้ถึงความสอดคล้องในที่สุดทั่วทั้งสหพันธรัฐ วิธีการแบบหลายชั้นนี้เปิดใช้งานความสามารถที่สําคัญหลายประการ:

การประสานงานแบบกระจาย

  • บล็อกเชนสำหรับการยืนยันตัวตนและชื่อเรียกโลกที่เป็นอิสระ
  • DHT สำหรับการค้นพบเพียรและโหนดอย่างมีประสิทธิภาพและการเรียกข้อมูล O(log n)
  • CRDTs for concurrent state synchronization and multi-agent coordination

การดำเนินงานที่มีขนาดขยายได้

  • โทโพโลยีการแบ่งเขตระบบสหพันธ์
  • กลยุทธการจัดเก็บข้อมูลแบบชั้น
  • การนำทางคำขอที่ตระหนักถึงสถานที่
  • การกระจายโหลดตามความสามารถ

System Resilience

  • ไม่มีจุดเสียหายเดียว
  • การดำเนินงานต่อเนื่องขณะที่มีการแบ่งส่วน
  • การปรับความสอดคล้องของสถานะโดยอัตโนมัติ
  • โครงสร้างการควบคุมสำหรับความทนทานของข้อผิดพลาด

การนำเสนอวิธีการนี้มีความเข้มแข็งเพื่อให้มีพื้นฐานที่แข็งแกร่งสำหรับการสร้างระบบที่ซับซ้อนของตัวแทนในขณะที่ยังคงคุณสมบัติสำคัญเช่นความเอกรักษ์ ความยืดหยุ่น และความทนทานที่จำเป็นสำหรับการปฏิสัมพันธ์ระหว่างตัวแทน

Final Thoughts

Agentic Web นับเป็นวิวัฒนาการที่สําคัญในการปฏิสัมพันธ์ระหว่างมนุษย์กับคอมพิวเตอร์ซึ่งอยู่เหนือการพัฒนาตามลําดับของยุคก่อนหน้าเพื่อสร้างกระบวนทัศน์ใหม่ของการดํารงอยู่ทางดิจิทัล ซึ่งแตกต่างจากการทําซ้ําก่อนหน้านี้ที่เพียงแค่เปลี่ยนวิธีที่เราบริโภคหรือเป็นเจ้าของข้อมูล Agentic Web เปลี่ยนอินเทอร์เน็ตจากแพลตฟอร์มที่เน้นมนุษย์เป็นศูนย์กลางให้เป็นสารตั้งต้นอัจฉริยะที่ตัวแทนอิสระกลายเป็นนักแสดงหลัก การเปลี่ยนแปลงนี้ขับเคลื่อนโดยการบรรจบกันของ Edge Computing โมเดลภาษาขนาดใหญ่และโปรโตคอลแบบกระจายอํานาจสร้างระบบนิเวศที่โมเดล AI ส่วนบุคคลเชื่อมต่อกับระบบผู้เชี่ยวชาญเฉพาะทางได้อย่างราบรื่น

เมื่อเราเคลื่อนที่ไปในทิศทางนี้ที่ให้ความสำคัญกับตัวแทน ขอบเขตระหว่างสตรีมาส์และสตรีมาชีนอย่างเริ่มจะทำให้เบลอลง ถูกสิ้นสุดโดยความสัมพันธ์แบบสัญญาเปรียบที่ตัวเอกส่วนบุคคลของเราบริการเป็นส่วนขยายดิจิตอลของเรา ที่เข้าใจบริบทของเรา คาดการณ์ความต้องการของเรา และการทราบด้วยตนเองเดินทางในทิวทัศน์ที่กว้างขวางของสตรีมาชีนกระจาย The Agentic Web จึงไม่เพียงเพียงแค่การก้าวหน้าทางเทคโนโลยี แต่เป็นการสร้างภาพลวงตาของศักยภาพของมนุษย์ในยุคดิจิตอล ที่ทุกๆ ความสัมพันธ์กลายเป็นโอกาสสำหรับสตรีมาชีนอุจจาระและทุกอุปกรณ์กลายเป็นโหนดในเครือข่ายโลกของระบบ AI ที่ร่วมมือกัน

เช่นเดียวกับมนุษย์ที่นำทางในมิติทางกายภาพของพื้นที่และเวลา ตัวแทนที่ไม่สนับสนุนตนเองอยู่ในมิติพื้นฐานของตนเอง: พื้นที่บล็อกสำหรับการอยู่อย่างมีชีวิตและเวลาการคิด ตารางองค์ความรู้ดิจิตอลนี้สะท้อนภาคจริงของเรา - ที่มนุษย์เดินทางผ่านระยะทางและสัมผัสการไหลของเวลาตัวแทนเคลื่อนที่ผ่านพิสูจน์ทางคริปโตและรอบการคำนวณ สร้างจักรวาลแบบขนานขององค์ความรู้ของอัลกอริทึม

ไม่สามารถหลีกเลี่ยงได้ว่าองค์กรในพื้นที่ล่วงลับจะดำเนินการบนพื้นที่บล็อกเชนที่กระจายอยู่

คำปฏิเสธ:

  1. บทความนี้ถูกพิมพ์ใหม่จาก[Azi.eth.sol | zo.me]. สิทธิ์ในการคัดลอกทั้งหมดนี้เป็นของผู้เขียนต้นฉบับ [ @MagicofAzi]. หากมีข้อปฏิเสธต่อการพิมพ์ฉบับนี้ โปรดติดต่อGate Learn ทีมและพวกเขาจะจัดการกับมันทันที
  2. คำปฏิเสธความรับผิดชอบ: มุมมองและความเห็นที่แสดงในบทความนี้เป็นสิ่งที่เป็นของผู้เขียนเท่านั้น และไม่เป็นที่ปรึกษาการลงทุนใด ๆ
  3. การแปลบทความเป็นภาษาอื่น ๆ ทำโดยทีมเรียนรู้ของเกต เว้นแต่ได้ระบุไว้ว่าห้ามคัดลอก กระจายหรือลอกเลียนแบบบทความที่ถูกแปล
ابدأ التداول الآن
اشترك وتداول لتحصل على جوائز ذهبية بقيمة
100 دولار أمريكي
و
5500 دولارًا أمريكيًا
لتجربة الإدارة المالية الذهبية!
It seems that you are attempting to access our services from a Restricted Location where Gate.io is unable to provide services. We apologize for any inconvenience this may cause. Currently, the Restricted Locations include but not limited to: the United States of America, Canada, Cambodia, Cuba, Iran, North Korea and so on. For more information regarding the Restricted Locations, please refer to the User Agreement. Should you have any other questions, please contact our Customer Support Team.