Віталік Нова стаття: Нова парадигма майбутнього управління «AI Engine + людське кермо»

Ще один спосіб дослідження в багатьох випадках - зробити простий механізм правилами гри, щоб штучний інтелект став гравцем.

Заголовок оригіналу: " Штучний інтелект як двигун, людина як кермо "

Автор: Віталік, засновник Ethereum

Компіляція: Байшуй, Золота фінансова

Якщо ви запитаєте людей, що саме їм подобається в демократичній структурі, чи то урядові, робочому місці, чи у DAO на основі блокчейну, ви часто почуєте однакові аргументи: вони уникають концентрації влади, вони надають користувачам сильні гарантії, оскільки ніхто не може вільно змінювати напрямок системи, вони можуть робити більш якісні рішення, збираючи багато точок зору та мудрості.

Якщо ви попросите людей назвати аспекти демократичної структури, які їм не подобаються, вони часто вказують на ті самі скарги: звичайні виборці недостатньо кваліфіковані, оскільки кожен виборець має дуже малу можливість вплинути на результат, мало хто з виборців вкладає високоякісне мислення в прийняття рішень, а також ви часто отримуєте низький рівень участі (що робить систему вразливою до атак) або фактичну централізацію, оскільки кожен за замовчуванням довіряє та реплікує деякі впливові погляди.

Мета цієї статті - дослідити парадигму, яка може дозволити нам отримати користь від демократичної структури за допомогою штучного інтелекту без негативних наслідків. "Штучний інтелект - це двигун, а людина - кермо". Людина надає системі лише невелику кількість інформації, можливо, лише кілька сотень, проте ця інформація дуже ретельно продумана й має високу якість. Штучний інтелект розглядає ці дані як "цільову функцію" і безперервно приймає велику кількість рішень, щоб максимально досягти цієї мети. Зокрема, у цій статті буде розглянуто цікаве питання: чи можемо ми це зробити, не ставлячи окремий штучний інтелект в центр, а залежачи від конкурентного відкритого ринку, в якому може вільно брати участь будь-який штучний інтелект (або людино-машинний гібрид)?

Зміст

Чому не дати прямий AI керувати?
Футархія
Дистиляція людського судження
Глибоке фінансування (Deep funding)
Збільшити конфіденційність
Переваги дизайну двигуна + керма

Чому не зробити так, щоб відповідала за це штучний інтелект?

Найпростіший спосіб включити людські уподобання в механізм на основі штучного інтелекту - створити модель штучного інтелекту та якимось чином введіть їх у цю модель. Існують прості способи зробити це: вам просто потрібно розмістити текстовий файл зі списком інструкцій для персоналу в системі нагадувань. Потім ви можете надати штучному інтелекту доступ до Інтернету за допомогою одного з багатьох «фреймворків AI-агентів», передати йому ключі до ваших активів та профілів у соціальних мережах, і ви вже успішно завершили завдання.

Після кількох ітерацій це може бути достатньо для задоволення потреб багатьох випадків використання, і я повністю очікую, що в найближчому майбутньому ми побачимо багато структур, які включатимуть виконання команд, наданих штучним інтелектом для читання групи (навіть в реальному часі) та вживання відповідних заходів.

Ця структура не є ідеальною як механізм управління, як довгострокова інституція. Цінною рисою, якою повинна володіти довгострокова установа, є довіра і нейтральність. У своєму дописі, який представляє цю концепцію, я перерахував чотири цінні атрибути надійного нейтралітету:

Не вписуйте конкретних людей або конкретні результати в механізм
Відкритий та перевірений публічно виконавчий
Будьте простішими
Не змінюйте часто

LLM (або AI агент) задовольняє 0/4. Ця модель неодмінно кодує велику кількість конкретних людей і вподобань результатів під час навчання. Це іноді може призводити до несподіваних вподобань штучного інтелекту, наприклад, останнє дослідження свідчить про те, що головна LLM більше цінує життя в Пакистані, ніж в США (!!). Вона може бути відкритою для ваг, але це далеко не open-source; ми дійсно не знаємо, що приховано у глибинах моделі. Це протилежність простоти: Колмогорова складність LLM становить сотні мільярдів бітів, що приблизно відповідає загальній кількості всіх американських законів (федеральних + штатових + місцевих). І через швидкий розвиток штучного інтелекту вам доведеться оновлювати його кожні три місяці.

З цієї причини, ще один підхід, який я б віддав перевагу вивченню в багатьох випадках використання, полягає в тому, щоб проста механіка була правилами гри, а штучний інтелект був гравцем. Саме це розуміння робить ринок таким ефективним: правила є відносно дурною системою прав власності, маргінальні справи вирішуються судовою системою, яка повільно накопичує та коригує прецеденти, а вся інформація надходить від підприємців, які працюють «на маргінесі».

Одним «геймером» можуть бути LLM, групи LLM, які взаємодіють між собою та викликають різні інтернет-сервіси, різні комбінації ШІ + людина та багато інших конструктів; Як конструктору механізмів, вам не потрібно знати. Ідеальна мета полягає в тому, щоб мати механізм, який може працювати автоматично – якщо мета цього механізму полягає у виборі того, що фінансувати, то це має бути так само схоже на винагороду за блок Bitcoin або Ethereum.

Перевагою цього методу є:

Уникає включення в механізм якоїсь однієї моделі; Замість цього ви отримуєте відкритий ринок, що складається з безлічі різних гравців і архітектур, кожен з яких має свої різні упередження. Відкриті моделі, закриті моделі, групи агентів, гібриди людина+ШІ, роботи, нескінченні мавпи тощо – все це чесні ігри; Механізм нікого не дискримінує.
Цей механізм є відкритим. Хоча гравець не є, гра є відкритою - і це вже досить добре зрозуміла модель (наприклад, політичні партії та ринок працюють таким чином)
Цей механізм досить простий, тому способів, якими конструктор механізму закодував свою упередженість у дизайн, відносно мало.
Механізм не зміниться, навіть якщо архітектуру базових учасників потрібно буде переробляти кожні три місяці з цього моменту і до сингулярності.

Мета механізму наставництва – достовірно відобразити фундаментальні цілі учасників. Він повинен надати лише невеликий обсяг інформації, але це повинна бути якісна інформація.

Ви можете вважати, що цей механізм використовує асиметрію між висуненням та перевіркою відповідей. Це подібно до складання сканворду - важко знайти рішення, але легко перевірити правильність відповіді. Ви (i) створюєте відкритий ринок, де гравці виступають у ролі «розв'язувачів», а потім (ii) підтримуєте механізм, що працює людьми, для виконання набагато простіших завдань перевірки вже висунутих рішень.

Футархія

Futarchy спочатку була запропонована Робіном Хенсоном, яка означає "голосування за цінність, але ставка на віру". Механізм голосування вибирає набір цілей (може бути будь-якими, але вони повинні бути вимірювальними), а потім комбінує їх у вимір M. Коли вам потрібно прийняти рішення (на приклад, ТАК/НІ), ви створюєте умовний ринок: ви запитуєте людей ставити (i) на те, чи оберуть вони ТАК або НІ, (ii) якщо оберуть ТАК, то значення M, в іншому випадку - нуль, (iii) якщо оберуть НІ, то значення M, в іншому випадку - нуль. З цими трема змінними ви можете визначити, чи ринок вважає, що ТАК або НІ є більш вигідним для значення M.

«Ціна акцій компанії» (або, у випадку криптовалюти, ціна токена) є найбільш часто цитованим показником, оскільки його легко зрозуміти та виміряти, але механізм може підтримувати різноманітні показники: щомісячні активні користувачі, медіана щастя, про яке повідомляють самі респонденти, для певних груп, деякі децентралізовані показники, що піддаються кількісній оцінці, тощо.

Футаркія спочатку була винайдена ще до епохи штучного інтелекту. Тим не менш, Futarchy чудово вписується в парадигму «складні розв'язувачі, прості валідатори», описану в попередньому розділі, а трейдерами у Futarchy також може бути штучний інтелект (або комбінація людина + штучний інтелект). Роль «розв'язувача» (предиктивного ринкового трейдера) полягає у визначенні того, як кожен запропонований план вплине на значення майбутнього індикатора. Це важко. Якщо розв'язувач правильний, він заробляє гроші, а якщо він помиляється, він втрачає гроші. Валідаторам (людям, які голосують за індикатор, якщо вони помічають, що метрика «сфальсифікована» або застаріла, коригують метрику та визначають фактичне значення метрики в якийсь момент у майбутньому) потрібно лише відповісти на простіше запитання «Яка цінність метрики зараз?».

Парування людського розсуду

Дистиляція людського судження - це тип механізму, який працює наступним чином. Потрібно відповісти на велику кількість (припустимо, 1000000) питань. Приклади включають в себе природні ситуації:

Яка має бути винагорода для кожної людини в цьому списку за внесок у проєкт або завдання?
Які саме коментарі порушують правила соціальної мережі (або підгрупи)?
Які з цих адрес Ethereum представляють реальних та унікальних людей?
Які з цих фізичних об'єктів мають позитивний або негативний внесок у їхнє естетичне оточення?

Ви маєте команду, яка може відповісти на ці питання, але це вимагатиме великих зусиль для відповідей на кожне питання. Ви можете запросити команду відповісти на лише деякі питання (наприклад, якщо загальний список містить 1 000 000 елементів, команда може відповісти лише на 100 з них). Ви навіть можете задати команді непрямі питання: не запитуйте "Який відсоток від загального кредиту має отримати Еліс?", а запитайте "Чи Еліс або Боб мають отримати більше кредиту, і в кілька разів?". При розробці механізму журі ви можете використовувати перевірені часом механізми реального світу, такі як комітет фінансування, суд (визначення вартості рішення), оцінка тощо, звичайно, учасники журі також можуть використовувати новаторські інструменти дослідження штучного інтелекту, щоб допомогти їм знайти відповіді.

Потім ви дозволяєте будь-кому надати список цифрових відповідей на всіх питаннях (наприклад, надати оцінку кількості кредитів, що має отримати кожен учасник у всьому списку). Учасникам рекомендується використовувати штучний інтелект для виконання цього завдання, але вони можуть використовувати будь-яку технологію: штучний інтелект, змішаний з людиною, штучний інтелект, який має доступ до Інтернет-пошуку та може самостійно наймати інших людей або штучний інтелект, посилений теорією керування мавп тощо.

Як тільки повний список постачальників і суддів подадуть відповіді, список буде перевірений згідно відповідей суддів, і якась комбінація повного списку, яка найбільш сумісна з відповідями суддів, буде визнана остаточною відповіддю.

Механізм людського судження, що ґрунтується на випаровуванні, відрізняється від futarchy, але має кілька важливих схожостей:

У futarchy, "розв'язувачі" роблять прогнози, а "реальні дані" (які використовуються для винагороди або покарання розв'язувачів) - це пророчий механізм, який працює на основі вихідних показників, створений журі.
У людському розумінні дистиляції «вирішувальник» надає відповіді на велику кількість питань, при цьому прогнози, на яких вони ґрунтуються, є високоякісними відповідями на невелику частину цих питань, які надає журі.

Для прикладу іграшкового прикладу людського розсуду, призначеного для розподілу кредитів, буде використовуватися цей код Python. Скрипт вимагає, щоб ви були членом журі та містили повний список, який містить попередньо згенеровані (штучно та людський) відповіді, включені в коді. Цей механізм розпізнає лінійну комбінацію повного списку, яка найкраще відповідає відповідям журі. У даному випадку переможна комбінація - це 0.199 * відповідь Клода + 0.801 * відповідь Діпсік; ця комбінація краще відповідає відповідям журі, ніж будь-яка окрема модель. Ці коефіцієнти також будуть винагородою для учасників.

У цьому прикладі "перемоги Сорена" аспекти "людського керма" виявляються у двох випадках. По-перше, кожне питання вирішується на основі високоякісного людського судження, хоча це все ще використовує журі як "технократів" для оцінки результатів. По-друге, існує неявний механізм голосування, що визначає, чи є "перемога Сорена" правильною метою (наприклад, намагання залучити Сорена до альянсу або віддати йому всю територію на схід від певної ключової річки як мирний жест). Існують інші підбадьорені приклади людського судження, де завдання журі має більш прямий ціннісний характер: наприклад, уявіть розподілену соціальну мережу (або підспільноту), у якій завдання журі полягає в позначенні випадково вибраних форумних повідомлень як відповідних або не відповідних правилам спільноти.

У парадигмі людського розсуду існують деякі відкриті змінні:

Як взяти вибірку? Роллю повної списку є надання великої кількості відповідей; роль судді - надання відповідей високої якості. Нам потрібно вибирати суддів таким чином і обирати для них питання, щоб здатність моделі відповідати на питання суддів максимально відображала їх загальну продуктивність. Деякі розглядувані фактори включають:
Баланс між професійними знаннями та упередженням: Досвідчені судді зазвичай спеціалізуються в своїй професійній галузі, тому коли вони вибирають контент для оцінки, ви отримуєте більш якісний ввід. З іншого боку, надмірний вибір може призвести до упередженості (судді віддають перевагу контенту людей, з якими вони пов'язані) або слабкості вибірки (деякий контент систематично не оцінено).
Anti-Goodhart: Буде контент, який намагається «пограти» з механікою штучного інтелекту, наприклад, учасники генерують багато коду, який виглядає вражаюче, але марний. Це означає, що журі може це виявити, але статична модель штучного інтелекту цього не зробить, якщо не докладе всіх зусиль. Один із можливих способів зафіксувати таку поведінку — додати механізм оскарження, за допомогою якого люди можуть позначати такі спроби, гарантуючи їм винесення рішення судом присяжних (і, таким чином, стимулюючи розробників ШІ гарантувати, що вони захоплені правильно). Якщо присяжні погодяться, викривач отримає винагороду, а якщо присяжні не погодяться, буде сплачено штраф.
Якою функцією рейтингу ви користуєтеся? Одна з ідей, яка використовується в поточному пілотному проекті глибинного фінансування, полягає в тому, щоб запитати суддів, чи „А“ повинен отримати більше кредиту, ніж „B“, і наскільки більше? Функція рейтингу це score(x) = sum((log(x[B]) - log(x[A]) - log(juror_ratio)) ** 2 для (А, В, juror_ratio) у jury_answers): іншими словами, для кожної відповіді журі він порівнює, наскільки віддалена відноситься відносна відповідь в повному списку до відповіді судді і додає штраф, пропорційний квадрату цієї відстані (у логарифмічному просторі). Це призначено для того, щоб показати, що простір проектування функції рейтингу є досить обширним, і вибір функції рейтингу пов'язаний із вибором питань, які ви ставите перед суддею.
Як ви нагороджуєте тих, хто подає повний список? Ідеально, ви хочете часто надавати ненульову винагороду декільком учасникам, щоб уникнути монопольного механізму, але ви також хочете задовольнити наступні вимоги: учасники не можуть збільшувати винагороду, подаючи кілька разів однаковий (або трохи змінений) набір відповідей. Один зі способів - безпосередньо обчислити лінійну комбінацію повного списку відповідей, яка найкраще відповідає суддівському складу (коефіцієнти невід'ємні і сума - 1), і використовувати ці самі коефіцієнти для розподілу винагороди. Можливі інші способи.

Загалом метою є використання відомого ефективного, мінімізація упередженості та перевірений часом механізму людського розсуду (наприклад, уявіть, як судова система включає протистояння двох суперечливих сторін з великою кількістю інформації, але з упередженістю, тоді як суддя має обмежену кількість інформації, але може бути неупередженим), а також використання відкритого ринку штучного інтелекту як об'єктивного та недорогого прогностичного індикатора для цих механізмів (це схоже на роботу великої моделі передбачення «дистиляції»).

Глибоке фінансування (глибоке фінансування)

Глибока фінансова підтримка полягає в застосуванні людського виснаження суджень до проблеми вагових коефіцієнтів на картинці "Який відсоток кредиту X належить до Y?".

Найпростіший спосіб - просто проілюструвати це за допомогою прикладу:

Виведення прикладу глибокого фінансування на двох рівнях: походження думки Ethereum. Будь ласка, перегляньте код Python тут.

Мета тут полягає в тому, щоб розподілити кредити за філософський внесок в Ethereum. Розглянемо приклад:

Це показує, що 20.5% від загальної суми вирішуваного капіталу припадає на долю кіберпанк-руху, а 9.2% - на долю технологічного прогресивізму.
На кожному вузлі ви задаєте питання: якою мірою це оригінальний внесок (а отже, він заслуговує на похвалу за себе), а якою мірою це рекомбінація інших висхідних впливів? Для шифропанк-руху він на 40% новий і на 60% залежний.
Потім ви можете переглянути вплив цих вузлів: либертаріанський малореґульований та анархізм забезпечили 17,3% успіху для криптопанк-руху, тоді як пряма демократія Швейцарії отримала лише 5%.
Зауважте, однак, що ліберальний дрібний уряд і анархізм також надихнули монетарну філософію Bitcoin, тому вони вплинули на філософію Ethereum двома способами.
Щоб обчислити загальний внесок либертаріанського малого уряду та анархізму у Єфір, вам потрібно перемножити кожну грань на шляху, а потім додати шляхи: 0,205 * 0,6 * 0,173 + 0,195 * 0,648 * 0,201 ≈ 0,0466. Таким чином, якщо ви маєте пожертвувати 100 доларів, щоб винагородити всіх, хто вносить внесок у філософію Єфіріуму, згідно з цим симульованим кругом глибокого фінансування, прибільці либертаріанського малого уряду та анархіста отримають 4,66 долара.

Цей метод призначений для застосування в галузях, де висока чіткість структури працює на основі попередньої роботи. Академічна спільнота (згадайте: посилання на графік) та відкрите програмне забезпечення (згадайте: залежності бібліотек та віток) - це два природних приклади.

Мета добре функціонуючої системи глибокого фінансування полягає у створенні та підтримці глобального графа, де будь-який спонсор, зацікавлений у підтримці конкретного проекту, зможе надсилати кошти на адресу, що представляє цей вузол, а кошти автоматично поширюватимуться на їхні залежності (і рекурсію на їхні залежності тощо) залежно від ваги краю графіка.

Ви можете уявити протокол децентралізованого управління, який використовує вбудований механізм глибокого фінансування для випуску своїх токенів: децентралізоване управління в межах протоколу вибере журі, яке буде працювати з механізмом глибокого фінансування, оскільки протокол автоматично випускає токени та зберігає їх у відповідному вузлі. Таким чином, протокол програмно нагороджує всіх своїх прямих та опосередкованих учасників, нагадуючи, як біткоїн чи ефірні блоки винагороджують певний тип внесків (майнерів). Шляхом впливу на вагу краю журі може постійно визначати типи внесків, які воно цінує. Цей механізм може служити децентралізованим та довгостроково сталим альтернативним рішенням для видобутку, продажу або одноразового повітряного скидання.

Збільшити конфіденційність

Зазвичай, для правильного вирішення проблеми, зазначеної у вищезазначеному прикладі, потрібно мати доступ до приватної інформації: внутрішній чат організації, інформація, надана учасниками спільноти у конфіденційному порядку тощо. Однією з переваг «використання лише одного штучного інтелекту», особливо в середовищі невеликого масштабу, є те, що дозволяє одному штучному інтелекту мати доступ до інформації, що легше сприймається, ніж відкрита для всіх.

Для того, щоб людське судження або глибоке фінансування спрацювали в цих випадках, ми можемо спробувати використовувати криптографію, щоб безпечно надати ШІ доступ до приватної інформації. Ідея полягає у використанні багатосторонніх обчислювальних (MPC), повністю гомоморфного шифрування (FHE), довіреного середовища виконання (TEE) або подібних механізмів для надання приватної інформації, але лише якщо його єдиним результатом є "повний коміт", який потрапляє безпосередньо до механіки.

Якщо ви це зробите, то вам доведеться обмежити набір механізмів моделями штучного інтелекту (не людьми або комбінаціями ШІ + людини, тому що ви не можете змусити людей бачити дані) і специфічними для моделей, які працюють на якомусь конкретному субстраті (наприклад, MPC, FHE, довірене обладнання). Одним з основних напрямків досліджень є пошук практичних версій, які будуть досить ефективними і змістовними в найближчому майбутньому.

Переваги конструкції двигун + кермо

Такий дизайн має багато очікуваних переваг. До цього часу найважливішою перевагою є те, що вони дозволяють будувати DAO, де напрямок контролює людські виборці, але їх не турбує занадто багато рішень. Вони досягли компромісу, де кожен не повинен робити N рішень, але їхня влада полягає не лише в одному рішенні (зазвичай це працює), а й здатні викликати складні, важко виражені уподобання.

Крім того, цей механізм, здається, має властивість гладкості стимулювання. Під "гладкістю стимулювання" я розумію комбінацію двох факторів:

Розповсюдження: Будь-яка окрема дія, вжита механізмом голосування, не матиме непропорційного впливу на інтереси будь-якого окремого учасника.
Плутанина: зв'язок між рішеннями голосування і тим, як вони впливають на інтереси учасників, є більш складним і його важко прорахувати.

Терміни «обфускація» і «дифузія» тут взяті з криптографії, які є ключовими властивостями криптографічної безпеки і безпеки хеш-функцій.

В сучасному реальному світі одним з найкращих прикладів стимулювання є правова держава: високопосадовці уряду не регулярно вживають заходи у формі "дати компанії Алісі 200 мільйонів доларів", "штрафувати компанію Боба 100 мільйонів доларів", а замість цього вони встановлюють правила, призначені для рівного застосування до великої кількості учасників, і потім ці правила інтерпретуються іншою категорією учасників. Коли цей підхід працює, перевагою є значне зменшення корупції та інших форм підкупу. Коли його порушують (що часто відбувається на практиці), ці проблеми швидко розгортаються значно більшими масштабами.

Штучний інтелект, очевидно, стане важливою складовою майбутнього, що неминуче стане важливою складовою майбутнього управління. Але якщо ви дозволите ШІ брати участь у управлінні, це має очевидні ризики: ШІ має упередження, його можуть навмисно пошкодити під час тренування, і розвиток ШІ технологій настільки швидкий, що «дозволяти ШІ приймати рішення» насправді може означати «дозволяти людині, яка відповідає за підвищення рівня ШІ, приймати рішення». Екстрагування людського судження надає альтернативний шлях вперед, який дозволяє нам використовувати силу ШІ у відкритий вільний спосіб ринку, зберігаючи при цьому демократичний контроль людини.

Особлива подяка Devansh Mehta, Davide Crapis та Julian Zawistowski за відгуки та перегляд, а також Tina Zhen, Shaw Walters та іншим за обговорення.

HEART4.47%

ETH-2.37%

Переглянути оригінал

Контент має виключно довідковий характер і не є запрошенням до участі або пропозицією. Інвестиційні, податкові чи юридичні консультації не надаються. Перегляньте Відмову від відповідальності , щоб дізнатися більше про ризики.

Нагородити
подобається
Прокоментувати
Поділіться

Прокоментувати

0/400

Немає коментарів

Тема
#BTC#
192k публікації
#ETH#
119k публікації
#PI#
91k публікації
4#GateioInto11#
76k публікації
5#ContentStar#
64k публікації
6#BOME#
59k публікації
7#GT#
56k публікації
8#DOGE#
53k публікації
9#MAGA#
52k публікації
10#SLERF#
51k публікації

Закріпити

карта сайту