OpenAI выпускает CoT Monitoring, чтобы остановить вредоносное поведение больших моделей

Генерация тезисов в процессе

Golden Finance сообщила, что OpenAI выпустила последнее исследование, используя мониторинг CoT (цепочка мыслей), она может предотвратить вредоносное поведение, такое как большие модели, говорящие чепуху и скрывающие истинные намерения, а также является одним из эффективных инструментов для надзора за супермоделями. OpenAI использует недавно выпущенную передовую модель o3-mini в качестве объекта мониторинга, а более слабую модель GPT-4o — в качестве монитора. Тестовая среда — это задача кодирования, которая требует от ИИ реализации функциональности в кодовой базе для прохождения модульных тестов. Результаты показали, что монитор CoT показал хорошие результаты в обнаружении систематического поведения «взлома вознаграждения» с коэффициентом запоминаемости до 95%, что намного превышает 60% поведения, которое только отслеживалось.

O33.56%

GPT-26.93%

Посмотреть Оригинал

Содержание носит исключительно справочный характер и не является предложением или офертой. Консультации по инвестициям, налогообложению или юридическим вопросам не предоставляются. Более подробную информацию о рисках см. в разделе «Дисклеймер».

Награда
лайк
комментарий
Поделиться

комментарий

0/400

Нет комментариев

Тема
#BTC#
191504 посты
#ETH#
119166 посты
#PI#
92395 посты
4#GateioInto11#
75926 посты
5#ContentStar#
63742 посты
6#BOME#
58985 посты
7#GT#
55667 посты
8#DOGE#
52556 посты
9#MAGA#
51259 посты
10#SLERF#
50237 посты

Закрепить

Карта сайта