OpenAI lança monitoramento CoT para impedir o comportamento malicioso de grandes modelos

Geração de resumo em curso

Golden Finance informou que a OpenAI lançou a pesquisa mais recente, usando monitoramento CoT (cadeia de pensamento), pode prevenir comportamentos maliciosos, como grandes modelos falando bobagens e escondendo intenções verdadeiras, e também é uma das ferramentas eficazes para supervisionar super modelos. OpenAI usa o recém-lançado modelo de ponta o3-mini como o objeto monitorado, e o modelo GPT-4o mais fraco como o monitor. O ambiente de teste é uma tarefa de codificação que requer que a IA implemente a funcionalidade na base de código para passar nos testes de unidade. Os resultados mostraram que o monitor CoT teve um bom desempenho na deteção sistemática de comportamentos de "hacking de recompensa", com uma taxa de recordação de até 95%, excedendo em muito os 60% de comportamentos que foram apenas monitorados.

O33.56%

GPT-26.93%

Ver original

O conteúdo serve apenas de referência e não constitui uma solicitação ou oferta. Não é prestado qualquer aconselhamento em matéria de investimento, fiscal ou jurídica. Consulte a Declaração de exoneração de responsabilidade para obter mais informações sobre os riscos.

Recompensa
gostar
Comentar
Partilhar

Comentar

0/400

Nenhum comentário

Tópico
#BTC#
191504 publicações
#ETH#
119166 publicações
#PI#
92395 publicações
4#GateioInto11#
75926 publicações
5#ContentStar#
63742 publicações
6#BOME#
58985 publicações
7#GT#
55667 publicações
8#DOGE#
52556 publicações
9#MAGA#
51259 publicações
10#SLERF#
50237 publicações

Pino