2026-01-19 21:13:23

#BREAKING

Anthropic Descobre 'Eixo do Assistente' para Prevenir Jailbreaks de IA e Desvios de Persona

Pesquisadores da Anthropic mapeiam o 'espaço de persona' neural em LLMs, encontrando um eixo-chave que controla a estabilidade da personagem de IA e bloqueia padrões de comportamento prejudiciais.

#Bitcoin $BTC

BTC-0,56%

Ver original

Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.