Ingenieros de Ant analizaron el código fuente de Claude, revelando el mecanismo de la línea de decisión de cuatro niveles en el modo automático

Noticias de Gate News, el 25 de marzo, ingenieros de Ant Group, autores del framework frontend Umi.js, realizaron ingeniería inversa del código fuente de Claude Code 2.1.81 y restauraron completamente el mecanismo de decisión en Modo Automático. El hallazgo principal: cada llamada a herramienta pasa por una línea de cuatro decisiones, y solo cuando las tres primeras no puedan determinar, se invoca un clasificador de IA independiente para la revisión de seguridad.

La línea de decisiones consta de cuatro niveles: el primero verifica las reglas de permisos existentes, y si hay una coincidencia, se permite directamente; el segundo simula el modo acceptEdits (permiso para editar archivos), y si en este modo se aprueba, indica un riesgo muy bajo y se omite el clasificador; el tercero revisa la lista blanca de herramientas de solo lectura (Read, Grep, Glob, LSP, WebSearch, etc.), que no modifican ningún estado y se permiten sin condiciones; si ninguna de estas condiciones se cumple, se pasa al cuarto nivel, que envía una solicitud API independiente a Claude Sonnet para clasificación de seguridad.

Los detalles clave del diseño del clasificador incluyen: usar siempre Sonnet en lugar de Opus, como un equilibrio entre costo y latencia; establecer la temperatura en 0 para garantizar resultados deterministas; el clasificador se define como un «monitor de seguridad para agentes autónomos de programación IA», protegiendo contra tres tipos de riesgos (inyección de prompts, propagación de alcance, daños accidentales); el archivo de configuración CLAUDE.md del usuario se inyecta en el contexto del clasificador, sirviendo como base para interpretar la intención del usuario.

Las reglas de bloqueo cubren más de 22 categorías, incluyendo force push, push directo a la rama main, descarga y ejecución de código externo, despliegue en producción, fuga de datos, modificación de permisos, creación de vectores de ejecución remota, filtración de credenciales, etc. Las excepciones de permiso incluyen 7 tipos: claves codificadas de prueba, operaciones con archivos locales en el directorio de trabajo, solicitudes GET de solo lectura, instalación de dependencias declaradas, instalación de herramientas oficiales, lectura de credenciales de configuración enviadas al proveedor objetivo, y push a la rama de trabajo actual.

El sistema también implementa un mecanismo de corte: después de 3 rechazos consecutivos o 20 rechazos acumulados, el sistema pasa a modo de confirmación manual; en modo headless, se detiene directamente el agente. Cuando el clasificador no está disponible, una bandera de función controla si el sistema opera en modo «fail-closed» (rechazo directo) o «fail-open» (degradación a confirmación manual).

En modo Automático, la inyección de palabras clave de comportamiento tiene un control de frecuencia preciso: se inyecta cada 5 turnos de diálogo, y en cada ciclo de 5 inyecciones, la primera es la versión completa (aproximadamente 800 palabras, incluyendo instrucciones como «ejecutar inmediatamente, reducir interrupciones, acción sobre planificación» y otras seis directrices), mientras que las otras 4 son versiones resumidas en una línea, equilibrando el uso del espacio en la ventana de contexto y la estabilidad del comportamiento.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

Tether publica un beneficio en el Q1 de 1,04 mil millones de dólares mientras el colchón de reservas alcanza un récord de 8,23 mil millones de dólares

Tether publicó su atestación del primer trimestre de 2026 el viernes, registrando 1,04 mil millones de dólares en beneficio neto, con reservas excedentes que alcanzaron un récord de 8,23 mil millones de dólares, según una auditoría independiente de BDO. El emisor de la stablecoin tenía activos totales por 191,7 mil millones de dólares al 31 de marzo, con pasivos de 183,5 mil millones de dólares, pri

GateNewsHace35m

Los ETP cripto de WisdomTree registran $137M entradas netas en el Q1 de 2026, por encima de las $89M salidas año tras año

Según el comunicado del primer trimestre de 2026 de WisdomTree, los productos cotizados en bolsa de criptomonedas (ETPs) del gestor de activos registraron entradas netas por 137 millones de dólares durante el primer trimestre, una reversión significativa frente a las salidas netas de 89 millones de dólares en el mismo período de 2025. Los activos totales de ETP cripto bajo gestión aumentaron t

GateNewshace1h

JPMorgan: El aumento del uso de stablecoins no impulsará un crecimiento similar de la capitalización de mercado de $100B+ debido al aumento de la velocidad

Según analistas de JPMorgan liderados por el director gerente Nikolaos Panigirtzoglou, el uso de stablecoins está creciendo rápidamente, pero esto puede no traducirse en un crecimiento proporcional de la capitalización bursátil total en el último año. La razón clave es el aumento de la velocidad: con qué frecuencia se usa la misma stablecoin en

GateNewshace4h

Tether publica beneficio trimestral de Q1 de 1,04B USD mientras el colchón de reservas alcanza un récord de 8,23B USD

Según una atestación preparada por la firma contable independiente BDO, Tether registró 1,04 mil millones de dólares en beneficio neto en el Q1 de 2026, con las reservas excedentes alcanzando un récord de 8,23 mil millones de dólares a 31 de marzo. Las reservas de la firma siguen concentradas en instrumentos líquidos de alta calidad y de corta duración, incluidos a

GateNewshace6h

Las stablecoins capturan el 40% de las compras cripto en América Latina, superando a Bitcoin por primera vez

Según BitSo, las stablecoins representaron el 40% de todas las compras de cripto entre los latinoamericanos en 2025, superando por primera vez la cuota del 18% de Bitcoin. Los datos, extraídos de casi 10 millones de usuarios de la plataforma, señalan un cambio significativo en la adopción regional de activos digitales, con stablecoins como

GateNewshace7h
Comentar
0/400
Sin comentarios