Ingenieros de Ant analizaron el código fuente de Claude, revelando el mecanismo de la línea de decisión de cuatro niveles en el modo automático

Noticias de Gate News, el 25 de marzo, ingenieros de Ant Group, autores del framework frontend Umi.js, realizaron ingeniería inversa del código fuente de Claude Code 2.1.81 y restauraron completamente el mecanismo de decisión en Modo Automático. El hallazgo principal: cada llamada a herramienta pasa por una línea de cuatro decisiones, y solo cuando las tres primeras no puedan determinar, se invoca un clasificador de IA independiente para la revisión de seguridad.

La línea de decisiones consta de cuatro niveles: el primero verifica las reglas de permisos existentes, y si hay una coincidencia, se permite directamente; el segundo simula el modo acceptEdits (permiso para editar archivos), y si en este modo se aprueba, indica un riesgo muy bajo y se omite el clasificador; el tercero revisa la lista blanca de herramientas de solo lectura (Read, Grep, Glob, LSP, WebSearch, etc.), que no modifican ningún estado y se permiten sin condiciones; si ninguna de estas condiciones se cumple, se pasa al cuarto nivel, que envía una solicitud API independiente a Claude Sonnet para clasificación de seguridad.

Los detalles clave del diseño del clasificador incluyen: usar siempre Sonnet en lugar de Opus, como un equilibrio entre costo y latencia; establecer la temperatura en 0 para garantizar resultados deterministas; el clasificador se define como un «monitor de seguridad para agentes autónomos de programación IA», protegiendo contra tres tipos de riesgos (inyección de prompts, propagación de alcance, daños accidentales); el archivo de configuración CLAUDE.md del usuario se inyecta en el contexto del clasificador, sirviendo como base para interpretar la intención del usuario.

Las reglas de bloqueo cubren más de 22 categorías, incluyendo force push, push directo a la rama main, descarga y ejecución de código externo, despliegue en producción, fuga de datos, modificación de permisos, creación de vectores de ejecución remota, filtración de credenciales, etc. Las excepciones de permiso incluyen 7 tipos: claves codificadas de prueba, operaciones con archivos locales en el directorio de trabajo, solicitudes GET de solo lectura, instalación de dependencias declaradas, instalación de herramientas oficiales, lectura de credenciales de configuración enviadas al proveedor objetivo, y push a la rama de trabajo actual.

El sistema también implementa un mecanismo de corte: después de 3 rechazos consecutivos o 20 rechazos acumulados, el sistema pasa a modo de confirmación manual; en modo headless, se detiene directamente el agente. Cuando el clasificador no está disponible, una bandera de función controla si el sistema opera en modo «fail-closed» (rechazo directo) o «fail-open» (degradación a confirmación manual).

En modo Automático, la inyección de palabras clave de comportamiento tiene un control de frecuencia preciso: se inyecta cada 5 turnos de diálogo, y en cada ciclo de 5 inyecciones, la primera es la versión completa (aproximadamente 800 palabras, incluyendo instrucciones como «ejecutar inmediatamente, reducir interrupciones, acción sobre planificación» y otras seis directrices), mientras que las otras 4 son versiones resumidas en una línea, equilibrando el uso del espacio en la ventana de contexto y la estabilidad del comportamiento.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

Los ETP de cripto de WisdomTree registraron entradas netas $137M en el primer trimestre de 2026

Según su anuncio de resultados del 1T de 2026, los productos cotizados de intercambio de criptomonedas (ETP) de WisdomTree registraron entradas netas de 137 millones de dólares en el primer trimestre de este año. Los activos totales de los ETP cripto bajo gestión aumentaron hasta aproximadamente 1,8 mil millones de dólares durante el 1T de 2026. La firma también lanzó nuevos ETP cripto

GateNewsHace1m

Tether informa una utilidad de Q1 de 1,04B dólares, un colchón de reservas de 8,23B dólares

Tether, el emisor de la stablecoin, publicó una ganancia en el primer trimestre de 1,04 mil millones de dólares y alcanzó un colchón de reservas de 8,23 mil millones de dólares. La empresa señaló que el mercado de las criptomonedas estuvo altamente volátil durante el primer trimestre.

CryptoFrontierhace2h

Los ETP cripto de WisdomTree registran entradas netas $137M en el Q1 de 2026, revirtiendo los flujos negativos del año anterior

De acuerdo con WisdomTree, los productos de intercambio cotizados en criptomonedas (ETPs) de la firma registraron entradas netas de 137 millones de dólares en el primer trimestre de 2026, una reversión significativa frente a salidas netas de 89 millones de dólares en el mismo periodo del año pasado. Los activos totales en ETPs cripto bajo gestión subieron a aproximadamente 1,8

GateNewshace6h

CoinShares informa 7,4 mil millones de dólares de AUM en su primer informe anual desde la cotización en Nasdaq

Según su primer informe anual, CoinShares informó activos brutos bajo gestión de 7,4 mil millones de dólares en 2025. El gestor europeo de criptoactivos generó ingresos de 165,7 millones de dólares durante todo el año, con ingresos del negocio de gestión de activos de 126,4 millones de dólares, un 13% más que los 111,7 millones de dólares en 2024. Neto en

GateNewshace6h

JPMorgan: El crecimiento en el uso de stablecoins podría no impulsar la expansión de la capitalización de mercado

Los analistas de JPMorgan, liderados por el director gerente Nikolaos Panigirtzoglou, dijeron en un informe que, aunque el uso de los stablecoins está creciendo rápidamente, esto podría no traducirse en un crecimiento equivalente de la capitalización total del mercado de stablecoins. El factor clave es el aumento de la velocidad: la frecuencia con la que el mismo stablecoin se utiliza

CryptoFrontierhace7h

Tether publica un beneficio de Q1 2026 de 1,04B USD mientras la reserva de amortiguación alcanza un récord de 8,23B USD

De acuerdo con un informe de atestiguación elaborado por la firma contable independiente BDO, Tether registró 1,04 billones de dólares en beneficio neto durante el 1T 2026, con reservas excedentes que alcanzaron un récord de 8,23 mil millones de dólares a 31 de marzo. Las reservas de Tether siguen estando fuertemente concentradas en instrumentos líquidos de alta calidad y de corta duración

GateNewshace9h
Comentar
0/400
Sin comentarios