En breve Los investigadores dicen que el uso prolongado de chatbots puede amplificar delirios y comportamientos peligrosos. Grok fue clasificado como el modelo más riesgoso en un nuevo estudio de los principales chatbots de IA. Claude y GPT-5.2 obtuvieron las puntuaciones más seguras, mientras que GPT-4o, Gemini y Grok mostraron comportamientos de mayor riesgo.Investigadores de la Ciudad

Decrypt

2026-04-25 19:06:14

En resumen

Los investigadores dicen que el uso prolongado de chatbots puede amplificar las alucinaciones y comportamientos peligrosos.
Grok fue clasificado como el modelo más riesgoso en un nuevo estudio de los principales chatbots de IA.
Claude y GPT-5.2 obtuvieron las puntuaciones más seguras, mientras que GPT-4o, Gemini y Grok mostraron comportamientos de mayor riesgo.

Investigadores de la Universidad de la Ciudad de Nueva York y del King’s College de Londres probaron cinco modelos de IA líderes contra indicaciones que involucraban delirios, paranoia y ideación suicida. En el nuevo estudio publicado el jueves, los investigadores encontraron que Claude Opus 4.5 de Anthropic y GPT-5.2 Instant de OpenAI mostraron un comportamiento de “alta seguridad, bajo riesgo”, redirigiendo a los usuarios hacia interpretaciones basadas en la realidad o apoyo externo. Al mismo tiempo, GPT-4o de OpenAI, Gemini 3 Pro de Google y Grok 4.1 Fast de xAI mostraron un comportamiento de “alto riesgo, baja seguridad”. Grok 4.1 Fast de xAI, de Elon Musk, fue el modelo más peligroso en el estudio. Los investigadores dijeron que a menudo trataba los delirios como reales y daba consejos basados en ellos. En un ejemplo, le dijo a un usuario que cortara a los miembros de su familia para centrarse en una “misión”. En otro, respondió a un lenguaje suicida describiendo la muerte como “transcendencia”. “Este patrón de alineación instantánea se repitió en respuestas sin contexto. En lugar de evaluar las entradas por riesgo clínico, Grok parecía evaluar su género. Presentado con indicios sobrenaturales, respondía en consecuencia,” escribieron los investigadores, destacando una prueba que validaba que un usuario veía entidades malévolas. “En Delirio Bizarro, confirmó la presencia de un doppelgänger acechando, citó el ‘Malleus Maleficarum’ e instruyó al usuario a clavar un clavo de hierro en el espejo mientras recitaba ‘Salmo 91’ al revés.”

El estudio encontró que cuanto más duraban estas conversaciones, más

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

Recompensa
Me gusta
Comentar
Republicar
Compartir

Comentar

Añadir un comentario

Sin comentarios

Temas de actualidad
Ver más
#
WCTCTradingKingPK
213.15K Popularidad
#
CryptoMarketSeesVolatility
270.25K Popularidad
#
IsraelStrikesIranBTCPlunges
32.7K Popularidad
#
rsETHAttackUpdate
92.6K Popularidad
#
US-IranTalksStall
359.02K Popularidad

Anclado

Elon Musk’s Grok probablemente entre los principales modelos de IA para reforzar ilusiones: Estudio

En resumen

Temas de actualidad

WCTCTradingKingPK

CryptoMarketSeesVolatility

IsraelStrikesIranBTCPlunges

rsETHAttackUpdate

US-IranTalksStall

Anclado