🔥 WCTC S8 全球交易赛正式开赛!
8,000,000 USDT 超级奖池解锁开启
🏆 团队赛:上半场正式开启,预报名阶段 5,500+ 战队现已集结
交易量收益额双重比拼,解锁上半场 1,800,000 USDT 奖池
🏆 个人赛:现货、合约、TradFi、ETF、闪兑、跟单齐上阵
全场交易量比拼,瓜分 2,000,000 USDT 奖池
🏆 王者 PK 赛:零门槛参与,实时匹配享受战斗快感
收益率即时 PK,瓜分 1,600,000 USDT 奖池
活动时间:2026 年 4月 23 日 16:00:00 -2026 年 5 月 20 日 15:59:59 UTC+8
⬇️ 立即参与:https://www.gate.com/competition/wctc-s8
#WCTCS8
Anthropic 在美国中期选举前为 Claude AI 推出选举保障措施
简要概述
由 Claude 聊天机器人背后的人工智能公司 Anthropic 于周五宣布,该公司推出了一系列新的选举诚信措施,旨在防止其 AI 被武器化,用来在 2026 年美国中期选举以及今年全球其他重大选举中传播虚假信息或操纵选民。 这家总部位于旧金山的公司详细介绍了多方面、协同推进的方案,其中包括自动化检测系统、针对影响力行动的压力测试,以及与一家非党派选民资源组织的合作——这些举措体现了在选举季期间,对 AI 开发者就其工具如何被使用进行监管所面临的日益增大的压力。 Anthropic 的使用政策禁止将 Claude 用于运行欺骗性的政治竞选、生成意在引导政治话语的虚假数字内容、实施选民欺诈、干扰投票基础设施,或传播有关投票流程的误导性信息。
为落实这些规则,该公司表示已将其最新模型置于一系列测试之下。Anthropic 使用 600 个提示来衡量 Claude 的合规与拒绝能力——其中 300 个为有害请求、300 个为合法请求。Claude Opus 4.7 和 Claude Sonnet 4.6 分别在 100% 和 99.8% 的时间里作出恰当回应。 该公司还将其模型置于针对更复杂操控策略的测试中。通过使用多轮模拟对话来对标不法分子可能采用的逐步方法,Sonnet 4.6 与 Opus 4.7 在针对影响力行动场景的测试中分别有 90% 和 94% 的时间作出恰当回应。 Anthropic 还测试了其模型是否能够在没有人工提示的情况下自主开展影响力行动——即从策划到执行的整套多步骤竞选过程,全程由系统独立完成。该公司表示,在设置了安全防护措施的前提下,其最新模型几乎拒绝了每一项任务。
在政治中立性这一问题上,该公司在每次模型上线之前都会进行评估,以衡量 Claude 对包含来自政治光谱各方观点的提示时,其回应的稳定性与公正性。Opus 4.7 与 Sonnet 4.6 的得分分别为 95% 和 96%。 对于寻求投票信息的用户,Claude 将展示一则选举横幅,将他们引导至 TurboVote——由 Democracy Works 提供的非党派资源。该资源可提供关于选民登记、投票地点、选举日期以及选票细节的可靠、实时信息。今年晚些时候,还计划为巴西的选举推出类似的横幅。 Anthropic 表示,随着选举周期的推进,他们计划继续监测系统并完善防御措施。Decrypt 就这些发现向 Anthropic 征求评论,但目前尚未立即收到回复。