✍️ Gate 广场「创作者认证激励计划」进行中!
我们欢迎优质创作者积极创作,申请认证
赢取豪华代币奖池、Gate 精美周边、流量曝光等超 $10,000+ 丰厚奖励!
立即报名 👉 https://www.gate.com/questionnaire/7159
📕 认证申请步骤:
1️⃣ App 首页底部进入【广场】 → 点击右上角头像进入个人主页
2️⃣ 点击头像右下角【申请认证】进入认证页面,等待审核
让优质内容被更多人看到,一起共建创作者社区!
活动详情:https://www.gate.com/announcements/article/47889
#AnthropicvsOpenAIHeatsUp: 定义下一时代AI的竞争
在过去两年里,人工智能领域大多被看作“一马当先”的单程竞赛。OpenAI凭借ChatGPT在头条新闻、用户采用率和文化认知度上占据主导地位。但有一位安静却强劲的挑战者一直在暗处积蓄势能:Anthropic。现在,这场竞争不再沉寂。它正在升温,火花正在跨越基准测试、企业合同和伦理框架四处飞溅。
如果2023年是ChatGPT爆发的一年,那么2025年正逐渐成形为Claude对阵GPT的“对决之年”。让我们来拆解:这场战斗为何重要、双方各自处于什么位置,以及这对人工智能的未来意味着什么。
起源故事:兄弟变对手
要理解这股热度,你必须先理解历史。Anthropic于2021年由前OpenAI高管和研究人员创立,包括Dario Amodei和Daniela Amodei。他们因对公司在与微软合作之后的发展方向日益担忧而离开OpenAI。核心分歧是什么?安全 vs. 速度。
OpenAI采纳了“快跑快上”的理念,先发布GPT-3,再发布GPT-4,随后又将ChatGPT推向数十亿用户。相比之下,Anthropic建立在“Constitutional AI(宪法AI)”这一原则之上——这是一种让模型在训练时遵循一套由《联合国人权宣言》和其他全球性指导方针提炼而来的原则的方法。他们希望按设计打造出有帮助、诚实且无害的AI,而不仅仅依靠事后过滤。
这种意识形态的分裂如今已经彻底爆发成一场全面的市场战争。
战场
1. 基准测试的交锋
几乎每周都有新的基准出现。Anthropic的Claude 3.5 Sonnet最近在若干关键指标上已经超过GPT-4o:
· 代码生成:Claude 3.5 Sonnet在HumanEval和SWE-bench上领先,因此成为开发复杂软件的开发者们的首选工具。
· 推理:在GPQA (Graduate-level Google-Proof Q&A)中,Claude在多步逻辑推断方面略胜GPT-4o。
· 长上下文:Claude可原生处理200K tokens (,并通过API最高到1M );而GPT-4o Turbo改进了许多,但在超长场景下仍难以实现完美复现。
OpenAI则用GPT-4o (“omni”进行反击——它们的多模态原生模型)能够在单一流程中实时呈现语音、视觉和文本。信息很明确:我们不再只是一个文本模型。
2. 企业阵地的抢占
这就是战斗变得更凶狠的地方。OpenAI凭借与微软Azure的集成获得了先发优势。但Anthropic则签下了自己的重量级“冠军”:Amazon。借助来自Amazon的$4 十亿美元投资,并集成到AWS Bedrock之后,Anthropic现在拥有一条直通所有依赖全球最大云服务提供商的企业的直接管道。与此同时,Google又向Anthropic投入了另一$2 十亿美元,使其成为少数“双云”偏好的选择。
企业现在开始分阵营:
· OpenAI在品牌认知度以及插件生态、定制GPT和Microsoft 365 Copilot套件方面占优。
· Anthropic在信任、安全认证以及“可解释性”方面胜出——它们的模型往往能告诉你它们为何给出某个答案。这对金融和医疗等受监管行业来说是大事。
3. 开发者体验
问问X ((此前的Twitter)上的任何一位码农,你每天用的是什么模型。两年前,是ChatGPT。如今,越来越多的人口口相传,复杂调试和架构设计用Claude更靠谱。Claude的API因输出更可预测、幻觉率更低而受到好评。OpenAI则用它的Assistants API、function calling以及庞大的插件库进行回应。但Anthropic刚刚发布了“Tool Use” )——也就是它们对function calling (的版本,而且稳定性相当惊人。
这种热度在黑客马拉松和GitHub上都清晰可感。开发者们不再问“GPT还是一切归零?”——他们开始问“这个任务该用哪个模型?”
哲学层面的冲突:安全 vs. 能力
在营销与基准测试之下,真正的“硝烟”来源于此。OpenAI在Sam Altman的带领下,为了AGI )(Artificial General Intelligence)(,不惜一切代价。他们放宽了一些安全措施,以便更快上线功能。他们的“Model Spec(模型规范)”文件显示,在许多模糊场景中,他们优先考虑有用性而不是无害性。
由Dario Amodei领导的Anthropic仍然对Constitutional AI保持近乎固执的执念。它们的模型被明确训练为:即使被绕过,仍会拒绝有害请求。他们还发布了更多透明度成果,包括用system cards详细说明每一层危害缓解机制。最近,Anthropic宣布了“Responsible Scaling Policy(负责任扩展政策)”,承诺一旦某些风险阈值被触及,就会停止开发。OpenAI在纸面上也有类似政策,但批评者认为其约束力较弱。
这也在公众认知中制造出一种引人入胜的分裂:
· OpenAI被视为雄心勃勃、甚至有时有点鲁莽的创新者。
· Anthropic被视为更谨慎、更讲原则,但可能也更慢的替代方案。
近期升级 )最近30天(
是什么让)这个趋势在此刻如此火热?一连串正面“出击”:
· 价格战:Anthropic将Claude 3 Haiku价格下调40%,直接压制了GPT-3.5 Turbo。OpenAI的回应是让GPT-4o mini对免费层用户开放。
· 邮件泄露:双方的前员工泄露了关于如何处理选举诚信与深度伪造的内部争论,Anthropic团队批评OpenAI的“监管力度较轻”。
· 基准测试泄露:一项传闻中的新推理测试 #AnthropicvsOpenAIHeatsUp 名为“ARC-AGI 2”(,显示Claude得分67%,而GPT-4o为58%,尽管OpenAI声称该测试对Anthropic的训练数据存在偏差。
这对你意味着什么 )The User(
竞争很美好。热浪带来的具体影响是:
1. 更低的价格:两家公司都在削减API成本,因为它们知道你随时都能切换。
2. 更好的安全:Anthropic迫使OpenAI更加重视安全。OpenAI也迫使Anthropic加快创新。
3. 更多选择:没有哪一个模型能包打天下。用GPT-4o进行实时多模态聊天。用Claude做长文档分析和编程。两者都用并进行对比。
4. 功能加速:本地处理、更长的上下文、更好的工具使用——这些进展会比任何一家独占垄断的情况到来得更快。
结论:尚无明确的胜者 )Yet(
截至今天,OpenAI在认知度和多模态集成方面仍占领先。ChatGPT仍是每周拥有超过1亿+用户的默认入口。但Anthropic已经拿下了“开发者满意度”的桂冠,并正在快速拉近与企业端的差距。
接下来的12个月将决定一切:
· OpenAI会不会发布GPT-5,并带来真正的推理突破?
· Anthropic会不会发布Claude 4,支持原生多模态并提供实时语音?
· 监管机构会介入吗?两家公司都在面临FTC对数据收集与市场集中度的审查。
有一点可以肯定:)这不是一个临时的标签。这是本十年AI领域定义性的竞争。而与过去那些旧的科技战争 #AnthropicvsOpenAIHeatsUp (Apple vs. Microsoft,iOS vs. Android)(不同,这场竞争对人类迄今所构建的最强大技术的安全、对齐与可及性都具有深远影响。
所以,敬请关注。热度只会越来越高。而在这场战斗中,最终的赢家或许正是我们所有人——前提是我们保持知情、保持怀疑,并持续参与。