OpenAI 表示其面向医生的全新 ChatGPT 在临床任务中优于人类

简要介绍

  • OpenAI 推出了面向临床医生的 ChatGPT,这是一个专门版本,旨在支持诸如文档编写和医学研究等临床任务。
  • 该平台对已验证的美国医生、护士执业者、医师助理和药剂师免费开放。
  • OpenAI 表示,根据其自身的基准测试,该聊天机器人在某些临床任务中表现优于人类医生。

OpenAI 于周三披露了 ChatGPT 的一个免费、专门面向临床医生的版本,覆盖医生、护士执业者、医师助理和药剂师,这进一步加深了公司进军医疗健康领域的力度。该领域正面临人员短缺、行政事务负担过重以及职业倦怠等难题。 该产品名为 ChatGPT for Clinicians,旨在处理文档编写、医学研究以及护理咨询——这些耗时任务会挤占临床医生能够与患者相处的时间。目前,访问权限仅限于美国经验证的从业者,未来计划向国际市场扩展。 此时发布的消息恰逢医学领域的人工智能应用加速普及。根据 OpenAI 援引的美国医学会 2026 年一项调查,72% 的医生如今在临床实践中使用 AI,而仅在一年前这一比例还是 48%。公司称,过去一年中,临床医生对其自家平台的使用率已增长超过一倍,数百万人每周依赖 ChatGPT。

该工具的功能包括:临床搜索功能,能够基于数百万份同行评审资料进行检索;用于医学文献综述的深度研究模式;用于转诊信和事前授权请求等任务的可重复使用工作流程模板;以及在平台内研究临床问题时获取继续医学教育学分的能力。  对话内容不会用于训练 OpenAI 的模型;对于符合条件的账户,可通过《商业伙伴协议》提供 HIPAA 合规支持。 在推出的同时,OpenAI 还发布了 HealthBench Professional,这是一项新的基准测试,旨在评估 AI 在三类真实临床任务中的表现:护理咨询、文档编写和医学研究。

公司表示,在 ChatGPT for Clinicians 工作区运行的 GPT-5.4 在该基准测试中的得分为 59.0——高于人类医生的 43.7(即便人类医生拥有无限时间和互联网接入),也高于来自 Anthropic、Google 和 xAI 的竞争模型。 不过,这些结果还带有一个重要的前提:OpenAI 同时研发了该产品以及用于评估它的基准测试。 为开发该工具,公司表示其与数百名医生顾问合作,并审阅了超过 700,000 份模型响应。在预先测试中,医生们认为在近 7,000 次对话中,99.6% 的响应是安全且准确的。 OpenAI 还十分谨慎地将该工具定位为支持系统,而非临床判断的替代品——这种区分监管机构和持怀疑态度者很可能会在产品更广泛推出时密切关注。 医疗健康正成为人工智能工具快速扩张的市场。除了 OpenAI 的数据显示其平台在过去一年里临床医生对 ChatGPT 的使用率已翻倍外,麦肯锡的数据表明,50% 的医疗健康领域领导者表示其组织已落地生成式 AI;这一比例在 2024 年第四季度为 47%,在 2023 年第四季度为 25%。与此同时,BCG 的研究显示,已有 60% 的消费者会使用 AI 来管理个人健康。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论