Lemon Slice 获得 1050 万美元融资,旨在解决头像“恐怖谷”问题

数字化身炒作背后的真实

生成式AI的繁荣使市场充斥着聊天机器人和AI代理,但大多数仍然是基于文本的体验。Lemon Slice 正在解决一个困扰数字化身领域多年的问题:创建逼真的数字角色,避免触发“恐怖谷”效应——用户在看到几乎像人类但又不完全像的化身时产生的不适感。

这家创业公司认为,现有的数字化身解决方案对用户体验的提升有限。当前的产品常常显得僵硬不自然,只能带来几秒钟的惊艳,然后互动中暴露出其局限性。这一技术差距阻碍了数字化身的主流普及,尽管行业已进行了多年的开发。

技术突破:Lemon Slice-2

由Lina Colucci、Sidney Primas和Andrew Weitz于2024年创立的Lemon Slice,开发了Lemon Slice-2,这是一款拥有200亿参数的扩散模型,设计用于在单个GPU上运行,同时实现每秒20帧的实时视频流。不同于依赖定制方案以应对特定用例的竞争对手,这一通用方法直面“恐怖谷”挑战。

该模型可以将单一图像转变为互动数字化身,能够扮演多种角色——从客户服务代表到教育辅导员,再到心理健康支持代理。在互动过程中,用户可以动态调整背景、造型和角色外观。公司还在探索非人类角色生成,以满足超越人类化身的多样化应用需求。

语音合成由集成的ElevenLabs技术提供,确保对话自然流畅。

便捷的部署模式

Lemon Slice通过API和可嵌入的小部件分发其数字化身技术,帮助企业以最少的代码集成解决方案。目前的应用涵盖教育、语言学习、电子商务和企业培训等领域。

$1050万种子轮推动扩展

公司在周二宣布已通过Matrix Partners、Y Combinator、Dropbox CTO Arash Ferdowsi、Twitch CEO Emmett Shear以及The Chainsmokers等投资者完成了1050万美元的种子轮融资。资金将用于招聘工程师、市场拓展以及GPU计算资源以进行模型训练。

目前公司有8名员工,Lemon Slice正处于快速扩张的阶段。创业公司还采取措施防止未经授权的面部和语音克隆,利用大型语言模型进行内容审核。

为何此方法独具优势

Matrix Partners的Ilya Sukhar指出,随着视频内容消费逐渐占据主导——用户更喜欢YouTube教程而非文字——大多数数字化身平台仍然是垂直行业的解决方案。Lemon Slice的扩散变换器架构借鉴了最先进的视频生成模型,实现了端到端的灵活性,没有架构上的限制阻碍质量提升。

竞争对手和其他数字化身平台曾试图解决这一难题,但大多选择了针对逼真度或风格化游戏角色的狭窄架构路径。Lemon Slice的通用扩散框架理论上可以完全突破“恐怖谷”障碍,从单一图像输入中同时处理人类和非人类表现。

Y Combinator的支持彰显了对这一以ML为核心的方法在企业和消费者应用中推动数字化身技术普及的信心。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)