Gate 广场创作者新春激励正式开启,发帖解锁 $60,000 豪华奖池
如何参与:
报名活动表单:https://www.gate.com/questionnaire/7315
使用广场任意发帖小工具,搭配文字发布内容即可
丰厚奖励一览:
发帖即可可瓜分 $25,000 奖池
10 位幸运用户:获得 1 GT + Gate 鸭舌帽
Top 发帖奖励:发帖与互动越多,排名越高,赢取 Gate 新年周边、Gate 双肩包等好礼
新手专属福利:首帖即得 $50 奖励,继续发帖还能瓜分 $10,000 新手奖池
活动时间:2026 年 1 月 8 日 16:00 – 1 月 26 日 24:00(UTC+8)
详情:https://www.gate.com/announcements/article/49112
从混乱到清晰:人工智能如何改变电子商务目录
在电子商务领域,技术人员常常讨论庞大的基础设施问题:搜索架构、实时库存管理、个性化推荐系统。然而,在表面之下隐藏着一个更具隐患的问题,几乎困扰每个在线商家:产品属性的标准化。一个杂乱无章的产品目录,尺寸、颜色、材质或技术规格值不一致,破坏了后续的一切——过滤器变得不可靠,搜索引擎的准确性下降,手动数据清洗消耗大量资源。
作为Zoro的全栈工程师,我每天都在应对这个问题:如何在超过300万SKU中整理出秩序,每个SKU都拥有数十个属性?答案并不在黑箱AI中,而在于一个智能混合系统,将LLM的思维能力与明确的业务规则和人工控制机制结合起来。
大规模问题
表面上看,属性不一致似乎无关紧要。以尺寸为例:“XL”、“Small”、“12cm”、“Large”、“M”、“S”——都意味着相同,但没有标准化。颜色也是类似:”RAL 3020“、”Crimson“、”Red“、”Dark Red“——部分是颜色标准(RAL 3020是一种规范的红色),部分是虚构的名称。
将这种混乱扩展到数百万产品,影响变得十分显著:
战略方法:规则驱动的混合AI
我的目标不是开发一个神秘的黑魔法AI系统,而是要建立一个:
最终设计出一条结合LLM智能、明确规则和业务控制的管道。AI有“护栏”,而非无边界的黑箱。
为什么采用离线处理而非实时?
最初的架构决策至关重要:所有属性处理都在异步后台任务中进行,而非实时。这看似妥协,但实际上是战略性选择,带来巨大优势:
实时管道可能导致:
离线任务则提供:
将客户系统与数据处理分离,是应对海量数据的关键。
处理流程
整个流程分为多个阶段:
阶段1:数据清洗
在引入AI之前,先经过预处理:
这个看似简单的步骤极大提升了LLM的准确性。原则是:垃圾输入,垃圾输出。在这个规模下,微小的错误也会引发巨大问题。
阶段2:带上下文的AI推理
LLM不只是按字母排序,而是理解值的含义。服务端提供:
借助这些上下文,模型能理解:
模型返回:
阶段3:确定性回退
不是所有属性都需要AI。有些属性用明确逻辑处理更好:
管道自动识别这些,并应用确定性逻辑。节省成本,确保一致性。
阶段4:商家控制
关键属性需要人工审核。每个类别可以标记:
这个双重系统赋予人工最终控制权。若模型出错,商家可以覆盖——无需中断流程。
存储与后续系统
所有结果直接存入MongoDB,作为唯一“真相源”:
之后,数据流向两个系统:
过滤器现在按逻辑顺序出现。产品页面显示连贯的规格。搜索引擎排名更精准。客户在类别中导航时更顺畅。
具体成果
管道将混乱的原始数据转化为干净、可用的输出:
在超过300万SKU中,这一转变保持了一致性。
影响
成果远超技术层面:
不仅是技术胜利,更是商业胜利。
关键经验
结论
将属性值标准化听起来很简单——直到你需要为数百万产品实时完成。通过结合LLM智能、明确规则和人工控制,我将一个隐藏的、顽固的问题转变为可扩展的系统。
这提醒我们:在电商中取得巨大成功的技术,不一定是炫酷的创新,而是解决那些乏味但关键的问题——每个产品页面都离不开的那些。