Wayfair boosts catalog accuracy and support speed with OpenAI · RoboRadar

作为全球最大的家居零售商之一，Wayfair 已将 OpenAI 模型集成到关键内部系统中，旨在大规模优化供应商支持流程及商品目录质量。这一项目在 2024 年初仅为小规模价值测试，如今已演变为成熟的生产系统，不仅减少了人工投入、加速了决策过程，更提升了数百万件商品的数据质量。Wayfair 并没有将生成式 AI 仅仅视为一种实验或局部解决方案，而是将其嵌入了核心业务流程。公司首先针对复杂度最高、规模化需求最强的领域发力：即供应商支持请求的分流与解决，以及 3,000 万件库存商品中数万项属性标签的持续优化。“最核心的价值在于‘思考型伙伴关系 (Thought Partnership)’。这不仅仅是获取模型权限，更是共同探索新的应用场景并实现快速落地。”—Fiona Tan，首席技术官Wayfair 的目录团队管理着分布在近千个类目下的数千万件产品。准确且一致的商品属性标签（如颜色、材质、尺寸或特定功能）对于搜索、推荐和展示至关重要。Wayfair 目录招商副总监 Jessica D’Arcy 表示：“数据质量越高，客户对我们的信任程度就越深。它能帮助消费者做出正确的购买决策，直接减少因商品描述不符而导致的退货等高成本后续问题。”在接入 OpenAI 之前，标签的改进主要依赖于供应商和顾客向 Wayfair 反馈错误信息。然而，人工处理的效率完全无法应对庞大的业务量。早期为单个标签开发的定制化 AI 模型虽然有效，但事实证明其构建和维护成本极高。Wayfair 资深机器学习科学家 Carolyn Phillips 表示：“起初我们为每个标签构建定制模型，技术上确实可行。但当你面对 4.7 万个标签时，这种方法根本无法实现规模化。”为了摆脱“一事一议”的孤立模型，Wayfair 构建了一套基于单一 OpenAI 模型的“标签无关 (Tag-agnostic)”系统。该系统通过一个“定义智能体 (Definition Agent)”摄取网页信息及内部定义，为每个标签生成背景语义。Phillips 指出：“真正的瓶颈不在于模型性能，而在于人工定义和编码每个标签具体含义所耗费的时间。”这些语义背景连同从 Wayfair 整个数据生态系统中汇总的商品数据，共同输入到一个能够跨产品类目进行属性分类的框架中；目前，该团队扩展新属性覆盖范围的速度比一年前提升了 70 倍。该系统目前已在超过 100 万件商品上正式运行，且首批已完善属性的商品的上线时长已足以衡量数据质量提升对客户旅程的影响。Phillips 表示：“完善属性并非抽象的概念，你能从 SEO（搜索引擎优化）和 PLA（购物广告）的表现中看到实效，即客户发现产品的方式发生了变化。”一项受控 A/B 测试显示，实验组在曝光量、点击率及页面排名方面均有显著提升。然而，Wayfair 并没有简单地将更正产品数据的决策权全盘交给模型。Phillips 强调：“我们的目标是建立信任，让客户对所购商品充满信心。”公司开发了一套结构化测试，通过人工审计流程（由工作人员物理检查样本）来验证模型输出，并与供应商协作核实变更。目前，当基于数据的置信度较高时，自动化系统会直接覆盖内容并通知供应商；而当未达到高标准或标签被视为高风险时，Wayfair 会在做出更改前先征求供应商的确认。Wayfair 与数万家供应商合作，共同维护其庞大的商品目录。为了处理供应商的支持请求，Wayfair 的员工过去需要审查每一张入站工单，手动识别供应商的诉求，并将其分流至正确的内部负责人 — 这一过程不仅耗时，而且极易出错。Wayfair 供应商支持与运营部门的 Graham Ganssle 表示：“供应商的请求并不简单，它们涵盖了数百种问题类型，实际上没有哪位员工能做到精通所有领域。”Wayfair 为一款名为 Wilma 的产品增加了智能体功能，利用 AI 改善这些工作流程。首批上线的功能之一是由 OpenAI 模型驱动的工单分流。该系统能够阅读入站请求、补全缺失的背景信息，并将工单路由至相应的团队。Wilma 的设计初衷是快速部署；由于它构建在已集成 OpenAI API 的系统之上，从原型开发到正式上线仅用了大约一个月。Ganssle 表示：“Wilma 让员工效率倍增。它阅读工单、识别意图，从我们的数据库中补全上下文，必要时还会主动联系供应商，并将问题指引至正确的处理方向。”除了路由分流，Wayfair 还为特定的解决团队部署了十余个智能体 AI 流。例如，为“零件更换运营团队”配备的“辅助模式 (Co-pilot)”助手可以阅读复杂的案例历史，提出后续步骤建议，并草拟回复供人工审核。这些助手基于历史数据进行训练，因此能够学习特定语境下的成功案例。Ganssle 补充道：“模型能够综合整个服务流程中的背景信息，这是单个员工很难做到的。这种跨系统信息整合能力提升了客户和供应商的满意度。”Wayfair 追踪 AI 建议与人工最终决策的一致频率 — 这一指标被称为“对齐率 (Alignment Rate)”。在每个团队内部，当对齐率持续达到预设阈值时，工作流即可从辅助模式 (Co-pilot) 切换为自主模式 (Autopilot)。这种分阶段推进的方法在项目落地期间建立了信任，让质量控制得到保证。“如果在开始时未能正确路由问题，后续的所有环节都会变慢。工单分流是所有流程的基石。”— Graham Ganssle，Wayfair 供应商支持与运营部门自集成 OpenAI 模型至内部系统以来，Wayfair 报告了显著的可衡量改进。在商品目录方面，公司减少了客户可能看到的错误或缺失的属性标签 — 已针对 Wayfair 目录中超过一百万件高曝光、高销量的商品修正了 250 万个产品标签。他们预计在未来六个月内将这一成果提升四倍。在供应商支持方面，分流、辅助模式和自主模式系统通过每月自动处理 4.1 万张工单（在某些工作流中自动化比例高达 70%），提升了吞吐量，并因消除了员工负载中的常规手工劳动而缩短了周转时间。这极大地减少了多个工作流的解决时间，显著提升了供应商满意度，并降低了相关流程中的工单重新开启率。模型能够洞察工单背景和供应商意图 — 其视野远超单个员工在屏幕上所能看到的信息量 — 这种更广阔的洞察力也是满意度提升的关键因素。在运营层面，各团队报告了以下进展：更快速的复杂供应商工单路由与解决供应商满意度提升减少手动数据录入和分类工作更广泛的问题覆盖能力，无需在数百个主题上具备专业知识商品目录属性在发布前具备更高的置信度此外，Wayfair 已在约 12,000 名员工中部署了超过 1,200 个 ChatGPT Enterprise 席位，用以支持即时任务处理、内部问题解决，以及生成式模型的创新实验。Wayfair 在投资机器学习，以及与 AI 平台及大语言模型供应商合作推动业务发展方面有着悠久的历史。如今，前沿模型的进步，特别是多模态系统，正在拓展团队的构建能力。这在家居零售领域至关重要，因为这类产品具有视觉化、风格化等性质，且往往带有主观色彩。“我们对现在能够处理的问题范围感到兴奋，”Carolyn Phillips 表示，“传统算法需要定义严密的训练数据集。而这些模型让我们能够以一种此前无法规模化的方式，有效处理模糊性和上下文语义。”展望未来，员工对 ChatGPT Enterprise 的需求非常强劲。Wayfair 的团队将其视为一种实用的工具，能显著提升工作速度。与此同时，客户的期望也在快速转变。越来越多的购物者已习惯在日常生活中使用 AI，开始期望在浏览、对比和购买商品时也能获得类似的能力。Fiona Tan 表示：“在家居领域，客户往往无法用准确的词汇来描述他们想要的东西。而自然语言和多模态系统正好填补了这一空白。”对于 Wayfair 的领导层而言，目标始终是提升人类的专业知识水平，同时大规模增强内部能力。Fiona Tan 总结道：“我们正致力于构建这样一个世界：AI 贯穿于整个购物旅程 — 包括我们的网站、客户支持、对话式界面等每个方面。”