theNet by Cloudflare

利用 AI 解读数据,讲述引人入胜的故事

非结构化数据为挖掘全新客户见解提供了巨大的机会。如果企业能够将这些数据转化为易于理解的客户故事,便可以采取行动来帮助提高客户满意度并减少客户流失。

非结构化数据有很多。事实上,据估计,所有数据中有 90% 都是非结构化数据,而且其增长速度远超结构化数据。构成非结构化客户数据的文本、图像、音频和其他类型的内容,在 Discord、Reddit、Slack 和 X 等一系列平台上迅速增加。收集所有这些数据并将其转化为切实可行的见解可能颇具挑战性,但这样做带来的潜在优势值得我们为之付出努力。

我在担任 Google 用户体验工程师期间,亲眼见证了如何将生成式 AI 功能与客户数据相结合,以提升数字体验。我所在的团队非常出色,负责开发营销 Web 网页,包括 cloud.google.com 主页。我们的一些项目需要为销售团队和支持团队构建对话式用户界面,以实现 Salesforce 工单的部分自动化。通过半自动的支持响应,我们能够快速解决客户问题并让客户满意。

然而,对于大多数企业来说,客户反馈链已经断开,Sushidata 正努力解决这个问题。作为 Sushidata 的联合创始人兼首席执行官,我将与优秀的团队合作,帮助公司通过将 AI 应用于分析非结构化数据,来加深客户见解并改善客户体验。在公司迄今为止的发展历程中,我们汲取了一些重要经验教训,了解了应该集中精力关注哪些领域以及如何充分利用数据。


实现现有客户价值的最大化

关注现有客户的体验往往会产生最大的影响力。获取新客户所需的资源远远多于留住现有客户耗费的资源。虽然企业永远不会停止吸引新客户,但是满足现有客户的需求应该是首要优先事项之一。

通过从非结构化数据中挖掘见解,您可以及早发现潜在问题。例如,我们为客户收集的一些数据包括其客户的投诉,称不满意支持团队花那么长时间才解决他们的问题。我们目前正在开发一种警报机制,该机制利用自然语言处理,通过必要的媒介(Slack、电子邮件甚至短信)向适当的团队发出警报。通过这个机制,我们的客户将能够在其客户投诉的问题,以免客户决定探索竞争解决方案。

同时,实时了解客户需求可以创造新的追加销售机会。如果客户在 Slack 上描述了一个特定的业务挑战,或在 Discord 上发布了一个功能请求,您也许能够提供满足其要求的解决方案。以下是一些值得思考的问题:当有人询问企业解决方案定价时,您应该怎么做?我的答案就是,与客户互动并尽可能帮助这位潜在买家。


利用 AI 的功能和优势

如何在海量客户数据中找到有价值的见解?需要通过 AI 来充分利用非结构化数据。利用大型语言模型 (LLM),您可以从多个来源高效地收集客户数据,关联从不同地方获取的数据,统一跨平台的用户,分析数据以理解情绪,发现实时趋势,以及以视觉形式呈现新的见解。

如果没有 AI,这项工作几乎不可能完成。假设您希望将源自多个在线论坛的对话数据,整理成一个关于您产品的逻辑连贯的客户叙述。您不仅需要找到所有提及产品的对话,还需要一个上下文感知系统,能够识别众多消息之间的关系,将特定的信息关联起来,并生成一个合情合理的故事。鉴于人类沟通的微妙差别,以及常常模糊不清存在歧义,因此,即使是在对话内容相互交织且沟通顺畅的情况下,这一过程也需要复杂精妙的 AI 功能和语境感知能力。


应对关键战略决策

如何实施 AI 提供支持的方法,从非结构化数据中获取客户见解?在开始利用这些丰富的数据之前,您需要做出一些重要决策并克服一些挑战。

收集
无论企业规模大小,Discord、Slack、X 和 Reddit 等社区平台通常都是挖掘客户情绪和反馈的绝佳场所。除了您的团队可能在这些平台上与客户进行直接对话之外,客户也会与其同行(即:潜在客户)讨论您的公司和产品,从而提供潜在的关键信息。

您需要确定使用哪一种技术,能够快速、高效地收集所有相关数据,同时遵守平台规则和数据隐私法规。Sushidata 使用 OAuth 来推动数据收集,而不是使用 Zapier,因为我们不希望用户连接到 Zapier 时遇到麻烦。我们特别关注每个数据来源,并确保尽可能快速、高效地连接到该来源。OAuth 是一个开放标准,让我们以及我们的客户能够从每个平台连接到 API。使用 OAuth,企业可以轻松访问客户信息,而不必陷入从公共论坛抓取数据的道德灰色地带。

统一
整合来自多个来源的数据是分析客户数据的最大挑战之一。一方面,您希望将所有这些孤立的数据整合在一起。但另一方面,您也希望了解哪些信息来自哪个平台,以便能够在适当的地方采取行动。

Sushidata 会为每个来源平台分配 ID。如果想要深入了解某个产品问题、错误,或功能请求,只需单击一下即可直接转到来源。

存储
如果主要是收集文本数据,则可以使用传统数据库。Sushidata 使用 Cloudflare 的无服务器数据库,为每个租户提供单独的数据库实例,确保每个企业的数据与其他企业的数据相互独立。

如果要包含其他类型的数据,例如图像,则使用向量数据库(使相关数据存储在紧密关联的近距离数据库中)有助于提高性能。Cloudflare 开发人员平台让我们能够确定哪些数据应包含在向量数据库中。

此外,选择对象存储,例如 Cloudflare R2,有助于存储海量的各种数据,包括文本、图像、视频,以及日志和事件数据。

分析
如今,企业可以访问海量数据,但需要进行分析才能利用这些数据来做出明智的决策。AI 对于标记和分析所有这些数据,并生成切实可行的见解至关重要。

发现或构建适当的 AI 模型是关键。Sushidata 提供对多个 AI 模型的访问,让您能够灵活地探索可用的新模型。我们使用 Cloudflare Workers AI 进行嵌入和文本生成模型,这些模型在靠近用户的边缘运行。

借助适当的模型,您可以分析已收集的非结构化数据的上下文,然后进行多维情绪分析。当我自己与 Sushidata 联合创始人 Victor Sanchez 和 Victor Iisei 着手评估客户情绪时,我们希望做的不仅仅是评估顾客是否感到快乐或难过。还有很多其他情绪可以探索。

我们决定使用 AI 来进行五维情绪分析。这有助于我们的客户更好地了解其客户表达的是信心还是恐惧,困惑还是清晰等情绪。正确捕捉客户情绪,有助于更好地确定最佳行动方案。

可视化
在大多数情况下,使用客户见解的人并不是数据科学家,而是客户体验或社区管理团队的成员。您需要找到一种方案,以可视化的形式向这些人呈现见解,以便快速、轻松地传达信息。

借助适当的可视化功能,该团队承运可以立即了解您的公司是否收到了更多反馈、功能请求、错误报告或提及的其他问题。客户体验团队可以规划客户旅程,然后努力优化这些旅程。他们还可以使用可视化,与公司领导者分享见解。

安全性
保护客户数据并遵守数据隐私法规至关重要。为了保护个人客户的隐私,需要在数据收集过程中对数据进行去标识化处理,删除个人可识别信息 (PII)。还需要遵守平台的数据收集规则。如前文所述,多租户对于保护数据安全至关重要。

如果您在训练自己的 AI 模型,则还需要确保输入到模型的数据没有遭到泄露或损坏。例如,我们已经看到,一些公司使用 Reddit 数据(包括公司员工与客户之间的对话)来训练生成式 AI 模型。它们计划将这些模型部署到论坛,代表公司来回答客户问题。但这些公司需要确保拥有干净、准确的数据。如果有人进入论坛并冒充用户,则基于这些数据的模型将无法提供准确、有建设性的回复。


展望 AI 对未来叙事的影响

将 AI 应用于分析非结构化数据,在更好地理解客户情绪方面有着巨大潜力,例如客户对产品的感受、遇到的问题等等。借助这些信息,企业可以采取行动来提高客户满意度、减少客户流失,并最终增加收入。

我们设想的未来是,您可以访问 Sushidata 并提问,“为什么我的用户要离开?”,然后让 AI 根据您提供的数据来讲述故事。故事载体可能是一个不断演变的图形或仪表板,只需单击“播放”按钮,即可帮助您以前所未有的方式解读数据。

诚然,实现这一愿景面临着一些挑战。整合来自多个来源的数据、分析这些数据、保护数据并生成引人入胜的故事框架,这些都是比较复杂的任务。但我们创立 Sushidata 的初衷,就是为了将这一愿景变为现实。

在帮助我们建立和管理平台方面,Cloudflare 发挥了关键作用。使用 Cloudflare 产品,我们能够成功地分类并分析来自在线论坛的数以万计的对话,从而将数据转化为逻辑连贯的客户故事。企业将利用这些故事来满足客户需求,并制定长期战略来实现现有客户价值的最大化。

Cloudflare 就影响当今技术决策者的最新趋势和主题发布了系列文章,本文为其一。


深入探讨这个话题

阅读《提高开发人员速度》电子书,进一步了解现代化应用开发的三个常见障碍,以及如何最大限度地提高开发人员的生产力。

作者

George Portilla - @georgeportilla
Sushidata CEO 兼联合创始人



关键要点

阅读本文后,您将能够了解:

  • 分析现有客户数据可以带来哪些好处

  • 为什么 AI 是释放非结构化数据价值的关键

  • 将非结构化数据转化为切实可行见解关键挑战与策略


相关资源


接收有关最流行互联网见解的每月总结。