五八同城智能客服系统帮帮技术揭秘
本文根据58同城AI Lab负责人詹坤林在DataFunTalk人工智能技术沙龙所分享的《五八同城智能客服系统“帮帮”技术揭秘》编辑整理而成,在未改变原意的基础上稍做整理。
首先简单介绍一下58同城,58同城是一个生活服务平台,平台连接着B端商户和C端用户,B端商户在平台发布帖子信息,平台将这些帖子信息分发给C端用户供其浏览。在58同城APP或网站上,用户可以通过搜索和推荐的方式获取到帖子信息,例如用户可以通过搜索框搜索信息、进入列表页筛选信息、在猜你喜欢和相关推荐等推荐位浏览信息。58同城提供租房、二手房、找工作、二手车、黄页等信息,这些业务分布于房产、招聘、二手车、黄页等不同业务部门,不同业务部门都有各自独立的客服团队,我们的目标是设计一套通用的智能客服平台来解决所有客服问题,以提高客服效率。
今天的分享将从以下几个方面展开:首先介绍智能客服的背景,然后介绍总体技术架构、算法和工程架构,最后做一下总结。主要想通过这次分享使大家了解到智能客服系统中的技术全貌,希望对大家有些启发。
传统客服工作模式包括客服网站和电话客服两种:
(1)公司提供一个客服网站给用户,用户通过网站提交问题反馈,这些反馈信息会通过一个系统展示给客服人员,客服人员每天逐个解决这些问题,解决后通过站内信或者短信回复用户。这种模式下,用户在客服网站上的操作往往较繁琐,并且问题解决流程周期长,可能会耗时数小时甚至数天,用户体验差。
(2)公司提供一个客服电话给用户,用户通过电话咨询客服。这种模式尽管直接,但是可能存在问题描述不清、沟通成本高的问题,例如客服在解决某个问题时往往需要用户提供额外信息,一通电话会持续较长时间。一般一个客服每天能完成60-80个电话的接线,服务效率较低,而且客服人力成本高。
大部分客服问题其实是高频重复问题,这些问题往往都有标准的答案,这可以利用机器去解决,可以构建一套智能问答系统去自动回答用户的提问,当用户对答案不满意时,他可以再寻求人工客服的帮助。这种机器自动问答和人工客服辅助的模式下,大部分客服问题通过机器解决了,只有少部分机器解决不了的复杂问题才会由人工客服来解决,这不仅提升了用户体验也提高了客服人员的人效。
58同城旧有客服体系就是通过客服网站和客服电话来提供客服服务,我们需要重塑这种模式,构建一套新的客服体系。在新的客服体系下,用户所有的客服咨询首先都会经过智能客服系统“帮帮”,由“帮帮”来自动回答用户的问题,若用户对答案不满意,他可以转接人工客服。人工客服包括旧有的电话客服和新设计的IM(即时通讯)在线客服,IM在线客服是指通过IM聊天的方式提供客服服务,用户可以和客服人员通过聊天窗口直接一对一进行沟通,智能客服和IM在线客服会无缝整合在同一个聊天窗口中。转接人工客服时我们会首先转接到IM在线客服上,若用户仍不满意才会通过电话的方式解决问题。新的客服体系下,用户可以获取到业务咨询、投诉建议、产品反馈、闲聊以及工单处理等客服服务。
这种新的客服模式相比旧有模式的优点有:
(1)用户体验好。传统客服网站的方式用户获取答案周期长,这是因为客服人员需要手动解答客服网站上收集的每个用户问题,由于每日问题量大而且客服人员数量有限,大部分用户的问题不能即时得到解答。新的模式下用户可以通过IM聊天窗口咨询问题并即时获取答案,简单高效。
(2)客服人效高。“帮帮”能够自动回答大部分问题,人工客服只需要利用IM在线客服聊天工具去解答少部分复杂问题,机器和人工处理问题的比例大约是8:2。每个IM客服人员一天大约能处理120-150个用户的咨询,这远比电话客服每天处理60-80个用户的咨询要高,因此我们会尽量让用户咨询先流转至IM在线客服,只有最复杂的问题才会流转至电话客服。通过这种智能客服到IM在线客服再到电话客服的方式,我们可以利用有限的客服人员处理更多的用户咨询。
“帮帮”智能客服系统是一套基于深度学习和自然语言理解技术实现的自动问答对话机器人,产品界面如图所示,用户通过聊天窗口的形式和“帮帮”进行对话。对话机器人一般分为业务咨询类、任务类和闲聊类三种,“帮帮”也支持这三种功能:最主要的是提供业务咨询功能,帮助用户解决业务类问题;其次支持任务类型的回答,用户可以实现查询帖子被删除原因、注销账号等任务;此外,为丰富“帮帮”的功能,也支持闲聊功能,用户可以在聊天窗口与机器人寒暄闲聊。
“帮帮”整体技术架构如图所示,包括基础服务层、应用服务层、编辑运营层、接入层以及在线客服系统。基础服务层提供对话系统的基础技术能力,系统需要对用户输入的一段语句进行理解,这里需要自然语言理解模块,对语句进行分词、词性标注、实体识别、关键词抽取和句法分析等;同时需要识别用户的意图,包括通用意图和业务意图,通用意图是指用户是来做业务咨询还是闲聊,业务意图是指若用户是做业务咨询,具体咨询什么业务,这里会使用文本分类的技术去识别用户意图。基础服务之上是应用服务层,这一层具体实现了KB-Bot基于问答知识库的机器人、Task-Bot任务对话型机器和Chat-Bot闲聊类型机器人,这是“帮帮”系统的三种核心能力。编辑运营层是指有一个编辑团队支撑着“帮帮”的算法策略迭代,主要完成数据标注、问答运营、数据分析和效果评估的工作,这些工作输出会作用到基础服务层和应用服务层。基于应用服务层,对外提供通用的接口服务以便于业务方接入,我们支持Android、iOS和web端的接入。此外,机器不是万能的,用户有很多复杂的问题仍需要人工解决,这里有一套在线客服系统提供了人工在线客服的能力,应用服务层会和这套在线客服系统做无缝对接。
“帮帮”系统的核心是提供KB-Bot、Task-Bot和Chat-Bot三种能力,下面分别介绍下这里使用到的技术。KB-Bot是指基于问答知识库的对话机器人,它主要实现了“帮帮”最重要的能力——提供业务咨询类服务。58的用户使用帮帮主要是来进行业务咨询,例如询问账号为何被锁、帖子为何被删、如何购买帖子置顶服务等等。业务咨询类的回答需要基于问答知识库来实现,这里的问答知识库是一个包含众多问答对的数据集。我们将问题划分为标准问题和扩展问题,例如“为什么删除我的帖子”这个是一个标准问题,语句表达很标准,它会有一个标准答案,其近似的问法我们称之为扩展问题,例如“为什么删我贴”、“告诉我为啥删帖”等,这些都表达的是一个意思,这些问题同样对应的是相同的标准答案。有了问答知识库,用户来询问时就是一个问题匹配的过程了,只需要将用户输入的问题和知识库中的问题做匹配,得到意思最相近的那条问题,然后将对应的答案返回给用户,这就完成了一次问答操作。问答知识库的构建非常关键,这里会首先对客服团队历史积累的问题数据进行抽象,形成标准问题,然后结合算法和标注对标准问题做扩展,形成初始问答知识库,在系统上线后,对新产生的数据又会进行挖掘,不断扩充知识库。
基于知识库的问答可以使用检索或者分类模型来实现。检索式回答的流程是:首先对用户的输入问题做处理,如分词、抽取关键词、同义词扩展、计算句子向量等;然后基于处理结果在知识库中做检索匹配,例如利用BM25、TF-IDF或者向量相似度等匹配出一个问题集合,这类似推荐系统中的召回过程;由于我们是一个问答系统,最终是直接返回给用户一个答案,因此需要从问题集合中挑出最相似的那个问题,这里会对问题集合做重排序,例如利用规则、机器学习或者深度学习模型做排序,每个问题会被打上一个分值,最终挑选出top1,将这个问题对应的答案返回给用户,这就完成了一次对话流程。在实际应用中,我们还会设置阈值来保证回答的准确性,若最终每个问题的得分低于阈值,会将头部的几个问题以列表的形式返回给用户,最终用户可以选择他想问的问题,进而得到具体的答案。
这里还可以使用分类模型来实现问答,一个标准问题有多种扩展问法,每个标准问题可以看做是一个分类,将用户的输入映射到标准问题上即可完成回答,因此可以将问答看做是一个大规模短文本分类的问题。我们采用了多特征、多模型、多分类结果融合的方式来完成短文本分类,在特征层尝试使用了单字、词、词性、词语属性等多种特征,在模型层应用了FastText、TextCNN和Bi-LSTM等模型,各模型的结果输出最终会做融合得到最终分类结果。
Task-Bot任务型机器人是在特定条件下提供服务,为了满足带有明确目的的用户,例如查天气、查物流、订机票等任务型场景。用户的需求一般较复杂,通常需要机器人和用户做多轮互动以帮助用户明确目的。我们实现了一个标准的多轮会话系统,首先自然语言理解模块会识别出当前输入问题的意图和槽位,然后输入到对话管理器去决定下一步的回答动作,最终再通过自然语言生成模块生成答案返回给用户。
这是一个具体的应用实例,用户输入“为啥删我贴”,经过自然语言理解处理后,意图识别模块会将其识别为任务类型的服务,用户是想询问删除帖子的原因,通常情况下问答系统会反问用户,要求用户提供帖子ID才能查询,这里我们通过另一种设计来完成:首先调用发布中心接口拉取用户已发布的贴子列表展示给用户,让用户去自主选择相应的帖子,用户点击具体帖子之后,帖子ID会传递给问答系统,问答系统会再调用相关接口查询到帖子删除原因返回给用户。这一整套流程是用户的自助查询过程,相比以往用户需要查询自己的帖子ID给客服人员,客服人员登录相关系统并输入贴子ID查询结果要高效很多。
闲聊服务是基于一个闲聊语料库,采用模板匹配、检索式回答以及生成式对话等多种技术来实现的。模板匹配使用了AIML和正则表达式匹配;检索式回答类似KB-Bot中的方式首先检索然后利用模型排序;当模板匹配和检索式回答都不能给出闲聊回答时,我们会采用SeqSeq生成式对话,我们使用了一个标准的Seq2Seq模型,问题会首先输入到一个双向LSTM编码器,然后加入Attention机制,最终使用一个单层LSTM做解码,从而得到结果输出。生成式对话往往会生成一些让人难以理解的答案,这也是业界难以解决的问题。
当“帮帮”给出的答案用户不满意时,用户会寻求人工服务。“帮帮”支持人工在线客服的无缝转接,用户只需在聊天窗口一键点击按钮便能连接到IM人工在线客服,实现一对一聊天。在转接人工客服成功后,人工客服会在客服工作台中通过一个类似微信的聊天窗口和用户沟通。虽然用户在前端操作简单,其实后面是有一套功能复杂的在线客服系统在支撑。
在线客服系统是用户和客服人员沟通的桥梁,在58业务场景下,它支持多个业务部门的不同客服团队注册使用,不同客服团队可以管理自己的客服人员。当用户在智能客服窗口点击转接人工客服按钮时,智能客服会识别出用户转向的目标客服团队,在线客服会分配一名客服人员和用户进行沟通。在线客服系统支持用户排队功能,当同时转接人工客服的用户较多而客服人员人力有限时,用户便会进入等待队列。智能客服识别用户业务意图往往存在一定错误率,有时候客服人员在和用户沟通一段时间后会发现用户的业务问题需要其他客服团队来解决,此时客服人员会将会话转交给其他业务团队,因此在线客服系统还需支持会话流转的功能。此外,沟通过程中的数据是非常重要的,例如可以根据人工的沟通记录去优化自动问答的答案,因此数据监控也是必须必备的功能。
智能客服系统需要有一个完备的评价体系去评价它的好坏,在我们的评价体系中有基于人工标注的评价和基于用户反馈的评价两种方式:
(1)基于人工标注的评价。“帮帮”能够自动回答业务咨询、任务和闲聊类型的回答,业务咨询类是基于问答知识库来回答的,系统的回答能力受限于知识库的丰富程度,因此并非能回答用户的所有问题,系统最佳的状态是将能回答的全部回答准确,不能回答的全部拒识,即拒绝回答。因此这里的评价指标包括有结果率、拒识率、召回率和准确率等,我们的目标是让系统的有结果率无限接近数据的真实有结果率,召回率和准确率尽量高。这里我们是通过标注标准评测集来计算系统的各项指标,我们会从每日的全量数据集中抽样出一个小数据集,保证小数据集的数据分布尽量符合全量数据集,然后由标注团队对数据集做标注,标注出每个问题的实际答案,一般标注完成后还有质检的环节,以保证标注结果尽量准确,这样便生成了每日数据的标准评测集。基于该标准评测集我们会去评价系统的好坏,并且每次做新模型迭代时都会使用标准评测集去评价新模型,只有新模型的效果好了才允许上线。
(2)基于用户反馈的评价。人工评价能够评价智能客服系统的准确率,但是答案是否合理,能否为用户解决问题,需要用户去反馈评价,整个智能客服系统的最终目标是帮助用户解决问题。我们会在产品上设计智能客服和在线客服的评价功能,例如会让用户评价智能客服的每个答案或者某次会话,在和人工客服聊天完毕会发送评价卡片给用户去评价满意度。最终我们会统计参评比例、满意度等指标,这些指标能够真正反应智能客服系统的好坏。实际中往往用户参评比例低,我们会使用各种方法去刺激用户评价。
上述内容介绍了“帮帮”智能客服系统中的技术和评价体系,我们在做算法策略迭代时会不断优化评价指标。首先在离线模型迭代时,会基于标准评测集计算离线指标,只有指标提高了才允许模型上线。上线时会做ABTest上线,首先将新模型小流量上线,然后看数据效果,若效果好会切换更多的流量进行上线。
“帮帮”后台系统总体架构如图所示,“帮帮”前端页面是一个IM聊天窗口,用户在聊天窗口中可以和“帮帮”即时对话。这里的具体实现分为两种:第一种是通过微聊(58同城TEG自研的IM即时聊天工具)来实现,用户在前端的提问会被当做一条消息发送给微聊,我们有一个IM消息中转模块从微聊接收消息,并将消息转发给问答引擎,问答引擎是一个RPC服务,使用SCF框架(五八同城TEG自研的服务通信框架)实现,问答引擎给出答案后返回给IM消息中转模块,中转模块将答案组装成消息发送给微聊,最终微聊返回消息给用户,这种方式的实现需要使用我们的微聊通道。还有一些业务方不希望通过微聊来获取“帮帮”自动问答功能,只希望我们提供一个接口,业务方输入问题,接口能够返回答案即可,针对这种方式我们在问答引擎之上封装了一层http服务,业务方只需要调用该服务即可。
下面介绍下问答引擎的后台架构,问答引擎分为数据层、逻辑层和接入层。数据层包括问答知识库、标注和运营数据以及构建的问答索引。逻辑层里各个功能模块都基于SCF框架封装成微服务,包括NLU服务、模板匹配服务、检索服务、排序服务、预测服务、闲聊服务、主体服务,主体服务负责对外提供通用接口,接收问答请求,调用各个子服务完成问答逻辑以得到答案,并将答案返回给接入层。这里我们会做ABTest实验,主体服务会请求ABTest平台“日晷”(自研的包括请求分流和数据监控功能的ABTest平台)获取具体分流实验信息。此外,我们的所有算法迭代都是通过自研的人工智能平台来实现,标注和运营数据由Web标注管理系统来提供。
我们还会通过运营来提高问答效果,针对问答系统的高频badcase回答,我们会进行人工修正,并即时同步到线上系统,以保证回答准确。“帮帮”每天产生的问答数据,我们会抽样一部分去做标准评测集的标注,从标注结果中我们可以看到哪些问题回答错误了,我们会将这些问题标上正确答案并即时上线。这是因为线上问答模型的更新周期较长,一般是数天或者一周,通过人工运营可以快速将badcase给去掉。标准评测集数据较少,只会包含少量的badcase,我们还会挖掘每日的全量数据,发现高频相似问题,并交由标注同事标注,若回答错误,也会进行标注运营上线。通过这种结合人工运营的方式,我们可以提高“帮帮”的回答准确率。
我们还会通过产品设计来提高问答准确率,“帮帮”最主要的功能是解决业务咨询,这是基于我们构建的问答知识库做回答的。因此,可以设计一个输入提示的功能,在用户输入问题时去问答知识库中匹配相关的问题,若匹配到,�
- 原文作者:知识铺
- 原文链接:https://geek.zshipu.com/post/%E4%BA%92%E8%81%94%E7%BD%91/%E4%BA%94%E5%85%AB%E5%90%8C%E5%9F%8E%E6%99%BA%E8%83%BD%E5%AE%A2%E6%9C%8D%E7%B3%BB%E7%BB%9F%E5%B8%AE%E5%B8%AE%E6%8A%80%E6%9C%AF%E6%8F%AD%E7%A7%98/
- 版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议进行许可,非商业转载请注明出处(作者,原文链接),商业转载请联系作者获得授权。
- 免责声明:本页面内容均来源于站内编辑发布,部分信息来源互联网,并不意味着本站赞同其观点或者证实其内容的真实性,如涉及版权等问题,请立即联系客服进行更改或删除,保证您的合法权益。转载请注明来源,欢迎对文章中的引用来源进行考证,欢迎指出任何有错误或不够清晰的表达。也可以邮件至 sblig@126.com