机器人聊天方法、计算机设备及存储介质与流程

阅读: 评论:0



1.本技术涉及金融技术领域,具体涉及一种机器人聊天方法、计算机设备及存储介质。


背景技术:



2.人机对话一直是自然语言处理领域内的重要研究方向之一,其中,智能客服应用广泛,因此受到了广泛关注。相关技术中,智能客服主要使用基于faq(知识库)的问答系统,但是其输出的回复缺乏多样性。且,目前基于faq问答系统的智能客服在回复用户问题时较为生硬、没有感情彩,影响用户的体验。


技术实现要素:



3.有鉴于此,本技术提供一种机器人聊天方法、计算机设备及存储介质,以解决现有技术中智能客服回复问题缺乏多样性以及回复生硬、缺乏感情彩的问题。
4.为了解决上述技术问题,本技术提供的第一个技术方案为:提供一种机器人聊天方法,包括:接收用户输入的信息,并判断所述信息的类型;响应于所述信息的类型与预设的问答生成模型相匹配,则通过所述问答生成模型,获取所述信息中的情感信息和/或主题信息;基于所述情感信息和/或所述主题信息,向所述用户返回与所述信息相对应的回复。
5.可选地,所述响应于所述信息的类型与预设的问答生成模型相匹配,则通过所述问答生成模型,获取所述信息中的情感信息和/或主题信息,包括:获取所述信息中的所述情感信息和/或所述主题信息,判断其与所述问答生成模型中预设的所述情感信息和/或所述主题信息是否匹配;其中,所述情感信息包括正面情绪和负面情绪,所述主题信息包括音乐、运动、电影、生活、教育、工作、旅游、医疗或财经;响应于判断结果为匹配,则通过所述问答生成模型,生成与所述情感信息和/或所述主题信息相对应的回复。
6.可选地,所述响应于所述信息的类型与预设的问答生成模型相匹配,则通过所述问答生成模型,获取所述信息中的情感信息和/或主题信息,还包括:响应于判断结果为不匹配;或,响应于所述问答生成模型未存储所述信息中的所述情感信息和/或所述主题信息;向所述用户返回第一答复策略。
7.可选地,所述响应于判断结果为匹配,包括:从所述信息中提取一个中间语义向量对所述信息进行解码;对所述解码过程补充所述情感信息和/或所述主题信息;通过所述中间语义向量、所述情感信息和/或所述主题信息对所述用户输入的信息及其情绪进行分析,以获得所述信息的含义;基于所述信息的含义,对所述用户进行回复。
8.可选地,所述获得所述信息的含义之前,包括:引入注意力机制对所述信息进行回溯;对所述信息进行单词分解,并根据每一所述单词对当前时刻解码的重要性,对每一所述单词赋予不同的权重;通过所述解码过程获取所述信息中每一所述单词在输出层的概率;输出所述信息的含义。
9.可选地,所述从所述信息中提取一个中间语义向量对所述信息进行解码,包括:将
所述信息输入所述问答生成模型,得到所述信息对应的数字矩阵;对所述数字矩阵进行计算,获得所述信息对应的数字结果;将所述数字结果通过所述问答生成模型转换为文字信息;输出所述文字信息。
10.可选地,所述接收用户输入的信息,并判断所述信息的类型,包括:响应于所述信息的类型为问答型,则调用知识库为所述用户提供与所述信息相对应的回复;响应于所述信息的类型为开放式或带有情感倾向,则调用所述问答生成模型进行所述信息的识别,以获得所述信息的所述情感信息和/或所述主题信息。
11.可选地,所述基于所述情感信息和/或所述主题信息,向所述用户返回与所述信息相对应的回复,包括:响应于所述情感信息为正面情绪,则向所述用户返回与所述正面情绪相匹配的回复;响应于所述情感信息为负面情绪,则向所述用户返回与所述负面情绪相匹配的回复,以对所述用户进行安慰。
12.为了解决上述技术问题,本技术提供的第二个技术方案为:提供一种计算机设备,包括:处理器和存储器,存储器连接所述处理器,用于存储可在所述处理器上运行的计算机程序;其中,所述处理器执行所述计算机程序时实现上述任一项所述的方法。
13.为了解决上述技术问题,本技术提供的第三个技术方案为:提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法。
14.本技术的有益效果:区别于现有技术,本技术的机器人聊天方法,通过问答生成模型对用户输入的信息进行情感信息和/或主题信息的判断,然后基于该情感信息和/或主题信息,向所述用户返回与其输入的信息相对应的回复。可以解决现有智能客服的回复缺乏多样性和感情彩的问题,使得智能客服的回复融合了用户的主题信息和情感信息,大大提高了机器人在与用户聊天中的情感互动,提高了机器人与用户的沟通效率,同时也提升了用户的聊天体验。
附图说明
15.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
16.图1是本技术一实施例提供的机器人聊天方法的整体流程框图;图2是本技术一实施例提供的步骤s1的子步骤的流程框图;图3是本技术一实施例提供的步骤s2的子步骤的流程框图;图4是本技术一实施例提供的步骤s22的子步骤的流程框图;图5是本技术一实施例提供的步骤s221的子步骤的流程框图;图6是本技术一实施例提供的对信息提取一个中间语义向量进行解码的示意框图;图7是本技术一实施例提供的步骤s223的子步骤的流程框图;图8是本技术一实施例提供的seq2seq模型的注意力机制模型框图;图9是本技术一实施例提供的步骤s3的子步骤的流程框图;
图10是本技术一实施例提供的用户和机器人的聊天交互示意图;图11是本技术一实施例提供的电子设备的结构示意框图;图12是本技术一实施例提供的计算机可读存储介质的结构示意框图。
具体实施方式
17.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本技术的一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
18.本技术中的术语“第一”、“第二”、仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”、的特征可以明示或者隐含地包括至少一个该特征。本技术实施例中所有方向性指示(诸如上、下、左、右、前、后
……
)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
19.在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
20.若本技术技术方案涉及个人信息,应用本技术技术方案的产品在处理个人信息前,已明确告知个人信息处理规则,并取得个人自主同意。若本技术技术方案涉及敏感个人信息,应用本技术技术方案的产品在处理敏感个人信息前,已取得个人单独同意,并且同时满足“明示同意”的要求。例如,在摄像头等个人信息采集装置处,设置明确显著的标识告知已进入个人信息采集范围,将会对个人信息进行采集,若个人自愿进入采集范围即视为同意对其个人信息进行采集;或者在个人信息处理的装置上,利用明显的标识/信息告知个人信息处理规则的情况下,通过弹窗信息或者请个人自行上传其个人信息等方式获得个人授权;其中,个人信息处理规则可包括个人信息处理者、个人信息处理目的、处理方式以及处理个人信息种类等信息。
21.人机对话一直是自然语言处理领域内的重要研究方向之一,其中,智能客服在银行、线上购物等金融科技中应用广泛,因此受到了多个业务线的广泛关注。智能客服系统旨在解决传统客服模式需要大量人力的状况,近年来随着人机交互技术的进步,对话系统正逐渐走向实际应用,在节约人力的同时,人们还希望智能客服在针对特别问题或者特别用户时能够提供更高的服务质量。
22.本技术发明人发现:目前银行主要使用基于faq(知识库)的问答系统,但是其输出的回复缺乏多样性。且,目前基于faq问答系统的智能客服在回复用户问题时较为生硬、没有感情彩,影响用户的体验。
23.为了解决上述问题,本技术提供一种机器人聊天方法、计算机设备及存储介质。
24.对于对话生成任务而言,近年来本领域内最常用的方式是基于循环神经网络(rnn)的seq2seq模型。seq2seq模型一般由两部分组成:第一部分是encoder(编码器)部分,用于对输入的n长度的序列进行表征,为原序列;第二部分是decoder(解码器)部分,用于将encoder提取出的表征建立起到输出的m长度序列的映射,为目标序列。在对话生成任务中,用户问题就是原序列,回复内容就是目标序列。
25.在聊天功能中,本技术的机器人聊天方法将seq2seq模型嵌入情感信息和主题信息,不仅能有更多样性的回复,并且回复带有情感彩,能够提升用户体验。生成式模型的机器人利用大量成对的问答数据,学习怎样去模拟人类对话,并且针对不同的话题可以生成对应的回复,即使是在训练模型的人类对话语料中未出现的内容,也可以生成对应的回复。因此,基于生成式模型,用户能够和机器人完成任何其感兴趣的话题内容的对话。本技术旨在于聊天过程使用生成式方法,为用户生成回复,并为模型生成的回复增加情感信息,提升机器人聊天的情感丰富度。
26.请参阅图1和图2,图1是本技术一实施例提供的机器人聊天方法的整体流程框图,图2是本技术一实施例提供的步骤s1的子步骤的流程框图。
27.本技术提供的机器人聊天方法,包括:s1:接收用户输入的信息,并判断信息的类型。
28.具体的,在某一人机对话的应用场景中,例如用户在银行app上向银行的咨询问题。用户输入一段文字信息,该信息发送到银行智能客服系统中,银行这边与客户首先自动对接的是智能客服。智能客服系统通过中控平台对用户输入的信息进行一个初步的判断,以判断用户输入的信息是知识问答型问题,还是开放式的问题或者带有情感倾向的问题等。其中,知识问答型问题可以理解为用户是对银行的某一功能、业务进行咨询的,那么可以调用银行的faq进行关于该功能、业务的自动回复。开放式的问题可以理解为没有固定答案的、在银行的faq中没有相关问题答案的问题。带有情感倾向的问题可以理解为用户带有感情彩的问题,例如用户对某一功能、服务等不满意,表达不满、愤怒等情绪的问题。
29.在一实施例中,接收用户输入的信息,并判断信息的类型的步骤s1,包括:s11:响应于信息的类型为问答型,则调用知识库为用户提供与信息相对应的回复。
30.具体的,在判断出用户输入的信息的具体类型之后,就可以调用银行/企业内的多种应答策略来为用户进行问题的回复。当中控平台对用户输入的信息判断为问答型之后,那么会相应地调用faq为用户提供相应的答复。例如,用户提问:没有开通网银的银行卡如何进行线上支付。faq可以调用相关的答案为用户提供答复:可以通过银联在线支付的功能进行线上支付,只要卡号和密码就能付款,很方便,不管是储蓄卡还是信用卡都支持。当然还可以进一步回复用户:银联在线支付的功能,每个用户单笔支付限额为2000元,单日支付限额为5000元等内容,以方便用户在支付时根据支付限额进行合理支出。当然,用户对faq的回复有不明白的地方,也可以继续追问,一般在faq中都设置有相关问题的答复。
31.s12:响应于信息的类型为开放式或带有情感倾向,则调用问答生成模型进行信息的识别,以获得信息的情感信息和/或主题信息。
32.具体的,当用户的提问不是问答型,而是开放式问题或带有情感倾向的问题时,此
时由于没有固定的答案,且用户可能处于生气的状态,因此对于用户的回复以及情绪安抚就很重要。此时,首先从智能客服系统的多个答复策略中调用问答生成模型进行用户输入信息的识别,以判断用户的情感信息和/或用户提出的问题所对应的主题信息。情感信息可以包括正面情绪和负面情绪,例如快乐、难过、失望或兴奋等。主题信息可以包括音乐、运动、电影、生活、教育、工作、旅游、医疗或财经等。从而为后续的回复提供相应的情感信息和/或主题信息的参考,为用户提供更加准确、更富有情感的回复。
33.s2:响应于信息的类型与预设的问答生成模型相匹配,则通过问答生成模型,获取信息中的情感信息和/或主题信息。
34.具体的,如图10所示,本技术中的问答生成模型主要用于回复用户的开放式问题或者带有情感倾向的问题,当中控平台判断出用户输入的信息类型与本技术预设的问答生成模型所对应的信息类型相匹配时,则调用本技术的问答生成模型来对用户输入的信息中的情感信息和/或主题信息进行判断。
35.例如,用户提出银行app中的某个功能不好用,信息涉及的主题不能聚焦,或者问题不在银行/企业的主营业务上,就调用问答生成模型去判断该信息的主题或者用户的情绪,有针对性地生成一段话回复给用户。比如:小主先别生气,我们后续会不断改进。如果用户提出的问题机器人回答不了也会有兜底回答,例如:这个问题我也不清楚,我也在学习中。或者输入转人工客服等策略。
36.可以理解,如果用户输入的信息类型与本技术预设的问答生成模型所对应的信息类型不匹配,则不调用问答生成模型,而是调用智能客服系统中的其他策略,例如上述faq、召唤等。可以理解,智能客服系统中存储有多达几十种的回复策略,本技术的问答生成模型只是其中一种。
37.请参阅图3,图3是本技术一实施例提供的步骤s2的子步骤的流程框图。
38.在一实施例中,响应于信息的类型与预设的问答生成模型相匹配,则通过问答生成模型,获取信息中的情感信息和/或主题信息的步骤s2,可以包括:s21:获取信息中的情感信息和/或主题信息,判断其与问答生成模型中预设的情感信息和/或主题信息是否匹配。
39.具体的,可以理解,在对用户输入的信息的情感信息和/或主题信息与本技术预设的问答生成模型中的情感信息和/或主题信息进行是否匹配的判断之前,首先应该获取用户输入的信息中的情感信息和/或主题信息。即,先掌握用户在当前状态下是什么情绪,例如是高兴、难过还是生气等。再判断用户的情感信息和/或主题信息是否能匹配到问答生成模型中预设的情感信息和/或主题信息。
40.s22:响应于判断结果为匹配,则通过问答生成模型,生成与情感信息和/或主题信息相对应的回复。
41.具体的,如果判断结果是用户的情感信息和/或主题信息与问答生成模型中预设的情感信息和/或主题信息是匹配的,则说明本技术的问答生成模型能够生成与用户输入的信息相匹配的回复。因此,判断结果为匹配之后,可以直接通过问答生成模型来生成相应的带有情感的回复给用户。
42.请参阅图4至图6,图4是本技术一实施例提供的步骤s22的子步骤的流程框图,图5是本技术一实施例提供的步骤s221的子步骤的流程框图,图6是本技术一实施例提供的对
信息提取一个中间语义向量进行解码的示意框图。
43.进一步的,响应于判断结果为匹配的步骤s22,包括:s221:从信息中提取一个中间语义向量对信息进行解码。
44.具体的,如图6所示,在对用户输入的信息进行判断之前,首先要对用户输入的文字信息进行“转码”,因为一般来讲,机器人是不能直接识别文字的,而只能识别与文字信息所对应的编码信息。因此,需要对用户输入的信息提取一个中间语义向量进行该信息的解码。
45.具体来讲,从信息中提取一个中间语义向量对信息进行解码的步骤s221,包括:s2211:将信息输入问答生成模型,得到信息对应的数字矩阵。
46.具体的,先将用户输入的信息输入该问答生成模型中,通过seq2seq模型生成可以被问答生成模型识别的数字矩阵,用该数字矩阵表征用户输入的信息。通过seq2seq模型,将文字信息和数字建立映射关系,从而将文字信息转换为可以被问答生成模型所识别的数字矩阵。可以理解,用户输入的文字就是源序列,机器人对用户的回复就是目标序列,基于文字信息和数字之间相互转换的映射关系,文字信息所对应的数字,就是中间语义向量。
47.s2212:对数字矩阵进行计算,获得信息对应的数字结果。
48.具体的,将文字信息所转换形成的数字矩阵进行计算,计算的逻辑和算法以seq2seq模型为准,例如函数关系式:其中,x表示输入的文字信息,y表示输出的文字信息,t为与文字信息所对应的时间,通过上述公式可以计算出输入的文字信息所对应的输出文字。具体的函数计算过程可以参考seq2seq模型的函数计算过程,本技术在此不进行详细描述。
49.s2213:将数字结果通过问答生成模型转换为文字信息。
50.具体的,将通过上述数字矩阵计算出的结果通过问答生成模型再转换为文字信息,以便于输出能供用户理解的内容。
51.s2214:输出文字信息。
52.具体的,通过上述问答生成模型生成的文字直接输出给用户,作为与用户输入的信息相对应的回复。
53.s222:对解码过程补充情感信息和/或主题信息。
54.具体的,在传统的seq2seq模型中,通过seq2seq模型直接解码得出的文字信息是制式的、没有感情的生硬回复,使得用户很明显地感觉到在跟一个没有感情的机器聊天,影响用户的体验。因此,如图6所示,本技术将问答生成模型获取到的用户输入的信息所对应的情感信息和/或主题信息,作为补充信息添加到对用户输入的信息进行解码的过程中,使得解码之后得到的回复更加富有感情彩。
55.s223:通过中间语义向量、情感信息和/或主题信息对用户输入的信息及其情绪进行分析,以获得信息的含义;具体的,通过对用户输入的信息进行转换得到的中间语义向量和通过问答生成模型获取到的情感信息和/或主题信息,对用户输入的信息以及该信息中所附带的用户情绪
进行综合分析,从而得到用户输入的文字信息的含义。
56.请参阅图7和图8,图7是本技术一实施例提供的步骤s223的子步骤的流程框图,图8是本技术一实施例提供的seq2seq模型的注意力机制模型框图。
57.可选地,获得信息的含义的步骤s223之前,可以包括:s2230:引入注意力机制对信息进行回溯。
58.具体的,seq2seq模型虽然在对话中能够生成不错的效果,但容易生成无意义的安全回复。原因在于seq2seq模型中的解码器仅仅是接收到编码器最后的一个状态输出,这种机制对处理长期依赖的源序列效果不佳。因为解码器的状态记忆随着新词的不断生成会逐渐减弱,甚至丢失源序列的信息,使得最终得到的目标序列与源序列之间具有一定的差异,解码准确度受到影响。因此,缓解该问题的一个有效方式是引入注意力机制。
59.注意力机制采用回溯策略,将当前解码阶段的每个时间步与编码阶段文字信息的上下文联系起来,以避免在解码的过程中源序列信息逐渐遗失的情况。
60.s2231:对信息进行单词分解,并根据每一单词对当前时刻解码的重要性,对每一单词赋予不同的权重。
61.具体的,因为源序列中的每个单词对解码过程中的每个时间步都有影响,因此注意力机制会根据每个单词的重要性为其赋予不同的权重,有的单词对当前时刻解码的词贡献较大,有的贡献则较小,因此为每个单词赋予不同的权重可以为输出层提供更加准确的参考。本实施例中使用的注意力机制模型框图如图8所示。
62.s2232:通过解码过程获取信息中每一单词在输出层的概率。
63.具体的,在引入注意力机制的seq2seq模型框架中,本实施例通过为每个单词赋予不同的权重,可以获得每个单词在输出层的概率,使得解码器的输出层根据输入预测出单词的概率,从而使得机器人为用户输出的回复更准确、更富有感情彩。注意力机制的训练过程的目标函数与预测过程中的搜索策略与传统rnn一致,此处不再赘述。
64.s2233:输出信息的含义。
65.具体的,根据注意力机制对用户输入的信息进行回溯之后,得到更准确的信息的含义,将该含义进行输出。
66.s224:基于信息的含义,对用户进行回复。
67.具体的,得到上述更准确、更富有感情彩的信息含义之后,问答生成模型就可以基于该信息的含义,为用户提供回复内容。
68.示例性的:用户输入:你可真笨。
69.回复1:主人不喜欢我,小安(机器人名称)好委屈。
70.回复2:对不起让您不开心了。
71.在一实施例中,响应于信息的类型与预设的问答生成模型相匹配,则通过问答生成模型,获取信息中的情感信息和/或主题信息的步骤s2,还可以包括:s23:响应于判断结果为不匹配;或,响应于问答生成模型未存储信息中的情感信息和/或主题信息;具体的,可以理解,在实际与智能客服的沟通中,有时用户的问题可能是模棱两可的,感情信息也是不明确的,那么此时就可能无法与问答生成模型中存储的情感信息和/或主题信息进行匹配。或者,有时用户输入的信息中携带的情绪和主题信息过于复杂,在问答
生成模型中没有存储与该情绪和主题信息相匹配的情感信息和/或主题信息,那么此时对用户输入的信息与问答生成模型中的情感信息和/或主题信息进行判断的结果也是不匹配的。
72.s24:向用户返回第一答复策略。
73.具体的,当判断结果为不匹配时,智能客服系统就会采用预设的第一答复策略为用户进行回复。第一答复策略可以包括直接显示“进入人工服务”的显示框,也可以输出:主人,这个问题小安不会,小安正在学习中等。
74.s3:基于情感信息和/或主题信息,向用户返回与信息相对应的回复。
75.具体的,本技术的回复来自于对问答生成模型进行模型训练并提前整理的语料库。由于整理语料的成本较高,故本技术收集一些开放的聊天语料库,再加入小安机器人的线上用户的运营数据。为了节省人力成本,本技术将所有的用户问题做文本聚类分析,在得到聚类结果之后,针对聚类的类内样本比较多的高频类簇,从每个类簇中抽取一条最具代表性的样本。针对这些高频类簇的代表性样本,通过运营的标注人员编写答案并标注主题信息和情感信息,其中每个问题会有多个标注人员来编写,以增加答案的多样性,然后最终统一收集并对语料库进行检查,剔除或者修改不太合理的回答之后,作为最终的知识数据,保存为知识库,供基于知识问答型的语聊问答使用。另外,这套高频问题回流以及答案标注的流程机制,不仅可以用于问答生成模型最初的知识数据构建,也能用于能力上线之后定期的未解决问题数据的回流,且数据补充过程中同样适用。最终的训练语料数据量为3万多个问答对,本技术对这部分数据训练并得到问答生成模型。
76.请参阅图9和图10,图9是本技术一实施例提供的步骤s3的子步骤的流程框图,图10是本技术一实施例提供的用户和机器人的聊天交互示意图。
77.进一步的,基于情感信息和/或主题信息,向用户返回与信息相对应的回复的步骤s3,包括:s31:响应于情感信息为正面情绪,则向用户返回与正面情绪相匹配的回复。
78.具体的,例如在网购的应用场景中,用户收到某一产品非常满意,可能会输入:你们店的产品质量好、颜值高,我以后会继续回购的!那么此时,问答生成模型就可以获取到用户的情感信息是高兴、兴奋等正面情绪,此时可以为用户提供如下回复:小安为您感到高兴,也感谢您对我们的信任,我们会继续努力的;或者,您开心我就开心,能让您满意是我最大的荣幸等,对用户的正面情绪进行强化。
79.s32:响应于情感信息为负面情绪,则向用户返回与负面情绪相匹配的回复,以对用户进行安慰。
80.具体的,在另一购物场景中,例如,用户问:我的快递怎么十几天了还没到呢。从用户输入的信息进行情感信息和主题信息的获取,可以得到用户的情感信息是负面情绪,具体可能是生气、愤怒等。用户提及的主题是购物的快递时效。那么此时智能客服可以先回复:您先别生气,以对用户的情绪进行安抚,再针对用户所提及的主题结合具体情况进行回复。例如:由于疫情原因,您所在地区被封控,导致快递发不过去。可以理解,在智能客服系统中,回复策略有很多种,本技术主要集中在对用户进行情绪安抚这块,即根据用户输入的话题做一些情绪安抚,或者做针对性的回答。
81.再例如,在一金融/财经应用场景中,用户输入:我的基金天天亏钱。
82.回复1:主人别生气,现在行情不好。
83.回复2:小安抱抱,市场起起伏伏总会好的。
84.综上,经过将本技术的机器人聊天方法与原生的seq2seq模型的聊天方法进行试验,获取一个月的运营数据,最终得到以下结果:表1试验对象回复合格率回复字数平均长度5-20字长度占比原生seq2seq模型0.41%5.144.3%本技术的聊天方法0.74%8.394.3%由上表1可知:本技术的机器人聊天方法无论从回复字数还是合格率,都明显优于现有技术中采用的原生seq2seq模型的聊天方法。因此,本技术融合了情感信息和主题信息的聊天方法,大大提高了机器人在与用户聊天中的情感互动,提高了机器人与用户的沟通效率,同时也提升了用户的聊天体验。
85.本技术公开的机器人聊天方法包括:接收用户输入的信息,并判断所述信息的类型;响应于所述信息的类型与预设的问答生成模型相匹配,则通过所述问答生成模型,获取所述信息中的情感信息和/或主题信息;基于所述情感信息和/或所述主题信息,向所述用户返回与所述信息相对应的回复。解决现有智能客服的回复缺乏多样性和感情彩的问题。使得智能客服的回复融合了主题信息和情感信息,大大提高了机器人在与用户聊天中的情感互动,提高了机器人与用户的沟通效率,同时也提升了用户的聊天体验。
86.请参阅图11,图11是本技术一实施例提供的电子设备的结构示意框图。
87.电子设备200,具体可以包括处理器210和存储器220。存储器220耦接处理器210。
88.处理器210用于控制电子设备200的操作,处理器210还可以称为cpu(central processing unit,中央处理单元)。处理器210可能是一种集成电路芯片,具有信号的处理能力。处理器210还可以是通用处理器、数字信号处理器(dsp)、专用集成电路(asic)、现场可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器210也可以是任何常规的处理器等。
89.存储器220用于存储计算机程序,可以是ram,也可以是rom,或者其他类型的存储设备。具体的,存储器可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器中的非暂态的计算机可读存储介质用于存储至少一条程序代码。
90.处理器210用于执行存储器220中存储的计算机程序以实现本技术机器人聊天方法的实施例描述的机器人聊天方法。
91.在一些实施方式中,电子设备200还可以包括:外围设备接口230和至少一个外围设备。处理器210、存储器220和外围设备接口230之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口230相连。具体的,外围设备包括:射频电路240、显示屏250、音频电路260和电源270中的至少一种。
92.外围设备接口230可被用于将i/o(input/output,输入/输出)相关的至少一个外围设备连接到处理器210和存储器220。在一些实施例中,处理器210、存储器220和外围设备接口230被集成在同一芯片或电路板上;在一些其他实施方式中,处理器210、存储器220和
外围设备接口230中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
93.射频电路240用于接收和发射rf(radio frequency,射频)信号,也称电磁信号。射频电路240通过电磁信号与通信网络以及其他通信设备进行通信,射频电路240则是电子设备200的通信电路。射频电路240将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路240包括:天线系统、rf收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路240可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2g、3g、4g及5g)、无线局域网和/或wifi(wireless fidelity,无线保真)网络。在一些实施例中,射频电路240还可以包括nfc(near field communication,近距离无线通信)有关的电路,本技术对此不加以限定。
94.显示屏250用于显示ui(user interface,用户界面)。该ui可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏250是触摸显示屏时,显示屏250还具有采集在显示屏250的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器210进行处理。此时,显示屏250还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施方式中,显示屏250可以为一个,设置在电子设备200的前面板;在另一些实施方式中,显示屏250可以为至少两个,分别设置在电子设备200的不同表面或呈折叠设计;在另一些实施方式中,显示屏250可以是柔性显示屏,设置在电子设备200的弯曲表面上或折叠面上。甚至,显示屏250还可以设置成非矩形的不规则图形,也即异形屏。显示屏250可以采用lcd(liquid crystal display,液晶显示屏)、oled(organic light-emitting diode ,有机发光二极管)等材质制备。
95.音频电路260可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器210进行处理,或者输入至射频电路240以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在电子设备200的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器210或射频电路240的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路260还可以包括耳机插孔。
96.电源270用于为电子设备200中的各个组件进行供电。电源270可以是交流电、直流电、一次性电池或可充电电池。当电源270包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
97.关于本技术电子设备200的实施例中各功能模块或者部件功能和执行过程的详细阐述,可以参照上述本技术机器人聊天方法的实施例中的阐述,在此不再赘述。
98.在本技术所提供的几个实施例中,应该理解到,所揭露的电子设备200和机器人聊天方法,可以通过其它的方式实现。例如,以上所描述的电子设备200的各实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,
或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
99.作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
100.另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
101.请参阅图12,图12是本技术一实施例提供的计算机可读存储介质的结构示意框图。
102.参阅图12,上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在计算机可读存储介质300中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令/计算机程序用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施方式方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种介质以及具有上述存储介质的电脑、手机、笔记本电脑、平板电脑、相机等电子设备。
103.关于计算机可读存储介质300中的程序数据的执行过程的阐述可以参照上述本技术机器人聊天方法的实施例中阐述,在此不再赘述。
104.以上所述仅为本技术的实施方式,并非因此限制本技术的专利范围,凡是利用本技术说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本技术的专利保护范围内。

技术特征:


1.一种机器人聊天方法,其特征在于,包括:接收用户输入的信息,并判断所述信息的类型;响应于所述信息的类型与预设的问答生成模型相匹配,则通过所述问答生成模型,获取所述信息中的情感信息和/或主题信息;基于所述情感信息和/或所述主题信息,向所述用户返回与所述信息相对应的回复。2.根据权利要求1所述的方法,其特征在于,所述响应于所述信息的类型与预设的问答生成模型相匹配,则通过所述问答生成模型,获取所述信息中的情感信息和/或主题信息,包括:获取所述信息中的所述情感信息和/或所述主题信息,判断其与所述问答生成模型中预设的所述情感信息和/或所述主题信息是否匹配;其中,所述情感信息包括正面情绪和负面情绪,所述主题信息包括音乐、运动、电影、生活、教育、工作、旅游、医疗或财经;响应于判断结果为匹配,则通过所述问答生成模型,生成与所述情感信息和/或所述主题信息相对应的回复。3.根据权利要求2所述的方法,其特征在于,所述响应于所述信息的类型与预设的问答生成模型相匹配,则通过所述问答生成模型,获取所述信息中的情感信息和/或主题信息,还包括:响应于判断结果为不匹配;或,响应于所述问答生成模型未存储所述信息中的所述情感信息和/或所述主题信息;向所述用户返回第一答复策略。4.根据权利要求2所述的方法,其特征在于,所述响应于判断结果为匹配,包括:从所述信息中提取一个中间语义向量对所述信息进行解码;对所述解码过程补充所述情感信息和/或所述主题信息;通过所述中间语义向量、所述情感信息和/或所述主题信息对所述用户输入的信息及其情绪进行分析,以获得所述信息的含义;基于所述信息的含义,对所述用户进行回复。5.根据权利要求4所述的方法,其特征在于,所述获得所述信息的含义之前,包括:引入注意力机制对所述信息进行回溯;对所述信息进行单词分解,并根据每一所述单词对当前时刻解码的重要性,对每一所述单词赋予不同的权重;通过所述解码过程获取所述信息中每一所述单词在输出层的概率;输出所述信息的含义。6.根据权利要求4所述的方法,其特征在于,所述从所述信息中提取一个中间语义向量对所述信息进行解码,包括:将所述信息输入所述问答生成模型,得到所述信息对应的数字矩阵;对所述数字矩阵进行计算,获得所述信息对应的数字结果;将所述数字结果通过所述问答生成模型转换为文字信息;输出所述文字信息。
7.根据权利要求1所述的方法,其特征在于,所述接收用户输入的信息,并判断所述信息的类型,包括:响应于所述信息的类型为问答型,则调用知识库为所述用户提供与所述信息相对应的回复;响应于所述信息的类型为开放式或带有情感倾向,则调用所述问答生成模型进行所述信息的识别,以获得所述信息的所述情感信息和/或所述主题信息。8.根据权利要求1所述的方法,其特征在于,所述基于所述情感信息和/或所述主题信息,向所述用户返回与所述信息相对应的回复,包括:响应于所述情感信息为正面情绪,则向所述用户返回与所述正面情绪相匹配的回复;响应于所述情感信息为负面情绪,则向所述用户返回与所述负面情绪相匹配的回复,以对所述用户进行安慰。9.一种计算机设备,其特征在于,包括:处理器;存储器,连接所述处理器,用于存储可在所述处理器上运行的计算机程序;其中,所述处理器执行所述计算机程序时实现权利要求1至8任一项所述的方法。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至8任一项所述的方法。

技术总结


本申请公开了一种机器人聊天方法、计算机设备及存储介质,该方法包括:接收用户输入的信息,并判断所述信息的类型;响应于所述信息的类型与预设的问答生成模型相匹配,则通过所述问答生成模型,获取所述信息中的情感信息和/或主题信息;基于所述情感信息和/或所述主题信息,向所述用户返回与所述信息相对应的回复。本申请提高了机器人在与用户聊天中的情感互动,提高了机器人与用户的沟通效率,同时也提升了用户的聊天体验。提升了用户的聊天体验。提升了用户的聊天体验。


技术研发人员:

史文鑫

受保护的技术使用者:

平安银行股份有限公司

技术研发日:

2022.11.02

技术公布日:

2022/12/12

本文发布于:2022-12-15 08:27:59,感谢您对本站的认可!

本文链接:https://patent.en369.cn/patent/1/34231.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:所述   信息   用户   模型
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 369专利查询检索平台 豫ICP备2021025688号-20 网站地图