1.本公开涉及人机交互技术领域,特别涉及一种
语音交互配置方法、电子设备和计算机可读介质。
背景技术:
2.车机指的是安装在汽车里面的车载信息娱乐产品的简称,车机在功能上能够实现人与车,车与外界(车与车)的信息通讯。随着科技的不断发展,对车机的人机交互功能的需求也不断更新和发展。
3.车机语音交互免唤醒
指令,指的是用户不需要说出固定的唤醒词,车机即可反应并实现相应技能的指令。例如,当用户想下达的指令为“你好,xx!导航到新街口”(其中“你好,xx!”为唤醒词,唤醒指令为“导航到新街口”)时,用户可以直接说"导航到新街口",车机即可实现相应导航技能。反之,车机语音唤醒指令,指的是用户需要说出固定的唤醒词,车机才会反应并实现相应技能的指令。例如,用户直接说:“发信息给xx”,此时车机并不会响应,用户应该说:“你好,xx!发信息给xx"。
4.目前,车机的语音交互免唤醒指令是固定不变的,无法进行自定义设定或改变,其场景也是预先划分好的,而且所支持的免唤醒技能较少。但是,不同的用户具有不同的需求,恰恰某个用户经常用的技能可能并不是免唤醒技能,因此需要每次说出唤醒指令,导致极大地增加了语音交互的响应时间,降低了语音交互效率。
技术实现要素:
5.本公开的主要目的在于,提供一种语音交互配置方法、电子设备和计算机可读介质,以改善现有技术中存在的上述缺陷。
6.本公开是通过下述技术方案来解决上述技术问题:
7.作为本公开的第一方面,提供一种语音交互配置方法,包括以下
步骤:
8.接收触发语音交互的唤醒指令;
9.响应于检测到
所述唤醒指令的接收次数超过第一预设阈值,将所述唤醒指令设定为免唤醒指令以将所述唤醒指令对应匹配的唤醒技能切换为免唤醒技能,并将设定后的免唤醒指令更新至免唤醒列表中;以及
10.根据设定后的免唤醒指令输出控制信号,以触发所述免唤醒指令对应匹配的免唤醒技能。
11.作为本公开的第二方面,提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行计算机程序时实现如上述的语音交互配置方法。
12.作为本公开的第三方面,提供一种计算机可读介质,其上存储有计算机指令,所述计算机指令在由处理器执行时实现如上述的语音交互配置方法。
13.根据本公开内容,本领域技术人员可以理解本公开内容的其它方面。
14.本公开的积极进步效果在于:
15.本公开提供的语音交互配置方法、电子设备和计算机可读介质,根据用户需求实时智能调整免唤醒列表中的免唤醒指令,从而有效地满足了用户对免唤醒指令的不同需求,节省了语音交互的响应时间,极大地提升了语音交互效率,进而提升了用户体验度。
附图说明
16.在结合以下附图阅读本公开的实施例的详细描述之后,能够更好地理解本公开的所述特征和优点。在附图中,各组件不一定是按比例绘制,并且具有类似的相关特性或特征的组件可能具有相同或相近的附图标记。
17.图1为根据本公开内容的一实施例的语音交互配置方法的免唤醒配置步骤的流程示意图。
18.图2为根据本公开内容的一实施例的语音交互配置方法的免唤醒管理步骤的流程示意图。
19.图3为根据本公开的另一实施例的实现语音交互配置方法的电子设备的结构示意图。
具体实施方式
20.下面通过实施例的方式进一步说明本公开,但并不因此将本公开限制在所述的实施例范围之中。
21.应当注意,在说明书中对“一实施例”、“可选实施例”、“另一实施例”等的引用指示所描述的实施例可以包括特定的特征、结构或特性,但是每个实施例可能不一定包括该特定的特征、结构或特性。而且,这样的短语不一定指代相同的实施例。此外,当结合实施例描述特定特征、结构或特性时,无论是否被明确描述,结合其它实施例来实现这样的特征、结构或特性都在相关领域的技术人员的知识范围内。
22.在本公开内容的描述中,需要理解的是,术语“中心”、“横向”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本公开内容和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本公开内容的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本公开内容的描述中,除非另有说明,“多个”的含义是两个或两个以上。另外,术语“包括”及其任何变形,意图在于覆盖不排他的包含。
23.在本公开内容的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本公开内容中的具体含义。
24.这里所使用的术语仅仅是为了描述具体实施例而不意图限制示例性实施例。除非上下文明确地另有所指,否则这里所使用的单数形式“一个”、“一项”还意图包括复数。还应
当理解的是,这里所使用的术语“包括”和/或“包含”规定所陈述的特征、整数、步骤、操作、单元和/或组件的存在,而不排除存在或添加一个或更多其他特征、整数、步骤、操作、单元、组件和/或其组合。
25.为了克服目前存在的上述缺陷,本实施例提供一种语音交互配置方法,包括以下步骤:接收触发语音交互的唤醒指令;响应于检测到唤醒指令的接收次数超过第一预设阈值,将唤醒指令设定为免唤醒指令以将唤醒指令对应匹配的唤醒技能切换为免唤醒技能,并将设定后的免唤醒指令更新至免唤醒列表中;根据设定后的免唤醒指令输出控制信号,以触发免唤醒指令对应匹配的免唤醒技能。
26.在本实施例中,优选地,该语音交互配置方法应用于车机设备上,但并不具体限定该语音交互配置方法的应用场景,可根据实际需求、实际场景或可能出现的需求和场景进行相应的设定及调整。
27.在本实施例中,根据用户需求实时智能调整免唤醒列表中的免唤醒指令,从而有效地满足了用户对免唤醒指令的不同需求,节省了语音交互的响应时间,极大地提升了语音交互效率,进而提升了用户体验度。
28.具体地,作为一实施例,如图1所示,本实施例提供的语音交互配置方法包括免唤醒配置步骤,该免唤醒配置步骤主要包括以下步骤:
29.步骤101、接收触发语音交互的唤醒指令。
30.在本步骤中,当用户启用语音交互功能时,基于预定义的唤醒词,解析并接收用户触发语音交互的唤醒指令,其中,该唤醒指令用于表征执行对应匹配的唤醒技能。例如,用户说出“你好,xx!发信息给xx”,基于唤醒词“你好,xx!”,触发响应,并执行唤醒指令“发信息给xx”对应的发信息技能。
31.步骤102、响应于检测到唤醒指令的接收次数超过第一预设阈值,将唤醒指令设定为免唤醒指令。
32.在本步骤中,检测到某一个唤醒指令在预设时间段内的接收次数超过第一预设阈值,则可以认为该唤醒指令为该用户的常用指令,因此将该唤醒指令设定为免唤醒指令以将唤醒指令对应匹配的唤醒技能切换为免唤醒技能,并且向用户输出提示信息以提示用户已将该指令升级为免唤醒指令,从而极大地方便用户。
33.在本实施例中,并不具体限定上述预设时间段及上述第一预设阈值,均可根据实际需求、实际场景或可能出现的需求和场景进行相应的设定及调整。
34.将唤醒指令设定为免唤醒指令之后,用户则无需再说出具体唤醒词,即可实现直接响应执行用户所需技能。例如,用户原本需要说:“你好,xx!帮我一家附近500元的餐厅”,大概需要10秒左右可以完成响应及操作,而经过智能学习调度之后,用户可以直接说:“帮我一家附近500元的餐厅”,即可触发寻餐厅技能,而且大概只需要6秒左右可以完成响应及操作。用户原本需要说:“你好,xx!导航到新街口”,而经过智能学习调度之后,用户可以直接说:“导航到新街口”,即可触发导航技能场景。
35.步骤103、将设定后的免唤醒指令更新至免唤醒列表中。
36.在本实施例中,考虑到车机设备的处理速度以及性能,免唤醒列表中的免唤醒指令优选配置在100个左右,当然并不具体限定免唤醒指令的配置数量,可根据实际需求、实际场景或可能出现的需求和场景进行相应的设定及调整。
37.在本步骤中,当将设定后的免唤醒指令更新至免唤醒列表时,根据免唤醒指令的配置数量,可将免唤醒列表中的原免唤醒指令适当进行淘汰,以释放出新免唤醒指令的配置空间,具体规则在下述免唤醒管理步骤中进行赘述。
38.步骤104、根据设定后的免唤醒指令输出控制信号。
39.在本步骤中,根据设定后的免唤醒指令输出控制信号,以触发免唤醒指令对应匹配的免唤醒技能,例如,执行导航技能、启动音乐应用等。
40.本实施例提供的语音交互配置方法的免唤醒配置步骤,根据用户需求实时智能调整免唤醒列表中的免唤醒指令,从而有效地满足了用户对免唤醒指令的不同需求,节省了语音交互的响应时间,极大地提升了语音交互效率,进而提升了用户体验度。
41.如图2所示,本实施例提供的语音交互配置方法还包括与如上述的免唤醒配置步骤并列执行的免唤醒管理步骤,该免唤醒管理步骤主要包括以下步骤:
42.步骤201、将免唤醒列表分为不同分组。
43.作为一可选实施方式,在本步骤中,考虑到车机应用场景的需求,将免唤醒列表分为三组,分别为固定组、可调度组及可调整组,当然并不具体限定分组数量,也可只分为两组或四组以上,可根据实际需求、实际场景或可能出现的需求和场景进行相应的设定及调整。
44.步骤202、对不同分组内的免唤醒指令制定不同的管理规则。
45.作为一可选实施方式,在本步骤中,固定组中配置有固定不变的若干免唤醒指令,其可以为使用频次比较高的免唤醒指令,例如,可以配置20个免唤醒指令作为固定组(可设定为1~20个免唤醒指令区间);可调度组中配置有动态添加的用户最常用的免唤醒指令,例如,可以配置30个免唤醒指令作为可调度组(可设定为21~50个免唤醒指令区间);可调整组中配置有经常会淘汰掉的免唤醒指令,例如,可以配置50个免唤醒指令作为可调整组(可设定为51~100个免唤醒指令区间)。
46.在本实施例中,免唤醒指令匹配是利用hash(散列函数)匹配,一个hash表对应一个分组,里面最终存储是按照树状存储,树状的匹配速度快于顺序的遍历。
47.步骤203、基于制定的管理规则管理或调整不同分组内的免唤醒指令。
48.在本步骤中,将如上述需要更新的免唤醒指令添加至免唤醒列表的可调整组中或移除免唤醒列表的可调整组中的免唤醒指令。
49.具体地,作为一可选实施方式,在本步骤中,响应于检测到一免唤醒指令的使用次数超过第二预设阈值,则表示该免唤醒指令的使用较为频繁,因此可将该免唤醒指令添加至免唤醒列表的可调整组中。
50.在本实施例中,并不具体限定第二预设阈值,可根据实际需求、实际场景或可能出现的需求和场景进行相应的设定及调整。
51.具体地,作为一可选实施方式,在本步骤中,将免唤醒列表的可调整组中的每个免唤醒指令根据使用次数进行排序;基于排序结果从可调整组中移除排序靠后的第一预设数量的免唤醒指令;将从可调整组移除的免唤醒指令调整为唤醒指令并将调整后的唤醒指令更新至唤醒列表中,并且将其使用次数清零。
52.在本实施例中,并不具体限定第一预设数量,可根据实际需求、实际场景或可能出现的需求和场景进行相应的设定及调整。
53.在本步骤中,还将免唤醒指令添加至可调度组中或将可调度组中的免唤醒指令移入至可调整组。
54.具体地,作为一可选实施方式,在本步骤中,将可调整组中的免唤醒指令添加至可调度组中,即将可调整组中使用次数明显较多的免唤醒指令直接添加至可调度组中,从而加快响应速度。
55.具体地,作为一可选实施方式,在本步骤中,将可调度组中的每个免唤醒指令根据使用次数进行排序;基于排序结果从可调度组中将排序靠后的第二预设数量的免唤醒指令移入至可调整组。
56.在本实施例中,并不具体限定第二预设数量,可根据实际需求、实际场景或可能出现的需求和场景进行相应的设定及调整。
57.步骤204、更新并存储免唤醒列表。
58.在本步骤中,可利用上述管理规则实时或定期更新并存储免唤醒列表。
59.作为一可选实施方式,当免唤醒指令数量较多时,可将固定组及可调度组中的免唤醒指令设定为一级缓存。
60.具体地,固定组及可调度组(或也可以是可调整组)作为一级缓存存放在ram(随机存取存储器)上面,可调整组(或分组之外的免唤醒指令)放在磁盘中作为二级缓存。这样,一级缓存因为存放在内存里,以使得加快响应速度,二级缓存存放在磁盘中,响应速度会较慢,但采用这种方式会极大地增加可利用的免唤醒指令数量,同时保证响应速度。当然,在免唤醒指令的数量较少或不太多时,也可将所有的免唤醒指令均存储在ram里面的hash表里。
61.本实施例提供的语音交互配置方法的免唤醒管理步骤,可以定期淘汰不常用的免唤醒指令,还可以加快剩余的免唤醒指令的响应速度。例如:原有固定100个免唤醒的技能列表,无法调整,用户使用免唤醒技能的响应时间大概为200ms左右,经过智能淘汰和调整之后,响应时间可以降低到180ms左右,从而加快了响应速度,而且免唤醒列表是可以动态缩减,免唤醒列表最终留存的免唤醒指令都是该用户最常用的免唤醒指令,从而有效地满足了用户对免唤醒指令的不同需求,进而提升了用户体验度。
62.图3为根据本实施例提供的一种电子设备的结构示意图。电子设备包括存储器、处理器及存储在存储器上并可在处理器上执行的计算机程序,处理器执行程序时实现如上实施例中的语音交互配置方法。图3显示的电子设备30仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
63.如图3所示,电子设备30可以以通用计算设备的形式表现,例如其可以为服务器设备。电子设备30的组件可以包括但不限于:上述至少一个处理器31、上述至少一个存储器32、连接不同系统组件(包括存储器32和处理器31)的总线33。
64.总线33包括数据总线、地址总线和控制总线。
65.存储器32可以包括易失性存储器,例如随机存取存储器(ram)321和/或高速缓存存储器322,还可以进一步包括只读存储器(rom)323。
66.存储器32还可以包括具有一组(至少一个)程序模块324的程序/实用工具325,这样的程序模块324包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
67.处理器31通过执行存储在存储器32中的计算机程序,从而执行各种功能应用以及数据处理,例如本公开如上实施例中的语音交互配置方法。
68.电子设备30也可以与一个或多个外部设备34(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(i/o)接口35进行。并且,模型生成的设备30还可以通过网络适配器36与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。如图3所示,网络适配器36通过总线33与模型生成的设备30的其它模块通信。应当明白,尽管图中未示出,可以结合模型生成的设备30使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、raid(磁盘阵列)系统、磁带驱动器以及数据备份存储系统等。
69.应当注意,尽管在上文详细描述中提及了电子设备的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
70.本实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,程序被处理器执行时实现如上实施例中的语音交互配置方法中的步骤。
71.其中,可读存储介质可以采用的更具体可以包括但不限于:便携式盘、硬盘、随机存取存储器、只读存储器、可擦拭可编程只读存储器、光存储器件、磁存储器件或上述的任意合适的组合。
72.在可能的实施方式中,本公开还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上执行时,程序代码用于使终端设备执行实现如上实施例中的语音交互配置方法中的步骤。
73.其中,可以以一种或多种程序设计语言的任意组合来编写用于执行本公开的程序代码,程序代码可以完全地在用户设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户设备上部分在远程设备上执行或完全在远程设备上执行。
74.虽然以上描述了本公开的具体实施方式,但是本领域的技术人员应当理解,这仅是举例说明,本公开的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本公开的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本公开的保护范围。
技术特征:
1.一种语音交互配置方法,其特征在于,包括以下步骤:接收触发语音交互的唤醒指令;响应于检测到所述唤醒指令的接收次数超过第一预设阈值,将所述唤醒指令设定为免唤醒指令以将所述唤醒指令对应匹配的唤醒技能切换为免唤醒技能,并将设定后的免唤醒指令更新至免唤醒列表中;以及根据设定后的免唤醒指令输出控制信号,以触发所述免唤醒指令对应匹配的免唤醒技能。2.如权利要求1所述的方法,还包括以下步骤:将免唤醒指令添加至所述免唤醒列表的可调整组中或移除所述免唤醒列表的可调整组中的免唤醒指令,所述免唤醒列表中的若干免唤醒指令分为至少两组,其中一组为所述可调整组。3.如权利要求2所述的方法,所述将免唤醒指令添加至所述免唤醒列表的可调整组中的步骤,包括以下步骤:响应于检测到一免唤醒指令的使用次数超过第二预设阈值,将该免唤醒指令添加至所述免唤醒列表的可调整组中。4.如权利要求2所述的方法,所述移除所述免唤醒列表的可调整组中的免唤醒指令的步骤,包括以下步骤:将免唤醒列表的可调整组中的每个免唤醒指令根据使用次数进行排序;基于排序结果从所述可调整组中移除排序靠后的第一预设数量的免唤醒指令。5.如权利要求4所述的方法,还包括以下步骤:将从所述可调整组移除的免唤醒指令调整为唤醒指令并将调整后的唤醒指令更新至唤醒列表中。6.如权利要求2所述的方法,所述免唤醒列表中的若干免唤醒指令的至少两组中一组为固定组,所述固定组中配置有固定不变的若干免唤醒指令。7.如权利要求6所述的方法,所述免唤醒列表中的若干免唤醒指令分为至少三组,其中至少一组为可调度组;所述方法还包括以下步骤:将免唤醒指令添加至所述可调度组中或将所述可调度组中的免唤醒指令移入至所述可调整组。8.如权利要求7所述的方法,所述将免唤醒指令添加至所述可调度组中的步骤,包括以下步骤:将所述可调整组中的免唤醒指令添加至所述可调度组中。9.如权利要求7所述的方法,所述将所述可调度组中的免唤醒指令移入至所述可调整组的步骤,包括以下步骤:将所述可调度组中的每个免唤醒指令根据使用次数进行排序;基于排序结果从所述可调度组中将排序靠后的第二预设数量的免唤醒指令移入至所述可调整组。10.如权利要求7所述的方法,还包括以下步骤:将所述固定组及所述可调度组中的免唤醒指令设定为一级缓存。
11.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行计算机程序时实现如权利要求1~10中任意一项所述的语音交互配置方法。12.一种计算机可读介质,其上存储有计算机指令,其特征在于,所述计算机指令在由处理器执行时实现如权利要求1~10中任意一项所述的语音交互配置方法。
技术总结
本公开提供了一种语音交互配置方法、电子设备和计算机可读介质。该方法包括以下步骤:接收触发语音交互的唤醒指令;响应于检测到唤醒指令的接收次数超过第一预设阈值,将唤醒指令设定为免唤醒指令以将唤醒指令对应匹配的唤醒技能切换为免唤醒技能,并将设定后的免唤醒指令更新至免唤醒列表中;根据设定后的免唤醒指令输出控制信号,以触发免唤醒指令对应匹配的免唤醒技能。本公开根据用户需求实时智能调整免唤醒列表中的免唤醒指令,从而有效地满足了用户对免唤醒指令的不同需求,节省了语音交互的响应时间,极大地提升了语音交互效率,进而提升了用户体验度。进而提升了用户体验度。进而提升了用户体验度。
技术研发人员:
姜顺豹
受保护的技术使用者:
上海擎感智能科技有限公司
技术研发日:
2021.08.12
技术公布日:
2023/2/16