一种语音控制方法、装置、电子设备及存储介质与流程

阅读: 评论:0


一种语音控制方法、装置、电子设备及存储介质
【技术领域】
1.本技术实施例涉及终端技术领域,尤其涉及一种语音控制方法、装置、电子设备及存储介质。


背景技术:



2.目前,随着语音助手的发展,各种应用程序能够由语音指令控制页面操作,即根据用户发出的语音指令启动各种应用程序,完成一些常规的操作,无需用户手动操作,给用户的使用带来一定便捷。
3.但现有技术中,当用户的某一任务涉及到需要对应用程序中的多个页面进行操作时,需要在跳转至每个页面后,单独进行语言控制,导致语言控制操作较为繁琐,效率较低。


技术实现要素:



4.本技术实施例提供了一种语音控制方法、装置、电子设备及存储介质,能够根据用户完整的语音指令自动执行步骤,直至完成完整语音指令对应的任务,使人机交互更高效、便捷。
5.第一方面,本技术实施例提供了一种语音控制方法,所述方法包括:
6.通过第三方语音助手接收目标语音指令,所述目标语音指令中携带有待执行的目标任务所对应的目标应用程序、目标任务参数集合以及目标任务类型;
7.基于预先存储的任务类型与标准步骤序列的对应关系,确定出所述目标任务类型对应的目标标准步骤序列;
8.基于预先存储的任务参数与标准步骤的对应关系,从所述目标任务参数集合中确定所述目标标准步骤序列中每个目标标准步骤对应的目标任务参数;
9.针对所述目标应用程序,基于所述目标任务参数执行对应的目标标准步骤,直至所述目标标准步骤序列中的全部标准步骤执行完毕。
10.本技术实施例中,可以认为任务类型与标准步骤序列存在对应关系,即不同的任务类型对应不同的标准步骤序列,同时,任务参数与标准步骤也可以认为存在对应关系,即不同的标准步骤对应不同的任务参数。当获取了目标语音指令中的目标任务类型后,便可以根据目标任务类型确定目标标准步骤序列,进一步地,根据目标标准步骤确定目标任务参数,针对目标语音指令中所指向的目标应用程序,根据目标任务参数,相应地执行目标标准步骤,当目标标准步骤序列中的全部标准步骤执行完毕,就完成了目标语音指令对应的任务,无需要用户在应用程序的不同页面上多次发出语音指令,实现了目标标准步骤序列的自动执行,简化了语言控制流程,提升了语言控制效率。
11.可选的,任一标准步骤序列中的首个标准步骤均为启动对应应用程序的步骤,针对所述目标应用程序,基于所述目标任务参数执行对应的目标标准步骤,直至所述目标标准步骤序列中的全部标准步骤执行完毕,包括:
12.执行所述目标标准步骤序列中的首个标准步骤,以启动所述目标应用程序;
13.基于预先存储的应用程序的页面标识与标准步骤子序列的对应关系,从所述目标标准步骤序列中确定出所述目标应用程序的首页标识相对应的第一标准步骤子序列,所述首页标识为所述目标应用程序的首页的页面标识;
14.在所述目标应用程序的所述首页,基于所述目标任务参数执行所述第一标准步骤子序列中对应的每个目标标准步骤,以使跳转至第一次级页面;
15.基于预先存储的应用程序的页面标识与标准步骤子序列的对应关系,从所述目标标准步骤序列中确定出所述目标应用程序的第一次级页面标识相对应的第二标准步骤子序列,所述第一次级页面标识为所述目标应用程序的所述第一次级页面的页面标识;
16.在所述第一次级页面,基于所述目标任务参数执行所述第二标准步骤子序列中对应的每个目标标准步骤,以使跳转至第二次级页面,以此类推,直至所述目标标准步骤序列中的全部目标标准步骤执行完毕。
17.本技术实施例中,目标标准步骤序列中的全部目标标准步骤可能是在不同的页面中执行的,而应用程序中的页面标识与在该页面上执行的标准步骤子序列可以认为存在对应关系,那么在启动目标应用程序之后,可以根据目标应用程序所处的页面,确定并执行相应的标准步骤子序列,直到目标标准步骤序列中的全部目标标准步骤执行完毕,实现了目标标准步骤序列的自动执行,简化了语言控制流程,提升了语言控制效率。
18.可选的,在所述目标应用程序的所述首页,基于所述目标任务参数执行所述第一标准步骤子序列中对应的每个目标标准步骤,包括:
19.在所述目标应用程序的所述首页,基于预先存储的标准步骤与标准步骤代码的对应关系,确定所述第一标准步骤子序列中每个目标标准步骤对应的目标标准步骤代码;
20.基于每个所述目标标准步骤对应的目标标准步骤代码以及目标任务参数,执行所述目标标准步骤。
21.本技术实施例中,可以认为标准步骤与标准步骤代码有一定的对应关系,当首页对应的第一标准步骤子序列确定后,便可以确定出上述第一标准步骤子序列中的每个目标标准步骤对应的目标标准步骤代码,于是根据目标标准步骤对应的目标标准步骤代码以及目标任务参数,以使执行该目标标准步骤。
22.可选的,所述目标标准步骤代码中预先定义有所述目标标准步骤对应的目标页面元素,基于每个所述目标标准步骤对应的目标标准步骤代码以及目标任务参数,执行所述目标标准步骤,包括:
23.基于每个所述目标标准步骤对应的目标标准步骤代码以及目标任务参数,执行针对所述目标页面元素的所述目标标准步骤。
24.本技术实施例中,当确定了目标标准步骤对应的目标标准步骤代码后,可以认为上述的目标标准代码中预先定义有目标标准步骤对应的目标元素,故根据每个目标标准步骤对应的目标标准步骤代码以及目标任务参数,便可以针对目标页面元素执行对应的目标标准步骤,从而准确的实现目标标准步骤。
25.可选的,当执行所述目标标准步骤序列中任一标准步骤时,语音播放所述任一标准步骤对应的标准步骤内容。
26.本技术实施例中,当执行目标标准步骤序列中任一标准步骤时,能够语音播放任一标准步骤对应的标准步骤内容,以使用户知晓当前的步骤执行情况,若有步骤执行错误,
用户能够立即中断执行,有效避免全部目标标准步骤执行完毕后,并没有实现用户目标语音指令对应的目标任务的情况。
27.第二方面,本技术实施例提供了一种语音控制装置,所述装置包括:
28.接收单元,用于通过第三方语音助手接收目标语音指令,所述目标语音指令中携带有待执行的目标任务所对应的目标应用程序、目标任务参数集合以及目标任务类型;
29.第一确定单元,用于基于预先存储的任务类型与标准步骤序列的对应关系,确定出所述目标任务类型对应的目标标准步骤序列;
30.第二确定单元,用于基于预先存储的任务参数与标准步骤的对应关系,从所述目标任务参数集合中确定所述目标标准步骤序列中每个目标标准步骤对应的目标任务参数;
31.执行单元,用于针对所述目标应用程序,基于所述目标任务参数执行对应的目标标准步骤,直至所述目标标准步骤序列中的全部标准步骤执行完毕。
32.可选的,任一标准步骤序列中的首个标准步骤均为启动对应应用程序的步骤,所述执行单元包括:
33.步骤执行单元,用于所述目标标准步骤序列中的首个标准步骤,以启动所述目标应用程序;
34.第一标准步骤子序列确定单元,用于基于预先存储的应用程序的页面标识与标准步骤子序列的对应关系,从所述目标标准步骤序列中确定出所述目标应用程序的首页标识相对应的第一标准步骤子序列,所述首页标识为所述目标应用程序的首页的页面标识;
35.所述步骤执行单元,还用于在所述目标应用程序的所述首页,基于所述目标任务参数执行所述第一标准步骤子序列中对应的每个目标标准步骤,以使跳转至第一次级页面;
36.第二标准步骤子序列确定单元,用于基于预先存储的应用程序的页面标识与标准步骤子序列的对应关系,从所述目标标准步骤序列中确定出所述目标应用程序的第一次级页面标识相对应的第二标准步骤子序列,所述第一次级页面标识为所述目标应用程序的所述第一次级页面的页面标识;
37.所述步骤执行单元,还用于在所述第一次级页面,基于所述目标任务参数执行所述第二标准步骤子序列中对应的每个目标标准步骤,以使跳转至第二次级页面,以此类推,直至所述目标标准步骤序列中的全部目标标准步骤执行完毕。
38.可选的,所述步骤执行单元包括:
39.步骤代码确定单元,用于所述目标应用程序的所述首页,基于预先存储的标准步骤与标准步骤代码的对应关系,确定所述第一标准步骤子序列中每个目标标准步骤对应的目标标准步骤代码;
40.步骤代码执行单元,用于基于每个所述目标标准步骤对应的目标标准步骤代码以及目标任务参数,执行所述目标标准步骤。
41.可选的,所述目标标准步骤代码中预先定义有所述目标标准步骤对应的目标页面元素,基于每个所述目标标准步骤对应的目标标准步骤代码以及目标任务参数,所述步骤代码执行单元具体用于:
42.基于每个所述目标标准步骤对应的目标标准步骤代码以及目标任务参数,执行针对所述目标页面元素的所述目标标准步骤。
43.可选的,所述装置还包括:
44.语音播放单元,用于当执行所述目标标准步骤序列中任一标准步骤时,语音播放所述任一标准步骤对应的标准步骤内容。
45.第三方面,本发明实施例提供了一种电子设备,所述电子设备包括至少一个处理器以及与所述至少一个处理器连接的存储器,所述至少一个处理器用于执行存储器中存储的计算机程序时实现如第一方面任一实施例所述方法的步骤。
46.第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面任一实施例所述方法的步骤。
47.应当理解的是,本发明实施例的第二~四方面与本发明实施例的第一方面的技术方案一致,各方面及对应的可行实施方式所取得的有益效果相似,不再赘述。
【附图说明】
48.为了更清楚地说明本技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
49.图1为本技术实施例提供的一种语音控制方法的流程图;
50.图2为本技术实施例提供的一种视频应用程序首页的结构示意图;
51.图3为本技术实施例提供的一种视频应用程序第一次级页面的结构示意图;
52.图4为本技术实施例提供的一种视频应用程序第二次级页面的结构示意图;
53.图5为本技术实施例提供的一种视频应用程序第三次级页面的结构示意图;
54.图6为本技术实施例提供的一种视频应用程序第四次级页面的结构示意图;
55.图7为本技术实施例提供的一种语音控制方法的逻辑示意图;
56.图8为本技术实施例提供的一种语音控制装置的结构示意图;
57.图9为本技术实施例提供的一种电子设备的结构示意图。
【具体实施方式】
58.为了更好的理解本说明书的技术方案,下面结合附图对本技术实施例进行详细描述。
59.应当明确,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本说明书保护的范围。
60.在本技术实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书。在本技术实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
61.随着应用程序不断的开发,越来越多的应用程序支持语音控制功能,即根据用户发出的语音指令,通过语音助手接收到语音指令后,对于语音指令对应的步骤能够去自动执行,无需用户手动操作。
62.经本技术发明人研究发现,当用户的某一任务涉及到需要对应用程序中的多个页
面进行操作时,需要在跳转至每个页面后,单独进行语言控制,即可见即可说,而对于未见的页面,则无法进行语音控制,导致语言控制操作较为繁琐,效率较低。
63.鉴于此,本技术实施例提供了一种语音控制方法,该方法中,可以认为任务类型与标准步骤序列存在对应关系,即不同的任务类型对应不同的标准步骤序列,同时,任务参数与标准步骤也可以认为存在对应关系,即不同的标准步骤对应不同的任务参数。当获取了目标语音指令中的目标任务类型后,便可以根据目标任务类型确定目标标准步骤序列,进一步地,根据目标标准步骤确定目标任务参数,针对目标语音指令中所指向的目标应用程序,根据目标任务参数,相应地执行目标标准步骤,当目标标准步骤序列中的全部标准步骤执行完毕,就完成了目标语音指令对应的任务,无需要用户在应用程序的不同页面上多次发出语音指令,实现了目标标准步骤序列的自动执行,简化了语言控制流程,提升了语言控制效率。
64.下面结合附图对本技术实施例提供的技术方案进行介绍。请参见图1,本技术实施例提供了一种语音控制方法,应用于终端,这里的终端可以认为是手机(ios手机,android手机)、平板电脑、笔记本电脑等,此处不做特别限制,该方法流程描述如下:
65.步骤101:通过第三方语音助手接收目标语音指令,目标语音指令中携带有待执行的目标任务所对应的目标应用程序、目标任务参数集合以及目标任务类型。
66.本技术实施例中,终端可以由第三方语音助手接收用户发出的目标语音指令,该目标语音指令中携带有执行目标任务对应的目标应用程序、目标任务参数集合以及目标任务类型。应理解,不同品牌的手机内置的第三方语言助手可以认为不相同,例如,苹果手机的第三方语音助手为“siri”;小米手机的第三方语音助手为“小爱同学”;华为手机的第三方语音助手为“小艺”,此处对可用于本技术方法的手机品牌类型不做特别限制。
67.例如,用户发出的语音指令为:小艺小艺,打开腾讯视频,打开《梦华录》3集,全屏播放。该目标语音指令中携带有目标应用程序:腾讯视频,目标任务参数集合:《梦华录》、3集,目标任务类型:视频播放。
68.步骤102:基于预先存储的任务类型与标准步骤序列的对应关系,确定出目标任务类型对应的目标标准步骤序列。
69.本技术实施例中,可以认为任务类型与标准步骤序列存在对应关系,即不同的任务类型对应不同的标准步骤序列,因此,当确定出目标语音指令对应的目标任务类型之后,便可以确定出对应的标准步骤序列。
70.作为一种可能的实施方式,终端中可以认为预先存储有任务类型与标准步骤序列之间的对应关系,基于上述对应关系,当根据用户发出的目标语音指令确定目标任务类型后,便可以根据目标任务类型获得目标标准步骤序列。
71.例如,若确定目标任务类型为视频播放类型,获得的目标标准步骤序列为:1、启动并打开视频应用程序;2、点击搜索框;3、输入视频名称;4、点击搜索;5、点击搜索结果;6、点击集数;7、点击全屏播放。
72.又例如,若确定目标任务类型为信息发送类型,获得的目标标准步骤序列为:1、启动并打开社交应用程序;2点击搜索框;3、输入联系人名称;4、点击搜索结果;5、点击聊天对话框;6、输入要发送的信息;7、点击发送。
73.步骤103:基于预先存储的任务参数与标准步骤的对应关系,从目标任务参数集合
中确定目标标准步骤序列中每个目标标准步骤对应的目标任务参数。
74.本技术实施例中,由于目标语音指令中携带有目标任务参数集合,所以当接收到用户发出的目标语音指令后,终端便能够获得目标任务参数集合,其中,目标参数集合中的每个目标任务参数表征的是用户基于实现目标任务,针对每个目标标准步骤而表述的具体任务内容,以使终端基于目标标准步骤对应的目标任务参数执行每一步目标标准步骤,所以想要执行完目标标准步骤序列中的全部目标标准步骤,首先就要确定每个目标标准步骤对应的目标参数。
75.作为一种可能的实施方式,终端中可以认为预先存储有任务参数与标准步骤之间的对应关系,那么在确定目标标准步骤序列后,基于上述对应关系,便可以确定出目标标准步骤序列中每个目标标准步骤对应的目标任务参数。应当理解,上述目标标准步骤序列中部分目标标准步骤对应的目标任务参数可以为空值。
76.例如,用户发出的语音指令为:小艺小艺,打开腾讯视频,打开《梦华录》3集,全屏播放。该目标语音指令中携带有目标应用程序:腾讯视频,目标任务参数集合:《梦华录》、3集,目标任务类型:视频播放。确定出目标任务类型为视频播放类型,视频播放类型对应的目标标准步骤为:1、启动并打开视频应用程序;2、点击搜索框;3、输入视频名称;4、点击搜索;5、点击搜索结果;6、点击集数;7、点击全屏播放。此时目标标准步骤1、2、4、5以及7对应的目标任务参数为空值,而目标标准步骤3对应的目标任务参数为视频名称《梦华录》、目标标准步骤6对应的目标任务参数为播放集数3集。
77.步骤104:针对目标应用程序,基于目标任务参数执行对应的目标标准步骤,直至目标标准步骤序列中的全部标准步骤执行完毕。
78.本技术实施例中,在确定了目标标准步骤对应的目标任务参数后,便可以根据目标标准参数执行对应的目标标准步骤,直到目标标准步骤序列中的全部目标标准步骤执行完毕,达到自动执行用户所希望完成的目标任务对应的全部目标标准步骤的目的。
79.例如,用户发出的语音指令为:小艺小艺,打开腾讯视频,打开《梦华录》3集,全屏播放。该目标语音指令中携带有目标应用程序:腾讯视频,目标任务参数集合:《梦华录》、3集,目标任务类型:视频播放。确定出目标任务类型为视频播放类型,视频播放类型对应的目标标准步骤为:1、启动并打开视频应用程序;2、点击搜索框;3、输入视频名称;4、点击搜索;5、点击搜索结果;6、点击集数;7、点击全屏播放。此时目标标准步骤1、2、4、5以及7对应的目标任务参数为空值,而目标标准步骤3对应的目标任务参数为视频名称《梦华录》、目标标准步骤6对应的目标任务参数为播放集数3集,所以最终获得的目标标准步骤序列为:1、启动并打开腾讯视频;2、点击搜索框;3、输入“梦华录”;4、点击搜索;5、点击搜索结果;6、点击“3集”;7、点击全屏播放。根据目标任务参数《梦华录》、3集执行最终获得的目标标准步骤序列中的全部目标标准步骤。
80.在一些实施例中,考虑到目标标准步骤序列中的全部目标标准步骤可能是在不同的页面中执行的,因此,在执行上述全部目标标准步骤的过程中,需要根据目标应用程序当前所处的具体页面,来确定哪些目标标准步骤需要被执行,以便于可以准确的执行完全部目标标准步骤。
81.作为一种可能的实施例,任一标准步骤序列中的首个标准步骤均为启动对应应用程序的步骤,首先,终端可以基于目标标准步骤序列中的首个标准步骤,从而启动目标应用
程序,并使目标应用程序进入首页。然后,终端中可以认为预先存储有应用程序的页面标识与标准步骤子序列的对应关系,因此,基于上述对应关系,可以确定出首页标识(即首页的页面标识)所对应的第一标准步骤子序列,然后执行上述第一标准步骤子序列中的每个目标标准步骤,执行完毕后便跳转至第一次级页面。在第一次级页面,便又会根据上述对应关系,确定出第一次级页面标识(即第一次级页面的页面标识)所对应的第二标准步骤子序列,然后在第一次级页面上,执行上述第二目标子序列中的每个目标标准步骤。以此类推,直到目标标准步骤序列中的全部目标标准步骤执行完毕,即直到完成目标任务。应理解,目标应用程序所需跳转的页面的次数与具体的任务类型相关,此处不做特别限制。
82.例如,若用户发出的语音指令为:小艺小艺,打开腾讯视频,打开《梦华录》3集,全屏播放。该目标语音指令中携带有目标应用程序:腾讯视频,目标任务参数集合:《梦华录》、3集,目标任务类型:视频播放。根据视频播放类型确定目标标准步骤序列为:1、启动并打开腾讯视频;2、点击搜索框;3、输入“梦华录”;4、点击搜索;5、点击搜索结果;6、点击“3集”;7、点击全屏播放。
83.其中,请参见图2,根据目标标准步骤1启动并打开腾讯视频,在打开腾讯视频后进入腾讯视频的首页,在首页对应的第一目标标准步骤子序列为:2、点击搜索框,当上述的第一目标标准步骤子序列执行完毕后,页面跳转至第一次级页面;请参见图3,在第一次级页面对应的第二目标标准步骤子序列为:3、输入“梦华录”;4、点击搜索,当上述的第二目标标准步骤子序列执行完毕后,页面跳转至第二次级页面;请参见图4,在第二次级页面对应的第三目标标准步骤子序列为:5、点击搜索结果,当第三目标标准子序列执行完毕后,页面跳转至第三次级页面;请参见图5,在第三次级页面对应的第四目标标准步骤子序列为:6、点击“3集”;7、点击全屏播放,当第四目标标准子序列执行完毕后,页面跳转至所述第四次级页面;请参见图6,此时目标标准步骤序列中的全部目标标准步骤执行完毕,即目标任务达成,为目标语音指令对应的全部目标标准步骤执行完毕对应的页面。
84.在一些实施例中,考虑到执行目标标准步骤序列中每个目标标准步骤,依赖于对应的程序代码以及用户所语音指令中所携带的对应的任务参数,因此,本技术实施例中,在执行上述每个目标标准步骤时,可以先查到对应的程序代码,同时结合该目标标准步骤对应的任务参数,从而准确的执行该目标标准步骤。
85.以目标应用程序当前处于首页为例,终端中可以认为预先存储有表征步骤与标准步骤代码的对应关系,然后基于上述对应关系,便可以确定出需要在首页执行的第一标准步骤子序列中的每个目标标准步骤对应的目标标准步骤代码。然后,基于上述每个目标标准步骤对应的目标标准步骤代码以及目标任务参数,来执行该目标标准步骤。
86.应理解,在目标应用程序的其他页面(非首页)时,执行其他页面对应的标准步骤子序列中的每个目标标准步骤时的具体过程,与在首页时是相同的,此处不再赘述。
87.在一些实施例中,考虑到对于在目标应用程序的任一页面执行的任一标准步骤而言,均存在对应的执行对象,即可以认为是页面中所存在的某一元素,因此,本技术实施例中,在执行每个标准步骤时,要先确认该标准步骤对应的是哪个元素,才能针对特定元素去执行相应的标准步骤。
88.作为一种可能的实施方式,第一标准步骤子序列中的每个目标标准步骤对应的目标标准步骤代码中,可以认为预先定义有目标标准步骤对应的目标页面元素,那么在执行
上述第一标准步骤子序列中的每个目标标准步骤时,上述目标页面元素可以认为与目标标准步骤代码以及目标标准步骤是相关的,然后执行上述的目标标准步骤代码,从而执行针对上述目标页面元素的目标标准步骤。
89.应理解,在目标应用程序的其他页面(非首页)时,执行其他页面对应的标准步骤子序列中的每个目标标准步骤时的具体过程,与在首页时是相同的,此处不再赘述。
90.例如,请参见图2,该页面中对应的标准步骤子序列仅为点击“搜索框”这一目标标准步骤,此时需要先到页面上的“搜索框”元素,才能进行点击搜索框,从而完成上述目标标准步骤。
91.在一些申请实施例中,考虑到目标标准步骤序列中的全部目标标准步骤在执行过程中出现执行错误,需要让用户实时知晓步骤执行情况,避免当全面目标标准步骤执行完毕时,获得的执行结果并非用户目标语音指令对应的结果这种情况的发生。
92.作为一种可能的实施方式,当执行目标标准步骤序列中任一标准步骤时,终端可以语音播放任一标准步骤对应的标准步骤内容,以使用户知晓当前的步骤执行情况,若有步骤执行错误,用户能够立即中断执行。
93.例如,用户发出的语音指令为:小艺小艺,打开腾讯视频,打开《梦华录》3集,全屏播放。该目标语音指令中携带有目标应用程序:腾讯视频,目标任务参数集合:《梦华录》、3集,目标任务类型:视频播放。确定出目标任务类型为视频播放类型,最终获得的目标标准步骤序列为:1、启动并打开腾讯视频;2、点击搜索框;3、输入“梦华录”;4、点击搜索;5、点击搜索结果;6、点击“3集”;7、点击全屏播放。当执行上述7个步骤中的任一步骤时,都会语音播放目标标准步骤对应的标准步骤内容,比如执行目标标准步骤1“启动并打开腾讯视频”,此时会语音播放“启动并打开腾讯视频”,用户可以根据语音播放的标准步骤内容,判断当前进行的步骤是否错误。
94.请参见图7,并结合图2-图6,继续以播放《梦华录》为例子,针对如何执行目标标准步骤序列中的全部目标标准步骤进行详细说明。
95.首先,用户发出目标语音指令:小艺小艺,打开腾讯视频,打开《梦华录》3集,全屏播放。通过语音助手接收该目标语音指令,该目标语音指令中携带有目标应用程序:腾讯视频,目标任务参数集合:《梦华录》、3集,目标任务类型:视频播放。根据预先存储的视频播放类型与标准步骤序列的对应关系,确定出目标标准步骤序列为:1、启动并打开腾讯视频;2、点击搜索框;3、输入视频名称;4、点击搜索;5、点击搜索结果;6、点击集数;7、点击全屏播放。结合目标任务参数集合与目标标准步骤序列中全部目标标准步骤的对应关系,根据每个目标标准步骤对应的目标任务参数,确定出目标标准步骤3“输入视频名称”对应的目标任务参数为“梦华录”,目标标准步骤6“点击集数”对应的目标任务参数为“3集”,而上述目标标准步骤序列中的其它目标标准步骤对应的目标任务参数为空值。然后基于目标标准步骤序列开始执行全部目标标准步骤,执行目标标准步骤1,对应启动并打开腾讯视频,在进入腾讯视频首页后,请参见图2,在首页对应的第一目标标准步骤子序列为目标标准步骤2“点击搜索框”,查首页上对应的目标页面元素“搜索框”,执行目标标准步骤2,执行完毕后,在首页没有下一步骤,但目标标准步骤序列中的全部目标标准步骤并没有执行完毕,此时页面跳转至第一次级页面,请参见图3,在第一次级页面对应的第二目标标准步骤子序列为目标标准步骤3“输入视频名称”、目标标准步骤4“点击搜索”,在第一次级页面上查目
标页面元素“输入框”,基于目标任务参数“梦华录”执行步骤目标标准3,执行完毕后,在第一次级页面上还要下一个步骤,即目标标准步骤4,在第一次级页面上查目标页面元素“搜索”,执行目标标准步骤4,执行完毕后,在第一次级页面上没有下一步骤,但目标标准步骤序列中的全部目标标准步骤并没有执行完毕,此时页面跳转至第二次级页面,请参见图4,在第二次级页面对应的第三目标标准步骤子序列为目标标准步骤5“点击搜索结果”,在第二次级页面上查目标页面元素“搜索结果”,执行目标标准步骤5,执行完毕后,在第二次级页面没有下一步骤,但目标标准步骤序列中的全部目标标准步骤并没有执行完毕,此时页面跳转至第三次级页面,请参见图5,在第三次级页面对应的第四目标标准步骤子序列为目标标准步骤6“点击集数”、目标标准步骤7“点击全屏播放”,基于目标任务参数“3集”在第三次级页面上查目标页面元素“3集”,执行目标标准步骤6,执行完毕后,在第三次级页面上还要下一个步骤,即目标标准步骤7,在第三次级页面上查目标页面元素“全屏播放”,执行目标标准步骤7,执行完毕后,在第三次级页面上没有下一步骤,并且此时目标标准步骤序列中的全部目标标准步骤执行完毕,此时页面跳转至目标任务完成时对应的第四次级页面,请参见图6。
96.请参见图8,基于同一发明构思,本技术实施例还提供了一种语音控制装置,该装置包括:接收单元201、第一确定单元202、第二确定单元203以及执行单元204。
97.接收单元201,用于通过第三方语音助手接收目标语音指令,目标语音指令中携带有待执行的目标任务所对应的目标应用程序、目标任务参数集合以及目标任务类型;
98.第一确定单元202,用于基于预先存储的任务类型与标准步骤序列的对应关系,确定出目标任务类型对应的目标标准步骤序列;
99.第二确定单元203,用于基于预先存储的任务参数与标准步骤的对应关系,从目标任务参数集合中确定目标标准步骤序列中每个目标标准步骤对应的目标任务参数;
100.执行单元204,用于针对目标应用程序,基于目标任务参数执行对应的目标标准步骤,直至目标标准步骤序列中的全部标准步骤执行完毕。
101.可选的,任一标准步骤序列中的首个标准步骤均为启动对应应用程序的步骤,执行单元204包括:
102.步骤执行单元,用于目标标准步骤序列中的首个标准步骤,以启动目标应用程序;
103.第一标准步骤子序列确定单元,用于基于预先存储的应用程序的页面标识与标准步骤子序列的对应关系,从目标标准步骤序列中确定出目标应用程序的首页标识相对应的第一标准步骤子序列,首页标识为目标应用程序的首页的页面标识;
104.步骤执行单元,还用于在目标应用程序的首页,基于目标任务参数执行第一标准步骤子序列中对应的每个目标标准步骤,以使跳转至第一次级页面;
105.第二标准步骤子序列确定单元,用于基于预先存储的应用程序的页面标识与标准步骤子序列的对应关系,从目标标准步骤序列中确定出目标应用程序的第一次级页面标识相对应的第二标准步骤子序列,第一次级页面标识为目标应用程序的第一次级页面的页面标识;
106.步骤执行单元,还用于在第一次级页面,基于目标任务参数执行第二标准步骤子序列中对应的每个目标标准步骤,以使跳转至第二次级页面,以此类推,直至目标标准步骤序列中的全部目标标准步骤执行完毕。
107.可选的,步骤执行单元包括:
108.步骤代码确定单元,用于目标应用程序的首页,基于预先存储的标准步骤与标准步骤代码的对应关系,确定第一标准步骤子序列中每个目标标准步骤对应的目标标准步骤代码;
109.步骤代码执行单元,用于基于每个目标标准步骤对应的目标标准步骤代码以及目标任务参数,执行目标标准步骤。
110.可选的,目标标准步骤代码中预先定义有目标标准步骤对应的目标页面元素,基于每个目标标准步骤对应的目标标准步骤代码以及目标任务参数,步骤代码执行单元具体用于:
111.基于每个目标标准步骤对应的目标标准步骤代码以及目标任务参数,执行针对目标页面元素的所述目标标准步骤。
112.可选的,装置还包括:
113.语音播放单元,用于当执行目标标准步骤序列中任一标准步骤时,语音播放任一标准步骤对应的标准步骤内容。
114.请参见图9,基于同一发明构思,本技术实施例还提供了一种电子设备100,该电子设备100可以包括至少一个处理器,该至少一个处理器用于执行存储器中存储的计算机程序,实现本技术实施例提供的如图1所示的语音控制方法的步骤。
115.可选的,上述处理器具体可以是中央处理器、特定asic,可以是一个或多个用于控制程序执行的集成电路。
116.可选的,该电子设备100还可以包括与至少一个处理器连接的存储器,存储器可以包括rom、ram和磁盘存储器。存储器用于存储处理器运行时所需的数据,即存储有可被至少一个处理器执行的指令,至少一个处理器通过执行存储器存储的指令,执行如图1所示的方法。其中,存储器的数量为一个或多个。
117.其中,接收单元201、第一确定单元202、第二确定单元203以及执行单元204所对应的实体设备均可以是前述的处理器。该电子设备可以用于执行图1所示的实施例所提供的方法。因此关于该电子设备中各功能模块所能够实现的功能,可参考图1所示的实施例中的相应描述,不多赘述。
118.其中,上述电子设备100可以为智能手机、平板电脑等智能电子设备,本实施例对上述电子设备的形式不作限定。
119.实例性的,图9以智能手机为例示出了电子设备100的结构示意图,如图9所示,电子设备100可以包括处理器110,外部存储器接口120,内部存储器121,通用串行总线(universal serial bus,usb)接口130,充电管理模块140,电源管理模块141,电池142,天线1,天线2,移动通信模块150,无线通信模块160,音频模块170,扬声器170a,受话器170b,麦克风170c,耳机接口170d,传感器模块180,按键190,马达191,指示器192,摄像头193,显示屏194,以及用户识别卡(subscriber identification module,sim)卡接口195等。
120.可以理解的是,本技术实施例示意的结构并不构成对电子设备100的具体限定。在本技术另一些实施例中,电子设备100可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
121.处理器110可以包括一个或多个处理单元,例如:处理器110可以包括应用处理器(application processor,ap),调制解调处理器,图形处理器(graphics processing unit,gpu),图像信号处理器(image signal processor,isp),控制器,视频编解码器,数字信号处理器(digital signal processor,dsp),基带处理器,和/或神经网络处理器(neural-network processing unit,npu)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
122.控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
123.处理器110中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器110中的存储器为高速缓冲存储器。该存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器110的等待时间,因而提高了系统的效率。
124.在一些实施例中,处理器110可以包括一个或多个接口。接口可以包括集成电路(inter-integrated circuit,i2c)接口,集成电路内置音频(inter-integrated circuit sound,i2s)接口,脉冲编码调制(pulse code modulation,pcm)接口,通用异步收发传输器(universal asynchronous receiver/transmitter,uart)接口,移动产业处理器接口(mobile industry processor interface,mipi),通用输入输出(general-purpose input/output,gpio)接口,用户标识模块(subscriber identity module,sim)接口,和/或通用串行总线(universal serial bus,usb)接口等。
125.充电管理模块140用于从充电器接收充电输入。
126.电源管理模块141用于连接电池142,充电管理模块140与处理器110。
127.在一些实施例中,电子设备100的天线1和移动通信模块150耦合,天线2和无线通信模块160耦合,使得电子设备100可以通过无线通信技术与网络以及其他设备通信。所述无线通信技术可以包括全球移动通讯系统(global system for mobile communications,gsm),通用分组无线服务(general packet radio service,gprs),码分多址接入(code division multiple access,cdma),宽带码分多址(wideband code division multiple access,wcdma),时分码分多址(time-division code division multiple access,td-scdma),长期演进(long term evolution,lte),bt,gnss,wlan,nfc,fm,和/或ir技术等。所述gnss可以包括全球卫星定位系统(global positioning system,gps),全球导航卫星系统(global navigation satellite system,glonass),北斗卫星导航系统(beidou navigation satellite system,bds),准天顶卫星系统(quasi-zenith satellite system,qzss)和/或星基增强系统(satellite based augmentation systems,sbas)。
128.电子设备100通过gpu,显示屏194,以及应用处理器等实现显示功能。
129.显示屏194用于显示图像,视频等。显示屏194包括显示面板。
130.isp用于处理摄像头193反馈的数据。
131.摄像头193用于捕获静态图像或视频。
132.数字信号处理器用于处理数字信号,除了可以处理数字图像信号,还可以处理其他数字信号。例如,当电子设备100在频点选择时,数字信号处理器用于对频点能量进行傅里叶变换等。
133.视频编解码器用于对数字视频压缩或解压缩。电子设备100可以支持一种或多种视频编解码器。这样,电子设备100可以播放或录制多种编码格式的视频,例如:动态图像专家组(moving picture experts group,mpeg)1,mpeg2,mpeg3,mpeg4等。
134.外部存储器接口120可以用于连接外部存储卡,例如micro sd卡,实现扩展电子设备100的存储能力。外部存储卡通过外部存储器接口120与处理器110通信,实现数据存储功能。例如将音乐,视频等文件保存在外部存储卡中。
135.内部存储器121可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。内部存储器121可以包括存储程序区和存储数据区。其中,存储程序区可存储操作系统,至少一个功能所需的应用程序(比如声音播放功能,图像播放功能等)等。存储数据区可存储电子设备100使用过程中所创建的数据(比如音频数据,电话本等)等。此外,内部存储器121可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universal flash storage,ufs)等。处理器110通过运行存储在内部存储器121的指令,和/或存储在设置于处理器中的存储器的指令,执行电子设备100的各种功能应用以及数据处理。
136.电子设备100可以通过音频模块170,扬声器170a,受话器170b,麦克风170c,耳机接口170d,以及应用处理器等实现音频功能。例如音乐播放,录音等。
137.音频模块170用于将数字音频信息转换成模拟音频信号输出,也用于将模拟音频输入转换为数字音频信号。
138.扬声器170a,也称“喇叭”,用于将音频电信号转换为声音信号。
139.受话器170b,也称“听筒”,用于将音频电信号转换成声音信号。
140.麦克风170c,也称“话筒”,“传声器”,用于将声音信号转换为电信号。
141.耳机接口170d用于连接有线耳机。耳机接口170d可以是usb接口130,也可以是3.5mm的开放移动电子设备平台(open mobile terminal platform,omtp)标准接口,美国蜂窝电信工业协会(cellular telecommunications industry association of the usa,ctia)标准接口。
142.按键190包括开机键,音量键等。
143.马达191可以产生振动提示。
144.指示器192可以是指示灯,可以用于指示充电状态,电量变化,也可以用于指示消息,未接来电,通知等。
145.sim卡接口195用于连接sim卡。sim卡可以通过插入sim卡接口195,或从sim卡接口195拔出,实现和电子设备100的接触和分离。电子设备100可以支持1个或n个sim卡接口,n为大于1的正整数。sim卡接口195可以支持nano sim卡,micro sim卡,sim卡等。同一个sim卡接口195可以同时插入多张卡。所述多张卡的类型可以相同,也可以不同。sim卡接口195也可以兼容不同类型的sim卡。sim卡接口195也可以兼容外部存储卡。电子设备100通过sim卡和网络交互,实现通话以及数据通信等功能。在一些实施例中,电子设备100采用esim,即:嵌入式sim卡。esim卡可以嵌在电子设备100中,不能和电子设备100分离。
146.本技术实施例还提供一种计算机存储介质,其中,计算机存储介质存储有计算机指令,当计算机指令在计算机上运行时,使得计算机执行如图1所述的方法。
147.以上所述仅为本说明书的较佳实施例而已,并不用以限制本说明书,凡在本说明
书的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本说明书保护的范围之内。

技术特征:


1.一种语音控制方法,其特征在于,所述方法包括:通过第三方语音助手接收目标语音指令,所述目标语音指令中携带有待执行的目标任务所对应的目标应用程序、目标任务参数集合以及目标任务类型;基于预先存储的任务类型与标准步骤序列的对应关系,确定出所述目标任务类型对应的目标标准步骤序列;基于预先存储的任务参数与标准步骤的对应关系,从所述目标任务参数集合中确定所述目标标准步骤序列中每个目标标准步骤对应的目标任务参数;针对所述目标应用程序,基于所述目标任务参数执行对应的目标标准步骤,直至所述目标标准步骤序列中的全部标准步骤执行完毕。2.根据权利要求1所述的方法,其特征在于,任一标准步骤序列中的首个标准步骤均为启动对应应用程序的步骤,针对所述目标应用程序,基于所述目标任务参数执行对应的目标标准步骤,直至所述目标标准步骤序列中的全部标准步骤执行完毕,包括:执行所述目标标准步骤序列中的首个标准步骤,以启动所述目标应用程序;基于预先存储的应用程序的页面标识与标准步骤子序列的对应关系,从所述目标标准步骤序列中确定出所述目标应用程序的首页标识相对应的第一标准步骤子序列,所述首页标识为所述目标应用程序的首页的页面标识;在所述目标应用程序的所述首页,基于所述目标任务参数执行所述第一标准步骤子序列中对应的每个目标标准步骤,以使跳转至第一次级页面;基于预先存储的应用程序的页面标识与标准步骤子序列的对应关系,从所述目标标准步骤序列中确定出所述目标应用程序的第一次级页面标识相对应的第二标准步骤子序列,所述第一次级页面标识为所述目标应用程序的所述第一次级页面的页面标识;在所述第一次级页面,基于所述目标任务参数执行所述第二标准步骤子序列中对应的每个目标标准步骤,以使跳转至第二次级页面,以此类推,直至所述目标标准步骤序列中的全部目标标准步骤执行完毕。3.根据权利要求2所述的方法,其特征在于,在所述目标应用程序的所述首页,基于所述目标任务参数执行所述第一标准步骤子序列中对应的每个目标标准步骤,包括:在所述目标应用程序的所述首页,基于预先存储的标准步骤与标准步骤代码的对应关系,确定所述第一标准步骤子序列中每个目标标准步骤对应的目标标准步骤代码;基于每个所述目标标准步骤对应的目标标准步骤代码以及目标任务参数,执行所述目标标准步骤。4.根据权利要求3所述的方法,其特征在于,所述目标标准步骤代码中预先定义有所述目标标准步骤对应的目标页面元素,基于每个所述目标标准步骤对应的目标标准步骤代码以及目标任务参数,执行所述目标标准步骤,包括:基于每个所述目标标准步骤对应的目标标准步骤代码以及目标任务参数,执行针对所述目标页面元素的所述目标标准步骤。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:当执行所述目标标准步骤序列中任一标准步骤时,语音播放所述任一标准步骤对应的标准步骤内容。6.一种语音控制装置,其特征在于,所述装置包括:
接收单元,用于通过第三方语音助手接收目标语音指令,所述目标语音指令中携带有待执行的目标任务所对应的目标应用程序、目标任务参数集合以及目标任务类型;第一确定单元,用于基于预先存储的任务类型与标准步骤序列的对应关系,确定出所述目标任务类型对应的目标标准步骤序列;第二确定单元,用于基于预先存储的任务参数与标准步骤的对应关系,从所述目标任务参数集合中确定所述目标标准步骤序列中每个目标标准步骤对应的目标任务参数;执行单元,用于针对所述目标应用程序,基于所述目标任务参数执行对应的目标标准步骤,直至所述目标标准步骤序列中的全部标准步骤执行完毕。7.根据权利要求6所述的装置,其特征在于,任一标准步骤序列中的首个标准步骤均为启动对应应用程序的步骤,所述执行单元包括:步骤执行单元,用于执行所述目标标准步骤序列中的首个标准步骤,以启动所述目标应用程序;第一标准步骤子序列确定单元,用于基于预先存储的应用程序的页面标识与标准步骤子序列的对应关系,从所述目标标准步骤序列中确定出所述目标应用程序的首页标识相对应的第一标准步骤子序列,所述首页标识为所述目标应用程序的首页的页面标识;所述步骤执行单元,还用于在所述目标应用程序的所述首页,基于所述目标任务参数执行所述第一标准步骤子序列中对应的每个目标标准步骤,以使跳转至第一次级页面;第二标准步骤子序列确定单元,用于基于预先存储的应用程序的页面标识与标准步骤子序列的对应关系,从所述目标标准步骤序列中确定出所述目标应用程序的第一次级页面标识相对应的第二标准步骤子序列,所述第一次级页面标识为所述目标应用程序的所述第一次级页面的页面标识;所述步骤执行单元,还用于在所述第一次级页面,基于所述目标任务参数执行所述第二标准步骤子序列中对应的每个目标标准步骤,以使跳转至第二次级页面,以此类推,直至所述目标标准步骤序列中的全部目标标准步骤执行完毕。8.根据权利要求7所述的装置,其特征在于,所述步骤执行单元包括:步骤代码确定单元,用于所述目标应用程序的所述首页,基于预先存储的标准步骤与标准步骤代码的对应关系,确定所述第一标准步骤子序列中每个目标标准步骤对应的目标标准步骤代码;步骤代码执行单元,用于基于每个所述目标标准步骤对应的目标标准步骤代码以及目标任务参数,执行所述目标标准步骤。9.一种电子设备,其特征在于,所述电子设备包括至少一个处理器以及与所述至少一个处理器连接的存储器,所述至少一个处理器用于执行存储器中存储的计算机程序时实现如权利要求1-5任一项所述方法的步骤。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-5任一项所述方法的步骤。

技术总结


本申请实施例提供了一种语音控制方法、装置、电子设备及存储介质,能够根据用户完整的语音指令自动执行步骤,直至完成完整语音指令对应的任务,使人机交互更高效、便捷。其中,语音控制方法包括:通过第三方语音助手接收目标语音指令,目标语音指令中携带有待执行的目标任务所对应的目标应用程序、目标任务参数集合以及目标任务类型;确定出目标任务类型对应的目标标准步骤序列;从目标任务参数集合中确定目标标准步骤序列中每个目标标准步骤对应的目标任务参数;针对所述目标应用程序,基于目标任务参数执行对应的目标标准步骤,直至目标标准步骤序列中的全部标准步骤执行完毕。标准步骤序列中的全部标准步骤执行完毕。标准步骤序列中的全部标准步骤执行完毕。


技术研发人员:

张杰

受保护的技术使用者:

成都赛力斯科技有限公司

技术研发日:

2022.09.13

技术公布日:

2022/12/16

本文发布于:2022-12-18 23:09:46,感谢您对本站的认可!

本文链接:https://patent.en369.cn/patent/1/37474.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:目标   步骤   标准   所述
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 369专利查询检索平台 豫ICP备2021025688号-20 网站地图