1.本技术涉及信息处理技术领域,具体涉及一种
语音系统的
测试方法、装置、存储介质及电子
设备。
背景技术:
2.随着智能终端,例如智能手机、智能家电等设备的发展,越来越多的智能终端设备都配置了语音系统功能,语音系统能够智能地响应用户的语音指令。在智能终端的测试阶段也需要对语音系统的智慧程度和可靠程度等进行测试,目前常规的测试方案多是开发人员进行手动测试,缺乏针对语音系统的自动化测试方案,导致测试效率低下。
技术实现要素:
3.本技术实施例提供一种语音系统的测试方法、装置、存储介质及电子设备,能够提高测试效率。
4.第一方面,本技术实施例提供一种语音系统的测试方法,包括:
5.获取测试用例,根据
所述测试用例确定测试文本、语音属性以及评价维度;
6.按照所述语音属性对所述测试文本进行语音合成处理,得到测试语音;
7.对待测试语音设备播放所述测试语音,并获取所述待测试语音设备对所述测试语音的应答语音、响应界面和进程执行信息;
8.根据所述应答语音、所述响应界面以及所述进程执行信息,得到所述待测试语音设备在所述评价维度上的测试结果。
9.第二方面,本技术实施例还提供一种语音系统的测试装置,包括:
10.参数确定模块,用于获取测试用例,根据所述测试用例确定测试文本、语音属性以及评价维度;
11.语音合成模块,用于按照所述语音属性对所述测试文本进行语音合成处理,得到测试语音;
12.测试交互模块,用于对待测试语音设备播放所述测试语音,并获取所述待测试语音设备对所述测试语音的应答语音、响应界面和进程执行信息;
13.测试评价模块,用于根据所述应答语音、所述响应界面以及所述进程执行信息,得到所述待测试语音设备在所述评价维度上的测试结果。
14.第三方面,本技术实施例还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行如本技术任一实施例提供的语音系统的测试方法。
15.第四方面,本技术实施例还提供一种电子设备,包括处理器和存储器,所述存储器有计算机程序,所述处理器通过调用所述计算机程序,用于执行如本技术任一实施例提供的语音系统的测试方法。
16.本技术实施例提供的技术方案,在对待测试语音设备进行测试时,获取测试用例,
根据该测试用例确定测试文本、语音属性以及评价维度,按照该语音属性对测试文本进行语音合成处理,得到测试语音,然后对待测试语音设备播播放该测试语音,之后,获取待测试设备对该测试语音的应答语音、响应界面和进程执行信息,根据该应答语音、响应界面和进程执行信息得到待测试语音设备在评价维度上的测试结果,通过本技术实施例的方案只需确定测试用例即可实现在多个评价维度上对语音系统进行自动化测试,提高了测试效率。
附图说明
17.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
18.图1为本技术实施例提供的语音系统的测试方法的第一种流程示意图。
19.图2为本技术实施例提供的语音系统的测试方法的应用场景示意图。
20.图3为本技术实施例提供的语音系统的测试装置的结构示意图。
21.图4为本技术实施例提供的电子设备的第一种结构示意图。
22.图5为本技术实施例提供的电子设备的第二种结构示意图。
具体实施方式
23.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本技术的保护范围。
24.在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
25.本技术实施例提供一种语音系统的测试方法,该语音系统的测试方法的执行主体可以是本技术实施例提供的语音系统的测试装置,或者集成了该语音系统的测试装置的电子设备,其中该语音系统的测试装置可以采用硬件或者软件的方式实现。其中,电子设备可以是智能手机、平板电脑、掌上电脑、笔记本电脑、或者台式电脑等设备。
26.请参阅图1,图1为本技术实施例提供的语音系统的测试方法的第一种流程示意图。本技术实施例提供的语音系统的测试方法的具体流程可以如下:
27.101、获取测试用例,根据测试用例确定测试文本、语音属性以及评价维度。
28.本技术实施例中的电子设备作为测试终端,将测试终端与待测试语音设备连接,该连接可以是有线连接,例如通过usb数据线连接;也可以是无线连接,例如通过wifi等近场通信连接。待测试语音设备具有语音系统,例如语音助手、语音应答系统等,对待测试语音设备的测试实质上是对语音系统的测试。待测试语音设备可以是智能手机、智能家电、车载智能终端等设备。本技术对此不作限制,只要是具有语音应答功能的设备都可以作为本
申请实施例中的待测试语音设备。
29.此外,本技术实施例中的测试终端上部署有自动化测试系统,如图2所示,为本技术实施例提供的语音系统的测试方法的应用场景示意图。自动化测试系统包括但不限于如下几个模块:人声模块、录音模块、测试模块以及评价验证模块(图中未示出)。其中,人生模块用于模拟人类发生,将测试用例中的测试文本用声音表达出来作为测试语音,测试语音可以包括多种类型,包括但不限于唤醒词语音、询问语音、对话语音以及指令语音等,其中,唤醒词语音可以用于唤醒语音系统。唤醒后的语音系统会对用户的询问语音或对话语音等进行应答,还会相应于指令语音执行对应的操作。一般情况下,当被测试语音设备在唤醒状态下检测到语音信号后,会对测试语音进行响应,或者对执行结果进行语音播报,这些情况下的语音统一称为应答语音,其中,录音模块用于对应答语音进行录制。评价验证模块用于对待测试语音设备在各个评价维度进行评价,例如唤醒准确率、应答准确度等。测试模块负责驱动以上各个模块的协同工作。
30.此外,测试终端还需要配置有多个测试用例,还提供有对测试用例的增删改查功能,支持使用java或者python语言来编写测试用例的脚本。其中,不同的测试用例可以实现不同的测试目的。部分自动化测试用例可以表示如下:
31.表1部分测试用例示例
32.用例编号用例目的用例描述tc_000_wakeup验证唤醒功能测试唤醒成功率tc_001_wakeup验证唤醒功能测试对多语言的支持情况tc_002_wakeup验证唤醒功能测试不同语速的唤醒情况
……ꢀꢀ
tc_100_answer验证回答功能验证tts播报声音是否出现卡顿tc_101_answer验证回答功能验证tts回答是否正确
……ꢀꢀ
tc_200_smart验证智能程度验证不同语句的识别率tc_201_smart验证智能程度验证不同语速的识别率
……ꢀꢀ
tc_300_rely验证可靠性验证不同指令技能的执行成功率tc_301_rely验证可靠性验证进行持续对话测试时的稳定性
……ꢀꢀ
33.上表示出了部分示例性的测试用例的描述,如“tc_001_wakeup”,可以通过该测试用例对待测试语音设备对多语言的支持情况进行测试,则该测试用例的评价维度为待测试语音设备对多语言的支持情况。对于该测试用例,需要预先定义多种不同的语言对应的测试文本,以及该测试用例所需要的语音属性。下文将对测试文本和语音属性进行详细解释。
34.对于测试人员来说,在需要对待测试语音设备进行测试时,只需要将测试终端与待测试语音设备连接,并选择除要运行的测试用例,并触发测试指令即可。测试终端响应于测试指令,获取该测试指令对应的测试用例,并根据测试用例确定本次测试需要的测试文本,以及语音属性和评价维度。
35.102、按照语音属性对测试文本进行语音合成处理,得到测试语音。
36.在确定出测试文本和语音属性之后,按照语音属性对测试文本进行语音合成处理得到,得到测试语音。也就是说,测试终端按照预设的语音属性模拟人声,待测试语音设备在接收到测试语音时,对其进行解析并应答。例如,测试语音为“你好,小布”(小布为语音助手的名字),该语句为唤醒语句,其中包含有唤醒词“小布”。处于待机状态的待测试语音设备在接收到测试语音时,会先对该语音进行解析,当检测到其中包含有唤醒词中,则启动语音助手的主进程,即语音助手由待机状态进入工作状态,可以对其他的语音进行响应。
37.在一些实施例中,按照语音属性对测试文本进行语音合成处理,得到测试语音的步骤可以包括:获取与第一语音属性匹配的语音合成算法;根据语音合成算法对测试文本进行转换处理,得到与第一语音属性匹配的中间测试语音;按照第二语音属性对中间测试语音进行调整处理,得到测试语音。
38.该实施例中,语音属性包括第一语音属性和第二语音属性。其中,第一语音属性包括但不限于:音、方言类型(如广东话、上海话等)、语言种类(如汉语、英语等)等。第二语音属性包括但不限于语速、音量等。对于不同的第一语音属性来说,在进行语音合成时,语音合成算法的参数可能不同,基于此,在配置语音合成算法时,需要根据不同的第一语音属性确定出不同的参数,进而确定出各第一语音属性对应的语音合成算法。在进行测试时,当根据测试用例得到第一语音属性后,从多个预设的语音合成算法中确定出与该第一语音属性匹配的语音合成算法,然后根据该语音合成算法对测试文本进行转换处理,得到与第一语音属性匹配的中间测试语音。之后,再按照第二语音属性对中间测试语音进行调整处理,得到最终的测试语音。例如,调整中间测试语音的语速和音量等参数,得到最终的测试语音。
39.103、对待测试语音设备播放测试语音,并获取待测试语音设备对测试语音的应答语音、响应界面和进程执行信息。
40.得到测试语音后,通过人声模块播放该测试语音,待测试语音设备接收到该语音信号后,对该测试语音进行解析,并根据不同的测试语音做出各自对应的反馈,其中,这些反馈措施主要包括:以语音播报的方式响应该测试语音,即播放应答语音在被测试语音设备的显示界面上显示对应的用户交互界面;并启动对应的进程以执行该测试语音对应的操作。仍以测试语音为唤醒语句为例,如唤醒语句为“你好小布”,应答语句为“我在这呢”或者“有什么吩咐”等,需要说明的是,应答语句一般是预先配置好的,当待测试语音设备能够准确识别唤醒语句,则能够对该唤醒语句做出准确应答,因此,可以根据讲应答语句的准确程度作为唤醒能力的一个评价指标。并且,待测试话语音设备被唤醒后,语音系统由待机状态进入工作状态,也就是说,需要启动语音系统的主进程,那么测试终端就需要对该主进程的启动情况进行监测,如是否启动成功,启动时长等信息进行监测,得到进程执行信息,作为唤醒能力的另一个评价指标。在语音系统唤醒之后,待测试语音设备会在其显示界面上显示系统唤醒后的ui界面,例如,测试语音为唤醒语音,则响应界面为语音助手主界面,又例如,测试语音为“小布,今天天气怎么样?”,该语音为问答语音,则应答语音可以为“今天天气多云”,同时响应界面为天气查询结果的展示界面。又例如,测试语音为“帮我打开网易云音乐”,则语音系统需要启动网易云音乐的进程,并在界面显示网易云音乐的界面。
41.其中,在一些实施例中,对待测试语音设备播放测试语音,并获取待测试语音设备对测试语音的应答语音、响应界面和进程执行信息的步骤可以包括:对待测试语音设备播
放测试语音,并通过录音模块获取待测试语音设备对测试语音的应答语音;通过测试用例从待测试语音设备获取对测试语音进行响应所展示的响应界面和启动的进程,并对进程的启动结果进行监测,得到进程执行信息。
42.该实施例中,测试终端与待测试语音设备连接,可以通过运行的测试用例从待测试语音设备中读取响应界面以及进程执行信息。例如,在一实施例中,测试终端在python的环境下执行测试用例的脚本,则可以直接从待测试语音设备中读取响应界面以及进程执行信息。
43.或者,在另一实施例中,通过测试用例从待测试语音设备获取对测试语音进行响应所展示的响应界面和启动的进程,并对进程的启动结果进行监测,得到进程执行信息,包括:对测试用例进行编译处理,得到可在待测试语音设备上运行的测试文件;将测试文件发送至待测试语音设备进行运行,以采集待测试语音设备响应于测试语音展示的响应界面,并对待测试语音设备启动的进程进行监测,得到进程执行信息。
44.该实施例中,测试文件可以是.jar文件,也就是说,测试终端对测试用例进行编译处理,得到可以在待测试语音设备上运行的.jar文件,然后再将.jar文件推送到待测试语音设备,待测试语音设备使用classloader执行命令行的特性执行这个.jar脚本,从而得到测试语音进行响应所展示的响应界面和启动的进程,此外,还可以通过该测试用例对进程的启动结果进行监测,得到进程执行信息。
45.其中,在一实施例中,对待测试语音设备播放测试语音,并通过录音模块获取待测试语音设备对测试语音的应答语音的步骤可以包括:为测试语音添加预设环境噪声,得到混合测试语音,并对待测试语音设备播放混合测试语音;通过录音模块获取待测试语音设备的待处理语音;对待处理语音进行格式转换处理,得到预设音频格式的待处理语音;对预设音频格式的待处理语音进行音频预处理,得到应答语音。
46.该实施例中,为了提高测试环境的真实度,预先采集一些真实环境下的噪声信号进行存储。在得到测试语音后,为这些测试语音添加一些预设的环境噪声,以测试语音系统对噪声场景下的语音信号的响应能力,作为语音系统的可靠程度的一项指标。为测试语音添加预设环境噪声,得到混合测试语音,对待测试语音设备播放混合测试语音。当语音系统处于监听状态下时,可以采集到的测试终端播放的混合测试语音。测试终端的测试模块打开录音模块进行录音,直至语音助手回答完毕,在结束录音后,得到待测试语音设备的播报的待处理语音,对该待处理语音进行格式转换处理,得到预设音频格式的待处理语音,例如pcm格式,便于后续操作;对预设音频格式的待处理语音进行音频预处理,如降噪,剪裁等处理,得到应答语音。
47.104、根据应答语音、响应界面以及进程执行信息,得到待测试语音设备在评价维度上的测试结果。
48.在得到上述三个反馈信息后,综合这三种反馈信息,对语音系统在当前的测试用例对应的评价维度的测试结果进行计算。
49.其中,在一实施例中,根据应答语音、响应界面以及进程执行信息,得到待测试语音设备在评价维度上的测试结果,包括:获取测试语音对应的预设文本信息、预设响应界面以及预设进程执行信息;提取应答语音中的文本信息,并根据文本信息和预设文本信息计算第一匹配度;计算响应界面与预设响应界面的第二匹配度,以及进程执行信息与预设进
程执行信息之间的第三匹配度;根据第一匹配度、第二匹配度和的第三匹配度计算得到待测试语音设备在评价维度上的测试结果。
50.在测试用例中,对于测试语音,预先设置有该测试语音对应的三种期望的预设反馈,分别记为预设文本信息、预设响应界面以及预设进程执行信息。获取这三种信息,对于每一种反馈信息,计算真实的反馈信息与期望的反馈信息之间的匹配度,从而判断实际结果是否满足预期结果。具体地,根据文本信息和预设文本信息计算第一匹配度,第一匹配度反应语音系统的语音播报是否符合预期结果;计算响应界面与预设响应界面的第二匹配度,以及计算进程执行信息与预设进程执行信息之间的第三匹配度,综合这三个匹配度,得到待测试语音设备在评价维度上的测试结果。其中,测试结果可以是各种反馈的匹配度,也可以是综合三个匹配度得到的测试是否成功的指示信息。对于同一个测试用例来说,可以按照测试人员设置的测试反复执行多次,以得到多个测试结果,进而根据多个测试结果确定出当前评价维度的成功率。
51.通过上述方式,对于测试人员来说,在触发测试指令后,测试终端可以基于测试人员选择的测试用例自动对语音系统进行测试,并输出测试结果。无需测试人员执行其他的手动操作,提高了测试效率。
52.具体实施时,本技术不受所描述的各个步骤的执行顺序的限制,在不产生冲突的情况下,某些步骤还可以采用其它顺序进行或者同时进行。
53.由上可知,本技术实施例提供的语音系统的测试方法,在对待测试语音设备进行测试时,获取测试用例,根据该测试用例确定测试文本、语音属性以及评价维度,按照该语音属性对测试文本进行语音合成处理,得到测试语音,然后对待测试语音设备播播放该测试语音,之后,获取待测试设备对该测试语音的应答语音、响应界面和进程执行信息,根据该应答语音、响应界面和进程执行信息得到待测试语音设备在评价维度上的测试结果,通过本技术实施例的方案只需确定测试用例即可实现在多个评价维度上对语音系统进行自动化测试,提高了测试效率。
54.在一实施例中还提供一种语音系统的测试装置。请参阅图3,图3为本技术实施例提供的语音系统的测试装置300的结构示意图。其中该语音系统的测试装置300应用于电子设备,该语音系统的测试装置300包括参数确定模块301、语音合成模块302、测试交互模块303以及测试评价模块304,如下:
55.参数确定模块301,用于获取测试用例,根据所述测试用例确定测试文本、语音属性以及评价维度;
56.语音合成模块302,用于按照所述语音属性对所述测试文本进行语音合成处理,得到测试语音;
57.测试交互模块303,用于对待测试语音设备播放所述测试语音,并获取所述待测试语音设备对所述测试语音的应答语音、响应界面和进程执行信息;
58.测试评价模块304,用于根据所述应答语音、所述响应界面以及所述进程执行信息,得到所述待测试语音设备在所述评价维度上的测试结果。
59.在一些实施例中,语音合成模块302,用于获取与所述第一语音属性匹配的语音合成算法;根据所述语音合成算法对所述测试文本进行转换处理,得到与第一语音属性匹配的中间测试语音;以及,按照所述第二语音属性对所述中间测试语音进行调整处理,得到测
试语音。
60.在一些实施例中,测试交互模块303,用于根据所述状态标识对待测试语音设备播放所述测试语音试语音,并通过录音模块获取所述待测试语音设备对所述测试语音的应答语音;以及,通过所述测试用例从所述待测试语音设备获取对所述测试语音进行响应所展示的响应界面和启动的进程,并对所述进程的启动结果进行监测,得到进程执行信息。
61.在一些实施例中,测试交互模块303,用于为所述测试语音添加预设环境噪声,得到混合测试语音,并对待测试语音设备播放所述混合测试语音;通过录音模块获取所述待测试语音设备的待处理语音;对所述待处理语音进行格式转换处理,得到预设音频格式的待处理语音;以及,对所述预设音频格式的待处理语音进行音频预处理,得到应答语音。
62.在一些实施例中,测试交互模块303,用于对所述测试用例进行编译处理,得到可在所述待测试语音设备上运行的测试文件;将所述测试文件发送至所述待测试语音设备进行运行,以采集所述待测试语音设备响应于所述测试语音展示的响应界面,并对所述待测试语音设备启动的进程进行监测,得到进程执行信息。
63.在一些实施例中,测试评价模块304,用于获取所述测试语音对应的预设文本信息、预设响应界面以及预设进程执行信息;提取所述应答语音中的文本信息,并根据所述文本信息和所述预设文本信息计算第一匹配度;计算所述响应界面与所述预设响应界面的第二匹配度,以及所述进程执行信息与所述预设进程执行信息之间的第三匹配度;以及,根据所述第一匹配度、所述第二匹配度和所述的第三匹配度计算得到所述待测试语音设备在所述评价维度上的测试结果。
64.在一些实施例中,所述评价维度包括唤醒功能、可靠程度和智能程度中的至少一项。
65.应当说明的是,本技术实施例提供的语音系统的测试装置与上文实施例中的语音系统的测试方法属于同一构思,通过该语音系统的测试装置可以实现语音系统的测试方法实施例中提供的任一方法,其具体实现过程详见语音系统的测试方法实施例,此处不再赘述。
66.由上可知,本技术实施例提出的语音系统的测试装置,在对待测试语音设备进行测试时,获取测试用例,根据该测试用例确定测试文本、语音属性以及评价维度,按照该语音属性对测试文本进行语音合成处理,得到测试语音,然后对待测试语音设备播播放该测试语音,之后,获取待测试设备对该测试语音的应答语音、响应界面和进程执行信息,根据该应答语音、响应界面和进程执行信息得到待测试语音设备在评价维度上的测试结果,通过本技术实施例的方案只需确定测试用例即可实现在多个评价维度上对语音系统进行自动化测试,提高了测试效率。
67.本技术实施例还提供一种电子设备。所述电子设备可以是智能手机、平板电脑等设备。请参阅图4,图4为本技术实施例提供的电子设备的第一种结构示意图。电子设备400包括处理器401和存储器402。其中,处理器401与存储器402电性连接。
68.处理器401是电子设备400的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或调用存储在存储器402内的计算机程序,以及调用存储在存储器402内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。
69.存储器402可用于存储计算机程序和数据。存储器402存储的计算机程序中包含有
可在处理器中执行的指令。计算机程序可以组成各种功能模块。处理器401通过调用存储在存储器402的计算机程序,从而执行各种功能应用以及数据处理。
70.在本实施例中,电子设备400中的处理器401会按照如下的步骤,将一个或一个以上的计算机程序的进程对应的指令加载到存储器402中,并由处理器401来运行存储在存储器402中的计算机程序,从而实现各种功能:
71.获取测试用例,根据所述测试用例确定测试文本、语音属性以及评价维度;
72.按照所述语音属性对所述测试文本进行语音合成处理,得到测试语音;
73.对待测试语音设备播放所述测试语音,并获取所述待测试语音设备对所述测试语音的应答语音、响应界面和进程执行信息;
74.根据所述应答语音、所述响应界面以及所述进程执行信息,得到所述待测试语音设备在所述评价维度上的测试结果。
75.在一些实施例中,请参阅图5,图5为本技术实施例提供的电子设备的第二种结构示意图。电子设备400还包括:射频电路403、显示屏404、控制电路405、输入单元406、音频电路407、传感器408以及电源409。其中,处理器401分别与射频电路403、显示屏404、控制电路405、输入单元406、音频电路407、传感器408以及电源409电性连接。
76.射频电路403用于收发射频信号,以通过无线通信与网络设备或其他电子设备进行通信。
77.显示屏404可用于显示由用户输入的信息或提供给用户的信息以及电子设备的各种图形用户接口,这些图形用户接口可以由图像、文本、图标、视频和其任意组合来构成。
78.控制电路405与显示屏404电性连接,用于控制显示屏404显示信息。
79.输入单元406可用于接收输入的数字、字符信息或用户特征信息(例如指纹),以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。其中,输入单元406可以包括指纹识别模组。
80.音频电路407可通过扬声器、传声器提供用户与电子设备之间的音频接口。其中,音频电路407包括麦克风。所述麦克风与所述处理器401电性连接。所述麦克风用于接收用户输入的语音信息。
81.传感器408用于采集外部环境信息。传感器408可以包括环境亮度传感器、加速度传感器、陀螺仪等传感器中的一种或多种。
82.电源409用于给电子设备400的各个部件供电。在一些实施例中,电源409可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
83.虽然图中未示出,电子设备400还可以包括摄像头、蓝牙模块等,在此不再赘述。
84.在本实施例中,电子设备400中的处理器401会按照如下的步骤,将一个或一个以上的计算机程序的进程对应的指令加载到存储器402中,并由处理器401来运行存储在存储器402中的计算机程序,从而实现各种功能:
85.获取测试用例,根据所述测试用例确定测试文本、语音属性以及评价维度;
86.按照所述语音属性对所述测试文本进行语音合成处理,得到测试语音;
87.对待测试语音设备播放所述测试语音,并获取所述待测试语音设备对所述测试语音的应答语音、响应界面和进程执行信息;
88.根据所述应答语音、所述响应界面以及所述进程执行信息,得到所述待测试语音设备在所述评价维度上的测试结果。
89.由上可知,本技术实施例提供了一种电子设备,所述电子设备在对待测试语音设备进行测试时,获取测试用例,根据该测试用例确定测试文本、语音属性以及评价维度,按照该语音属性对测试文本进行语音合成处理,得到测试语音,然后对待测试语音设备播播放该测试语音,之后,获取待测试设备对该测试语音的应答语音、响应界面和进程执行信息,根据该应答语音、响应界面和进程执行信息得到待测试语音设备在评价维度上的测试结果,通过本技术实施例的方案只需确定测试用例即可实现在多个评价维度上对语音系统进行自动化测试,提高了测试效率。
90.本技术实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,当所述计算机程序在计算机上运行时,所述计算机执行上述任一实施例所述的语音系统的测试方法。
91.需要说明的是,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过计算机程序来指令相关的硬件来完成,所述计算机程序可以存储于计算机可读存储介质中,所述计算机可读存储介质可以包括但不限于:只读存储器(rom,read only memory)、随机存取存储器(ram,random access memory)、磁盘或光盘等。
92.此外,本技术中的术语“第一”、“第二”和“第三”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或模块的过程、方法、系统、产品或设备没有限定于已列出的步骤或模块,而是某些实施例还包括没有列出的步骤或模块,或某些实施例还包括对于这些过程、方法、产品或设备固有的其它步骤或模块。
93.以上对本技术实施例所提供的语音系统的测试方法、装置、存储介质及电子设备进行了详细介绍。本文中应用了具体个例对本技术的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本技术的方法及其核心思想;同时,对于本领域的技术人员,依据本技术的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本技术的限制。
技术特征:
1.一种语音系统的测试方法,其特征在于,包括:获取测试用例,根据所述测试用例确定测试文本、语音属性以及评价维度;按照所述语音属性对所述测试文本进行语音合成处理,得到测试语音;对待测试语音设备播放所述测试语音,并获取所述待测试语音设备对所述测试语音的应答语音、响应界面和进程执行信息;根据所述应答语音、所述响应界面以及所述进程执行信息,得到所述待测试语音设备在所述评价维度上的测试结果。2.如权利要求1所述的方法,其特征在于,所述语音属性包括第一语音属性和第二语音属性;所述按照所述语音属性对所述测试文本进行语音合成处理,得到测试语音,包括:获取与所述第一语音属性匹配的语音合成算法;根据所述语音合成算法对所述测试文本进行转换处理,得到与第一语音属性匹配的中间测试语音;按照所述第二语音属性对所述中间测试语音进行调整处理,得到测试语音。3.如权利要求1所述的方法,其特征在于,所述对待测试语音设备播放所述测试语音,并获取所述待测试语音设备对所述测试语音的应答语音、响应界面和进程执行信息,包括:对待测试语音设备播放所述测试语音,并通过录音模块获取所述待测试语音设备对所述测试语音的应答语音;通过所述测试用例从所述待测试语音设备获取对所述测试语音进行响应所展示的响应界面和启动的进程,并对所述进程的启动结果进行监测,得到进程执行信息。4.如权利要求3所述的方法,其特征在于,所述对待测试语音设备播放所述测试语音,并通过录音模块获取所述待测试语音设备对所述测试语音的应答语音,包括:为所述测试语音添加预设环境噪声,得到混合测试语音,并对待测试语音设备播放所述混合测试语音;通过录音模块获取所述待测试语音设备的待处理语音;对所述待处理语音进行格式转换处理,得到预设音频格式的待处理语音;对所述预设音频格式的待处理语音进行音频预处理,得到应答语音。5.如权利要求3所述的方法,其特征在于,所述通过所述测试用例从所述待测试语音设备获取对所述测试语音进行响应所展示的响应界面和启动的进程,并对所述进程的启动结果进行监测,得到进程执行信息,包括:对所述测试用例进行编译处理,得到可在所述待测试语音设备上运行的测试文件;将所述测试文件发送至所述待测试语音设备进行运行,以采集所述待测试语音设备响应于所述测试语音展示的响应界面,并对所述待测试语音设备启动的进程进行监测,得到进程执行信息。6.如权利要求3所述的方法,其特征在于,所述根据所述应答语音、所述响应界面以及所述进程执行信息,得到所述待测试语音设备在所述评价维度上的测试结果,包括:获取所述测试语音对应的预设文本信息、预设响应界面以及预设进程执行信息;提取所述应答语音中的文本信息,并根据所述文本信息和所述预设文本信息计算第一匹配度;计算所述响应界面与所述预设响应界面的第二匹配度,以及所述进程执行信息与所述
预设进程执行信息之间的第三匹配度;根据所述第一匹配度、所述第二匹配度和所述的第三匹配度计算得到所述待测试语音设备在所述评价维度上的测试结果。7.如权利要求1至6任一项所述的方法,其特征在于,所述评价维度包括唤醒功能、可靠程度和智能程度中的至少一项。8.一种语音系统的测试装置,其特征在于,包括:参数确定模块,用于获取测试用例,根据所述测试用例确定测试文本、语音属性以及评价维度;语音合成模块,用于按照所述语音属性对所述测试文本进行语音合成处理,得到测试语音;测试交互模块,用于对待测试语音设备播放所述测试语音,并获取所述待测试语音设备对所述测试语音的应答语音、响应界面和进程执行信息;测试评价模块,用于根据所述应答语音、所述响应界面以及所述进程执行信息,得到所述待测试语音设备在所述评价维度上的测试结果。9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,当所述计算机程序在计算机上运行时,使得所述计算机执行如权利要求1至7任一项所述的语音系统的测试方法。10.一种电子设备,包括处理器和存储器,所述存储器存储有计算机程序,其特征在于,所述处理器通过调用所述计算机程序,用于执行如权利要求1至7任一项所述的语音系统的测试方法。
技术总结
本申请实施例公开了一种语音系统的测试方法、装置、存储介质及电子设备,其中,本申请实施例获取测试用例,根据该测试用例确定测试文本、语音属性以及评价维度,按照该语音属性对测试文本进行语音合成处理,得到测试语音,然后对待测试语音设备播播放该测试语音,之后,获取待测试设备对该测试语音的应答语音、响应界面和进程执行信息,根据该应答语音、响应界面和进程执行信息得到待测试语音设备在评价维度上的测试结果,通过本申请实施例的方案只需确定测试用例即可实现在多个评价维度上对语音系统进行自动化测试,提高了测试效率。率。率。
技术研发人员:
蒲敏超 孙玉杰 王彦琴 邓朝明
受保护的技术使用者:
OPPO广东移动通信有限公司
技术研发日:
2022.06.02
技术公布日:
2022/9/2