声纹注册方法、服务器、家电终端设备及可读存储介质与流程

阅读: 评论:0



1.本发明涉及通信的技术领域,尤其涉及一种声纹注册方法、服务器、家电终端设备及可读存储介质。


背景技术:



2.声纹控制是指根据人的声音特性信息对用户发出的语音指令进行身份判断,从而执行语音指令。实现声纹控制之前,必须先进行声纹注册。声纹注册系统会输出指定内容的提示信息,采集用户按照提示信息发出的语音信息,并对该语音信息进行声纹注册。
3.一般,声纹注册过程都需要在安静条件下进行,但是当用户进行声纹注册的环境存在大量的环境噪音或其他人在旁边说话时,都会影响声纹注册的质量。虽然声纹注册系统在进行声纹注册时,会对语音信息进行去噪处理,但是仍然无法准确地提取注册用户的声纹特征来进行注册,从而影响后续验证,导致声纹控制不准确。


技术实现要素:



4.本发明实施例通过提供一种声纹注册方法、服务器、家电终端设备及可读存储介质,旨在解决现有技术中声纹注册不准确的技术问题。
5.为实现上述目的,本发明实施例提供了一种声纹注册方法,所述声纹注册方法包括:
6.接收来自家电终端设备的声纹注册请求,所述声纹注册请求包括用户的原始音频信息,以及所述用户对所述原始音频信息标记得到的标记信息;
7.根据所述原始音频信息和所述标记信息确定目标声纹信息;
8.根据所述目标声纹信息进行注册。
9.可选地,所述根据所述原始音频信息和所述标记信息确定目标声纹信息的步骤包括:
10.接收家电终端设备发送的基于所述原始音频信息编辑界面编辑的标记信息;
11.根据所述标记信息从所述原始音频信息中提取所述目标音频信息,所述标记信息包括时间戳;
12.根据所述目标音频信息确定目标声纹信息。
13.可选地,所述目标音频信息包括基于所述原始音频信息编辑界面所确定的至少一个有效音频信息和/或噪声音频信息。
14.可选地,所述根据所述原始音频信息以及所述目标音频信息,确定目标声纹信息的步骤包括:
15.当所述目标音频信息包括至少一个有效音频信息时,判断所述有效音频信息中的噪声参数是否超出预设噪声参数范围;
16.在所述有效音频信息中的噪声参数超出预设噪声参数范围时,对所述有效音频信息进行去噪处理后,并进行声纹提取,得到目标声纹信息。
17.可选地,所述根据所述原始音频信息以及所述目标音频信息,确定目标声纹信息的步骤包括:
18.当所述目标音频信息包括噪声音频信息时,根据所述噪声音频信息对所述原始音频信息进行去噪处理后,并进行声纹提取,得到目标声纹信息。
19.可选地,所述根据所述原始音频信息以及所述目标音频信息,确定目标声纹信息的步骤包括:
20.当所述目标音频信息包括有效音频信息和噪声音频信息时,根据所述噪声音频信息对所述有效音频信息进行去噪处理后,并进行声纹提取,得到目标声纹信息。
21.为实现上述目的,本发明实施例提供一种声纹注册方法,所述声纹注册方法包括:
22.家电终端设备接收原始音频信息,根据所述原始音频信息生成原始音频信息编辑界面;
23.基于所述原始音频信息编辑界面对所述原始音频信息进行标记以得到标记信息;
24.根据所述原始音频信息以及标记信息生成声纹注册请求;
25.将所述声纹注册请求发送至服务器,以使所述服务器根据所述原始音频信息以及所述标记信息确定目标声纹信息并将所述目标声纹信息进行注册。
26.可选地,所述显示所述服务器返回的原始音频信息编辑界面的步骤之后,包括:
27.所述家电终端设备接收基于所述原始音频信息编辑界面所标记得到的标记信息;
28.将所述标记信息发送至服务器,以使服务器根据所述标记信息从所述原始音频信息中提取所述目标音频信息;或者,
29.根据所述标记信息从原始音频信息中提取所述目标音频信息,并将所述目标音频信息发送至服务器端以进行声纹注册。
30.为实现上述目的,本发明实施例提供一种服务器,所述服务器包括存储器、处理器以及存储在所述存储器并可在所述处理器上运行的声纹注册程序,所述声纹注册程序被所述处理器执行时实现如上所述的声纹注册方法。
31.为实现上述目的,本发明实施例提供一种家电终端设备,所述设备包括存储器、处理器以及存储在所述存储器并可在所述处理器上运行的声纹注册程序,所述声纹注册程序被所述处理器执行时实现如上所述的声纹注册方法。
32.为实现上述目的,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有声纹注册程序,所述声纹注册程序被处理器执行时实现如上所述的声纹注册方法。
33.本实施例提供的声纹注册方法、服务器、家电终端设备及可读存储介质,通过在对采集的语音信息进行声纹注册之前,根据声纹注册请求输出原始音频信息编辑界面,供用户对原始音频信息进行编辑,从而获得标记信息或目标音频信息。根据所述标记信息对所述原始音频信息进行处理以得到目标信息,并根据原始音频信息和目标音频信息确定目标声纹信息以将所述目标声纹信息进行声纹注册。如此,在进行声纹注册之前,可以在终端对所述原始音频信息进行编辑以确定准确的目标音频,从而使得服务器根据目标音频和原始音频,提取准确的声纹特征,并进行声纹注册,提高了声纹注册的准确性,进而提升了声纹控制的准确性。
附图说明
34.图1是本发明实施例方案涉及的硬件运行环境的设备结构示意图;
35.图2为本发明声纹注册方法的一实施例的流程示意图;
36.图3为本发明声纹注册方法的另一实施例的流程示意图;
37.图4为本发明声纹注册方法步骤s23的对应的一实施例的流程示意图;
38.图5为本发明声纹注册方法步骤s23的对应的另一实施例的流程示意图;
39.图6为本发明声纹注册方法步骤s23的对应的再一实施例的流程示意图;
40.图7为本发明声纹注册方法再一实施例的流程示意图。
具体实施方式
41.为了更好的理解上述技术方案,下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
42.作为一种实现方式,家电终端设备可以如图1所示。
43.本发明实施例方案涉及的是家电终端设备,家电终端设备包括:处理器101,如cpu,存储器102,通信总线103。其中,通信总线103用于实现这些组件之间的连接通信。
44.存储器102可以是高速ram存储器,也可以是稳定的存储器(non-volatilememory),如磁盘存储器。如图1所示,作为一种计算机存储介质的存储器102中可以包括家电终端设备的控制程序;而处理器101可以用于调用存储器102中存储的家电终端设备的控制程序,并执行以下操作:
45.家电终端设备接收原始音频信息,根据所述原始音频信息生成原始音频信息编辑界面;
46.基于所述原始音频信息编辑界面对所述原始音频信息进行标记以得到标记信息;
47.根据所述原始音频信息以及标记信息生成声纹注册请求;
48.将所述声纹注册请求发送至服务器,以使所述服务器根据所述原始音频信息以及所述标记信息确定目标声纹信息并将所述目标声纹信息进行注册。
49.在本实施例提供的技术方案中,通过在对采集的语音信息进行声纹注册之前,根据声纹注册请求输出原始音频信息编辑界面,供用户对原始音频信息进行编辑,从而获得标记信息或目标音频信息。根据所述标记信息对原始音频信息进行处理以得到目标音频信息。对所述目标音频信息中的人声信息进行加强处理并对噪声进行去噪处理以及对声纹特征进行提取从而得到目标声纹信息,将所述目标声纹信息注册进服务器。这样在声纹注册前,终端根据声纹注册请求生成原始音频信息编辑界面,用户可以在终端对原始音频信息进行选取、剪切以及替换等编辑得到标记信息从而确定用户自己的人声信息,从而可以根据原始音频以及目标音频获取所述人声信息并提取所述人声信息中的目标声纹信息,提高了空调器识别到注册用户自己的人声信息的准确性,进而准确注册用户声纹,提高声纹控制的准确性。
50.基于上述家电终端设备的硬件构架,提出本发明家电终端设备的控制方法的实施例。
51.参照图2,图2为本发明家电终端设备的控制方法的一实施例,所述家电终端设备的控制方法包括以下步骤:
52.步骤s10、接收来自家电终端设备的声纹注册请求,所述声纹注册请求包括用户的原始音频信息,以及所述用户对所述原始音频信息标记得到的标记信息;
53.需要说明的是,所述终端可以是移动终端如手机或ipad等,也可以是计算机终端或家电终端设备如空调器;在进行声纹注册请求之前,所述移动终端或计算机终端或家电终端设备的录音权限或录音模式为开启状态。
54.所述声纹注册请求可以由移动终端或计算机终端中的app发送,或者由家电终端设备发送,所述声纹注册请求可以是语音指令触发,如用户说出预设语音信息“声纹注册请求”时触发声纹注册请求指令,或在用户说出自然语音信息控制家电终端设备执行相应操作如用户发出语音指令“温度调整到26度”时触发声纹注册请求,也可以是按钮触发,如在移动终端app或家电终端设备界面上设置有声纹注册请求对应的按钮,通过所述按钮触发声纹注册请求,在本实施例中并不对此作具体限定。
55.一实施例中,在触发声纹注册请求时,移动终端或家电终端设备开启录音模式,并输出一串字符串以引导用户读取所述字符,所述字符串可以是数字或文字等;在获取到用户读取的字符串对应的语音信息时,将所述语音信息作为声纹注册请求发送到服务器,所述语音信息中包括用户的人声音频信息以及环境噪声音频信息。
56.由于环境中可能会有其他人在说话,这时家电终端设备不能准确地识别到用户的人声信息,因而可以在录入完用户的声音信息后再继续录入一段纯环境噪声信息以便区分用户的人声信息与环境噪声信息,从而获得原始音频信息。然后,将所述原始音频信息发送到服务器,所述服务器可以是云端服务器,也可以是本地服务器,在此不做具体限定。
57.另一实施例中,在用户触发声纹注册请求时,家电终端设备或移动终端开启录音模式并输出字符串以供用户进行朗读,在用户朗读完所述字符串时,终端采集用户的人声信息以及环境噪音信息即原始音频信息,根据原始音频信息生成声纹注册请求,并发送声纹注册请求到所述服务器。
58.可选地,在所述步骤s10之前,家电终端设备接收原始音频信息,根据原始音频信息生成原始音频信息编辑界面以便用户对所述原始音频信息进行选取、剪切以及替换等编辑,从而得到标记信息,根据所述原始音频信息以及标记信息生成声纹注册请求并将所述声纹注册请求发送至服务器。
59.可选地,服务器在接收到来自终端或家电终端设备发送的声纹注册请求时,获取所述声纹注册请求中的原始音频信息以及标记信息,对所述原始音频进行分析以确定原始音频信息中的噪声参数,然后判断所述原始音频信息中的噪声参数是否超出预设噪声参数范围。
60.具体地,所述噪声参数可以是信噪比或噪声比例,如所述原始音频信息的信噪比越高,噪声越小,信噪比越低,噪声越大。通过判断所述原始音频信息的信噪比是否小于预设信噪比,或者,判断所述噪声比例是否超过预设噪声比例,来判断噪声参数是否在所述预设噪声参数范围之外。
61.可以理解的是,若所述原始音频信息中的所述噪声比例超过预设噪声比例或所述信噪比小于预设信噪比时,表示所述原始音频信息噪声过大,服务器不能直接对原始音频
信息进行运算并提取目标声纹;若所述原始所述噪声比例在预设噪声比例之内或所述信噪比大于预设信噪比时,表示原始音频是在安静环境下录制的,噪声非常小,则服务器可以直接对所述原始音频信息进行运算并提取目标声纹信息。
62.因此,在所述原始音频信息中的噪声比例超过预设噪声比例或所述信噪比小于预设信噪比时,服务器根据原始音频信息生成原始音频信息编辑界面信息,并将所述原始音频信息编辑界面信息发送至终端,或者终端根据所述原始音频信息生成原始音频信息编辑界面。终端将原始音频信息编辑界面输出原始音频信息编辑界面以便用户对所述原始音频信息进行选取、剪切以及替换等编辑。
63.步骤s20、根据所述原始音频信息以及和所述标记信息确定目标声纹信息;
64.进一步地,根据所述原始音频信息以及所述标记信息确定目标音频信息;
65.根据所述目标音频信息确定目标声纹信息。
66.具体地,目标音频信息可包括用户通过所述原始音频信息编辑界面所编辑的有效音频信息和/或噪声音频信息中的至少一个。其中,所述有效音频信息为包含用户的人声的音频信息。所述噪声音频信息为不包含用户人声信息的纯环境噪音信息。移动终端或家电终端设备在输出原始音频信息编辑界面时,用户可在所述原始音频信息编辑界面上对所述原始音频信息进行选取、剪切以及替换等编辑,以将有效音频信息与噪声音频信息分离开来。
67.可选地,原始音频信息编辑界面可以包括有目标音频信息的存储位置,而且所述目标音频信息存储位置可以为多个,以将有效音频信息以及所述噪声音频信息分别存储。终端将所述有效音频信息和或所述噪声目标音频信息发送至服务器。所述服务器获取所述终端基于所述原始音频信息编辑界面确定的目标音频信息。
68.所述服务器在获取到所述目标音频信息后,通过所述目标音频信息对原始音频信息与进行去噪处理。可选地,将所述原始音频信息与所述目标音频信息输入自适应滤波器以进行噪声消除处理以得到人声信息,并对所述人声信息进行声纹特征提取以得到目标声纹信息。
69.步骤s30、将所述目标声纹信息进行注册。
70.将所述目标声纹保存至所述服务器中以便对接收到的声纹信息进行验证。
71.本实施例提供的技术方案中,通过在对采集的语音信息进行声纹注册之前,根据声纹注册请求输出原始音频信息编辑界面,供用户对原始音频信息进行编辑,从而获得标记信息或目标音频信息。根据所述标记信息对原始音频信息进行处理以得到目标音频信息。对所述目标音频信息中的人声信息进行加强处理并对噪声进行去噪处理以及对声纹特征进行提取从而得到目标声纹信息,将所述目标声纹信息注册进服务器。这样在声纹注册前,终端根据声纹注册请求生成原始音频信息编辑界面,用户可以在终端对原始音频信息进行选取、剪切以及替换等编辑得到标记信息从而确定用户自己的人声信息,从而可以根据原始音频以及目标音频获取所述人声信息并提取所述人声信息中的目标声纹信息,提高了空调器识别到注册用户自己的人声信息的准确性,进而准确注册用户声纹,提高声纹控制的准确性。
72.参照图3,图3为本发明声纹注册方法的另一实施例,基于上述一实施例,所述步骤s20包括:
73.步骤s21、接收家电终端设备发送的基于所述原始音频信息编辑界面编辑的标记信息;
74.可以理解的是,移动终端或家电终端设备根据所述原始音频信息生成原始音频信息编辑界面后,将所述原始音频信息编辑界面输出至显示屏,以便用户可以基于所述显示屏显示的原始音频信息编辑界面进行操作。
75.可选地,原始音频信息编辑界面可以包括但不限于所述原始音频信息的进度条、所述原始音频信息对应的时间戳以及原始音频信息对应的编辑工具,所述原始音频信息的编辑工具用于对所述原始音频信息进行选取、剪切以分段、替换以及提取目标音频信息等操作。
76.用户在原始音频信息编辑界面上进行提取目标音频信息的操作后,移动终端或家电设备根据用户操作,获取目标音频信息对应的时间戳信息,并将其发送至服务器,以便服务器可以根据所述目标音频信息对应的时间戳将所述目标音频信息从原始音频信息中提取出来。
77.可选地,原始音频信息编辑界面上还可以设置目标音频信息选取框,用以选取至少预设时长的目标音频信息,所述预设时长可以设置为3秒。所述目标音频信息选取框可以由注册的用户拖住框的两侧以拉长所选取音频的时长,将所述目标音频信息选取框在所述原始音频信息的进度条中拖动以选取包括用户人声信息的所述目标音频。在选取好目标音频后,移动终端或家电设备则将目标音频信息选取框的两侧对应的时间戳发送到服务器,从而进行目标音频信息的提取。
78.可选地,用户还可在原始音频信息编辑界面中的音频信息进度条中点击设置目标音频信息的开始时间以及结束时间,移动终端或家电设备将目标音频信息的开始时间以及结束时间的时间戳发送到服务器,从而进行目标音频信息的提取。
79.步骤s22、根据所述标记信息从所述原始音频信息中提取目标音频信息,所述标记信息包括时间戳;
80.步骤s23、根据所述原始音频信息以及所述目标音频信息确定目标声纹信息。
81.所述服务器接收终端发送的目标音频信息对应的时间戳,并根据所述时间戳确定目标音频信息在原始音频信息进度条中的开始时间以及结束时间,从而将目标音频从原始音频中提取出来,并对所述原始音频信息以及所述目标音频进行处理以得到目标声纹信息。
82.可以理解的是,由于声纹信息所涉及的隐私安全问题,上述服务器所执行的步骤也可以放在家电终端设备执行,具体步骤在此不再赘述。
83.在本实施例提供的技术方案中,用户在家电终端设备的所述原始音频信息编辑界面上进行操作以确定目标音频信息对应的时间戳,将所述目标音频信息对应的标记信息如时间戳发送到服务器以便服务器根据时间戳从原始音频中获取目标音频。这样服务器仅需接收目标音频信息的时间戳便可以将目标音频信息从所述原始音频信息中准确提取出来,提高了声纹注册效率。
84.参照图4,图4为本发明声纹注册方法步骤s23的对应的一实施例的流程示意图,基于上述实施例,所述步骤s23包括:
85.步骤s231、当所述目标音频信息包括至少一个有效音频信息时,判断所述有效音
频信息中的噪声参数是否超出预设噪声参数范围;
86.上述目标音频信息包括用户通过原始音频信息编辑界面所编辑的有效音频信息和/或噪声音频信息中的至少一个。
87.可选地,所述目标音频信息可以是有效音频信息,即所述原始音频信息中包含有用户人声信息的音频片段;用户在所述家电终端设备的原始音频信息编辑界面上确定所述有效音频信息在原始音频信息进度条中对应的第一时间戳,移动终端或家电设备将所述第一时间戳发送到服务器。服务器在接收到第一时间戳时,根据第一时间戳确定所述有效音频信息,并对有效音频信息进行分析以计算出噪声参数,然后判断有效音频信息中的噪声参数是否超出预设噪声参数范围。具体地,所述噪声参数可以是信噪比或噪声比例;所述有效音频信息的信噪比越高,噪声越小,信噪比越低,噪声越大。通过判断所述有效音频信息的信噪比是否小于预设信噪比,或者,判断所述噪声比例是否超过预设噪声比例,来判断噪声参数是否超出预设噪声参数范围。
88.步骤s232、在所述有效音频信息中的噪声参数超出预设噪声参数范围时,对所述有效音频信息进行去噪处理后,并进行声纹提取,得到目标声纹信息。
89.具体地,若所述有效音频信息的噪声参数在超出预设噪声参数范围,即有效音频信息中的信噪比在小于预设信噪比或者有效音频信息中的所述噪声比例超过预设噪声比例时,表示所述有效音频信息噪声过大,则服务器不能直接进行运算并提取目标声纹;若有效音频信息中的所述噪声比例在预设噪声比例之内或所述信噪比大于预设信噪比时,表示所述有效音频信息噪声非常小,即用户在讲话时正好没有环境杂音,则服务器可以直接对有效音频进行运算并提取目标声纹信息。
90.可以理解的是,由于声纹信息所涉及的隐私安全问题,上述服务器所执行的步骤也可以放在家电终端设备执行,具体步骤在此不再赘述。
91.因此,在有效音频信息中的所述噪声比例超过预设噪声比例或所述信噪比小于预设信噪比时,对有效音频信息进行常规去噪处理如将所述有效音频信息通过回声消除算法进行去噪处理,对去噪处理后的有效音频信息进行声纹特征提取以得到目标声纹信息,从而提高声纹注册的准确性。
92.可选地,参照图5,图5为本发明声纹注册方法步骤s23的对应的另一实施例的流程示意图,所述步骤s23还包括:
93.步骤s233、当所述目标音频信息包括噪声音频信息时,根据所述噪声音频信息对所述原始音频信息进行去噪处理后,并进行声纹提取,得到目标声纹信息。
94.可以理解的是,由于声纹信息所涉及的隐私安全问题,上述服务器所执行的步骤也可以放在家电终端设备执行,具体步骤在此不再赘述。
95.用户在移动终端或家电终端设备上显示的原始音频信息编辑界面进行选取、剪切以及替换等编辑,获得噪声音频信息,所述噪声音频信息为不包含用户人声信息的纯环境噪音信息。移动终端或家电终端设备根据用户操作,将所述噪声音频信息在原始音频信息进度条中对应的第二时间戳发送到服务器。服务器根据所述第二时间戳在原始音频信息中提取噪声音频信息,并将所述噪声音频信息与所述原始音频信息进行运算以便将人声与环境音混合的原始音频信息减去包括纯环境噪音信息的噪声音频信息,从而得到原始音频信息中的人声信息,并对所述人声信息进行声纹提取以获得目标声纹信息。提高了声纹注册
的准确性。
96.可选地,参照图6,图6为本发明声纹注册方法步骤s23的对应的再一实施例的流程示意图,所述步骤s23还包括:
97.步骤s234、当所述目标音频信息包括有效音频信息和噪声音频信息时,根据所述噪声音频信息对所述有效音频信息进行去噪处理后,并进行声纹提取,得到目标声纹信息。
98.用户在移动终端或家电终端设备上显示的原始音频信息编辑界面进行操作,确定出有效音频信息与噪声音频信息。然后,移动终端或家电终端设备根据用户操作,将所述有效音频信息在原始音频信息进度条中对应的第一时间戳以及所述噪声音频信息在原始音频信息进度条中对应的第二时间戳发送到服务器。然后,服务器根据所述第一时间戳与所述第二时间戳在原始音频信息中提取有效音频信息与噪声音频信息,并将所述有效音频信息与所述噪声音频信息进行运算,如将有效音频信息包括人声与环境音混合的音频信息减去噪声音频信息包括的纯环境噪音信息,得到有效音频信息中的人声信息,然后再对所述人声信息进行声纹提取以获得目标声纹信息,提高了声纹注册的准确性。
99.可以理解的是,由于声纹信息所涉及的隐私安全问题,上述服务器所执行的步骤也可以放在家电终端设备执行,具体步骤在此不再赘述。
100.本实施例提供的技术方案中,用户通过移动终端或家电终端设备输出的原始音频信息编辑界面将所述有效音频信息和或所述噪声音频信息在原始音频进度条中对应的时间戳发送到服务器,服务器根据时间戳将所述有效音频信息和/或噪声音频信息从原始音频信息中提取出来,并根据所述有效音频信息和/或噪声音频信息对所述有效音频信息或原始音频信息中的人声信息进行加强处理并对噪声进行去噪处理,对处理后的有效音频信息或原始音频信息进行声纹特征提取以得到目标声纹信息,从而准确地提取到用户的人声信息,进而提高声纹注册的准确性。
101.参照图7,图7为本发明声纹注册方法的再一实施例,基于上述实施例,声纹注册方法还包括:
102.步骤s50、家电终端设备接收原始音频信息,根据所述原始音频信息生成原始音频信息编辑界面;
103.步骤s60、基于所述原始音频信息编辑界面对所述原始音频信息进行标记以得到标记信息;
104.在本实施例中终端设备为家电终端设备,如空调器、电视机、冰箱、洗衣机等,家电终端设备在接收到用户触发的声纹注册请求时,开启录音模式并输出一串随机字符串以引导用户读取所述字符。所述字符串可以是数字或文字等。
105.在接收到用户朗读的所述字符串对应的原始音频信息时,家电终端设备根据原始音频信息生成原始音频信息编辑界面,所述原始音频信息包括人声信息以及环境噪声信息。显示原始音频信息编辑界面,以便用户根据移动终端或家电终端设备中的原始音频信息编辑界面对所述原始音频信息进行选取、剪切以及替换等编辑从而得到标记信息。
106.步骤s70、根据所述原始音频信息以及标记信息生成声纹注册请求;
107.步骤s80、将所述声纹注册请求发送至服务器,以使所述服务器根据所述原始音频信息以及所述标记信息确定目标声纹信息并将所述目标声纹信息进行注册。
108.根据原始音频信息以及标记信息生成声纹注册请求并一同发送至服务器,服务器
直接对所述原始音频信息以及选取的目标音频信息中的人声信息进行加强处理并对噪声进行去噪处理后提取目标声纹信息。
109.本实施例提供的技术方案中,家电终端设备在接收到原始音频信息时,直接根据原始音频信息生成并显示原始音频信息编辑界面,家电终端设备将基于所述原始音频编辑界面编辑得到的标记信息保存并将原始音频信息和标记信息作为声纹注册请求一同发送至所述服务器。这样使得服务器可以根据标记信息对原始音频信息进行处理以得到目标音频信息。根据所述原始音频信息以及目标音频信息进行运算以提取目标声纹信息。提高了声纹提取的准确性。
110.可选地,用户还可以在家电终端设备app的原始音频信息编辑界面上通过目标音频信息选取框获取到目标音频信息后,将所述目标音频信息保存在移动终端设备,再由移动终端设备将原始音频信息以及选取的目标音频信息一同发送至服务器。
111.这样家电终端设备将基于所述原始音频信息编辑界面确定的目标音频信息选取并保存之后,将原始音频信息与目标音频信息发送到服务器进行处理,这样加快了目标音频信息的选取速度,从而提高了声纹注册效率。
112.可选地,一实施例中,基于上述实施例,声纹注册方法还包括:
113.家电终端设备接收所述声纹注册请求,将所述声纹注册请求发送至服务器,所述声纹注册请求包括原始音频信息,以使所述服务器返回所述声纹注册请求对应的原始音频信息编辑界面;
114.显示所述服务器返回的原始音频信息编辑界面;
115.基于所述原始音频信息编辑界面对原始音频信息进行编辑获得标记信息;
116.将所述标记信息发送至服务器,以使所述服务器根据所述原始音频信息以及所述标记信息确定目标声纹信息,并将目标声纹信息进行注册。
117.在接收到用户朗读的所述字符串对应的原始音频信息时,家电终端设备根据原始音频信息生成声纹注册请求并将声纹注册请求发送到所述服务器,服务器则根据声纹注册请求生成原始音频信息编辑界面,并将原始音频信息编辑界面发送到移动终端或家电终端设备,以便用户根据移动终端或家电终端设备中的原始音频信息编辑界面对所述原始音频信息进行选取、剪切以及替换等编辑从而确定目标音频信息。
118.进一步地,所述家电终端设备接收用户通过原始音频信息编辑界面获取时间戳,并将时间戳发送到服务器;服务器根据时间戳从原始音频信息中获取目标音频信息。或者,所述家电终端设备根据时间戳从原始音频信息中直接自行提取所述目标音频信息,对所述目标音频信息进行运算并提取声纹特征以得到目标声纹信息。
119.本实施例提供的技术方案中,用户基于家电终端设备接收到来自服务器的原始音频信息编辑界面确定目标音频信息,将目标音频信息发送到所述服务器以便服务器对所述目标音频信息进行运算并提取声纹特征以得到目标声纹信息。这样通过家电终端设备准确确认用户的人声信息从而可以更准确地提取人声信息中的声纹特,提高了声纹注册的准确性。
120.本发明还提供一种计算机程序产品,包括计算机程序,所述处理器在执行所述计算机程序时实现如上所述的声纹注册方法的步骤。
121.本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序
产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
122.本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
123.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
124.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
125.尽管已描述了本发明的可选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
126.显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

技术特征:


1.一种声纹注册方法,其特征在于,所述声纹注册方法包括:接收来自家电终端设备的声纹注册请求,所述声纹注册请求包括用户的原始音频信息,以及所述用户对所述原始音频信息标记得到的标记信息;根据所述原始音频信息和所述标记信息确定目标声纹信息;根据所述目标声纹信息进行注册。2.如权利要求1所述的声纹注册方法,其特征在于,所述根据所述原始音频信息和所述标记信息确定目标声纹信息的步骤包括:接收家电终端设备发送的基于所述原始音频信息编辑界面编辑的标记信息;根据所述标记信息从所述原始音频信息中提取目标音频信息,所述标记信息包括时间戳;根据所述原始音频信息以及所述目标音频信息确定目标声纹信息。3.如权利要求1所述的声纹注册方法,其特征在于,所述目标音频信息包括基于所述原始音频信息编辑界面所确定的至少一个有效音频信息和/或噪声音频信息。4.如权利要求2所述的声纹注册方法,其特征在于,所述根据所述原始音频信息以及所述目标音频信息确定目标声纹信息的步骤包括:当所述目标音频信息包括至少一个有效音频信息时,判断所述有效音频信息中的噪声参数是否超出预设噪声参数范围;在所述有效音频信息中的噪声参数超出预设噪声参数范围时,对所述有效音频信息进行去噪处理后,并进行声纹提取,得到目标声纹信息。5.如权利要求2所述的声纹注册方法,其特征在于,所述根据所述原始音频信息以及所述目标音频信息确定目标声纹信息的步骤包括:当所述目标音频信息包括噪声音频信息时,根据所述噪声音频信息对所述原始音频信息进行去噪处理后,并进行声纹提取,得到目标声纹信息。6.如权利要求2所述的声纹注册方法,其特征在于,所述根据所述原始音频信息以及所述目标音频信息确定目标声纹信息的步骤包括:当所述目标音频信息包括有效音频信息和噪声音频信息时,根据所述噪声音频信息对所述有效音频信息进行去噪处理后,并进行声纹提取,得到目标声纹信息。7.一种声纹注册方法,其特征在于,所述声纹注册方法包括:家电终端设备接收原始音频信息,根据所述原始音频信息生成原始音频信息编辑界面;基于所述原始音频信息编辑界面对所述原始音频信息进行标记以得到标记信息;根据所述原始音频信息以及标记信息生成声纹注册请求;将所述声纹注册请求发送至服务器,以使所述服务器根据所述原始音频信息以及所述标记信息确定目标声纹信息并将所述目标声纹信息进行注册。8.如权利要求7所述的声纹注册方法,其特征在于,所述显示所述服务器返回的原始音频信息编辑界面的步骤之后,包括:所述家电终端设备接收基于所述原始音频信息编辑界面所标记得到的标记信息;将所述标记信息发送至服务器,以使服务器根据所述标记信息从所述原始音频信息中提取所述目标音频信息;或者,
根据所述标记信息从原始音频信息中提取所述目标音频信息,并将所述目标音频信息发送至服务器端以进行声纹注册。9.一种服务器,其特征在于,所述服务器包括存储器、处理器以及存储在所述存储器并可在所述处理器上运行的声纹注册程序,所述声纹注册程序被所述处理器执行时实现如权利要求1-6任一项所述的声纹注册方法。10.一种家电终端设备,其特征在于,所述设备包括存储器、处理器以及存储在所述存储器并可在所述处理器上运行的声纹注册程序,所述声纹注册程序被所述处理器执行时实现如权利要求7-8任一项所述的声纹注册方法。11.一种计算机的可读存储介质,其特征在于,所述计算机可读存储介质存储有声纹注册程序,所述声纹注册程序被处理器执行时实现如权利要求1-8任一项所述的声纹注册方法。

技术总结


本发明公开了一种声纹注册方法、服务器、家电终端设备及可读存储介质,所述声纹注册方法包括:接收来自家电终端设备的声纹注册请求,所述声纹注册请求包括用户的原始音频信息,以及所述用户对所述原始音频信息标记得到的标记信息;根据所述原始音频信息和所述标记信息确定目标声纹信息;根据所述目标声纹信息进行注册。本发明解决了声纹注册不准确的技术问题,提高了声纹注册准确性。提高了声纹注册准确性。提高了声纹注册准确性。


技术研发人员:

霍伟明 张新健 徐浩 方海波 徐聪聪 吴施烙

受保护的技术使用者:

广东美的制冷设备有限公司

技术研发日:

2021.05.21

技术公布日:

2022/11/22

本文发布于:2022-11-24 21:32:17,感谢您对本站的认可!

本文链接:https://patent.en369.cn/patent/4/784.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:所述   信息   音频   原始
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 369专利查询检索平台 豫ICP备2021025688号-20 网站地图