识别对象的方法、装置、电子设备及计算机程序产品与流程

阅读：评论：0

1.本发明涉及金融科技领域，具体而言，涉及一种识别对象的方法、装置、电子设备及计算机程序产品。

背景技术：

2.目前，随着声纹识别技术的发展，在移动终端、防盗门等需要进行身份验证的电子设备上通常支持声纹识别，其中，声纹识别技术中通常需要分两个阶段实现身份验证，具体包括：声纹注册阶段，用于采集目标对象的目标声纹特征并进行存储；声纹认证阶段，在获取得到待识别对象的声音之后，提取待识别对象的声纹特征并与存储的目标声纹特征进行比对，根据比对结果确认待识别对象的身份是否为目标对象。
3.容易注意到的是，现有技术在进行声纹识别时，将声纹特征作为了唯一的身份验证因子，但是随着语音模拟技术的发展，不法分子通过技术手段发展出了声音模拟、语音合成以及录音重放等多种攻击方式，从而使得声纹识别的安全性面临极大的挑战。例如，现有的声纹识别模式主要是通过收集待识别对象朗读随机数字或固定文本时的声音信息，然后根据声音信息提取待识别对象的声纹特征并与目标对象的目标声纹特征进行比对。在此基础上，不法分子可通过窃取随机数字或固定文本，然后利用目标对象的真实声音，通过录音重放或者语音合成的方式生成目标对象朗读随机数字或固定文本时的声音信息，从而绕过后台验证，完成身份验证。由此可见，仅通过比对待识别对象与目标对象的声纹特征来进行身份认证会导致身份认证安全性低的问题。
4.针对上述的问题，目前尚未提出有效的解决方案。

技术实现要素：

5.本发明实施例提供了一种识别对象的方法、装置、电子设备及计算机程序产品，以至少解决现有技术中仅通过比对声纹特征进行身份认证所存在的身份认证安全性低的技术问题。
6.根据本发明实施例的一个方面，提供了一种识别对象的方法，包括：获取待识别对象通过操作第一录音控件所录制的声音信息，其中，第一录音控件为客户端的显示界面中所展示的多个录音控件中的任意一个录音控件，每个录音控件对应一个控件标识；检测声音信息是否与预先存储的目标声纹特征相匹配，得到声音验证结果，其中，目标声纹特征为目标对象的声纹特征；检测第一录音控件所对应的第一控件标识是否与预先存储的目标控件标识相匹配，得到标识验证结果，其中，目标控件标识为目标对象在录音时所操作的录音控件的控件标识；根据声音验证结果和标识验证结果对待识别对象的身份信息进行识别，得到识别结果。
7.进一步地，识别对象的方法还包括：多个录音控件按照随机排列顺序在客户端的显示界面中进行展示。
8.进一步地，识别对象的方法还包括：在获取待识别对象通过操作第一录音控件所
录制的声音信息之前，获取目标对象的身份标识以及目标对象通过客户端录制的目标声音信息；对目标声音信息进行声纹特征提取，得到目标声纹特征；获取目标对象在录音时所操作的目标录音控件的目标控件标识；对目标控件标识、身份标识以及目标声纹特征进行关联，得到关联关系。
9.进一步地，识别对象的方法还包括：对声音信息进行声纹特征提取，得到第一声纹特征；确定第一声纹特征与目标声纹特征之间的相似度；在相似度大于预设相似度时，确定声音信息与目标声纹特征相匹配；在相似度小于或等于预设相似度时，确定声音信息与目标声纹特征不匹配。
10.进一步地，识别对象的方法还包括：在第一控件标识与目标控件标识相同时，确定第一控件标识与目标控件标识相匹配；在第一控件标识为目标控件标识之外的标识时，确定第一控件标识与目标控件标识不匹配。
11.进一步地，识别对象的方法还包括：在第一控件标识与目标控件标识不匹配，或者声音信息与目标声纹特征不匹配时，确定待识别对象的身份识别失败；记录待识别对象的身份识别失败的次数；根据声音验证结果、标识验证结果以及待识别对象的身份识别失败的次数，对待识别对象的身份信息进行识别，得到识别结果。
12.进一步地，识别对象的方法还包括：在待识别对象的身份识别失败的次数小于或等于预设次数，并且第一控件标识与目标控件标识相匹配，声音信息与目标声纹特征相匹配时，确定待识别对象的身份为目标对象；在待识别对象的身份识别失败的次数大于预设次数时，确定待识别对象的身份与目标对象不匹配。
13.根据本发明实施例的另一方面，还提供了一种识别对象的装置，包括：获取模块，用于获取待识别对象通过操作第一录音控件所录制的声音信息，其中，第一录音控件为客户端的显示界面中所展示的多个录音控件中的任意一个录音控件，每个录音控件对应一个控件标识；第一检测模块，用于检测声音信息是否与预先存储的目标声纹特征相匹配，得到声音验证结果，其中，目标声纹特征为目标对象的声纹特征；第二检测模块，用于检测第一录音控件所对应的第一控件标识是否与预先存储的目标控件标识相匹配，得到标识验证结果，其中，目标控件标识为目标对象在录音时所操作的录音控件的控件标识；识别模块，用于根据声音验证结果和标识验证结果对待识别对象的身份信息进行识别，得到识别结果。
14.根据本发明实施例的另一方面，还提供了一种计算机可读存储介质，计算机可读存储介质中存储有计算机程序，其中，计算机程序被设置为运行时执行上述的识别对象的方法。
15.根据本发明实施例的另一方面，还提供了一种电子设备，电子设备包括一个或多个处理器；存储器，用于存储一个或多个程序，当一个或多个程序被一个或多个处理器执行时，使得一个或多个处理器实现用于运行程序，其中，程序被设置为运行时执行上述的识别对象的方法。
16.根据本发明实施例的另一方面，还提供了一种计算机程序产品，包括计算机程序/指令，计算机程序/指令被处理器执行时实现上述的识别对象的方法。
17.在本发明实施例中，采用在客户端的显示界面中展示多个录音控件的方式，在获取待识别对象通过操作第一录音控件所录制的声音信息之后，检测声音信息是否与预先存储的目标声纹特征相匹配，得到声音验证结果，然后检测第一录音控件所对应的第一控件
标识是否与预先存储的目标控件标识相匹配，得到标识验证结果，最后根据声音验证结果和标识验证结果对待识别对象的身份信息进行识别，得到识别结果。其中，第一录音控件为客户端的显示界面中所展示的多个录音控件中的任意一个录音控件，每个录音控件对应一个控件标识；目标声纹特征为目标对象的声纹特征；目标控件标识为目标对象在录音时所操作的录音控件的控件标识。
18.由上述内容可知，在本技术中，客户端的显示界面中不再只展示一个录音控件，而是展示多个录音控件，并且每个录音控件对应一个控件标识，因此，本技术除了检测待识别对象的声音信息与目标对象的目标声纹特征是否匹配之外，还可检测待识别对象所操作的第一录音控件的第一控件标识是否与目标对象预设的目标控件标识相匹配，由于增加了检测第一控件标识与目标控件标识是否匹配的步骤，因此在不法分子用过语音合成等技术合成目标对象的声音信息时，如果第一控件标识与目标控件标识无法匹配，则仍然无法通过身份验证，从而提高了身份验证的安全性。另外，由于本技术是在待识别对象操作录音控件时获取控件标识，因此本技术在客户端没有增加多余的操作步骤，用户只需要按照原来的方式通过操作录音控件进行录制声音即可，从而在提高身份验证的安全性的同时，达到了保证用户操作简单便捷的目的。
19.由此可见，通过本技术的技术方案，达到了在比对声纹特征的基础上增加身份验证环节的目的，从而实现了提高身份验证安全性的技术效果，进而解决了现有技术中仅通过比对声纹特征进行身份认证所存在的身份认证安全性低的技术问题。
附图说明
20.此处所说明的附图用来提供对本发明的进一步理解，构成本技术的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：
21.图1是根据本发明实施例的一种可选的识别对象的方法的流程图；
22.图2是一种可选的按照固定顺序排列的多个录音控件的示意图；
23.图3是一种可选的按照随机顺序排列的多个录音控件的示意图；
24.图4是根据本发明实施例的一种可选的目标声纹特征的注册流程图；
25.图5是根据本发明实施例的一种可选的声纹特征验证流程图；
26.图6是根据本发明实施例的一种可选的识别对象的系统示意图；
27.图7是根据本发明实施例的一种可选的声纹采集模块的示意图；
28.图8是根据本发明实施例的一种可选的控件标识模块的示意图；
29.图9是根据本发明实施例的一种可选的错误次数管控模块的示意图；
30.图10是根据本发明实施例的一种可选的声纹识别主控模块的示意图；
31.图11是根据本发明实施例的一种可选的识别对象的装置示意图；
32.图12是根据本发明实施例的一种可选的电子设备的示意图。
具体实施方式
33.为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人
员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。
34.需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
35.另外，还需要说明的是，本公开的技术方案中，所涉及的用户个人信息的获取，存储和应用等，均为经用户授权或者经过各方充分授权的信息。
36.实施例1
37.根据本发明实施例，提供了一种识别对象的方法实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。
38.图1是根据本发明实施例的一种可选的识别对象的方法的流程图，如图1所示，该方法包括如下步骤：
39.步骤s101，获取待识别对象通过操作第一录音控件所录制的声音信息。
40.在步骤s101中，第一录音控件为客户端的显示界面中所展示的多个录音控件中的任意一个录音控件，每个录音控件对应一个控件标识。其中，客户端可应用在智能手机、智能门锁、智能手表、笔记本计算机以及智能平板等终端设备上，在客户端中的显示界面中显示有多个录音控件，待识别对象可以从多个录音控件中选择一个第一录音控件，并通过按压等操作向客户端发送录音指令，客户端在接收到录音指令之后，打开终端设备中的麦克风模块并开始录制待识别对象的声音信息，在录制完成之后，客户端将录制得到的待识别对象的声音信息发送至服务端。
41.需要注意到的是，在现有技术中，通常客户端的显示界面中只有一个录音控件，本技术通过增加多个录音控件，并且为每个录音控件设置一个对应的控件标识，从而可通过检测第一控件标识与目标控件标识是否匹配来对待识别对象进行身份验证。此外，由于现有技术中用户原本就是通过使用录音控件进行声音的录制，因此，本技术在没有过多改变用户的原有操作的同时，增加了检测第一控件标识与目标控件标识是否匹配的步骤，既保证了用户操作的便捷性和易用性，还提高了身份验证的安全性。
42.步骤s102，检测声音信息是否与预先存储的目标声纹特征相匹配，得到声音验证结果。
43.在步骤s102中，目标声纹特征为目标对象的声纹特征。其中，在服务端接收到客户端发送的待识别对象的声音信息之后，服务端可首先对声音信息进行去噪、话者分离以及有效语音提取等预处理，得到有效语音片段，然后服务端对有效语音片段进行声音特征提取，得到第一声纹特征。
44.进一步地，服务端将得到的第一声纹特征与预先存储的目标声纹特征进行比对，
得到第一声纹特征与目标声纹特征的相似度，在相似度大于预设相似度时，服务端确定待识别对象的声音信息与目标对象的目标声纹特征相匹配；在相似度小于或等于预设相似度时，服务端确定待识别对象的声音信息与目标声纹特征不匹配。
45.步骤s103，检测第一录音控件所对应的第一控件标识是否与预先存储的目标控件标识相匹配，得到标识验证结果。
46.在步骤s103中，服务端还将获取第一录音控件所对应的第一控件标识，并检测第一控件标识与预先存储的目标控件标识是否相匹配。具体的，如果第一控件标识与目标控件标识相同，则服务端确定第一控件标识与目标控件标识相匹配，如果第一控件标识与目标控件标识不同，则服务端确定第一控件标识与目标控件标识不匹配。
47.例如，为了增强趣味性，同时便于用户记忆，本技术提出了一种4*3的生肖录音控件的方案，其中，如图2所示，在目标对象注册目标控件标识时，客户端的显示界面中按照固定排列顺序展示了十二个录音控件，分别为鼠、牛、虎、兔、龙、蛇、马、羊、猴、鸡、狗、猪，目标对象可从12个录音控件中选取一个目标录音控件，例如，目标对象选择“蛇”录音控件作为目标录音控件，在此基础上，服务端将记录“蛇”为目标控件标识。如图3所示，在待识别对象需要录制声音进行身份验证时，12个录音控件按照随机排列顺序在客户端的显示界面中进行展示，此时，如果待识别对象是通过操作“蛇”录音控件并读出文本12345678，则服务端最终获取的第一控件标识为“蛇”，由于第一控件标识与目标控件标识都是“蛇”，因此，服务端确定该第一控件标识与目标控件标识相匹配。如果待识别对象是通过操作“鼠”录音控件进行录音，则服务端最终获取的第一控件标识为“鼠”，由于与目标控件标识“蛇”不同，因此，服务端确定该第一控件标识与目标控件标识不匹配。
48.步骤s104，根据声音验证结果和标识验证结果对待识别对象的身份信息进行识别，得到识别结果。
49.在步骤s104中，服务端在接收到声音验证结果以及标识验证结果之后，可根据声音验证结果和标识验证结果对待识别对象的身份信息进行识别，从而得到识别结果。具体的，在第一控件标识与目标控件标识不匹配，或者声音信息与目标声纹特征不匹配时，服务端确定待识别对象的身份识别失败；在第一控件标识与目标控件标识相匹配，并且声音信息与目标声纹特征相匹配时，服务端确定待识别对象的身份为目标对象。
50.另外，为了限制待识别对象的尝试次数，以降低随机命中率，提高身份验证的安全性，本技术还增加了错误次数管控机制。具体的，在第一控件标识与目标控件标识不匹配，或者声音信息与目标声纹特征不匹配时，服务端会确定待识别对象的身份识别失败，同时服务端还会记录待识别对象的身份识别失败的次数。在此基础上，在待识别对象的身份识别失败的次数小于或等于预设次数，并且第一控件标识与目标控件标识相匹配，声音信息与目标声纹特征相匹配时，服务端确定待识别对象的身份为目标对象；在待识别对象的身份识别失败的次数大于预设次数时，服务端将直接生成待识别对象的身份与目标对象不匹配的识别结果，并且生成验证次数超出上限的提示信息，待识别对象需要在间隔预设时间之后才可以重新进行验证。
51.基于上述步骤s101至步骤s104的内容可知，在本发明实施例中，采用在客户端的显示界面中展示多个录音控件的方式，在获取待识别对象通过操作第一录音控件所录制的声音信息之后，检测声音信息是否与预先存储的目标声纹特征相匹配，得到声音验证结果，
然后检测第一录音控件所对应的第一控件标识是否与预先存储的目标控件标识相匹配，得到标识验证结果，最后根据声音验证结果和标识验证结果对待识别对象的身份信息进行识别，得到识别结果。其中，第一录音控件为客户端的显示界面中所展示的多个录音控件中的任意一个录音控件，每个录音控件对应一个控件标识；目标声纹特征为目标对象的声纹特征；目标控件标识为目标对象在录音时所操作的录音控件的控件标识。
52.由上述内容可知，在本技术中，客户端的显示界面中不再只展示一个录音控件，而是展示多个录音控件，并且每个录音控件对应一个控件标识，因此，本技术除了检测待识别对象的声音信息与目标对象的目标声纹特征是否匹配之外，还可检测待识别对象所操作的第一录音控件的第一控件标识是否与目标对象预设的目标控件标识相匹配，由于增加了检测第一控件标识与目标控件标识是否匹配的步骤，因此在不法分子用过语音合成等技术合成目标对象的声音信息时，如果第一控件标识与目标控件标识无法匹配，则仍然无法通过身份验证，从而提高了身份验证的安全性。另外，由于本技术是在待识别对象操作录音控件时获取控件标识，因此本技术在客户端没有增加多余的操作步骤，用户只需要按照原来的方式通过操作录音控件进行录制声音即可，从而在提高身份验证的安全性的同时，达到了保证用户操作简单便捷的目的。
53.由此可见，通过本技术的技术方案，达到了在比对声纹特征的基础上增加身份验证环节的目的，从而实现了提高身份验证安全性的技术效果，进而解决了现有技术中仅通过比对声纹特征进行身份认证所存在的身份认证安全性低的技术问题。
54.在一种可选的实施例中，多个录音控件按照随机排列顺序在客户端的显示界面中进行展示。
55.可选的，如图2与图3所示，在目标对象注册目标控件标识时，客户端的显示界面中按照固定排列顺序展示了十二个录音控件，在待识别对象需要通过操作录音控件录制声音并进行身份验证时，12个录音控件按照随机排列顺序在客户端的显示界面中进行展示。
56.需要注意到的是，通过将多个录音控件按照随机排列顺序在客户端的显示界面中进行展示，可以防止不法分子通过记录多个录音控件之间的顺序，猜测得到目标对象所操作的目标录音控件，从而提高了身份验证的安全性。
57.在一种可选的实施例中，在获取待识别对象通过操作第一录音控件所录制的声音信息之前，服务端获取目标对象的身份标识以及目标对象通过客户端录制的目标声音信息，然后对目标声音信息进行声纹特征提取，得到目标声纹特征，并获取目标对象在录音时所操作的目标录音控件的目标控件标识，从而对目标控件标识、身份标识以及目标声纹特征进行关联，得到关联关系。
58.可选的，图4示出了根据本发明实施例的一种可选的目标声纹特征注册流程图，如图4所示，首先客户端的显示界面中展示有录音文本，目标对象按下目标录音控件，读出录音文本的内容，然后客户端采集目标对象的目标声音信息，并将目标声音信息上传至服务端。另外，客户端在显示界面中还将展示按照固定排列顺序排列的多个录音控件，由目标对象在多个录音控件中选择目标录音控件，从而客户端可获取得到目标录音控件的目标控件标识，客户端保存目标控件标识并将目标控件标识上传至服务端。服务端在接收到目标声音信息之后，对目标声音信息进行声纹特征提取，得到目标声纹特征，最后服务端将目标对象的身份标识、目标声纹特征以及目标控件标识进行关联，并将得到的关联关系存储至数
据库中。此时，客户端提示声纹特征注册完成，声纹特征的注册流程结束。
59.需要注意到的是，在声纹识别的整体流程中，通常用户仅需进行一次声纹特征的注册，其余时间则都在进行声纹特征的识别与认证，因此在声纹特征注册阶段进行客户端优化对用户的影响最小。由于本技术仅在声纹注册的过程中增加了获取目标控件标识的步骤，而其他的声纹特征的认证流程则与原有的操作流程完全一致，因此避免了增加用户操作负担的问题，达到了保证用户操作便捷、易用性高的目的。
60.在一种可选的实施例中，服务端对声音信息进行声纹特征提取，得到第一声纹特征，并确定第一声纹特征与目标声纹特征之间的相似度，在相似度大于预设相似度时，确定声音信息与目标声纹特征相匹配；在相似度小于或等于预设相似度时，确定声音信息与目标声纹特征不匹配。
61.可选的，图5示出了根据本发明实施例的一种可选的声纹特征验证流程图，如图5所示，客户端在显示界面中展示随机排列的多个录音控件，待识别对象从多个录音控件中选取一个第一录音控件，并在按住第一录音控件的同时朗读显示界面上的文本。然后客户端采集得到待识别对象朗读文本时的声音信息，并将声音信息上传至服务端。服务端在得到声音信息之后，首先对声音信息进行声纹特征提取，得到第一声纹特征，然后将第一声纹特征与存储在数据库中的目标声纹特征进行比对，得到两者之间的相似度，当相似度大于预设相似度时，服务端确定声音信息与目标声纹特征相匹配，当相似度小于或等于预设相似度时，服务端确定声音信息与目标声纹特征不匹配。
62.在一种可选的实施例中，服务端还将检测第一录音控件所对应的第一控件标识是否与预先存储的目标控件标识相匹配。具体的，在第一控件标识与目标控件标识相同时，确定第一控件标识与目标控件标识相匹配；在第一控件标识为目标控件标识之外的标识时，确定第一控件标识与目标控件标识不匹配。
63.可选的，如图5所示，服务端在检测完成第一声纹特征与目标声纹特征是否相匹配之后，服务端还将验证第一控件标识与目标控件标识是否一致，如果第一控件标识与目标控件标识相同，则服务端确定第一控件标识与目标控件标识相匹配，如果第一控件标识与目标控件标识不相同，则服务端确定第一控件标识与目标控件标识不匹配。
64.在一种可选的实施例中，为了限制待识别对象的尝试次数，以降低随机命中率，本技术还增加了错误次数管控机制。具体的，在第一控件标识与目标控件标识不匹配，或者声音信息与目标声纹特征不匹配时，服务端确定待识别对象的身份识别失败，并记录待识别对象的身份识别失败的次数，然后服务端根据声音验证结果、标识验证结果以及待识别对象的身份识别失败的次数，对待识别对象的身份信息进行识别，得到识别结果。
65.可选的，如图5所示，在第一控件标识与目标控件标识不匹配，或者声音信息与目标声纹特征不匹配时，服务端会确定待识别对象的身份识别失败，同时服务端还会统计身份识别失败的次数，当待识别对象连续多次进行身份识别时，如果一直身份识别失败，则服务端所记录的身份识别失败的次数也在一直增加，此时，服务端将根据声音验证结果、标识验证结果以及待识别对象的身份识别失败的次数，对待识别对象的身份信息进行识别，从而得到识别结果。
66.在一种可选的实施例中，如果待识别对象的身份识别失败的次数小于或等于预设次数，并且第一控件标识与目标控件标识相匹配，声音信息与目标声纹特征相匹配，则服务
端确定待识别对象的身份为目标对象；如果待识别对象的身份识别失败的次数大于预设次数，则服务端确定待识别对象的身份与目标对象不匹配。
67.可选的，如图5所示，在服务端中，操作人员设置有身份验证失败次数上限(即预设次数)，当待识别对象连续多次身份识别失败时，如果此时待识别对象的身份识别失败的次数小于或等于预设次数，并且第一控件标识与目标控件标识相匹配，声音信息与目标声纹特征相匹配，则服务端可确定待识别对象的身份为目标对象。例如，待识别对象在进行第一次身份识别时，便实现了第一控件标识与目标控件标识相匹配，并且声音信息与目标声纹特征相匹配的条件，则待识别对象的身份识别次数为0次，小于预设次数，则此时服务端可直接确定待识别对象的身份为目标对象。此外，服务端会将识别结果返回至客户端中，从而客户端根据识别结果生成登录成功或者登录失败的提示信息。
68.可选的，当待识别对象连续多次身份识别失败时，如果待识别对象的身份识别失败的次数已经大于预设次数，则服务端将直接确定待识别对象的身份与目标对象不匹配。例如，预设次数为3次，当待识别对象已经连续3次身份识别失败时，无论待识别对象在进行第四次身份识别时的声音验证结果和标识验证结果是否全部通过，服务端都会确定待识别对象的身份与目标对象不匹配。
69.需要注意到的是，通过上述过程，限制了待识别对象的尝试次数，从而可以降低随机命中率，避免了待识别对象通过无限制测试录音控件或者录制声音信息而通过身份信息验证的情况，进而实现了提高身份验证安全性的效果。
70.在一种可选的实施例中，图6示出了一种识别对象的系统，其中，如图6所示，识别对象的系统至少包括：数据库、声纹识别主控模块、声纹采集模块、控件标识模块以及错误次数管控模块。
71.可选的，声纹采集模块用于实现用户的声纹特征信息的采集、加工和存储，如图7所示，声纹采集模块包括：声纹采集主控单元、声纹信息采集单元、特征提取单元、数据上传单元以及数据下发单元。其中，声纹信息采集单元从客户端中获取用户的声音信息，并对用户的声音信息进行去噪、话者分离和有效语音截取等预处理，得到有效语音片段，并将有效语音片段上送到特征提取单元。特征提取单元对各种声学特征参数进行处理并确定模式匹配方法后完成声纹特征提取，得到声纹特征。声纹采集主控单元将用户的身份标识和声纹特征等信息进行关联后，通过数据上传单元信息发送至声纹识别主控模块。
72.可选的，控件标识模块用于实现第一控件标识以及目标控件标识的生成、采集和校验。如图8所示，控件标识模块包括：控件标识主控单元、控件生成单元、控件标识采集单元、控件标识检验单元、标识数据上传单元以及标识数据下发单元。其中，控件生成单元用于在客户端的显示界面中生成多个录音控件，并且每个录音控件有唯一的控件标识，录音控件的数量由业务需求决定，服务端通过变量配置。控件标识采集单元用于从客户端中获取用户选择的控件编码，如果是目标对象用于注册使用的目标控件标识，则发送至控件标识主控单元中并存储至数据库，如果是待识别对象用于身份识别的第一控件标识，则发送至控件标识校验单元进行下一步操作。控件标识校验单元从控件标识采集单元中获取到第一控件标识之后，判断第一控件标识与目标控件标识是否一致，并生成校验结果传输给控件标识主控单元。控件标识主控单元将校验结果通过标识数据上传单元信息发送至错误次数管控模块、声纹识别主控模块。
73.可选的，错误次数管控模块用于实现错误次数上限值(即预设次数)设置和超限检查。如图9所示，错误次数管控模块包括：错误次数管控主控单元、错误次数设置单元、错误次数管控单元、错误次数数据上传单元以及错误次数数据下发单元。其中，错误次数设置单元用于从服务端获取错误次数上限值(即预设次数)并完成配置。错误次数管控单元用于对待识别对象当前的身份识别失败的次数是否超过预设次数进行检查，错误次数管控单元可从标识验证结果和声音验证结果两个维度进行管控，并将管控结果发送至错误次数管控主控单元。错误次数管控主控单元用于将错误次数管控结果通过错误次数数据上传单元发送至声纹识别主控模块。
74.可选的，在多个录音控件为m*n的录音控件时，如果待识别对象实现不知道目标录音控件，则待识别对象第i次命中目标录音控件的概率前i次命中目标录音控件的概率如果想要将前i次命中目标录音控件的概率控制在a％以内，操作人员可将预设次数设置为a％*(m+n)(向下取整)。
75.可选的，声纹识别主控模块用于实现声纹特征比对以及对声音验证结果、标识验证结果与错误次数管控结果进行整合，从而生成识别结果。如图10所示，声纹识别主控模块包括：声纹认证单元、阈值分析单元、识别结果数据上传单元、识别结果数据下发单元以及声纹识别主控单元。其中，声纹认证单元用于实现声纹特征比对，声纹认证单元从数据库中获取目标声纹特征，并与特征提取单元上送的第一声纹特征进行比对，得到相似度分数，然后将相似度分数返回给阈值分析单元。阈值分析单元从服务端获取阈值(即预设相似度，阈值可由服务端通过变量配置)，并判断相似度分数是否高于阈值，若相似度分数高于阈值，则声音验证成功，否则声音验证失败，最后阈值分析单元将声音验证结果发送给声纹识别主控模块、错误次数管控模块。声纹识别主控单元从错误次数管控模块获取错误次数管控结果，从控件标识模块获取标识验证结果，并与声音验证结果整合形成识别结果，若声音验证成功、标识验证正确并且错误次数未超过预设次数，则识别结果为成功，其余情况则识别结果为失败。声纹识别主控单元通过识别结果数据下发单元将识别结果反馈给客户端。
76.可选的，在目标对象注册目标声纹特征时，声纹采集模块中的声纹信息采集单元、特征提取单元分别用于采集目标声纹信息的采集和提取目标声纹特征，控件标识模块中的控件标识采集单元用于采集目标控件标识。声纹注册主控单元用于将目标对象的身份标识、目标控件标识、以及目标声纹特征等信息进行关联后存储至数据库中，从而完成声纹注册。
77.需要注意到的是，通过增加控件标识模块以及错误次数管控模块，本技术达到了将声音验证与标识验证相结合的目的，并且通过两个维度进行身份识别，还提高了身份验证时的安全性。
78.实施例2
79.根据本发明实施例，还提供了一种识别对象的装置实施例，其中，图11是根据本发明实施例的一种可选的识别对象的装置示意图，如图11所示，该装置包括：获取模块1101、第一检测模块1102、第二检测模块1103以及识别模块1104。
80.其中，获取模块1101，用于获取待识别对象通过操作第一录音控件所录制的声音信息，其中，第一录音控件为客户端的显示界面中所展示的多个录音控件中的任意一个录音控件，每个录音控件对应一个控件标识；第一检测模块1102，用于检测声音信息是否与预先存储的目标声纹特征相匹配，得到声音验证结果，其中，目标声纹特征为目标对象的声纹特征；第二检测模块1103，用于检测第一录音控件所对应的第一控件标识是否与预先存储的目标控件标识相匹配，得到标识验证结果，其中，目标控件标识为目标对象在录音时所操作的录音控件的控件标识；识别模块1104，用于根据声音验证结果和标识验证结果对待识别对象的身份信息进行识别，得到识别结果。
81.需要说明的是，上述获取模块1101、第一检测模块1102、第二检测模块1103以及识别模块1104对应于上述实施例中的步骤s101至步骤s104，四个模块与对应的步骤所实现的示例和应用场景相同，但不限于上述实施例1所公开的内容。
82.可选的，在识别对象的装置中，多个录音控件按照随机排列顺序在客户端的显示界面中进行展示。
83.可选的，识别对象的装置还包括：第一获取模块、提取模块、第二获取模块以及关联模块。其中，第一获取模块，用于获取目标对象的身份标识以及目标对象通过客户端录制的目标声音信息；提取模块，用于对目标声音信息进行声纹特征提取，得到目标声纹特征；第二获取模块，用于获取目标对象在录音时所操作的目标录音控件的目标控件标识；关联模块，用于对目标控件标识、身份标识以及目标声纹特征进行关联，得到关联关系。
84.可选的，上述第一检测模块还包括：第一提取模块、第一确定模块、第二确定模块以及第三确定模块。其中，第一提取模块，用于对声音信息进行声纹特征提取，得到第一声纹特征；第一确定模块，用于确定第一声纹特征与目标声纹特征之间的相似度；第二确定模块，用于在相似度大于预设相似度时，确定声音信息与目标声纹特征相匹配；第三确定模块，用于在相似度小于或等于预设相似度时，确定声音信息与目标声纹特征不匹配。
85.可选的，上述第二检测模块还包括：第四确定模块以及第五确定模块。其中，第四确定模块，用于在第一控件标识与目标控件标识相同时，确定第一控件标识与目标控件标识相匹配；第五确定模块，用于在第一控件标识为目标控件标识之外的标识时，确定第一控件标识与目标控件标识不匹配。
86.可选的，上述识别模块还包括：第六确定模块、记录模块以及第一识别模块。其中，第六确定模块，用于在第一控件标识与目标控件标识不匹配，或者声音信息与目标声纹特征不匹配时，确定待识别对象的身份识别失败；记录模块，用于记录待识别对象的身份识别失败的次数；第一识别模块，用于根据声音验证结果、标识验证结果以及待识别对象的身份识别失败的次数，对待识别对象的身份信息进行识别，得到识别结果。
87.可选的，上述第一识别模块还包括：第七确定模块以及第八确定模块。其中，第七确定模块，用于在待识别对象的身份识别失败的次数小于或等于预设次数，并且第一控件标识与目标控件标识相匹配，声音信息与目标声纹特征相匹配时，确定待识别对象的身份为目标对象；第八确定模块，用于在待识别对象的身份识别失败的次数大于预设次数时，确定待识别对象的身份与目标对象不匹配。
88.实施例3
89.根据本发明实施例的另一方面，还提供了一种计算机可读存储介质，该计算机可
读存储介质中存储有计算机程序，其中，计算机程序被设置为运行时执行上述实施例1中的识别对象的方法。
90.实施例4
91.根据本发明实施例的另一方面，还提供了一种计算机程序产品，包括计算机程序/指令，计算机程序/指令被处理器执行时实现上述实施例1中的识别对象的方法。
92.实施例5
93.根据本发明实施例的另一方面，还提供了一种电子设备，该电子设备包括一个或多个处理器；存储器，用于存储一个或多个程序，当一个或多个程序被一个或多个处理器执行时，使得一个或多个处理器实现用于运行程序，其中，程序被设置为运行时执行上述的识别对象的方法。其中，图12是根据本发明实施例的一种可选的电子设备的示意图，如图12所示，电子设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序，处理器执行程序时实现以下步骤：
94.获取待识别对象通过操作第一录音控件所录制的声音信息，其中，第一录音控件为客户端的显示界面中所展示的多个录音控件中的任意一个录音控件，每个录音控件对应一个控件标识；检测声音信息是否与预先存储的目标声纹特征相匹配，得到声音验证结果，其中，目标声纹特征为目标对象的声纹特征；检测第一录音控件所对应的第一控件标识是否与预先存储的目标控件标识相匹配，得到标识验证结果，其中，目标控件标识为目标对象在录音时所操作的录音控件的控件标识；根据声音验证结果和标识验证结果对待识别对象的身份信息进行识别，得到识别结果。
95.可选的，处理器执行程序时还可实现以下步骤：多个录音控件按照随机排列顺序在客户端的显示界面中进行展示。
96.可选的，处理器执行程序时还可实现以下步骤：在接收待识别对象通过第一录音控件录制的声音信息之前，获取目标对象的身份标识以及目标对象通过客户端录制的目标声音信息；对目标声音信息进行声纹特征提取，得到目标声纹特征；获取目标对象在录音时所操作的目标录音控件的目标控件标识；对目标控件标识、身份标识以及目标声纹特征进行关联，得到关联关系。
97.可选的，处理器执行程序时还可实现以下步骤：对声音信息进行声纹特征提取，得到第一声纹特征；确定第一声纹特征与目标声纹特征之间的相似度；在相似度大于预设相似度时，确定声音信息与目标声纹特征相匹配；在相似度小于或等于预设相似度时，确定声音信息与目标声纹特征不匹配。
98.可选的，处理器执行程序时还可实现以下步骤：在第一控件标识与目标控件标识相同时，确定第一控件标识与目标控件标识相匹配；在第一控件标识为目标控件标识之外的标识时，确定第一控件标识与目标控件标识不匹配。
99.可选的，处理器执行程序时还可实现以下步骤：在第一控件标识与目标控件标识不匹配，或者声音信息与目标声纹特征不匹配时，确定待识别对象的身份识别失败；记录待识别对象的身份识别失败的次数；根据声音验证结果、标识验证结果以及待识别对象的身份识别失败的次数，对待识别对象的身份信息进行识别，得到识别结果。
100.可选的，处理器执行程序时还可实现以下步骤：在待识别对象的身份识别失败的次数小于或等于预设次数，并且第一控件标识与目标控件标识相匹配，声音信息与目标声
纹特征相匹配时，确定待识别对象的身份为目标对象；在待识别对象的身份识别失败的次数大于预设次数时，确定待识别对象的身份与目标对象不匹配。
101.上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。
102.在本发明的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。
103.在本技术所提供的几个实施例中，应该理解到，所揭露的技术内容，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如单元的划分，可以为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。
104.作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
105.另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。
106.集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括：u盘、只读存储器(rom，read-only memory)、随机存取存储器(ram，random access memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
107.以上仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

技术特征：

1.一种识别对象的方法，其特征在于，包括：获取待识别对象通过操作第一录音控件所录制的声音信息，其中，所述第一录音控件为客户端的显示界面中所展示的多个录音控件中的任意一个录音控件，每个录音控件对应一个控件标识；检测所述声音信息是否与预先存储的目标声纹特征相匹配，得到声音验证结果，其中，所述目标声纹特征为目标对象的声纹特征；检测所述第一录音控件所对应的第一控件标识是否与预先存储的目标控件标识相匹配，得到标识验证结果，其中，所述目标控件标识为所述目标对象在录音时所操作的录音控件的控件标识；根据所述声音验证结果和所述标识验证结果对所述待识别对象的身份信息进行识别，得到识别结果。2.根据权利要求1所述的方法，其特征在于，所述多个录音控件按照随机排列顺序在所述客户端的显示界面中进行展示。3.根据权利要求1所述的方法，其特征在于，在获取待识别对象通过操作第一录音控件所录制的声音信息之前，所述方法还包括：获取所述目标对象的身份标识以及所述目标对象通过所述客户端录制的目标声音信息；对所述目标声音信息进行声纹特征提取，得到所述目标声纹特征；获取所述目标对象在录音时所操作的目标录音控件的目标控件标识；对所述目标控件标识、所述身份标识以及所述目标声纹特征进行关联，得到关联关系。4.根据权利要求1所述的方法，其特征在于，检测所述声音信息是否与预先存储的目标声纹特征相匹配，得到声音验证结果，包括：对所述声音信息进行声纹特征提取，得到第一声纹特征；确定所述第一声纹特征与所述目标声纹特征之间的相似度；在所述相似度大于预设相似度时，确定所述声音信息与所述目标声纹特征相匹配；在所述相似度小于或等于所述预设相似度时，确定所述声音信息与所述目标声纹特征不匹配。5.根据权利要求1所述的方法，其特征在于，检测所述第一录音控件所对应的第一控件标识是否与预先存储的目标控件标识相匹配，得到标识验证结果，包括：在所述第一控件标识与所述目标控件标识相同时，确定所述第一控件标识与所述目标控件标识相匹配；在所述第一控件标识为所述目标控件标识之外的标识时，确定所述第一控件标识与所述目标控件标识不匹配。6.根据权利要求1所述的方法，其特征在于，根据所述声音验证结果和所述标识验证结果对所述待识别对象的身份信息进行识别，得到识别结果，包括：在所述第一控件标识与所述目标控件标识不匹配，或者所述声音信息与所述目标声纹特征不匹配时，确定所述待识别对象的身份识别失败；记录所述待识别对象的身份识别失败的次数；根据所述声音验证结果、所述标识验证结果以及所述待识别对象的身份识别失败的次
数，对所述待识别对象的身份信息进行识别，得到识别结果。7.根据权利要求6所述的方法，其特征在于，根据所述声音验证结果、所述标识验证结果以及所述待识别对象的身份识别失败的次数，对所述待识别对象的身份信息进行识别，得到识别结果，包括：在所述待识别对象的身份识别失败的次数小于或等于预设次数，并且所述第一控件标识与所述目标控件标识相匹配，所述声音信息与所述目标声纹特征相匹配时，确定所述待识别对象的身份为所述目标对象；在所述待识别对象的身份识别失败的次数大于所述预设次数时，确定所述待识别对象的身份与所述目标对象不匹配。8.一种识别对象的装置，其特征在于，包括：获取模块，用于获取待识别对象通过操作第一录音控件所录制的声音信息，其中，所述第一录音控件为客户端的显示界面中所展示的多个录音控件中的任意一个录音控件，每个录音控件对应一个控件标识；第一检测模块，用于检测所述声音信息是否与预先存储的目标声纹特征相匹配，得到声音验证结果，其中，所述目标声纹特征为目标对象的声纹特征；第二检测模块，用于检测所述第一录音控件所对应的第一控件标识是否与预先存储的目标控件标识相匹配，得到标识验证结果，其中，所述目标控件标识为所述目标对象在录音时所操作的录音控件的控件标识；识别模块，用于根据所述声音验证结果和所述标识验证结果对所述待识别对象的身份信息进行识别，得到识别结果。9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机程序，其中，所述计算机程序被设置为运行时执行所述权利要求1至7任一项中所述的识别对象的方法。10.一种电子设备，其特征在于，所述电子设备包括一个或多个处理器；存储器，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现用于运行程序，其中，所述程序被设置为运行时执行所述权利要求1至7任一项中所述的识别对象的方法。11.一种计算机程序产品，包括计算机程序/指令，其特征在于，所述计算机程序/指令被处理器执行时实现权利要求1至7任一项所述的识别对象的方法。

技术总结

本发明公开了一种识别对象的方法、装置、电子设备及计算机程序产品，涉及金融科技领域。其中，该方法包括：获取待识别对象通过操作第一录音控件所录制的声音信息，其中，第一录音控件为客户端的显示界面中所展示的多个录音控件中的任意一个录音控件，每个录音控件对应一个控件标识；检测声音信息是否与预先存储的目标声纹特征相匹配，得到声音验证结果；检测第一录音控件所对应的第一控件标识是否与预先存储的目标控件标识相匹配，得到标识验证结果；根据声音验证结果和标识验证结果对待识别对象的身份信息进行识别，得到识别结果。本发明解决了现有技术中仅通过比对声纹特征进行身份认证所存在的身份认证安全性低的技术问题。问题。问题。