盗版歌手检测方法、计算机设备及计算机存储介质与流程

阅读: 评论:0



1.本技术实施例涉及音频处理领域,具体涉及一种盗版歌手检测方法、计算机设备及计算机存储介质。


背景技术:



2.盗版歌手,即名下的歌曲多为盗版歌曲的歌手。近年来短视频兴起,大量盗版歌曲不断新增,持续污染曲库,呈现出有规模、有组织的盗版趋势,严重影响用户口碑。特别地,短视频平台对音乐人的扶持需要投入大量的资源和资金,若无法有效识别歌手是否为盗版歌手,则极有可能导致平台将资源和资金误投入到对盗版歌手的扶持中,严重损害了平台的利益。
3.相关方案中,主要采用人工审核的方式,人工审核和识别歌手是否为盗版歌手。但这种方式耗费的人力巨大,同时识别效率极低,无法应对海量的存量歌手数据和每日的增量歌手数据。


技术实现要素:



4.本技术实施例提供了一种盗版歌手检测方法、计算机设备及计算机存储介质,用于对盗版歌手进行检测识别以提升盗版歌手的识别效率。
5.本技术实施例第一方面提供了一种盗版歌手检测方法,所述方法包括:
6.获取同一个目标歌手名下的n首目标歌曲,处理每一首所述目标歌曲以获得每一首所述目标歌曲的语谱图,其中n为大于1的正整数;
7.将所述目标歌曲的语谱图输入目标音特征提取模型,以得到所述目标音特征提取模型输出的所述目标歌曲的音特征向量;
8.针对每首所述目标歌曲,将所述目标歌曲与其他每首目标歌曲的音特征向量的相似度的平均值,作为所述目标歌曲的相似度平均值;
9.若所述n首目标歌曲的相似度平均值符合预设特征,则确定所述目标歌手为原版歌手;
10.若所述n首目标歌曲的相似度平均值不符合所述预设特征,则确定所述目标歌手为盗版歌手。
11.本技术实施例第二方面提供了一种计算机设备,所述计算机设备包括:
12.获取单元,用于获取同一个目标歌手名下的n首目标歌曲,处理每一首所述目标歌曲以获得每一首所述目标歌曲的语谱图,其中n为大于1的正整数;
13.特征提取单元,用于将所述目标歌曲的语谱图输入目标音特征提取模型,以得到所述目标音特征提取模型输出的所述目标歌曲的音特征向量;
14.计算单元,用于针对每首所述目标歌曲,将所述目标歌曲与其他每首目标歌曲的音特征向量的相似度的平均值,作为所述目标歌曲的相似度平均值;
15.检测单元,用于若所述n首目标歌曲的相似度平均值符合预设特征,则确定所述目
标歌手为原版歌手;
16.所述检测单元还用于若所述n首目标歌曲的相似度平均值不符合所述预设特征,则确定所述目标歌手为盗版歌手。
17.本技术实施例第三方面提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现前述第一方面的方法。
18.本技术实施例第四方面提供了一种计算机存储介质,计算机存储介质中存储有指令,该指令在计算机上执行时,使得计算机执行前述第一方面的方法。
19.从以上技术方案可以看出,本技术实施例具有以下优点:
20.本实施例中,对目标歌手名下的n首目标歌曲处理得到各目标歌曲的语谱图,使用目标音特征提取模型对各目标歌曲的语谱图进行音特征提取以获得各目标歌曲的音特征向量,针对每首目标歌曲,将目标歌曲与其他每首目标歌曲的音特征向量的相似度的平均值,作为目标歌曲的相似度平均值,根据各目标歌曲的音特征向量的相似度确定该目标歌手是否为盗版歌手。因此,计算机设备根据歌曲的音特征自动识别和检测盗版歌手,解决了由人工识别盗版歌手带来的识别效率低下的问题,可实现快速高效地处理海量的歌手识别工作,提升盗版歌手的识别效率。
附图说明
21.图1为本技术实施例中盗版歌手检测方法一个流程示意图;
22.图2为本技术实施例中盗版歌手检测方法另一流程示意图;
23.图3为本技术实施例中原版歌手名下各首歌曲对应的坐标点的分布状态一种显示效果示意图;
24.图4为本技术实施例中盗版歌手名下各首歌曲对应的坐标点的分布状态一种显示效果示意图;
25.图5为本技术实施例中计算机设备一个结构示意图;
26.图6为本技术实施例中计算机设备另一结构示意图。
具体实施方式
27.本技术实施例提供了一种盗版歌手检测方法、计算机设备及计算机存储介质,用于对盗版歌手进行检测识别以提升盗版歌手的识别效率。
28.在相关方案的场景中,随着互联网的广泛应用,视频、歌曲等视听信息的传播愈加迅速,这其中也伴随着盗版歌曲的大量产生,盗版歌曲持续污染视频库和曲库,呈现出有规模、有组织的盗版趋势,严重影响用户口碑。
29.名下歌曲多为盗版歌曲的歌手即称为盗版歌手。例如,歌曲1、歌曲2和歌曲3这多首歌曲均为歌手a名下的原唱歌曲,歌曲4、歌曲5和歌曲6这多首歌曲均为歌手b名下的原唱歌曲,而歌手c却将歌手a和歌手b名下的多首歌曲的原唱冠以自己的名字,使得大众误认为歌曲1至6这多首歌曲的原唱均为歌手c,即歌手c名下的歌曲多为盗版,歌手c即为盗版歌手。
30.音乐平台或者视频平台等互联网平台需要检测和鉴别出平台中的盗版歌手,因为,上述互联网平台对音乐人的扶持需要投入大量的资源和资金,若无法有效识别歌手是
否为盗版歌手,则极有可能导致平台将资源和资金误投入到对盗版歌手的扶持中,严重损害了平台的利益。
31.目前互联网平台对盗版歌手的检测识别通常是由人工完成,即人工审核和识别歌手是否为盗版歌手,审核人员根据歌曲版权信息、自己的听歌经历或者其他可靠信息来甄别歌手名下的歌曲是否为盗版歌曲,以及甄别歌手是否为盗版歌手。然而,此人工审核的方式需要人员付出大量时间去获取多方信息,才能根据获取到的信息准确识别盗版歌手以及盗版歌曲,显然无法做到快速高效地识别,在面对海量的存量歌手数据和每日的增量歌手数据时更是无法快速高效地处理大量歌手的识别工作。
32.针对上述场景所存在的技术问题和缺陷,本技术提出盗版歌手检测方法,可以解决上述场景存在的人工识别盗版歌手的缓慢低效的问题,可提升盗版歌手的检测识别效率。
33.下面对本技术实施例中的盗版歌手检测方法进行描述:
34.请参阅图1,本技术实施例中盗版歌手检测方法一个实施例包括:
35.101、获取同一个目标歌手名下的n首目标歌曲,处理每一首所述目标歌曲以获得每一首所述目标歌曲的语谱图,其中n为大于1的正整数;
36.本实施例的方法可应用于计算机设备,该计算机设备可以是终端设备或者服务器设备等等。当计算机设备为终端时,可以是个人电脑(personal computer,pc)、台式计算机等终端设备;当该计算机设备为服务器时,可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集或者分布式系统,还可以是提供云数据库、云服务、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn、以及大数据和人工智能平台等执行基础云计算服务的云服务器。
37.计算机设备可获取待检测的目标歌手名下的n首目标歌曲,并对每一首目标歌曲进行处理以获得每一首目标歌曲的语谱图,语谱图用于在后续步骤中提取目标歌曲对应的音特征向量。
38.102、将所述目标歌曲的语谱图输入目标音特征提取模型,以得到所述目标音特征提取模型输出的所述目标歌曲的音特征向量;
39.计算机设备可部署预先训练完成的目标音特征提取模型,以使用此目标音特征提取模型来提取各目标歌曲的音特征向量,即计算机设备可将各目标歌曲的语谱图输入至目标音特征提取模型,目标音特征提取模型对各目标歌曲的语谱图进行特征提取,在完成特征提取时输出各目标歌曲的音特征向量,音特征向量可表征各目标歌曲的音特征。
40.103、针对每首所述目标歌曲,将所述目标歌曲与其他每首目标歌曲的音特征向量的相似度的平均值,作为所述目标歌曲的相似度平均值;
41.在获得各目标歌曲的音特征向量之后,可计算该目标歌手的n首目标歌曲中两两之间的音特征向量的相似度,并计算每首目标歌曲与该目标歌手的n首目标歌曲中其他目标歌曲之间的音特征向量的相似度的相似度平均值,此平均值作为判断目标歌手是否为盗版歌手的依据。
42.104、若所述n首目标歌曲的相似度平均值符合预设特征,则确定所述目标歌手为原版歌手;
43.当每首目标歌曲对应的相似度平均值符合预设特征时,则确定目标歌手为原版歌手。
44.105、若所述n首目标歌曲的相似度平均值不符合所述预设特征,则确定所述目标歌手为盗版歌手;
45.若每首目标歌曲的相似度平均值不符合该预设特征,则确定该目标歌手为盗版歌手。
46.本实施例中,对目标歌手名下的n首目标歌曲处理得到各目标歌曲的语谱图,使用目标音特征提取模型对各目标歌曲的语谱图进行音特征提取以获得各目标歌曲的音特征向量,针对每首目标歌曲,将目标歌曲与其他每首目标歌曲的音特征向量的相似度的平均值,作为目标歌曲的相似度平均值,根据各目标歌曲的音特征向量的相似度确定该目标歌手是否为盗版歌手。因此,计算机设备根据歌曲的音特征自动识别和检测盗版歌手,解决了由人工识别盗版歌手带来的识别效率低下的问题,可实现快速高效地处理海量的歌手识别工作,提升盗版歌手的识别效率。
47.下面将在前述图1所示实施例的基础上,进一步详细地描述本技术实施例。请参阅图2,本技术实施例中盗版歌手检测方法另一实施例包括:
48.201、获取同一个目标歌手名下的n首目标歌曲,处理每一首所述目标歌曲以获得每一首所述目标歌曲的语谱图,其中n为大于1的正整数;
49.语谱图作为一种频谱分析视图,其横坐标是时间,纵坐标是频率,坐标点值为语音数据能量。由于是采用二维平面表达三维信息,所以能量值的大小是通过颜来表示的,一个点的颜越深,表示该点的语音能量越强,相反,一个点的颜越浅,表示该点的语音能量越弱。
50.处理目标歌曲以获得目标歌曲的语谱图的方式可以是,计算机设备可以通过子带分解算法将目标歌曲由时间域转变为频率域,然后将其分割为若干个子频带,进一步地,可以对若干个子频带进行处理,得到语谱图。可选地,该子带分解算法可以是短时傅里叶变换,但不限于此。
51.其中,可选地,每个子频带包括:时间信息、频率信息和能量、相位信息,计算机设备可以去除子频带的相位信息,对能量求模的平方得到能量值,最后可以分别将时间信息、频率信息作为语谱图的横坐标和纵坐标,将每个点的能量值作为该点的坐标值。
52.202、将所述目标歌曲的语谱图输入目标音特征提取模型,以得到所述目标音特征提取模型输出的所述目标歌曲的音特征向量;
53.本实施例中,目标音特征提取模型可以是任意的特征提取模型,例如,目标音特征提取模型可以是残差神经网络resnet模型、卷积神经网络或者深度复数卷积递归网络dccrn等等。例如,目标音特征提取模型可以是resnet34模型,则目标歌曲的语谱图可输入resnet34模型,由resnet34模型对目标歌曲的语谱图进行音特征提取,得到目标歌曲的音特征向量。
54.本实施例中,采用度量学习框架作为音特征提取模型的训练框架来对模型进行训练。度量学习通过减少类间距离同时增加类内可分离性来优化网络模型,是一类实用的用于比较和衡量数据间相似度的机器学习方法。同时,本实施例采用triplet网络作为度量学习框架,基于此triplet网络训练音特征提取模型,其包括如下步骤:
55.计算机设备获取至少一个歌曲三元组数据,其中每个歌曲三元组数据中包括第一歌手名下的第一歌曲和第二歌曲,以及第二歌手名下的第三歌曲,该第一歌手不同于该第二歌手;
56.分别处理每个歌曲三元组数据中的每首歌曲以获得每个歌曲三元组数据中每首歌曲的语谱图;
57.获取初始音特征提取模型,将歌曲三元组数据中每首歌曲的语谱图输入初始音特征提取模型,以得到初始音特征提取模型输出的歌曲三元组数据中每首歌曲的音特征向量;
58.根据歌曲三元组数据中每首歌曲的音特征向量确定初始音特征提取模型的三元损失函数的值;
59.根据三元损失函数的值更新初始音特征提取模型的网络参数,完成更新时得到目标音特征提取模型。
60.其中,处理歌曲三元组数据中每首歌曲以获得每首歌曲的语谱图,其方式前文已有描述,此处不再赘述。初始音特征提取模型具体可以是resnet模型、卷积神经网络或者dccrn网络等等。
61.歌曲三元组数据中每首歌曲的音特征向量的维度可以是1
×
40维,利用三元损失函数分别计算歌曲三元组数据中第一歌曲的音特征向量xa与第二歌曲的音特征向量x
+
之间的欧氏距离,以及计算第一歌曲的音特征向量xa与第三歌曲的音特征向量x-之间的欧氏距离,从而促使初始音特征提取模型训练的过程中让前者音特征向量(即第一歌手的第一歌曲的音特征向量和第二歌曲的音特征向量)相互靠近,后者音特征向量(即第一歌手的第一歌曲的音特征向量和第二歌手的第三歌曲的音特征向量)之间相互疏远,本质上使得初始音特征提取模型学习到同一个歌手名下多首歌曲之间的音共性,同时学习到不同歌手各自名下的歌曲之间的音自身显著差异性。当三元损失函数的数值随着训练不断进行而减小到稳定状态时,代表训练阶段的结束,初始音特征提取模型的网络参数完成更新,完成网络参数更新的初始音特征提取模型即作为目标音特征提取模型。
62.可以理解的是,所述的音特征向量可以是embedding向量,上述各个音特征向量之间的距离除了可以是欧式距离,也可以是曼哈顿距离、切比雪夫距离等,具体可根据实际应用场景设置,在此不做限制。
63.其中,该三元损失函数可表示为:
64.l=max(0,||x
a-x
+
||-||x
a-x-||+α);
65.其中,l表示所述三元损失函数的值,xa表示所述第一歌曲的音特征向量,x
+
表示所述第二歌曲的音特征向量,x-表示所述第三歌曲的音特征向量,α表示最小间隙。
66.203、针对每首所述目标歌曲,将所述目标歌曲与其他每首目标歌曲的音特征向量的相似度的平均值,作为所述目标歌曲的相似度平均值;
67.本实施例中,计算目标歌手名下n首目标歌曲中两两之间的音特征向量的相似度,其方式可以是,计算该n首目标歌曲中两两之间的音特征向量的余弦相似度;或者,计算该n首目标歌曲中两两之间的音特征向量的曼哈顿距离;或者,计算该n首目标歌曲中两两之间的音特征向量的欧式距离。本实施例对计算目标歌曲两两之间的音特征向量
的相似度的方式不作限定,任何能够度量向量间距离的方式均可用于本实施例。
68.其中,计算目标歌曲两两之间的音特征向量的余弦相似度的公式可以是:
[0069][0070]
其中,cos(θ)
i,j
表示目标歌手名下n首目标歌曲中第i首歌曲与第j首歌曲之间的音特征向量的余弦相似度,ei表示第i首歌曲的音特征向量,ej表示第j首歌曲的音特征向量。
[0071]
因此,使用余弦相似度表示目标歌曲之间的音特征向量的相似度时,余弦相似度的值越大,说明音特征向量越相似;反之,则说明音特征向量越不相似。
[0072]
在获得每首目标歌曲与其他目标歌曲之间的音特征向量的多个相似度之后,将多个相似度的值相加并取平均值,得到该相似度平均值。例如,目标歌手名下有10首目标歌曲,可分别计算每首目标歌曲与其他目标歌曲之间的音特征向量的相似度,如计算第一首目标歌曲的音特征向量分别与其余9首目标歌曲中每一首目标歌曲的音特征向量的相似度,即得到第一首目标歌曲与其余9首目标歌曲在音特征向量的9个相似度,将此9个相似度相加并取平均值,得到第一首目标歌曲对应的相似度平均值。以此类推,可分别计算其余目标歌曲对应的相似度平均值。
[0073]
计算该相似度平均值的公式可表示为:
[0074][0075]
或者,
[0076][0077]
其中,scorei表示目标歌手名下n首目标歌曲中第i首歌曲对应的相似度平均值,cos(θ)
i,j
表示第i首歌曲与第j首歌曲之间的音特征向量的余弦相似度。上述两式中,j可以等于i。当j等于i时,cos(θ)
i,j
的值为1。
[0078]
此外,计算该相似度平均值的公式也可表示为:
[0079][0080]
或者,
[0081][0082]
其中,scorei表示目标歌手名下n首目标歌曲中第i首歌曲对应的相似度平均值,cos(θ)
i,j
表示第i首歌曲与第j首歌曲之间的音特征向量的余弦相似度。此两式中,j不等于i。
[0083]
204、若所述n首目标歌曲的相似度平均值符合预设特征,则确定所述目标歌手为原版歌手;
[0084]
205、若所述n首目标歌曲的相似度平均值不符合所述预设特征,则确定所述目标歌手为盗版歌手;
[0085]
本实施例中,根据各目标歌曲对应的相似度平均值判断目标歌手是否为盗版歌手的方式可以是,由于目标歌手名下n首目标歌曲中每一首目标歌曲均有对应的相似度平均值,则目标歌手名下n首目标歌曲对应n个相似度平均值,可计算目标歌手名下n首目标歌曲的n个相似度平均值的平均值,判断目标歌手名下n首目标歌曲的n个相似度平均值的平均值是否小于预设阈值,若是,则确定目标歌手为原版歌手;若否,则确定目标歌手为盗版歌手。
[0086]
计算公式可表示为:
[0087][0088]
其中,scorea表示目标歌手名下n首目标歌曲的n个相似度平均值的平均值,scorei表示目标歌手名下n首目标歌曲中第i首歌曲对应的相似度平均值。
[0089]
此外,判断目标歌手是否为盗版歌手的方式还可以是,建立坐标系,在该坐标系中确定目标歌手名下每首目标歌曲的音特征向量对应的坐标点,判断该坐标系中坐标点的分布状态是否符合预设分布特征,若是,则确定目标歌手为原版歌手;若否,则确定目标歌手为盗版歌手。
[0090]
另一种方式也可以是,将原版歌手名下各首歌曲对应的坐标点的分布状态,以及盗版歌手名下各首歌曲对应的坐标点的分布状态,作为训练数据输入神经网络模型,根据机器学习算法训练该神经网络模型,本质上是让该神经网络模型学习原版歌手名下各首歌曲对应的坐标点的分布状态以及盗版歌手名下各首歌曲对应的坐标点的分布状态,之后便可使用此训练完成的神经网络模型识别目标歌手名下n首目标歌曲的坐标点的分布状态,根据该分布状态判断目标歌手为盗版歌手还是原版歌手,并获得此神经网络模型输出的识别结果,识别结果表示目标歌手是否为盗版歌手。
[0091]
此外,也可以通过与已知是原版歌手名下各首歌曲对应的坐标点的分布状态进行比对确定目标歌手是否为盗版歌手。例如,已知歌手a为原版歌手,建立直角坐标系,在坐标系中确定每首歌曲的音特征向量对应的坐标点,得到歌手a名下各首歌曲对应的坐标点的分布状态,如图3所示;建立直角坐标系,在坐标系中确定每首歌曲的音特征向量对应的坐标点,得到目标歌手名下各首歌曲对应的坐标点的分布状态,假设如图4所示。对比图3和图4可以看出,图3各坐标点的分布较为聚拢,可推导出图3所示聚拢的分布状态或者比图3所示分布状态更加聚拢的分布状态应当对应于原版歌手,而图4所示的坐标点分布状态极其分散,与图3所示的分布状态完全不同,因而可推导目标歌手不是原版歌手,应当归类为盗版歌手。
[0092]
上面对本技术实施例中的盗版歌手检测方法进行了描述,下面对本技术实施例中的计算机设备进行描述,请参阅图5,本技术实施例中计算机设备一个实施例包括:
[0093]
获取单元501,用于获取同一个目标歌手名下的n首目标歌曲,处理每一首所述目
标歌曲以获得每一首所述目标歌曲的语谱图,其中n为大于1的正整数;
[0094]
特征提取单元502,用于将所述目标歌曲的语谱图输入目标音特征提取模型,以得到所述目标音特征提取模型输出的所述目标歌曲的音特征向量;
[0095]
计算单元503,用于针对每首所述目标歌曲,将所述目标歌曲与其他每首目标歌曲的音特征向量的相似度的平均值,作为所述目标歌曲的相似度平均值;
[0096]
检测单元504,用于若所述n首目标歌曲的相似度平均值符合预设特征,则确定所述目标歌手为原版歌手;
[0097]
所述检测单元504还用于若所述n首目标歌曲的相似度平均值不符合所述预设特征,则确定所述目标歌手为盗版歌手。
[0098]
本实施例一种优选的实施方式中,所述检测单元504具体用于计算所述n首目标歌曲的n个所述相似度平均值的平均值;判断所述n首目标歌曲的n个所述相似度平均值的平均值是否小于预设阈值;若是,则确定所述目标歌手为原版歌手;若否,则确定所述目标歌手为盗版歌手。
[0099]
本实施例一种优选的实施方式中,计算机设备还包括:
[0100]
模型训练单元505,用于执行所述目标音特征提取模型的训练步骤,该步骤包括:
[0101]
获取至少一个歌曲三元组数据,其中每个歌曲三元组数据中包括第一歌手名下的第一歌曲和第二歌曲,以及第二歌手名下的第三歌曲,所述第一歌手不同于所述第二歌手;
[0102]
分别处理每个所述歌曲三元组数据中的每首歌曲以获得每个所述歌曲三元组数据中每首歌曲的语谱图;
[0103]
获取初始音特征提取模型,将所述歌曲三元组数据中每首歌曲的语谱图输入所述初始音特征提取模型,以得到所述初始音特征提取模型输出的所述歌曲三元组数据中每首歌曲的音特征向量;
[0104]
根据所述歌曲三元组数据中每首歌曲的音特征向量确定所述初始音特征提取模型的三元损失函数的值;
[0105]
根据所述三元损失函数的值更新所述初始音特征提取模型的网络参数,完成更新时得到所述目标音特征提取模型。
[0106]
本实施例一种优选的实施方式中,所述三元损失函数满足:
[0107]
l=max(0,||x
a-x
+
||-||x
a-x-||+α);
[0108]
其中,l表示所述三元损失函数的值,xa表示所述第一歌曲的音特征向量,x
+
表示所述第二歌曲的音特征向量,x-表示所述第三歌曲的音特征向量,α表示最小间隙。
[0109]
本实施例一种优选的实施方式中,计算单元503具体用于计算所述n首目标歌曲中两两之间的音特征向量的余弦相似度;或者,计算所述n首目标歌曲中两两之间的音特征向量的曼哈顿距离;或者,计算所述n首目标歌曲中两两之间的音特征向量的欧式距离。
[0110]
本实施例一种优选的实施方式中,所述n首目标歌曲中两两之间的音特征向量的余弦相似度的计算公式满足:
[0111][0112]
其中,cos(θ)
i,j
表示所述n首目标歌曲中第i首歌曲与第j首歌曲之间的音特征向量的余弦相似度,ei表示所述第i首歌曲的音特征向量,ej表示所述第j首歌曲的音特征向量。
[0113]
本实施例中,计算机设备中各单元所执行的操作与前述图1至图2所示实施例中描述的类似,此处不再赘述。
[0114]
本实施例中,对目标歌手名下的n首目标歌曲处理得到各目标歌曲的语谱图,使用目标音特征提取模型对各目标歌曲的语谱图进行音特征提取以获得各目标歌曲的音特征向量,计算各目标歌曲之间的音特征向量的相似度,根据各目标歌曲的音特征向量的相似度确定该目标歌手是否为盗版歌手。因此,计算机设备根据歌曲的音特征自动识别和检测盗版歌手,解决了由人工识别盗版歌手带来的识别效率低下的问题,可实现快速高效地处理海量的歌手识别工作,提升盗版歌手的识别效率。
[0115]
下面对本技术实施例中的计算机设备进行描述,请参阅图6,本技术实施例中计算机设备一个实施例包括:
[0116]
该计算机设备600可以包括一个或一个以上中央处理器(central processing units,cpu)601和存储器605,该存储器605中存储有一个或一个以上的应用程序或数据。
[0117]
其中,存储器605可以是易失性存储或持久存储。存储在存储器605的程序可以包括一个或一个以上模块,每个模块可以包括对计算机设备中的一系列指令操作。更进一步地,中央处理器601可以设置为与存储器605通信,在计算机设备600上执行存储器605中的一系列指令操作。
[0118]
计算机设备600还可以包括一个或一个以上电源602,一个或一个以上有线或无线网络接口603,一个或一个以上输入输出接口604,和/或,一个或一个以上操作系统,例如windows servertm,mac os xtm,unixtm,linuxtm,freebsdtm等。
[0119]
该中央处理器601可以执行前述图1至图2所示实施例中计算机设备所执行的操作,具体此处不再赘述。
[0120]
本技术实施例还提供了一种计算机存储介质,其中一个实施例包括:该计算机存储介质中存储有指令,该指令在计算机上执行时,使得该计算机执行前述图1至图2所示实施例中计算机设备所执行的操作。
[0121]
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0122]
在本技术所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0123]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显
示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0124]
另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0125]
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。

技术特征:


1.一种盗版歌手检测方法,其特征在于,所述方法包括:获取同一个目标歌手名下的n首目标歌曲,处理每一首所述目标歌曲以获得每一首所述目标歌曲的语谱图,其中n为大于1的正整数;将所述目标歌曲的语谱图输入目标音特征提取模型,以得到所述目标音特征提取模型输出的所述目标歌曲的音特征向量;针对每首所述目标歌曲,将所述目标歌曲与其他每首目标歌曲的音特征向量的相似度的平均值,作为所述目标歌曲的相似度平均值;若所述n首目标歌曲的相似度平均值符合预设特征,则确定所述目标歌手为原版歌手;若所述n首目标歌曲的相似度平均值不符合所述预设特征,则确定所述目标歌手为盗版歌手。2.根据权利要求1所述的方法,其特征在于,判断所述n首目标歌曲的相似度平均值是否符合所述预设特征,包括:计算所述n首目标歌曲的n个所述相似度平均值的平均值;判断所述n首目标歌曲的n个所述相似度平均值的平均值是否小于预设阈值;若是,则确定所述目标歌手为原版歌手;若否,则确定所述目标歌手为盗版歌手。3.根据权利要求1所述的方法,其特征在于,所述目标音特征提取模型的训练步骤包括:获取至少一个歌曲三元组数据,其中每个歌曲三元组数据中包括第一歌手名下的第一歌曲和第二歌曲,以及第二歌手名下的第三歌曲,所述第一歌手不同于所述第二歌手;分别处理每个所述歌曲三元组数据中的每首歌曲以获得每个所述歌曲三元组数据中每首歌曲的语谱图;获取初始音特征提取模型,将所述歌曲三元组数据中每首歌曲的语谱图输入所述初始音特征提取模型,以得到所述初始音特征提取模型输出的所述歌曲三元组数据中每首歌曲的音特征向量;根据所述歌曲三元组数据中每首歌曲的音特征向量确定所述初始音特征提取模型的三元损失函数的值;根据所述三元损失函数的值更新所述初始音特征提取模型的网络参数,完成更新时得到所述目标音特征提取模型。4.根据权利要求3所述的方法,其特征在于,所述三元损失函数满足:l=max(0,||x
a-x
+
||-||x
a-x-||+α);其中,l表示所述三元损失函数的值,x
a
表示所述第一歌曲的音特征向量,x
+
表示所述第二歌曲的音特征向量,x-表示所述第三歌曲的音特征向量,α表示最小间隙。5.根据权利要求1所述的方法,其特征在于,所述计算所述n首目标歌曲中两两之间的音特征向量的相似度,包括:计算所述n首目标歌曲中两两之间的音特征向量的余弦相似度;或者,计算所述n首目标歌曲中两两之间的音特征向量的曼哈顿距离;或者,
计算所述n首目标歌曲中两两之间的音特征向量的欧式距离。6.根据权利要求5所述的方法,其特征在于,所述n首目标歌曲中两两之间的音特征向量的余弦相似度的计算公式满足:其中,cos(θ)
i,j
表示所述n首目标歌曲中第i首歌曲与第j首歌曲之间的音特征向量的余弦相似度,e
i
表示所述第i首歌曲的音特征向量,e
j
表示所述第j首歌曲的音特征向量。7.一种计算机设备,其特征在于,所述计算机设备包括:获取单元,用于获取同一个目标歌手名下的n首目标歌曲,处理每一首所述目标歌曲以获得每一首所述目标歌曲的语谱图,其中n为大于1的正整数;特征提取单元,用于将所述目标歌曲的语谱图输入目标音特征提取模型,以得到所述目标音特征提取模型输出的所述目标歌曲的音特征向量;计算单元,用于针对每首所述目标歌曲,将所述目标歌曲与其他每首目标歌曲的音特征向量的相似度的平均值,作为所述目标歌曲的相似度平均值;检测单元,用于若所述n首目标歌曲的相似度平均值符合预设特征,则确定所述目标歌手为原版歌手;所述检测单元还用于若所述n首目标歌曲的相似度平均值不符合所述预设特征,则确定所述目标歌手为盗版歌手。8.根据权利要求7所述的计算机设备,其特征在于,所述检测单元具体用于计算所述n首目标歌曲的n个所述相似度平均值的平均值;判断所述n首目标歌曲的n个所述相似度平均值的平均值是否小于预设阈值;若是,则确定所述目标歌手为原版歌手;若否,则确定所述目标歌手为盗版歌手。9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6中任一项所述的方法。10.一种计算机存储介质,其特征在于,所述计算机存储介质中存储有指令,所述指令在计算机上执行时,使得所述计算机执行如权利要求1至6中任一项所述的方法。

技术总结


本申请实施例公开了一种盗版歌手检测方法、计算机设备及计算机存储介质。计算机设备可对目标歌手名下的N首目标歌曲处理得到各目标歌曲的语谱图,使用目标音特征提取模型对各目标歌曲的语谱图进行音特征提取以获得各目标歌曲的音特征向量,针对每首目标歌曲,将目标歌曲与其他每首目标歌曲的音特征向量的相似度的平均值,作为目标歌曲的相似度平均值,根据各目标歌曲的音特征向量的相似度确定该目标歌手是否为盗版歌手。因此,计算机设备根据歌曲的音特征自动识别和检测盗版歌手,解决了由人工识别盗版歌手带来的识别效率低下的问题,可实现快速高效地处理海量的歌手识别工作,提升盗版歌手的识别效率。提升盗版歌手的识别效率。提升盗版歌手的识别效率。


技术研发人员:

何礼 胡诗超 孔令城

受保护的技术使用者:

腾讯音乐娱乐科技(深圳)有限公司

技术研发日:

2022.11.28

技术公布日:

2023/3/7

本文发布于:2023-03-12 23:12:58,感谢您对本站的认可!

本文链接:https://patent.en369.cn/patent/3/68439.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:目标   所述   音色   歌曲
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 369专利查询检索平台 豫ICP备2021025688号-20 网站地图