一种音频数据处理方法及装置与流程

阅读：评论：0

1.本技术涉及数据处理技术领域，尤其涉及一种音频数据处理方法及装置。

背景技术：

2.在声音系统场景内，当声音形成反馈闭环回路时，就很容易出现了啸叫现象，其产生的过程大致包括：音频采集端(例如摄像头、智能门铃、网络摄像机等)的麦克风(mic)采集到声音信号x1，x1经过采集端增益系统放大，通过网络传输到播放端(例如手机等终端设备)，再经过播放端增益系统放大后经扬声器(speaker，spk)播放出声音y1，采集端和播放端在同一空间时，y1声音会再次被采集端麦克风采集，继续放大，再传到播放端再放大再播放。如此循环，单一的声音信号会被无限放大，最终形成啸叫。

技术实现要素：

3.本技术实施例提供了一种音频数据处理方法及装置，用以有效抑制在音频数据采集端的麦克风和音频数据播放端的扬声器之间形成音频信号闭环导致的啸叫，并且易于实现、可行性高、普适性良好。
4.本技术实施例提供的一种音频数据处理方法，包括：
5.获取音频数据采集端采集的初始音频数据，以及参考数据；其中所述采集端采集的初始音频数据中包含音频数据播放端播放的音频数据；所述参考数据是所述播放端的待播放数据；
6.利用所述采集端采集的初始音频数据以及所述参考数据，进行回声消除，将得到的音频数据作为消除了所述播放端播放的音频数据后的采集端采集的音频数据输出。
7.所述方法通过获取音频数据采集端采集的初始音频数据，以及参考数据；其中所述采集端采集的初始音频数据中包含音频数据播放端播放的音频数据；所述参考数据是所述播放端的待播放数据，并利用所述采集端采集的初始音频数据以及所述参考数据，进行回声消除，将得到的音频数据作为消除了所述播放端播放的音频数据后的采集端采集的音频数据输出，从而有效抑制了在音频数据采集端的麦克风和音频数据播放端的扬声器之间形成音频信号闭环导致的啸叫，并且易于实现、可行性高、普适性良好。
8.在一些实施方式中，所述获取音频数据采集端采集的初始音频数据，以及参考数据，包括：
9.所述采集端通过麦克风采集初始音频数据；
10.所述采集端接收所述播放端发送的所述参考数据，并向所述播放端反馈接收确认消息，使得所述播放端在收到所述接收确认消息后播放所述待播放数据。
11.在一些实施方式中，所述获取音频数据采集端采集的初始音频数据，以及参考数据，包括：
12.所述采集端通过麦克风采集初始音频数据；
13.所述采集端利用所述播放端的音频处理参数，以及缓存的音频数据，生成所述参
考数据，其中，所述缓存的音频数据包括所述采集端上一次通过麦克风采集的音频数据。
14.在一些实施方式中，所述获取音频数据采集端采集的初始音频数据，以及参考数据，包括：
15.所述播放端接收所述采集端通过麦克风采集的并且分别经过所述采集端以及所述播放端中的增益系统处理后的音频数据；
16.所述播放端从本地缓存中获取所述参考数据，所述参考数据为所述播放端上一次的待播放数据。
17.在一些实施方式中，在所述利用所述采集端采集的初始音频数据以及所述参考数据，进行回声消除之前，所述方法还包括：确定所述采集端与所述播放端处于同一空间。
18.在一些实施方式中，当检测到对端的热点信号时，确定所述采集端与所述播放端处于同一空间；
19.或者，当接收到对端判定所述采集端与所述播放端处于同一空间的指令时，确定所述采集端与所述播放端处于同一空间。
20.本技术实施例提供的另一种音频数据处理方法，包括：
21.接收音频数据采集端发送的音频数据，并对所述音频数据进行增益放大处理后，得到音频数据播放端的待播放数据；
22.将所述待播放数据作为参考数据发送给所述音频数据采集端，使得所述音频数据采集端利用所述采集端采集的初始音频数据以及所述参考数据，进行回声消除。
23.本技术另一实施例提供了音频数据处理装置，其包括存储器和处理器，其中，所述存储器用于存储程序指令，所述处理器用于调用所述存储器中存储的程序指令，按照获得的程序执行上述任一种方法。
24.此外，根据实施例，例如提供了用于计算机的计算机程序产品，其包括软件代码部分，当所述产品在计算机上运行时，这些软件代码部分用于执行上述所定义的方法的步骤。该计算机程序产品可以包括在其上存储有软件代码部分的计算机可读介质。此外，该计算机程序产品可以通过上传过程、下载过程和推送过程中的至少一个经由网络直接加载到计算机的内部存储器中和/或发送。
25.本技术另一实施例提供了计算机可读存储介质，所述计算机可读存储介质存储有计算机可执行指令，所述计算机可执行指令用于使所述计算机执行上述任一种方法。
附图说明
26.为了更清楚地说明本技术实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简要介绍，显而易见地，下面描述中的附图仅是本技术的一些实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
27.图1a为本技术实施例提供的音频数据处理方法的流程示意图；
28.图1b为本技术实施例提供的音频数据处理方法的流程示意图；
29.图2为本技术实施例提供的采集端通过aec破坏反馈环路的示意图；
30.图3为本技术实施例提供的采集端模拟播放端播放数据做参考信号的示意图；
31.图4为本技术实施例提供的播放端通过aec破坏反馈环路示意图；
32.图5为本技术实施例提供的aec处理流程示意图；
33.图6为本技术实施例提供的播放端检测采集端热点的示意图；
34.图7为本技术实施例提供的整个系统的音频数据处理流程示意图；
35.图8为本技术实施例提供的音频数据处理装置的结构示意图。
具体实施方式
36.下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本技术一部分实施例，并不是全部的实施例。基于本技术中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本技术保护的范围。
37.本技术实施例提供了一种音频数据处理方法及装置，用以有效抑制在音频数据采集端的麦克风和音频数据播放端的扬声器之间形成音频信号闭环导致的啸叫。本技术实施例通过破坏啸叫反馈环路的形成，从而达到去除啸叫的目的，不需要特定的啸叫算法或者啸叫抑制电路，因此，易于实现、可行性更高、普适性更好。
38.其中，方法和装置是基于同一申请构思的，由于方法和装置解决问题的原理相似，因此装置和方法的实施可以相互参见，重复之处不再赘述。
39.本技术实施例的说明书和权利要求书及上述附图中的术语“第一”、“第二”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
40.以下示例和实施例将只被理解为是说明性的示例。虽然本说明书可能在若干处提及“一”、“一个”或“一些”示例或实施例，但这并非意味着每个这种提及都与相同的示例或实施例有关，也并非意味着该特征仅适用于单个示例或实施例。不同实施例的单个特征也可以被组合以提供其他实施例。此外，如“包括”和“包含”的术语应被理解为并不将所描述的实施例限制为仅由已提及的那些特征组成；这种示例和实施例还可以包含并未具体提及的特征、结构、单元、模块等。
41.下面结合说明书附图对本技术各个实施例进行详细描述。需要说明的是，本技术实施例的展示顺序仅代表实施例的先后顺序，并不代表实施例所提供的技术方案的优劣。
42.本技术实施例中，通过分析啸叫的形成，可以发现是因为音频信号闭环反馈回路导致的，因此，只要破坏了其中的反馈环路，那么就可以做到消除啸叫的效果。不形成反馈环路，即便音频的采集端和播放端在同一空间，采集端也采集不到播放端的播放的音频信号。需要注意的是，本技术技术方案中的采集端和播放端分别来自于不同的设备。
43.参见图1a，本技术实施例提供的一种音频数据处理方法，包括：
44.s101、获取音频数据采集端采集的初始音频数据，以及参考数据；其中所述采集端采集的初始音频数据中包含音频数据播放端播放的音频数据；所述参考数据是所述播放端的待播放数据；
45.s102、利用所述采集端采集的初始音频数据以及所述参考数据，进行回声消除(acoustic echo cancelling，aec)，将得到的音频数据作为消除了所述播放端播放的音频数据后的采集端采集的音频数据输出。
46.需要说明的是，本技术实施例提供的上述音频数据处理方法，可以应用于音频数据播放端，也可以应用于音频数据采集端。
47.在一些实施例中，步骤s102在回声消除之后，输出音频数据之前，还进行增益放大处理。或者，也可以在回声消除之前就对音频数据进行增益放大处理。
48.在一些实施例中，在采集端执行所述获取音频数据采集端采集的初始音频数据，以及参考数据，具体包括：
49.所述采集端通过麦克风采集初始音频数据；
50.所述采集端接收所述播放端发送的所述参考数据，并向所述播放端反馈接收确认消息，使得所述播放端在收到所述接收确认消息后播放所述待播放数据。
51.在一些实施例中，在采集端执行所述获取音频数据采集端采集的初始音频数据，以及参考数据，具体包括：
52.所述采集端通过麦克风采集初始音频数据；
53.所述采集端利用所述播放端的音频处理参数(可以是预设的，也可以是在采集端首次与播放端建立连接时，播放端发送的)，以及缓存的音频数据(可以是经过增益放大后缓存的音频数据)，生成所述参考数据，其中，所述缓存的音频数据包括所述采集端上一次通过麦克风采集的音频数据。
54.在一些实施例中，在播放端执行所述获取音频数据采集端采集的初始音频数据，以及参考数据，具体包括：
55.所述播放端接收所述采集端通过麦克风采集的并且分别经过所述采集端以及所述播放端中的增益系统处理后的音频数据；
56.所述播放端从本地缓存中获取所述参考数据，所述参考数据为所述播放端上一次的待播放数据。
57.在一些实施例中，在所述利用所述采集端采集的初始音频数据以及所述参考数据，进行回声消除之前，所述方法还包括：确定所述采集端与所述播放端处于同一空间(也就是说，确定需要进行上述回声消除)。
58.在一些实施例中，当检测到对端的热点信号时，确定所述采集端与所述播放端处于同一空间；即可以本端自己检测对端的热点信号，以此作为是否进行aec的依据；
59.或者，当接收到对端判定所述采集端与所述播放端处于同一空间的指令时，确定所述采集端与所述播放端处于同一空间。即也可以对端检测本端的热点信号，并且接收对端的检测结果，以此作为是否进行aec的依据。
60.在播放端，相应地，参见图1b，本技术实施例提供的一种音频数据处理方法，包括：
61.s201、接收音频数据采集端发送的音频数据，并对所述音频数据进行增益放大处理后，得到音频数据播放端的待播放数据；
62.s202、将所述待播放数据作为参考数据发送给所述音频数据采集端，使得所述音频数据采集端利用所述采集端采集的初始音频数据以及所述参考数据，进行回声消除。
63.下面给出几个具体实施例的举例说明。
64.实施例一：
65.参见图2，采集端将采集到的初始声音信号(即音频数据)通过网络建立链接发送到播放端播放出来，这里称作上行数据，同理，建立一条播放端到采集端的网络链接，由播放端向采集端发送数据，这里称作下行数据。播放端向采集端发送的数据为播放端即将播放的数据，采集端接收到后缓存起来，在采集端下次(需要注意的是该次采集到的声音信号已经包含播放端播放的音频数据)采集到声音信号时，将播放端向采集端发送的数据作为回声消除的参考帧数据，以回声消除(即aec)，aec模块的输入数据为音频采集设备采集的近端数据in，和远端参考数据ref，输出数据为消除远端参考数据后的数据out)的方式消除采集端采集到的播放端播放的音频数据，这样采集端采集到的初始音频数据经过aec后，得到的音频数据就不包含有播放端播放的音频数据，即破坏了声音信号反馈环路的形成。
66.如图2所示，在采集端设置aec模块，在播放端设置向采集端传输待播放数据y2的传输模块，y2为经过播放端音效增益系统处理后的数据，经过spk后基本不再变化，因此这里y2≈y1，其中y1为播放端播放的音频数据。这样一来，采集端采集到的初始音频信号就不存在播放端播放的音频信号，也就不存在音频信号的反馈环路，从而达到避免啸叫的效果。如图2，aec的in数据为采集端采集的音频信号x1+y1，参考数据为播放端反向传输的待播放音频数据y2，输出音频数据为x1’。图2中所示的增益系统，即用于对输入的音频信号进行增益放大处理的模块。
67.实施例二：
68.参见图3，本实施例中可以在采集端增加一播放数据模拟模块，采集端和播放端在第一次连接时，播放端向采集端传输其系统音频参数(如播放端进行音频处理的音频3a参数，功率放大器的放大倍数等)，由采集端的播放数据模拟模块根据这些参数，以及增益系统处理输出的音频数据，模拟出播放端待播放数据(播放数据模拟模块获取到播放端的音频处理参数后，以接收到的音频处理参数处理采集端采集到的数据得到近似于播放端待播的音频数据，然后通过缓存模块缓存，作为下次aec的参考数据ref)，这样一来，可跳过利用网络传输播放端的待播放数据给采集端的步骤，进而减少传输延时，在采集端直接缓存播放端上一次的待播放数据，待下一次采集音频数据时以此(缓存的待播放数据)作为aec的参考数据，从而去除采集端采集到的来自播放端的播放数据，达到避免啸叫的效果。
69.如图3所示，采集设备采集到数据后，经过音效处理系统的处理，得到x2，数据同时送给缓存模块和aec模块。aec的in数据为x2(包含y1)，从缓存模块(缓存模块一端写，一端读，读端为上次音频采集设备采集的数据，写端为当次音频采集设备采集的数据，当读端被播放数据模拟模块取走或读端没数据时，写端数据覆盖读端数据，新的采集数据来时继续在写端写，以此循环)读端取出的上次音频采集后缓存的x2’，通过播放端传输的音频处理参数(当播放端音频参数固定时，传输一次即可，当播放端音频处理参数变化时需要同步更新)模拟出上次播放端播放的数据y1’(其中y1’≈y1)，作为aec模块的参考数据，输出为传输给播放端的y2。
70.实施例三：
71.参见图4，同理，aec可以在播放端进行，这样一来就不用建立播放端到采集端下行数据的链接，也不消耗采集信号的采集端的资源。播放端也是保存前一次待播的数据(也就是上次播放的数据)，在后一次数据过来时，通过aec模块消除播放端前一次播放的数据，以
达到破坏环路的效果。
72.如图4，这里aec的in数据为采集端传给播放端的数据x1+y1经过音频处理后得到的x2，参考数据为播放端前一次缓存的待播放数据y2(y2≈y1)，输出为播放的y1。
73.当播放端和采集端不在同一空间时，有可能不会产生啸叫(在同一空间也不一定就产生啸叫)，不管是采集端进行aec还是播放端进行aec，在不存在啸叫的情况下运行是比较浪费资源的。因此，在一些实施例中，为了进一步避免资源浪费，本技术实施例还提供了检测采集端和播放端是否在同一空间的方法，也就是说，在进行aec之前，进一步判断是否需要进行aec(具体可以由采集端和播放端任一端去判断，其中一端判断，并将判断结果通知另一端)，执行aec的端根据检测的结果，判定是否运行aec，具体流程参见图5。
74.实施例四：
75.一般可连接播放端的采集端都有无线网卡，目前很多无线网卡都支持软接入点(ap)功能，利用这一特点，采集端可以通过驱动配置，使其能工作在ap模式，实现接入点的功能。而软ap的一大特征就是发射功率较小，当能检测到软ap配置的热点时，基本可以判定在同一空间，检测到在同一空间时，开启aec模块。
76.参见图6，以采集端开启热点，并进行aec处理，播放端通过检测热点信号判断两端是否处于同一空间为例，如图7所示，整个流程如下：
77.采集端启动录音，配置无线网卡驱动为软ap模式和站点(station)模式，并将ap功率设置在采集端使用的空间范围内可接收(具体ap功率根据实际情况而定)，ap热点名可与播放端协商指定特定名称，如“howldetect”。与播放端建立链接，开启网络发送和接收程序，开启录音程序。网络发送程序负责发送采集的音频数据，接收程序负责接收播放端下发的数据和空间判断消息，接收到播放端与采集端处于同一空间的指令时，进行aec处理，消除播放端播放的数据，非同一空间时，跳过aec处理，直接将音频数据通过网络发送给播放端播放。
78.在播放端，接收采集端发送的音频数据，并检测是否有采集端的热点信号，如果是，则发送播放端与采集端处于同一空间的指令给采集端，以及后续发送待播放的音频数据等给采集端(具体参见上述实施例，此处不再赘述)；否则，直接将采集端发送的音频数据进行增益放大后播放。
79.下面介绍一下本技术实施例提供的设备或装置，其中与上述方法中所述的相同或相应的技术特征的解释或举例说明，后续不再赘述。
80.参见图8，本技术实施例提供的音频数据处理装置，例如可以是所述的采集端(可以是任意一种具有音频采集功能的设备)，也可以是上述的播放端(可以是任意一种具有音频播放功能的设备)，包括：
81.存储器620，用于存储程序指令；
82.处理器600，用于调用所述存储器中存储的程序指令，按照获得的程序执行：
83.获取音频数据采集端采集的初始音频数据，以及参考数据；其中所述采集端采集的初始音频数据中包含音频数据播放端播放的音频数据；所述参考数据是所述播放端的待播放数据；
84.利用所述采集端采集的初始音频数据以及所述参考数据，进行回声消除，将得到的音频数据作为消除了所述播放端播放的音频数据后的采集端采集的音频数据输出。
85.在一些实施方式中，当所述音频数据处理装置作为音频数据采集端时，所述获取音频数据采集端采集的初始音频数据，以及参考数据，包括：
86.所述处理器600控制所述采集端中的麦克风采集初始音频数据；
87.所述处理器600控制接收所述播放端发送的所述参考数据，并向所述播放端反馈接收确认消息，使得所述播放端在收到所述接收确认消息后播放所述待播放数据。
88.在一些实施方式中，当所述音频数据处理装置作为音频数据采集端时，所述获取音频数据采集端采集的初始音频数据，以及参考数据，包括：
89.所述处理器600控制所述采集端中的麦克风采集初始音频数据；
90.所述处理器600利用所述播放端的音频处理参数，以及缓存的音频数据，生成所述参考数据，其中，所述缓存的音频数据包括所述采集端上一次通过麦克风采集的音频数据。
91.在一些实施方式中，当所述音频数据处理装置作为音频数据播放端时，所述获取音频数据采集端采集的初始音频数据，以及参考数据，包括：
92.所述处理器600控制接收所述采集端通过麦克风采集的并且分别经过所述采集端以及所述播放端中的增益系统处理后的音频数据；
93.所述处理器600从本地缓存中获取所述参考数据，所述参考数据为所述播放端上一次的待播放数据。
94.在一些实施方式中，所述处理器600利用所述采集端采集的初始音频数据以及所述参考数据，进行回声消除之前，所述处理器600还用于确定所述采集端与所述播放端处于同一空间。
95.在一些实施方式中，所述处理器600当检测到对端的热点信号时，确定所述采集端与所述播放端处于同一空间；
96.或者，所述处理器600当通过收发机610接收到对端判定所述采集端与所述播放端处于同一空间的指令时，确定所述采集端与所述播放端处于同一空间。
97.在一些实施方式中，当所述音频数据处理装置作为音频数据采集端时，存储器620，用于存储程序指令；处理器600，用于调用所述存储器中存储的程序指令，按照获得的程序执行：
98.通过收发机610接收音频数据采集端发送的音频数据，并对所述音频数据进行增益放大处理后，得到音频数据播放端的待播放数据；
99.将所述待播放数据作为参考数据通过收发机610发送给所述音频数据采集端，使得所述音频数据采集端利用所述采集端采集的初始音频数据以及所述参考数据，进行回声消除。
100.在一些实施例中，所述音频数据处理装置还包括收发机610，用于在处理器600的控制下接收和发送数据。
101.其中，在图6中，总线架构可以包括任意数量的互联的总线和桥，具体由处理器600代表的一个或多个处理器和存储器620代表的存储器的各种电路链接在一起。总线架构还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起，这些都是本领域所公知的，因此，本文不再对其进行进一步描述。总线接口提供接口。收发机610可以是多个元件，即包括发送机和接收机，提供用于在传输介质上与各种其他装置通信的单元。
102.在一些实施例中，还包括用户接口630，用户接口630可以是能够外接内接需要设备的接口，连接的设备包括但不限于小键盘、显示器、扬声器、麦克风、操纵杆等。
103.处理器600负责管理总线架构和通常的处理，存储器620可以存储处理器600在执行操作时所使用的数据。
104.在一些实施例中，处理器600可以是cpu(中央处埋器)、asic(application specific integrated circuit，专用集成电路)、fpga(field－programmable gate array，现场可编程门阵列)或cpld(complex programmable logic device，复杂可编程逻辑器件)。
105.本技术实施例提供的另一音频数据处理装置，包括：
106.第一单元，用于获取音频数据采集端采集的初始音频数据，以及参考数据；其中所述采集端采集的初始音频数据中包含音频数据播放端播放的音频数据；所述参考数据是所述播放端的待播放数据；
107.第二单元，用于利用所述采集端采集的初始音频数据以及所述参考数据，进行回声消除，将得到的音频数据作为消除了所述播放端播放的音频数据后的采集端采集的音频数据输出。
108.在一些实施方式中，第一单元具体用于：
109.通过麦克风采集初始音频数据；
110.接收所述播放端发送的所述参考数据，并向所述播放端反馈接收确认消息，使得所述播放端在收到所述接收确认消息后播放所述待播放数据。
111.在一些实施方式中，第一单元具体用于：
112.通过麦克风采集初始音频数据；
113.利用所述播放端的音频处理参数，以及缓存的音频数据，生成所述参考数据，其中，所述缓存的音频数据包括所述采集端上一次通过麦克风采集的音频数据。
114.在一些实施方式中，第一单元具体用于：
115.接收所述采集端通过麦克风采集的并且分别经过所述采集端以及所述播放端中的增益系统处理后的音频数据；
116.从本地缓存中获取所述参考数据，所述参考数据为所述播放端上一次的待播放数据。
117.在一些实施方式中，在第二单元利用所述采集端采集的初始音频数据以及所述参考数据，进行回声消除之前，所述第二单元还用于确定所述采集端与所述播放端处于同一空间。
118.在一些实施方式中，第二单元当检测到对端的热点信号时，确定所述采集端与所述播放端处于同一空间；
119.或者，第二单元当接收到对端判定所述采集端与所述播放端处于同一空间的指令时，确定所述采集端与所述播放端处于同一空间。
120.本技术实施例提供的另一种音频数据处理装置，包括：
121.接收处理单元，用于接收音频数据采集端发送的音频数据，并对所述音频数据进行增益放大处理后，得到音频数据播放端的待播放数据；
122.发送单元，用于将所述待播放数据作为参考数据发送给所述音频数据采集端，使
得所述音频数据采集端利用所述采集端采集的初始音频数据以及所述参考数据，进行回声消除。
123.需要说明的是，本技术实施例中对单元的划分是示意性的，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。另外，在本技术各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。
124.所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(read-only memory，rom)、随机存取存储器(random access memory，ram)、磁碟或者光盘等各种可以存储程序代码的介质。
125.本技术实施例提供了一种计算设备，该计算设备具体可以为桌面计算机、便携式计算机、智能手机、平板电脑、个人数字助理(personal digital assistant，pda)等。该计算设备可以包括中央处理器(center processing unit，cpu)、存储器、输入/输出设备等，输入设备可以包括键盘、鼠标、触摸屏等，输出设备可以包括显示设备，如液晶显示器(liquid crystal display，lcd)、阴极射线管(cathode ray tube，crt)等。
126.存储器可以包括只读存储器(rom)和随机存取存储器(ram)，并向处理器提供存储器中存储的程序指令和数据。在本技术实施例中，存储器可以用于存储本技术实施例提供的任一所述方法的程序。
127.处理器通过调用存储器存储的程序指令，处理器用于按照获得的程序指令执行本技术实施例提供的任一所述方法。
128.本技术实施例还提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述实施例中的任一所述方法。所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
129.本技术实施例提供了一种计算机可读存储介质，用于储存为上述本技术实施例提供的装置所用的计算机程序指令，其包含用于执行上述本技术实施例提供的任一方法的程序。所述计算机可读存储介质，可以是非暂时性计算机可读介质。
130.所述计算机可读存储介质可以是计算机能够存取的任何可用介质或数据存储设
备，包括但不限于磁性存储器(例如软盘、硬盘、磁带、磁光盘(mo)等)、光学存储器(例如cd、dvd、bd、hvd等)、以及半导体存储器(例如rom、eprom、eeprom、非易失性存储器(nand flash)、固态硬盘(ssd))等。
131.应当理解：
132.通信网络中的实体经由其往来传送流量的接入技术可以是任何合适的当前或未来技术，诸如可以使用wlan(无线本地接入网络)、wimax(微波接入全球互操作性)、lte、lte-a、5g、蓝牙、红外等；另外，实施例还可以应用有线技术，例如，基于ip的接入技术，如有线网络或固定线路。
133.适合于被实现为软件代码或其一部分并使用处理器或处理功能运行的实施例是独立于软件代码的，并且可以使用任何已知或未来开发的编程语言来规定，诸如高级编程语言，诸如objective-c、c、c++、c#、java、python、javascript、其他脚本语言等，或低级编程语言，诸如机器语言或汇编程序。
134.实施例的实现是独立于硬件的，并且可以使用任何已知或未来开发的硬件技术或其任何混合来实现，诸如微处理器或cpu(中央处理单元)、mos(金属氧化物半导体)、cmos(互补mos)、bimos(双极mos)、bicmos(双极cmos)、ecl(发射极耦合逻辑)和/或ttl(晶体管-晶体管逻辑)。
135.实施例可以被实现为单独的设备、装置、单元、部件或功能，或者以分布式方式实现，例如，可以在处理中使用或共享一个或多个处理器或处理功能，或者可以在处理中使用和共享一个或多个处理段或处理部分，其中，一个物理处理器或多于一个的物理处理器可以被用于实现一个或多个专用于如所描述的特定处理的处理部分。
136.装置可以由半导体芯片、芯片组或包括这种芯片或芯片组的(硬件)模块来实现。
137.实施例还可以被实现为硬件和软件的任何组合，诸如asic(应用特定ic(集成电路))组件、fpga(现场可编程门阵列)或cpld(复杂可编程逻辑器件)组件或dsp(数字信号处理器)组件。
138.实施例还可以被实现为计算机程序产品，包括在其中体现计算机可读程序代码的计算机可用介质，该计算机可读程序代码适应于执行如实施例中所描述的过程，其中，该计算机可用介质可以是非暂时性介质。
139.本领域内的技术人员应明白，本技术的实施例可提供为方法、系统、或计算机程序产品。因此，本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
140.本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
141.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特
定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
142.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
143.显然，本领域的技术人员可以对本技术进行各种改动和变型而不脱离本技术的精神和范围。这样，倘若本技术的这些修改和变型属于本技术权利要求及其等同技术的范围之内，则本技术也意图包含这些改动和变型在内。

技术特征：

1.一种音频数据处理方法，其特征在于，该方法包括：获取音频数据采集端采集的初始音频数据，以及参考数据；其中所述采集端采集的初始音频数据中包含音频数据播放端播放的音频数据；所述参考数据是所述播放端的待播放数据；利用所述采集端采集的初始音频数据以及所述参考数据，进行回声消除，将得到的音频数据作为消除了所述播放端播放的音频数据后的采集端采集的音频数据输出。2.根据权利要求1所述的方法，其特征在于，所述获取音频数据采集端采集的初始音频数据，以及参考数据，包括：所述采集端通过麦克风采集初始音频数据；所述采集端接收所述播放端发送的所述参考数据，并向所述播放端反馈接收确认消息，使得所述播放端在收到所述接收确认消息后播放所述待播放数据。3.根据权利要求1所述的方法，其特征在于，所述获取音频数据采集端采集的初始音频数据，以及参考数据，包括：所述采集端通过麦克风采集初始音频数据；所述采集端利用所述播放端的音频处理参数，以及缓存的音频数据，生成所述参考数据，其中，所述缓存的音频数据包括所述采集端上一次通过麦克风采集的音频数据。4.根据权利要求1所述的方法，其特征在于，所述获取音频数据采集端采集的初始音频数据，以及参考数据，包括：所述播放端接收所述采集端通过麦克风采集的并且分别经过所述采集端以及所述播放端中的增益系统处理后的音频数据；所述播放端从本地缓存中获取所述参考数据，所述参考数据为所述播放端上一次的待播放数据。5.根据权利要求1所述的方法，其特征在于，在所述利用所述采集端采集的初始音频数据以及所述参考数据，进行回声消除之前，所述方法还包括：确定所述采集端与所述播放端处于同一空间。6.根据权利要求5所述的方法，其特征在于，当检测到对端的热点信号时，确定所述采集端与所述播放端处于同一空间；或者，当接收到对端判定所述采集端与所述播放端处于同一空间的指令时，确定所述采集端与所述播放端处于同一空间。7.一种音频数据处理方法，其特征在于，该方法包括：接收音频数据采集端发送的音频数据，并对所述音频数据进行增益放大处理后，得到音频数据播放端的待播放数据；将所述待播放数据作为参考数据发送给所述音频数据采集端，使得所述音频数据采集端利用所述采集端采集的初始音频数据以及所述参考数据，进行回声消除。8.一种音频数据处理装置，其特征在于，包括：存储器，用于存储程序指令；处理器，用于调用所述存储器中存储的程序指令，按照获得的程序执行权利要求1至7任一项所述的方法。9.一种用于计算机的计算机程序产品，其特征在于，包括软件代码部分，当所述产品在
所述计算机上运行时，所述软件代码部分用于执行根据权利要求1至7中任一项所述的方法。10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机可执行指令，所述计算机可执行指令用于使所述计算机执行权利要求1至7任一项所述的方法。

技术总结

本申请公开了一种音频数据处理方法及装置，用以有效抑制在音频数据采集端的麦克风和音频数据播放端的扬声器之间形成音频信号闭环导致的啸叫，并且易于实现、可行性高、普适性好。本申请提供的音频数据处理方法包括：获取音频数据采集端采集的初始音频数据，以及参考数据；其中采集端采集的初始音频数据中包含音频数据播放端播放的音频数据；参考数据是播放端的待播放数据；利用采集端采集的初始音频数据以及参考数据，进行回声消除，将得到的音频数据作为消除了播放端播放的音频数据后的采集端采集的音频数据输出。集端采集的音频数据输出。集端采集的音频数据输出。