一种机器人听觉信息监听处理方法

阅读: 评论:0



1.本发明涉及监听处理方法技术领域,具体为一种机器人听觉信息监听处理方法。


背景技术:



2.机器人是一种能够半自主或全自主工作的智能机器。历史上最早的机器人见于隋炀帝命工匠按照柳抃形象所营造的木偶机器人,施有机关,有坐、起、拜、伏等能力。
3.在当今社会监听设备安装的越来越多,使人们的个人隐私容易被监听设备监听,存在个人隐私泄露的风险,当需要单独监听陌生人,由于外部环境的影响,使人们监听的质量下降。


技术实现要素:



4.(一)解决的技术问题
5.针对现有技术的不足,本发明提供了一种机器人听觉信息监听处理方法,解决了人们个人的隐私容易泄露和单独监听陌生人受外部影响较大的问题。
6.(二)技术方案
7.为实现以上目的,本发明通过以下技术方案予以实现:一种机器人听觉信息监听处理方法,包括信息压缩组件、人工智能检测组件、关键词识别组件、dms组件,所述信息压缩组件通过ad模数转化输出到人工智能检测组件,所述人工智能检测组件通过asr语音转化输出到dms组件与关键词识别组件;
8.所述信息压缩组件将语音数据进行压缩;
9.所述人工智能检测组件对压缩数据进行检测与处理;
10.所述关键词识别组件可以识别语音数据中关键字;
11.所述dms组件建立数据库,储存语音数据。
12.优选的,所述信息压缩组件采用霍夫曼(huffman)算法进行无损压缩语音数据。
13.优选的,所述人工智能检测组件内部的检测组件由vpr组件与情绪识别组件组成,所述vpr组件用于检测出语音中的声纹信息,所述情绪识别组件用于检测出语音中的情绪类型与特征,所述vpr组件判断为“否”,vpr组件将语音数据通过asr把语音数据转化为文字数据到关键词识别组件,所述vpr组件判断为“是”,vpr组件把数据输出到情绪识别组件,所述情绪识别组件通过asr把语音数据转化为文字数据到dms组件。
14.优选的,所述人工智能检测组件内部的处理组件由vad组件与解压组件组成,所述解压组件把压缩的语音数据解压,所述vad组件用于话音信号与各种背景噪声信号的区分,所述解压组件把压缩数据解压并输出到vad组件进行处理。
15.优选的,所述关键词识别组件检索为“否”,将文字数据输出到dms组件,所述关键词识别组件检索为“是”,将文字数据通过tts转化成语音数据输出出去。
16.优选的,所述情绪识别组件由特征组件与分类组件组成,所述特征组件对语音数据中能量(energy)、音高(pitch)、梅尔频率倒谱系数(mfcc)等语音特征进行识别,所述分
类组件使用高斯混合模型(gmm)、隐马尔可夫模型(hmm)与长短时记忆模型(lstm)常用模型进行数据分类,识别出语音数据的特性并对其分类。
17.优选的,所述dms组件把每个储存的数据设定特定id,查看特定id需要特定的密钥进行开启。
18.(三)有益效果
19.本发明提供了一种机器人听觉信息监听处理方法。具备以下有益效果:
20.1、本发明,采用人工智能检测组件中的检测组件与分析,机器人把陌生人与学习过的人的语音数据区分出去,避免学习过的人的个人被隐私被监听,造成隐私的泄漏。
21.2、本发明,通过关键词识别组件,使机器人识别出陌生人语音数据中的关键词信息,便于机器人快速监听到需要的陌生人的语音信息,避免外部影响到监听质量。
附图说明
22.图1为本发明的原理示意图。
具体实施方式
23.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
24.如图1所示,本发明实施例提供一种机器人听觉信息监听处理方法,包括信息压缩组件、人工智能检测组件、关键词识别组件、dms组件,信息压缩组件通过ad模数转化输出到人工智能检测组件,信息压缩组件将语音数据进行压缩,然后通过ad模数转化,把声波模拟数据转化成数字数据,便于后面工人智能检测组件对数据进行检测与分析。
25.人工智能检测组件通过asr语音转化输出到dms组件与关键词识别组件,人工智能检测组件对压缩数据进行检测与处理,人工智能检测组件,首先对语音数据进行处理后,再对处理好的数据进行检测,提高检测数据的精度。
26.人工智能检测组件内部的检测组件由vpr组件与情绪识别组件组成,vpr组件用于检测出语音中的声纹信息,vpr组件会语音中的声纹进行识别,便于区分机器人学习过人与陌生人的声纹信息,情绪识别组件用于检测出语音中的情绪类型与特征,vpr组件判断为“否”,“否”表示机器人内部的数据库没有学习过的声纹,vpr组件声纹数据判断为陌生人的声纹数据,vpr组件将语音数据通过asr把语音数据转化为文字数据到关键词识别组件,并把陌生人声纹数据转化为文字数据给关键词识别组件中进行识别,关键词识别组件对文字数据中的违规关键词进行检索,vpr组件判断为“是”,“是”为机器人内部的数据库学习过的声纹,并把神纹信息传输到情绪识别组件中,便于对人们的情绪进行识别,vpr组件将数据输出到情绪识别组件,情绪识别组件通过asr把语音数据转化为文字数据到dms组件,便于把学习过的神纹数据与情绪数据转化成文字数据并储存在dms组件中,情绪识别组件由特征组件与分类组件组成,特征组件对语音数据中能量(energy)、音高(pitch)、梅尔频率倒谱系数(mfcc)等语音特征进行识别,分类组件使用高斯混合模型(gmm)、隐马尔可夫模型(hmm)与长短时记忆模型(lstm)常用模型进行数据分类,识别出语音数据的特性并对其分
类。
27.人工智能检测组件内部的处理组件由vad组件与解压组件组成,解压组件把压缩的语音数据解压,vad组件用于话音信号与各种背景噪声信号的区分,vad组件对解压的语音数据进行再一次处理,便于后面的检测组件对语音数据进行检测,解压组件把压缩数据解压并输出到vad组件进行处理。
28.信息压缩组件将语音数据进行压缩,信息压缩组件采用霍夫曼(huffman)算法进行无损压缩语音数据,便于保障语音数据的完整性。
29.关键词识别组件可以识别语音数据中关键字,关键词识别组件检索为“否”,“否”表示关键词识别组件没有在文字数据中识别出关键词,将文字数据输出到dms组件,把没有识别出关键词的数据储存在dms组件中,便于机器人进行记录,关键词识别组件检索为“是”,“是”表示关键词识别组件识别出关键词,并将文字数据通过tts转化成语音数据输出出去,提高机器人监听陌生人的监听质量。
30.dms组件建立数据库,储存语音数据,dms组件把每个储存的数据设定特定id,查看特定id需要特定的密钥进行开启,dms组件为机器人的数据库,便于机器人储存数据,当人们需要查看监听过的数据时,需要对应id的密钥才能查看数据,增加数据的安全性。
31.机器人将人们的语音信息输入到人工智能检测组件中进行处理后,再通过vpr组件对处理好的语音信息进行识别,vpr组件首先对语音信息中进行特征提取,并从特征数据库对比该语音特征,若该语音特征与特征数据库相匹配,则说明语音数据为机器人训练学习过的语音数据,此时判断为“是”,vpr组件把语音数据传输到情绪识别组件,便于对语音数据中的情绪进行识别,把识别好的信息通过asr技术转换成文本数据,并将文本数据储存在dms组件中,避免外部机器人监听到学习的人的个人隐私,当该语音特征与特征数据库不匹配时,则说明语音数据为机器人没有训练学习过的语音数据,此时判断为“否”,vpr组件通过asr技术将语音数据转换为文字信息并传输到关键词识别组件中,对文字信息进行检索。
32.当vpr组件判定语音数据为陌生人时,vpr组件通过asr技术将语音数据转换为文字信息并传输到关键词识别组件中,关键词识别组件中设置有现有技术搜索引擎技术,搜索引擎从机器人违规数据库对文本数据进行检索,如文本数据为“今天我们跟踪这个人几天了”,其中的“跟踪”在机器人违规数据库为规格词汇,这时关键词识别组件通过tts技术把文本数据转换成语音,机器人将违规的语音播放出来。
33.尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

技术特征:


1.一种机器人听觉信息监听处理方法,其特征在于:包括信息压缩组件、人工智能检测组件、关键词识别组件、dms组件,所述信息压缩组件通过ad模数转化输出到人工智能检测组件,所述人工智能检测组件通过asr语音转化输出到dms组件与关键词识别组件;所述信息压缩组件将语音数据进行压缩;所述人工智能检测组件对压缩数据进行检测与处理;所述关键词识别组件可以识别语音数据中关键字;所述dms组件建立数据库,储存语音数据。2.根据权利要求1所述的一种机器人听觉信息监听处理方法,其特征在于:所述信息压缩组件采用霍夫曼(huffman)算法进行无损压缩语音数据。3.根据权利要求1所述的一种机器人听觉信息监听处理方法,其特征在于:所述人工智能检测组件内部的检测组件由vpr组件与情绪识别组件组成,所述vpr组件用于检测出语音中的声纹信息,所述情绪识别组件用于检测出语音中的情绪类型与特征,所述vpr组件判断为“否”,vpr组件将语音数据通过asr把语音数据转化为文字数据到关键词识别组件,所述vpr组件判断为“是”,vpr组件把数据输出到情绪识别组件,所述情绪识别组件通过asr把语音数据转化为文字数据到dms组件。4.根据权利要求1所述的一种机器人听觉信息监听处理方法,其特征在于:所述人工智能检测组件内部的处理组件由vad组件与解压组件组成,所述解压组件把压缩的语音数据解压,所述vad组件用于话音信号与各种背景噪声信号的区分,所述解压组件把压缩数据解压并输出到vad组件进行处理。5.根据权利要求1所述的一种机器人听觉信息监听处理方法,其特征在于:所述关键词识别组件检索为“否”,将文字数据输出到dms组件,所述关键词识别组件检索为“是”,将文字数据通过tts转化成语音数据输出出去。6.根据权利要求3所述的一种机器人听觉信息监听处理方法,其特征在于:所述情绪识别组件由特征组件与分类组件组成,所述特征组件对语音数据中能量(energy)、音高(pitch)、梅尔频率倒谱系数(mfcc)等语音特征进行识别,所述分类组件使用高斯混合模型(gmm)、隐马尔可夫模型(hmm)与长短时记忆模型(lstm)常用模型进行数据分类,识别出语音数据的特性并对其分类。7.根据权利要求1所述的一种机器人听觉信息监听处理方法,其特征在于:所述dms组件把每个储存的数据设定特定id,查看特定id需要特定的密钥进行开启。

技术总结


本发明提供一种机器人听觉信息监听处理方法,涉及监听处理方法领域。一种机器人听觉信息监听处理方法,包括信息压缩组件、人工智能检测组件、关键词识别组件、DMS组件,所述信息压缩组件通过AD模数转化输出到人工智能检测组件,所述人工智能检测组件通过ASR语音转化输出到DMS组件与关键词识别组件。通过采用人工智能检测组件中的检测组件与分析,机器人把陌生人与学习过的人的语音数据区分出去,避免学习过的人的个人被隐私被监听,造成隐私的泄漏,通过关键词识别组件,使机器人识别出陌生人语音数据中的关键词信息,便于机器人快速监听到需要的陌生人的语音信息,避免外部影响到监听质量。到监听质量。到监听质量。


技术研发人员:

宁崴 苏伯超 王丽丽

受保护的技术使用者:

深圳职业技术学院

技术研发日:

2022.07.29

技术公布日:

2022/11/3

本文发布于:2022-11-29 18:10:37,感谢您对本站的认可!

本文链接:https://patent.en369.cn/patent/4/13621.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:组件   数据   语音   所述
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 369专利查询检索平台 豫ICP备2021025688号-20 网站地图