H04N21/2347 H04N21/239 H04N21/254 H04N21/258 H04N21/4405 H04N21/441 H04N21/4627 G10L15/02 G10L15/16 G10L15/22 G10L15/26 G10L25/24 G06N3/04 G06N3/08
1.一种播放资源的处理方法,其特征在于,所述方法包括:
接收展示端发送的申请播放信息,所述申请播放信息包括展示端信息;
根据所述展示端信息识别所述展示端的权限,得到权限识别结果;
根据所述权限识别结果和所述申请播放信息从云服务器获取所述展示端对应的播放资源;
当接收到的用户输入的操作信息是控制播放信息时,根据所述控制播放信息控制所述展示端播放所述播放资源。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当接收到的用户输入的操作信息是控制灯光信息时,根据所述控制灯光信息控制所述展示端的灯光。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
对所述申请播放信息、所述操作信息和所述播放资源进行加密存储。
4.根据权利要求1所述的方法,其特征在于,所述接收到的用户输入的操作信息是所述用户通过键盘和/或语音输入的。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
根据LSTM+CTC神经网络识别所述用户通过语音输入的操作信息。
6.根据权利要求1所述的方法,其特征在于,在所述根据所述控制播放信息控制所述展示端播放所述播放资源之前,包括:
根据所述控制播放信息调整所述播放资源的播放顺序和/或修改所述播放资源。
7.一种播放资源的处理装置,其特征在于,所述装置包括:
通信模块,用于接收展示端发送的申请播放信息,所述申请播放信息包括展示端信息;
权限识别模块,用于根据所述展示端信息识别所述展示端的权限,得到权限识别结果;
获取模块,用于根据所述权限识别结果和所述申请播放信息从云服务器获取所述展示端对应的播放资源;
处理模块,用于当接收到用户输入的操作信息是控制播放信息时,根据所述控制播放信息控制所述展示端播放所述播放资源。
8.根据权利要求7所述的播放资源的处理装置,其特征在于,所述通信模块包括:蓝牙通信模块、红外线通信模块、WIFI通信模块、Zigbee通信模块中的至少一种。
9.根据权利要求7所述的播放资源的处理装置,其特征在于,所述装置还包括:
灯光模块,用于当接收到的用户输入的操作信息是控制灯光信息时,根据所述控制灯光信息控制所述展示端的灯光。
10.根据权利要求7所述的播放资源的处理装置,其特征在于:
所述处理模块,还用于根据LSTM+CTC神经网络识别所述用户通过语音输入的操作信息。
11.根据权利要求7所述的播放资源的处理装置,其特征在于,在所述根据所述控制播放信息控制所述展示端播放所述播放资源之前:所述处理模块,还用于根据所述播放控制信息调整所述播放资源的播放顺序和/或修改所述播放资源。
12.一种播放资源的处理设备,其特征在于,所述设备包括:处理器以及存储有计算机程序指令的存储器;
所述处理器执行所述计算机指令时实现如权利要求1-6任意一项所述的播放资源的处理方法。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-6任意一项所述的播放资源的处理方法。
本发明涉及智能控制技术领域,尤其涉及一种播放资源的处理方法、装置、设备和计算机可读存储介质。
传统展厅在播放文件时,需要工作人员提前对待播放文件进行拷贝,同时风控备用人员待命,若需播放多个文件,传统展厅仅能按照顺序播放,无法实时对播放文件进行鉴权和权限更新,若中途需更换播放文件或修改资料,需多人配合,极大地耗费了人力和时间。
本发明实施例提供了一种播放资源的处理方法、装置、设备和计算机可读存储介质,能够根据用户输入的操作信息控制展示端,在无人值守的情况下实时对播放资源进行鉴权和权限更新,提升了用户的使用体验。
第一方面,提供了一种播放资源的处理方法,该方法包括:接收展示端发送的申请播放信息,申请播放信息包括展示端信息;根据展示端信息识别展示端的权限,得到权限识别结果;根据权限识别结果和申请播放信息从云服务器获取展示端对应的播放资源;当接收到的用户输入的操作信息是控制播放信息时,根据控制播放信息控制展示端播放播放资源。
在第一方面的一些可实现方式中,当接收到的用户输入的操作信息是控制灯光信息时,根据控制灯光信息控制展示端的灯光。
在第一方面的一些可实现方式中,对申请播放信息、操作信息和播放资源进行加密存储。
在第一方面的一些可实现方式中,接收到的用户输入的操作信息是用户通过键盘和/或语音输入的。
在第一方面的一些可实现方式中,根据LSTM+CTC神经网络识别用户通过语音输入的操作信息。
在第一方面的一些可实现方式中,在根据控制播放信息控制展示端播放播放资源之前,包括:根据控制播放信息调整播放资源的播放顺序和/或修改播放资源。
第二方面,提供了一种播放资源的处理装置,该装置包括:通信模块,用于接收展示端发送的申请播放信息,申请播放信息包括展示端信息;权限识别模块,用于根据展示端信息识别展示端的权限,得到权限识别结果;获取模块,用于根据权限识别结果和申请播放信息从云服务器获取展示端对应的播放资源;处理模块,用于当接收到用户输入的操作信息是控制播放信息时,根据控制播放信息控制展示端播放播放资源。
在第二方面的一些可实现方式中,通信模块包括:蓝牙通信模块、红外线通信模块、WIFI通信模块、Zigbee通信模块中的至少一种。
在第二方面的一些可实现方式中,还包括灯光模块,用于当接收到的用户输入的操作信息是控制灯光信息时,根据控制灯光信息控制展示端的灯光。
在第二方面的一些可实现方式中,处理模块还用于根据LSTM+CTC神经网络识别用户通过语音输入的操作信息。
在第二方面的一些可实现方式中,在根据控制播放信息控制展示端播放播放资源之前:处理模块还用于,根据播放控制信息调整播放资源的播放顺序和/或修改播放资源。
第三方面,提供了一种播放资源的处理设备,该设备包括:处理器以及存储有计算机程序指令的存储器;处理器执行计算机程序指令时实现第一方面或者第一方面的一些可实现方式中的播放资源的处理方法。
第四方面,提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现第一方面或者第一方面的一些可实现方式中的播放资源的处理方法。
本发明涉及智能控制技术领域,尤其涉及一种播放资源的处理方法、装置、设备和计算机可读存储介质,通过接收展示端发送的申请播放信息,申请播放信息包括展示端信息;根据展示端信息识别展示端的权限,得到权限识别结果;根据权限识别结果和申请播放信息从云服务器获取展示端对应的播放资源;当接收到的用户输入的操作信息是控制播放信息时,根据控制播放信息控制展示端播放播放资源,能够灵活控制展示端,在无人值守的情况下实时对播放资源进行鉴权和权限更新,提升了用户的使用体验。
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种播放资源的处理方法的流程示意图;
图2是本发明实施例提供的一种处理播放资源的操作流程示意图;
图3是本发明实施例提供的一种语音信息的识别模块的结构示意图;
图4是本发明实施例提供的一种语音信息的识别方法的流程示意图;
图5是本发明实施例提供的一种长短期记忆网络的架构示意图;
图6是本发明实施例提供的一种播放资源的处理装置的结构示意图;
图7是本发明实施例提供的一种播放资源的处理设备的结构示意图。
下面将详细描述本发明的各个方面的特征和示例性实施例,为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本发明,并不被配置为限定本发明。对于本领域技术人员来说,本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
在本发明的实施例中,播放资源的处理方法可以应用于安装在中控设备(Android或iOS智能手机或pad)上的中控系统,中控系统与展示端、服务器端通信连接。
下面结合图1和图2对本发明实施例提供的播放资源的处理方法进行描述。
图1是本发明实施例提供的一种播放资源的处理方法的流程示意图。
图2是本发明实施例提供的一种处理播放资源的操作流程示意图。
播放资源的处理方法可以包括S110-S140。
S110,接收展示端发送的申请播放信息,申请播放信息包括展示端信息。
具体地,展示端发送的申请播放信息包括申请播放文件的相关属性和展示端信息,申请播放文件的相关属性可以包括申请播放文件的文件名、文件类型、缩略图和播放地址,展示端信息可以包括展示端的自定义名称、IP地址、MAC地址和设备类型(电视机、展示机等)。
具体地,中控系统将接收到的申请播放信息进行加密存储。
可选地,在一个实施例中,若申请播放文件的文件类型为视频,申请播放信息还可以包括视频格式、视频时长;若申请播放文件的文件类型为PPT,申请播放信息还可以包括PPT页数、幻灯片放映时长。
应理解的是,在接收展示端发送的申请播放信息之前,用户首先登录中控系统,成功登录后注册高级数据链路控制(High-Level Data Link Control,HDLC)服务,监控展示端接入;若中控系统登录失败,则重新登录。展示端在向中控系统发送申请播放信息之前,也需要事先进行登录并与中控系统建立连接,若登录失败,则重新登录。
其中,HDLC服务是一个同步网上传输数据、面向比特的数据链路层协议,用于监听搜索到的所有的展示端,从而控制所有展示端。
用户登录中控系统后,中控系统自动启动搜索当前局域网内的展示端设备,搜索成功后通过私有协议自动连接。
当展示端接入中控系统后,中控系统会自动更新到已连接的展示端设备列表,并将当前列表进行存储,当有新的展示端设备接入或断开时,中控系统将实时同步更新列表信息。
S120,根据展示端信息识别展示端的权限,得到权限识别结果。
具体地,中控系统可以根据展示端信息中展示端的自定义名称、IP地址、MAC地址信息对展示端的权限进行识别或判别。
中控系统在识别到展示端权限之后,可以通过安全协议返回权限识别结果。
S130,根据权限识别结果和申请播放信息从云服务器获取展示端对应的播放资源。
具体地,中控系统可以根据申请播放信息中的申请播放文件的文件名、文件类型和播放地址向云服务器获取播放资源。
中控系统首先根据得到的展示端权限和申请播放信息为展示端匹配相应的播放文件,然后向云服务器获取相应的播放资源。
其中,中控系统可以根据展示端的设备类型为展示端匹配相应的播放文件,还可以根据播放文件的文件类型为播放文件匹配相应的播放载体(展示端)。
可选地,在一个实施例中,中控系统从云服务器获取的播放资源是可见的。
可选地,在一个实施例中,中控系统从云服务器获取相应的播放资源时,还可以启动高性能安全缓存机制进行异步视频下载,下载成功后,对文件进行编码、加密、压缩、打散等技术保护。
S140,当接收到的用户输入的操作信息是控制播放信息时,根据控制播放信息控制展示端播放播放资源。
其中,接收到的用户输入的操作信息可以是用户通过键盘输入的。
控制播放信息可以包括:是否循环播放、是否终止当前播放、播放时间间隔。
具体地,中控系统根据控制播放信息控制展示端播放视频、图片、PPT等,展示端播放结束后可自动退出。
可选地,在一个实施例中,当接收到的用户输入的操作信息是控制灯光信息时,根据控制灯光信息控制展示端的灯光亮度、灯光模式等灯光信息。
可选地,在一个实施例中,在根据控制播放信息控制展示端播放播放资源之前,包括:根据控制播放信息调整播放资源的播放顺序和/或修改播放资源。
可选地,在一个实施例中,当需跳过当前播放资源播放新的播放资源时,用户可以输入新的操作信息,操作信息中包括跳过当前播放资源指令,中控系统根据操作信息立即退出当前正在播放的播放资源,并开始播放新播放资源;如需循环组播,可将需要播放的播放资源加入播放集合,操作信息中包括播放资源循环组播指令,中控系统会按照添加的播放文件顺序循环播放。
应理解的是,当根据用户的控制播放信息修改播放资源时,中控系统、展示端和云服务器对播放资源的修改同步实时更新。
应理解的是,中控系统将接收到的操作信息进行加密存储。
可选地,在一个实施例中,接收到的用户输入的操作信息可以是用户通过语音输入的,中控系统根据长短期记忆网络(Long Short-Term Memory,LSTM)以及时序分类算法(Connectionist Temporal Classification,CTC)神经网络识别用户语音输入的操作信息。图3是本发明实施例提供的一种语音信息的识别模块的结构示意图,如图3所示,根据LSTM+CTC神经网络识别语音信息主要包括以下步骤:
步骤1,从语音信息的声音波形中提取声学特征;
步骤2,根据声学模型将声学特征转换成发音的音素;
步骤3,根据语言模型等解码技术将音素转变成识别结果(文本)。
下面结合一个具体的实施例对语音信息的识别方法进行说明,图4是本发明实施例提供的一种语音信息的识别方法的流程示意图,如图4所示:
其中,语言模型包括LSTM+CTC神经网络。
步骤1包括:采用python_speech_features提取原始波形声音文件(WAV)的梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC),将每一帧的数据计算出一个13维长度的返回的特征值;
步骤2包括:将特征值所对应的13维长度的序列信息转化成音素分类,音素分类对应24+8*4个音素,分别对应汉语拼音中24个辅音字母和8个元音字母,其中每一个元音字母有四个音调;
步骤3包括:将所定义的音素传入双向LSTM中,输出包含有26个数据的数组。
其中,图5是本发明实施例提供的一种长短期记忆网络的架构示意图,如图5所示,LSTM的网络架构包括:尺寸大小为32*32*3的卷积层,尺寸大小为3*3的卷积核,卷积核主要提取相关的音素的特征值并将特征值信息传入到池化层中,最终输出包含有26个数据的数组。
其中,包含有26个数据的数组在经过LSTM的计算之后,再经过一个softmax层,得到音素的后验概率。
音素的后验概率可以用公式(1)表示:
其中,t为某一时刻,n为音素种类数量,k表示音素数量,在一帧的数据上所有音素的后验概率加起来为1。
将包含有26个数据的数组和计算得到的音素的后验概率传入CTC(损失函数)中,得到最终的识别结果。
CTC的训练集合可以用公式(2)表示:
s={(x1,z1),(x2,z2),…(xn,zn)} (2)
其中,s为包含有数据的数组,n为训练样本数量,x为输入样本,z是对应的真实输出的label,一个样本的输入是一个序列,输出的label也是一个序列,输入的序列长度大于输出的序列长度。
其中,对于长度为T帧的输入样本数据X,X=(X1,X2,X3,...,XT),Xi为输入样本数据X中第i帧数据经过MFCC计算后得到的结果,每一帧的数据是一个维度为m的向量,即每个Xi∈Rm,R为任意实数;经过CTC的训练集合,得到输入样本数据X的输出样本Z,Z=(Z1,Z2,Z3,...,ZT)。
作为一个具体的实施例,输入样本为一段发音“你好”的声音数据,经过MFCC计算后,得到声学特征X1,根据声学模型得到对应的音素信息Z1,Z1=[n,i,h,a,o](暂且将每个拼音的字母当做一个音素),根据CTC的训练集合将音素信息Z1转变识别结果(文本信息是“你好”),从而实现成功语音识别。
本发明实施例的播放资源的处理方法,通过接收展示端发送的申请播放信息,申请播放信息包括展示端信息;根据展示端信息识别展示端的权限,得到权限识别结果;根据权限识别结果和申请播放信息从云服务器获取展示端对应的播放资源;当接收到的用户输入的操作信息是控制播放信息时,根据控制播放信息控制展示端播放播放资源,在无人值守的情况下实时对播放资源进行鉴权和权限更新,能够根据操作信息灵活控制展示端的播放文件,提高了展示效率,降低了人力成本。
图6是本发明实施例提供的一种播放资源的处理装置的结构示意图,如图6所示,该组播放资源的处理装置200可以包括:通信模块210、权限识别模块220、获取模块230、处理模块240。
其中,通信模块210,用于接收展示端发送的申请播放信息,申请播放信息包括展示端信息;权限识别模块220,用于根据展示端信息识别展示端的权限,得到权限识别结果;获取模块230,用于根据权限识别结果和申请播放信息从云服务器获取展示端对应的播放资源;处理模块240,用于当接收到用户输入的操作信息是控制播放信息时,根据控制播放信息控制展示端播放播放资源。
在一些实施例中,通信模块210包括:蓝牙通信模块、红外线通信模块、WIFI通信模块、Zigbee通信模块中的至少一种。
在一些实施例中,还包括灯光模块,用于当接收到的用户输入的操作信息是控制灯光信息时,根据控制灯光信息控制展示端的灯光。
在一些实施例中,处理模块240还用于根据LSTM+CTC神经网络识别用户通过语音输入的操作信息。
在一些实施例中,在根据控制播放信息控制展示端播放播放资源之前:处理模块240还用于,根据播放控制信息调整播放资源的播放顺序和/或修改播放资源。
本发明实施例的播放资源的处理装置,通过接收展示端发送的申请播放信息,申请播放信息包括展示端信息;根据展示端信息识别展示端的权限,得到权限识别结果;根据权限识别结果和申请播放信息从云服务器获取展示端对应的播放资源;当接收到的用户输入的操作信息是控制播放信息时,根据控制播放信息控制展示端播放播放资源,能够灵活控制展示端,在无人值守的情况下实时对播放资源进行鉴权和权限更新,提升了用户的使用体验。
可以理解的是,本发明实施例的播放资源的处理装置200,可以对应于本发明实施例图1中的播放资源的处理方法的执行主体,播放资源的处理装置200的各个模块/单元的操作和/或功能的具体细节可以参见上述本发明实施例图1和图2的播放资源的处理方法中的相应部分的描述,为了简洁,在此不再赘述。
图7是本发明实施例提供的一种播放资源的处理设备的硬件结构示意图。
如图7所示,本实施例中的播放资源的处理设备300包括输入设备301、输入接口302、中央处理器303、存储器304、输出接口305、以及输出设备306。其中,输入接口302、中央处理器303、存储器304、以及输出接口305通过总线310相互连接,输入设备301和输出设备306分别通过输入接口302和输出接口305与总线310连接,进而与信息获取设备300的其他组件连接。
具体地,输入设备301接收来自外部的输入信息,并通过输入接口302将输入信息传送到中央处理器303;中央处理器303基于存储器304中存储的计算机可执行指令对输入信息进行处理以生成输出信息,将输出信息临时或者永久地存储在存储器304中,然后通过输出接口305将输出信息传送到输出设备306;输出设备306将输出信息输出到信息获取设备300的外部供用户使用。
在一个实施例中,图7所示的播放资源的处理设备300包括:存储器304,用于存储程序;处理器303,用于运行存储器中存储的程序,以执行本发明实施例提供的图1-图5所示实施例的方法。
本发明实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现本发明实施例提供的图1-图5所示实施例的方法。
需要明确的是,本发明并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本发明的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本发明的精神后,做出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、只读存储器(Read-Only Memory,ROM)、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(Radio Frequency,RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本发明中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本发明不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
以上所述,仅为本发明的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。
本文发布于:2023-04-14 10:48:17,感谢您对本站的认可!
本文链接:https://patent.en369.cn/patent/2/86184.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |