1.本技术涉及信息技术领域,具体而言,涉及一种多元
时序异常检测方法及装置、计算机设备和存储介质。
背景技术:
2.随着云计算、大数据、
传感器和物联网等新一代信息技术的迅速发展,许多基于网络物理系统(cyber physical systems,cps)构建形成的重要信息系统设施(例如,智能电网系统、水处理系统、配电网系统、自动驾驶系统等)因运行安全考量越发重视信息异常检测操作,以持续监测基本控制参数或指标参数,并及时发现任何可能的异常事件。
3.值得注意的是,现有信息异常检测操作通常实现的是对单个信息变量的监测数据的点异常检测效果,并未考虑到对应信息变量在时间维度上的数据相关性和数据因果性,更何况上述重要信息系统设施运行时往往会在同一
工业场景中涉及大量相互协同的工业传感器各自负责的信息变量,而不同工业传感器各自负责的信息变量在时间维度上或多或少地存在一定数据相关性,因此现有信息异常检测操作在面对涉及多元时间序列数据(即多种工业传感器各自获取的时间序列数据)的复杂工业场景时的异常检测精准度不佳,无法有效检测出复杂信息异常。
技术实现要素:
4.有鉴于此,本技术的目的在于提供一种多元时序异常检测方法及装置、计算机设备和存储介质,能够在多元时间序列场景下结合多种信息变量之间的数据相关性从时间维度层面实现对复杂信息异常的精准检测效果。
5.为了实现上述目的,本技术实施例采用的技术方案如下:
6.第一方面,本技术提供一种多元时序异常检测方法,
所述方法包括:
7.获取目标工业场景下的待检测时间序列组,其中所述待检测时间序列组包括数据采集时机保持一致的多种工业传感器各自对应的工业时序数据;
8.对所述待检测时间序列组进行数据预处理,得到多个待检测归一化时序组,其中每个待检测归一化时序组单独对应一个数据采集时间段,每个待检测归一化时序组包括所述多种工业传感器各自在对应数据采集时间段内的归一化工业时序片段;
9.针对每个待检测归一化时序组,根据该待检测归一化时序组包括的多种工业传感器各自的归一化工业时序片段,提取所述多种工业传感器在该待检测归一化时序组处的数据关联关系;
10.将该待检测归一化时序组所对应的所述多种工业传感器的归一化工业时序片段及数据关联关系输入到预存的多元时序重构模型中进行时序重构处理,得到对应的待匹配归一化时序组;
11.将该待检测归一化时序组与对应的待匹配归一化时序组进行时序比对,得到所述待检测时间序列组的与该待检测归一化时序组对应的时序异常检测结果。
12.在可选的实施方式中,所述对所述待检测时间序列组进行数据预处理,得到多个待检测归一化时序组的步骤,包括:
13.调用预设滑动窗口在所述待检测时间序列组包括的各种工业传感器的工业时序数据上进行滑动,并将对应窗口位置保持一致的所述多种工业传感器各自的工业时序片段数据集合为一个待处理工业时序组,其中每个待处理工业时序组所对应的数据采集时间段时长与所述预设滑动窗口的窗口时长保持一致;
14.针对每个待处理工业时序组,对该待处理工业时序组包括的多种工业传感器各自的工业时序片段数据分别进行最大最小标准化处理,得到与该待处理工业时序组对应的待检测归一化时序组。
15.在可选的实施方式中,针对每个待检测归一化时序组,所述提取所述多种工业传感器在该待检测归一化时序组处的数据关联关系的步骤,包括:
16.对该待检测归一化时序组包括的各种工业传感器的归一化工业时序片段进行采集特征提取处理,得到各种工业传感器在该待检测归一化时序组的数据采集时间段内的数据采集特征向量;
17.基于图结构学习原理计算各种工业传感器在该待检测归一化时序组的数据采集时间段内的数据采集特征向量之间的数据相关度,得到所述多种工业传感器在该待检测归一化时序组处的数据关联关系。
18.在可选的实施方式中,所述多元时序重构模型包括自注意力单元、编码单元及解码单元,其中所述编码单元包括相互串联的多个编码模块,每个编码模块由长短期记忆网络及图卷积网络组成,所述解码单元包括相互串联的多个解码模块,每个编码模块对应一个解码模块;
19.针对每个待检测归一化时序组,将该待检测归一化时序组所对应的所述多种工业传感器的归一化工业时序片段及数据关联关系输入到预存的多元时序重构模型中进行时序重构处理,得到对应的待匹配归一化时序组的步骤,包括:
20.将该待检测归一化时序组所对应的所述多种工业传感器的归一化工业时序片段及数据关联关系输入到所述编码单元中,调用所述编码单元中的每个编码模块通过长短期记忆网络从接收到的归一化时序数据处提取时间维度特征,而后通过图卷积网络将提取的时间维度特征嵌入到该待检测归一化时序组所对应的所述多种工业传感器的数据关联关系中进行时序编码,得到该编码模块输出的归一化编码时序数据;其中,所述编码单元中的排在串联首位的编码模块所接收到的归一化时序数据为该待检测归一化时序组所对应的所述多种工业传感器的归一化工业时序片段,所述编码单元中的除去排在串联首位的之外的每个编码模块所接收到的归一化时序数据为前一个编码模块输出的归一化编码时序数据;
21.调用自注意力单元对多个编码模块各自在长短期记忆网络的最后一层网络架构处提取出的时间维度特征进行注意力评估,得到各个编码模块的注意力加权隐藏状态表示;
22.调用所述解码单元中的所有解码模块各自基于对应编码模块的注意力加权隐藏状态表示以及接收到的归一化时序数据进行解码重构,得到所述解码单元最终输出的与该待检测归一化时序组对应的待匹配归一化时序组;其中,所述解码单元中的排在串联首位
的解码模块所接收到的归一化时序数据为所述编码单元中的排在串联末位的编码模块所输出的归一化编码时序数据,所述解码单元中的除去排在串联首位的解码模块之外的每个解码模块接收到的归一化时序数据为前一个解码模块的解码重构结果。
23.在可选的实施方式中,所述待匹配归一化时序组包括所述多种工业传感器各自在对应数据采集时间段内的归一化重构时序片段,则针对每个待检测归一化时序组,将该待检测归一化时序组与对应的待匹配归一化时序组进行时序比对,得到所述待检测时间序列组的与该待检测归一化时序组对应的时序异常检测结果的步骤,包括:
24.针对每种工业传感器,计算该种工业传感器所对应的归一化工业时序片段与归一化重构时序片段之间的误差异常分数;
25.确定该种工业传感器在该待检测归一化时序组的数据采集时间段内的异常分数阈值;
26.将该种工业传感器的误差异常分数与对应的异常分数阈值进行比较;
27.在该种工业传感器的误差异常分数大于对应的异常分数阈值的情况下,判定该种工业传感器在所述待检测时间序列组处的与该待检测归一化时序组的数据采集时间段对应的工业时序片段数据存在异常。
28.在可选的实施方式中,所述方法还包括:
29.获取至少一种训练工业场景各自对应的数据正常的多个归一化训练时序组以及每个归一化训练时序组所对应的多种工业传感器的数据关联关系,其中每个归一化训练时序组包括多种工业传感器各自在对应数据采集时间段内的归一化训练时序数据;
30.根据至少一种训练工业场景各自对应的多个归一化训练时序组以及每个归一化训练时序组所对应的多种工业传感器的数据关联关系,在基于图结构学习的自编码器集成学习模型上进行时序重构模型训练,得到所述多元时序重构模型。
31.第二方面,本技术提供一种多元时序异常检测装置,所述装置包括:
32.检测数据获取模块,用于获取目标工业场景下的待检测时间序列组,其中所述待检测时间序列组包括数据采集时机保持一致的多种工业传感器各自对应的工业时序数据;
33.时序预处理模块,用于对所述待检测时间序列组进行数据预处理,得到多个待检测归一化时序组,其中每个待检测归一化时序组单独对应一个数据采集时间段,每个待检测归一化时序组包括所述多种工业传感器各自在对应数据采集时间段内的归一化工业时序片段;
34.关联关系提取模块,用于针对每个待检测归一化时序组,根据该待检测归一化时序组包括的多种工业传感器各自的归一化工业时序片段,提取所述多种工业传感器在该待检测归一化时序组处的数据关联关系;
35.多元时序重构模块,用于将该待检测归一化时序组所对应的所述多种工业传感器的归一化工业时序片段及数据关联关系输入到预存的多元时序重构模型中进行时序重构处理,得到对应的待匹配归一化时序组;
36.时序异常检测模块,用于将该待检测归一化时序组与对应的待匹配归一化时序组进行时序比对,得到所述待检测时间序列组的与该待检测归一化时序组对应的时序异常检测结果。
37.在可选的实施方式中,所述装置还包括:
38.训练数据获取模块,用于获取至少一种训练工业场景各自对应的数据正常的多个归一化训练时序组以及每个归一化训练时序组所对应的多种工业传感器的数据关联关系,其中每个归一化训练时序组包括多种工业传感器各自在对应数据采集时间段内的归一化训练时序数据;
39.重构模型训练模块,用于根据至少一种训练工业场景各自对应的多个归一化训练时序组以及每个归一化训练时序组所对应的多种工业传感器的数据关联关系,在基于图结构学习的自编码器集成学习模型上进行时序重构模型训练,得到所述多元时序重构模型。
40.第三方面,本技术提供一种计算机设备,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机程序,所述处理器可执行所述计算机程序,以实现前述实施方式中任意一项所述的多元时序异常检测方法。
41.第四方面,本技术提供一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现前述实施方式中任意一项所述的多元时序异常检测方法。
42.在此情况下,本技术实施例的有益效果包括以下内容:
43.本技术通过对目标工业场景下的待检测时间序列组进行数据预处理,得到多个待检测归一化时序组,并针对每个待检测归一化时序组,根据该待检测归一化时序组包括的多种工业传感器各自在对应数据采集时间段内的归一化工业时序片段,提取多种工业传感器在该待检测归一化时序组处的数据关联关系,接着将该待检测归一化时序组涉及的所有归一化工业时序片段及数据关联关系输入到预存的多元时序重构模型中进行时序重构处理,得到对应的待匹配归一化时序组,然后将该待检测归一化时序组与对应的待匹配归一化时序组进行时序比对,得到待检测时间序列组的与该待检测归一化时序组对应的时序异常检测结果,从而在多元时间序列场景下结合多种信息变量之间的数据相关性从时间维度层面实现对复杂信息异常的精准检测效果。
44.为使本技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
45.为了更清楚地说明本技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
46.图1为本技术实施例提供的计算机设备的组成示意图;
47.图2为本技术实施例提供的多元时序异常检测方法的流程示意图之一;
48.图3为图2中的步骤s230包括的子步骤的流程示意图;
49.图4为本技术实施例提供的多元时序重构模型的模型组成示意图;
50.图5为图2中的步骤s240包括的子步骤的流程示意图;
51.图6为图2中的步骤s250包括的子步骤的流程示意图;
52.图7为本技术实施例提供的多元时序异常检测方法的流程示意图之二;
53.图8为本技术实施例提供的多元时序异常检测装置的流程示意图之一;
54.图9为本技术实施例提供的多元时序异常检测装置的流程示意图之二。
memory,eprom),电可擦除只读存储器(electric erasable programmable read-only memory,eeprom)等。其中,所述存储器11用于存储计算机程序,所述处理器12在接收到执行指令后,可相应地执行所述计算机程序。
64.在本实施例中,所述处理器12可以是一种具有信号的处理能力的集成电路芯片。所述处理器12可以是通用处理器,包括中央处理器(central processing unit,cpu)、图形处理器(graphics processing unit,gpu)及网络处理器(network processor,np)、数字信号处理器(dsp)、专用集成电路(asic)、现成可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件中的至少一种。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,可以实现或者执行本技术实施例中的公开的各方法、步骤及逻辑框图。
65.在本实施例中,所述通信单元13用于通过网络建立所述计算机设备10与其他电子设备之间的通信连接,并通过所述网络收发数据,其中所述网络包括有线通信网络及无线通信网络。例如,所述计算机设备10可以通过所述通信单元13从需要执行信息异常检测操作的多种工业传感器处获取每种工业传感器采集到的工业时序数据(即按照采集时间点先后顺序依次排布的多个传感器数据),并通过所述通信单元13将最终检测得到的时序异常检测结果反馈给用户终端,其中所述用户终端可以是,但不限于,移动终端、平板电脑等。
66.在本实施例中,所述多元时序异常检测装置100可以包括至少一个能够以软件或固件的形式存储于所述存储器11中或者固化在所述计算机设备10的操作系统中的软件功能模块。所述处理器12可用于执行所述存储器11存储的可执行模块,例如所述多元时序异常检测装置100所包括的软件功能模块及计算机程序等。所述计算机设备10能够通过所述多元时序异常检测装置100在多元时间序列场景下结合多种信息变量(即多种工业传感器各自负责的传感器数据)之间的数据相关性从时间维度层面实现对复杂信息异常的精准检测效果。
67.可以理解的是,图1所示的框图仅为所述计算机设备10的一种组成示意图,所述计算机设备10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。
68.在本技术中,为确保所述计算机设备10能够在多元时间序列场景下结合多种信息变量之间的数据相关性从时间维度层面实现对复杂信息异常的精准检测效果,本技术实施例提供一种多元时序异常检测方法实现前述目的。下面对本技术提供的多元时序异常检测方法进行详细描述。
69.请参照图2,图2是本技术实施例提供的多元时序异常检测方法的流程示意图之一。在本技术实施例中,所述多元时序异常检测方法可以包括步骤s210~步骤s250。
70.步骤s210,获取目标工业场景下的待检测时间序列组,其中待检测时间序列组包括数据采集时机保持一致的多种工业传感器各自对应的工业时序数据。
71.在本实施例中,所述目标工业场景为需要信息异常检测的信息系统设施执行作业时的运行场景,所述待检测时间序列组即为对应信息系统设施包括的多种工业传感器在所述目标工业场景下按照相同数据采集时机各自实际采集到的工业时序数据,其中每种工业传感器的工业时序数据包括该工业传感器在目标工业场景下按照采集时间点先后顺序依次采集到的多个传感器数据。
72.步骤s220,对待检测时间序列组进行数据预处理,得到多个待检测归一化时序组,其中每个待检测归一化时序组单独对应一个数据采集时间段,每个待检测归一化时序组包括多种工业传感器各自在对应数据采集时间段内的归一化工业时序片段。
73.在本实施例中,所述计算机设备10在得到所述待检测时间序列组后,可从所述待检测时间序列组处直接分离出多个待处理工业时序组,并针对每个待处理工业时序组中各种工业传感器的工业时序片段数据分别进行数据归化一化处理,以将对应待处理工业时序组转换为一个待检测归一化时序组,此时单个待检测归一化时序组包括多种工业传感器各自在对应数据采集时间段内的归一化工业时序片段,其中每个待检测归一化时序组单独对应一个数据采集时间段,每个待处理工业时序组中的各种工业传感器的工业时序片段数据所对应的数据采集时间点呈连续分布状态,多个待检测归一化时序组各自的数据采集时间段可以部分重叠,也可以互不重叠。
74.在本实施例的一种实施方式中,可按照预设时间段时长对所述待检测时间序列组进行平均分段处理,使对应分离出的多个待处理工业时序组在时间维度层面连续分布,且多个待处理工业时序组各自的数据采集时间段互不重叠。
75.在本实施例的另一种实施方式中,可以通过调用预设滑动窗口在所述待检测时间序列组包括的各种工业传感器的工业时序数据上进行滑动,并将对应窗口位置保持一致的所述多种工业传感器各自的工业时序片段数据集合为一个待处理工业时序组,其中每个待处理工业时序组所对应的数据采集时间段时长与所述预设滑动窗口的窗口时长保持一致,此时相邻截取生成的待处理工业时序组各自的数据采集时间段存在部分重叠,即相邻截取生成的待处理工业时序组各自的工业时序片段数据存在数据重合部分,以避免破坏工业时序数据在时间维度层面的连续分布性,并能确保截取出的待处理工业时序组数量足够多。
76.在本实施例中,计算机设备10在获得到一个待处理工业时序组时,会针对该待处理工业时序组包括的多种工业传感器各自的工业时序片段数据分别进行最大最小标准化处理,以将对应工业时序片段数据映射到[0,1]的区间范围,得到与该待处理工业时序组对应的待检测归一化时序组,此时单个待检测归一化时序组包括多种工业传感器各自在对应数据采集时间段内的归一化工业时序片段。其中,所述最大最小标准化处理在具体实施时需要确定对应工业时序片段数据中的最大传感器数据和最小传感器数据,并计算最大传感器数据和最小传感器数据之间的第一数据差值,而后针对该工业时序片段数据中的每个传感器数据,计算该传感器数据与对应最小传感器数据之间的第二数据差值,进而计算对应第二数据差值与所述第一数据差值之间的比值,即得到该传感器数据在对应归一化工业时序片段中匹配的归一化传感数据。
[0077]
步骤s230,针对每个待检测归一化时序组,根据该待检测归一化时序组包括的多种工业传感器各自的归一化工业时序片段,提取多种工业传感器在该待检测归一化时序组处的数据关联关系。
[0078]
在本实施例中,所述计算机设备10在得到一个待检测归一化时序组时,会对该待检测归一化时序组所包括的多种工业传感器各自的归一化工业时序片段进行分析,确定所述多种工业传感器在该待检测归一化时序组的数据采集时间段内对目标工业场景的数据采集响应相关程度,即得到所述多种工业传感器在该待检测归一化时序组处的数据关联关系。
[0079]
可选地,请按照图3,图3是图2中的步骤s230包括的子步骤的流程示意图。在本实施例中,所述步骤s230可以包括子步骤s231~子步骤s232。
[0080]
子步骤s231,对该待检测归一化时序组包括的各种工业传感器的归一化工业时序片段进行采集特征提取处理,得到各种工业传感器在该待检测归一化时序组的数据采集时间段内的数据采集特征向量。
[0081]
在本实施例中,所述数据采集特征向量用于表征对应工业传感器在特定数据采集时间段内的采集数据波动特性状况。
[0082]
子步骤s232,基于图结构学习原理计算各种工业传感器在该待检测归一化时序组的数据采集时间段内的数据采集特征向量之间的数据相关度,得到多种工业传感器在该待检测归一化时序组处的数据关联关系。
[0083]
在本实施例中,所述计算机设备10可基于图结构学习原理计算任意两种工业传感器的数据采集特征向量之间的余弦相似度,并调用softmax函数对计算出的余弦相似度进行处理,得到这两种工业传感器的数据采集特征向量之间的数据相关度,进而通过所有工业传感器的数据采集特征向量之间的数据相关度集成到同一矩阵中,得到表征所述多种工业传感器在该待检测归一化时序组处的数据关联关系的关联关系矩阵。
[0084]
由此,本技术可通过执行上述子步骤s231~子步骤s232,有效测定出目标工业场景下的多种工业传感器在该待检测归一化时序组的数据采集时间段内的数据关联关系。
[0085]
步骤s240,将该待检测归一化时序组所对应的多种工业传感器的归一化工业时序片段及数据关联关系输入到预存的多元时序重构模型中进行时序重构处理,得到对应的待匹配归一化时序组。
[0086]
在本实施例中,所述计算机设备10在得到某个待检测归一化时序组所对应的多种工业传感器的归一化工业时序片段及数据关联关系后,可通过调用预存的多元时序重构模型将该待检测归一化时序组所包括的多种工业传感器的归一化工业时序片段结合到所述多种工业传感器的数据关联关系中进行时序重构,以重构生成可视为正常数据的待匹配归一化时序组,其中所述多元时序重构模型采用数据正常的多个归一化训练时序组以及每个归一化训练时序组所对应的多种工业传感器的数据关联关系训练得到,以确保多元时序重构模型能够实现基于正常的多元时序数据重构出正常的多元时序数据,其中每个归一化训练时序组包括多种工业传感器各自在对应数据采集时间段内的归一化训练时序数据。
[0087]
可选地,请结合参照图4及图5,其中图4是本技术实施例提供的多元时序重构模型的模型组成示意图,图5是图2中的步骤s240包括的子步骤的流程示意图。在本技术实施例中,所述多元时序重构模型可以包括自注意力单元、编码单元及解码单元,其中所述编码单元包括相互串联的多个编码模块,除去排在串联首位的编码模块之外的每个编码模块的输入数据即为前一编码模块的输出数据,每个编码模块由长短期记忆网络(lstm)及图卷积网络(gcn)组成;所述解码单元包括相互串联的多个解码模块,编码模块的排列顺序与解码模块的排列顺序相反设置,每个编码模块对应一个解码模块(例如,排在串联首位的编码模块与排在串联末位的解码模块对应,排在串联末位的编码模块与排在串联首位的解码模块对应),除去排在串联首位的解码模块之外的每个解码模块的输入数据即为前一个解码模块的输出数据。由此,所述步骤s240可以包括子步骤s241~子步骤s243。
[0088]
子步骤s241,将该待检测归一化时序组所对应的多种工业传感器的归一化工业时
序片段及数据关联关系输入到编码单元中,调用编码单元中的每个编码模块通过长短期记忆网络从接收到的归一化时序数据处提取时间维度特征,而后通过图卷积网络将提取的时间维度特征嵌入到该待检测归一化时序组所对应的多种工业传感器的数据关联关系中进行时序编码,得到该编码模块输出的归一化编码时序数据。
[0089]
在本实施例中,所述编码单元可由基于图结构学习的自编码器集成学习模型(autoencoder with graph structure learning,agl)所包括的编码器模块构建形成,所述编码单元包括的排在串联首位的编码模块所接收到的归一化时序数据即为对应待检测归一化时序组包括的多种工业传感器的归一化工业时序片段,除去所述排在串联首位的编码模块之外的每个编码模块所接收到的多种工业传感器的归一化时序数据即为前一个编码模块输出的多种工业传感器的归一化编码时序数据。其中,第i个编码模块在自身的长短期记忆网络处提取出的所有时间维度特征可采用进行表示,第i个编码模块输出的归一化编码时序数据可采用x(ei)进行表示。
[0090]
子步骤s242,调用自注意力单元对多个编码模块各自在长短期记忆网络的最后一层网络架构处提取出的时间维度特征进行注意力评估,得到各个编码模块的注意力加权隐藏状态表示。
[0091]
在本实施例中,所述自注意力单元可由基于图结构学习的自编码器集成学习模型(autoencoder with graph structure learning,agl)所包括的self-attention模块构建形成。所述自注意力单元用于对来自所述编码单元包括的多个编码模块各自在长短期记忆网络的最后一层网络架构处提取出的时间维度特征进行注意力加权,以得到所述多个解码模块各自的注意力加权隐藏状态表示。其中,第i个编码模块在自身的长短期记忆网络的最后一层网络架构处提取出的时间维度特征可采用h
t
(ei)进行表示(例如,排在串联首位的编码模块输入给所述自注意力单元的时间维度特征h
t
(e1),排在串联末位的编码模块输入给所述自注意力单元的时间维度特征h
t
(en)),第i个编码模块的注意力加权隐藏状态表示可采用h'
t
(di)进行表达(例如,排在串联首位的编码模块的注意力加权隐藏状态表示h'
t
(d1),排在串联末位的编码模块的注意力加权隐藏状态表示h'
t
(dn))。
[0092]
子步骤s243,调用解码单元中的所有解码模块各自基于对应编码模块的注意力加权隐藏状态表示以及接收到的归一化时序数据进行解码重构,得到解码单元最终输出的与该待检测归一化时序组对应的待匹配归一化时序组。
[0093]
在本实施例中,所述解码单元可由基于图结构学习的自编码器集成学习模型(autoencoder with graph structure learning,agl)所包括的解码模块构建形成,所述解码单元包括的每个解码模块可由一个向量内积网络(inner-product)及一个长短期记忆网络(lstm)组成。针对所述解码单元包括的每个解码模块,该解码模块可通过向量内积网络接收自身待处理的归一化时序数据进行向量内积处理,并通过长短期记忆网络接收来自所述自注意力单元的与该解码模块对应的编码模块的注意力加权隐藏状态表示,而后由长短期记忆网络将接收到的注意力加权隐藏状态表示作为自身的初始隐藏状态,并将前述向量内积网络处理后的归一化时序数据作为自身的解码输入数据,接着通过对自身的初始隐藏状态及解码输入数据进行解码重构,得到该解码模块的解码重构结果。其中,所述解码单元中的排在串联首位的解码模块所接收到的归一化时序数据为所述编码单元中的排在串联末位的编码模块所输出的归一化编码时序数据,所述解码单元中的除去排在串联首位的
解码模块之外的每个解码模块接收到的归一化时序数据为前一个解码模块的解码重构结果(即前一个解码模块输出的多种工业传感器的归一化解码时序数据),由此所述解码单元最终输出的与该待检测归一化时序组对应的待匹配归一化时序组即由所述解码单元中的排在串联末位的解码模块所输出的解码重构结果(即排在串联末位的解码模块所输出的多种工业传感器的归一化解码时序数据)组成。其中,第j个解码模块的经自身的向量内积网络处理后的归一化时序数据可采用进行表示,第j个解码模块输出的解码重构结果可采用y(d
n+1-j
)进行表示,第j个解码模块所对应的编码模块的注意力加权隐藏状态可采用h'
t
(d
n+1-j
)进行表达,其中n用于表示编码模块总数目。
[0094]
由此,本技术可通过执行上述子步骤s241~子步骤s243,在多元时间序列场景下结合多种信息变量之间的数据相关性进行时序数据重构操作,确保重构出的时序数据能够有效表现出多种工业传感器之间的数据关联关系。
[0095]
步骤s250,将该待检测归一化时序组与对应的待匹配归一化时序组进行时序比对,得到待检测时间序列组的与该待检测归一化时序组对应的时序异常检测结果。
[0096]
在本实施例中,所述待匹配归一化时序组包括所述多种工业传感器各自在对应数据采集时间段内的归一化重构时序片段。所述计算机设备10在将相互对应的待检测归一化时序组与待匹配归一化时序组进行时序比对时,需要按照工业传感器种类选取同种工业传感器在待检测归一化时序组内的归一化工业时序片段和在待匹配归一化时序组内的归一化重构时序片段进行比对,以确定该种工业传感器在目标工业场景下于该待检测归一化时序组的数据采集时间段内是否存在采集数据异常,即得到所述待检测时间序列组的与该待检测归一化时序组对应的时序异常检测结果。
[0097]
可选地,请参照图6,图6是图2中的步骤s250包括的子步骤的流程示意图。在本实施例中,所述步骤s250可以包括子步骤s251~子步骤s254。
[0098]
子步骤s251,针对每种工业传感器,计算该种工业传感器所对应的归一化工业时序片段与归一化重构时序片段之间的误差异常分数。
[0099]
在本实施例中,可通过计算对应工业传感器的归一化工业时序片段与归一化重构时序片段之间的均方误差损失函数(mse loss)值,作为对应工业传感器的归一化工业时序片段与归一化重构时序片段之间的误差异常分数。
[0100]
子步骤s252,确定该种工业传感器在该待检测归一化时序组的数据采集时间段内的异常分数阈值。
[0101]
在本实施例中,可基于正态分布选取一个概率分布在0.96~0.99之间的数值作为该种工业传感器在该待检测归一化时序组的数据采集时间段内的异常分数阈值。
[0102]
子步骤s253,将该种工业传感器的误差异常分数与对应的异常分数阈值进行比较。
[0103]
子步骤s254,在该种工业传感器的误差异常分数大于对应的异常分数阈值的情况下,判定该种工业传感器在待检测时间序列组处的与该待检测归一化时序组的数据采集时间段对应的工业时序片段数据存在异常,否则判定该种工业传感器在待检测时间序列组处的与该待检测归一化时序组的数据采集时间段对应的工业时序片段数据正常。
[0104]
由此,本技术可通过执行上述子步骤s251~子步骤s254,快速实现对上述待检测时间序列组的工业时序片段的异常检测操作。
[0105]
由此,本技术可通过执行上述步骤s210~步骤s250,在多元时间序列场景下结合多种信息变量之间的数据相关性从时间维度层面实现对复杂信息异常的精准检测效果。
[0106]
可选地,请参照图7,图7是本技术实施例提供的多元时序异常检测方法的流程示意图之二。在本技术实施例中,所述多元时序异常检测方法还可以包括步骤s260及步骤s270。
[0107]
步骤s260,获取至少一种训练工业场景各自对应的数据正常的多个归一化训练时序组以及每个归一化训练时序组所对应的多种工业传感器的数据关联关系,其中每个归一化训练时序组包括多种工业传感器各自在对应数据采集时间段内的归一化训练时序数据。
[0108]
在本实施例中,每个归一化训练时序组所对应的多种工业传感器的数据关联关系可通过采用上述步骤s230相同的手段对所述归一化训练时序组包括的归一化训练时序数据进行处理得到,所述归一化训练时序组可采用上述步骤s220中的数据归一化手段对训练时间序列组处理得到,其中单个训练时间序列组包括多种工业传感器各自在对应数据采集时间段内的训练工业时序数据。
[0109]
步骤s270,根据至少一种训练工业场景各自对应的多个归一化训练时序组以及每个归一化训练时序组所对应的多种工业传感器的数据关联关系,在基于图结构学习的自编码器集成学习模型上进行时序重构模型训练,得到多元时序重构模型。
[0110]
由此,本技术可通过执行上述步骤s260~步骤s270,训练得到结合多种信息变量之间的数据相关性进行时间序列重构的多元时序重构模型。
[0111]
在本技术中,为确保所述计算机设备10能够通过所述多元时序异常检测装置100执行上述多元时序异常检测方法,本技术通过对所述多元时序异常检测装置100进行功能模块划分的方式实现前述功能。下面对本技术提供的多元时序异常检测装置100的具体组成进行相应描述。
[0112]
请参照图8,图8是本技术实施例提供的多元时序异常检测装置100的流程示意图之一。在本技术实施例中,所述多元时序异常检测装置100可以包括检测数据获取模块110、时序预处理模块120、关联关系提取模块130、多元时序重构模块140及时序异常检测模块150。
[0113]
检测数据获取模块110,用于获取目标工业场景下的待检测时间序列组,其中待检测时间序列组包括数据采集时机保持一致的多种工业传感器各自对应的工业时序数据。
[0114]
时序预处理模块120,用于对待检测时间序列组进行数据预处理,得到多个待检测归一化时序组,其中每个待检测归一化时序组单独对应一个数据采集时间段,每个待检测归一化时序组包括多种工业传感器各自在对应数据采集时间段内的归一化工业时序片段。
[0115]
关联关系提取模块130,用于针对每个待检测归一化时序组,根据该待检测归一化时序组包括的多种工业传感器各自的归一化工业时序片段,提取多种工业传感器在该待检测归一化时序组处的数据关联关系。
[0116]
多元时序重构模块140,用于将该待检测归一化时序组所对应的多种工业传感器的归一化工业时序片段及数据关联关系输入到预存的多元时序重构模型中进行时序重构处理,得到对应的待匹配归一化时序组。
[0117]
时序异常检测模块150,用于将该待检测归一化时序组与对应的待匹配归一化时序组进行时序比对,得到待检测时间序列组的与该待检测归一化时序组对应的时序异常检
测结果。
[0118]
可选地,请参照图9,图9是本技术实施例提供的多元时序异常检测装置100的流程示意图之二。在本技术实施例中,所述多元时序异常检测装置100还可以包括训练数据获取模块160及重构模型训练模块170。
[0119]
训练数据获取模块160,用于获取至少一种训练工业场景各自对应的数据正常的多个归一化训练时序组以及每个归一化训练时序组所对应的多种工业传感器的数据关联关系,其中每个归一化训练时序组包括多种工业传感器各自在对应数据采集时间段内的归一化训练时序数据。
[0120]
重构模型训练模块170,用于根据至少一种训练工业场景各自对应的多个归一化训练时序组以及每个归一化训练时序组所对应的多种工业传感器的数据关联关系,在基于图结构学习的自编码器集成学习模型上进行时序重构模型训练,得到多元时序重构模型。
[0121]
需要说明的是,本技术实施例所提供的多元时序异常检测装置100,其基本原理及产生的技术效果与前述的多元时序异常检测方法相同。为简要描述,本实施例部分未提及之处,可参考上述的针对多元时序异常检测方法的描述内容。
[0122]
在本技术所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本技术的实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0123]
另外,在本技术各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个可读存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个可读存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的可读存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0124]
综上所述,在本技术实施例提供的多元时序异常检测方法及装置、计算机设备和存储介质中,本技术通过对目标工业场景下的待检测时间序列组进行数据预处理,得到多个待检测归一化时序组,并针对每个待检测归一化时序组,根据该待检测归一化时序组包括的多种工业传感器各自在对应数据采集时间段内的归一化工业时序片段,提取多种工业传感器在该待检测归一化时序组处的数据关联关系,接着将该待检测归一化时序组涉及的所有归一化工业时序片段及数据关联关系输入到预存的多元时序重构模型中进行时序重
构处理,得到对应的待匹配归一化时序组,然后将该待检测归一化时序组与对应的待匹配归一化时序组进行时序比对,得到待检测时间序列组的与该待检测归一化时序组对应的时序异常检测结果,从而在多元时间序列场景下结合多种信息变量之间的数据相关性从时间维度层面实现对复杂信息异常的精准检测效果。
[0125]
以上所述,仅为本技术的各种实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应当以权利要求的保护范围为准。
技术特征:
1.一种多元时序异常检测方法,其特征在于,所述方法包括:获取目标工业场景下的待检测时间序列组,其中所述待检测时间序列组包括数据采集时机保持一致的多种工业传感器各自对应的工业时序数据;对所述待检测时间序列组进行数据预处理,得到多个待检测归一化时序组,其中每个待检测归一化时序组单独对应一个数据采集时间段,每个待检测归一化时序组包括所述多种工业传感器各自在对应数据采集时间段内的归一化工业时序片段;针对每个待检测归一化时序组,根据该待检测归一化时序组包括的多种工业传感器各自的归一化工业时序片段,提取所述多种工业传感器在该待检测归一化时序组处的数据关联关系;将该待检测归一化时序组所对应的所述多种工业传感器的归一化工业时序片段及数据关联关系输入到预存的多元时序重构模型中进行时序重构处理,得到对应的待匹配归一化时序组;将该待检测归一化时序组与对应的待匹配归一化时序组进行时序比对,得到所述待检测时间序列组的与该待检测归一化时序组对应的时序异常检测结果。2.根据权利要求1所述的方法,其特征在于,所述对所述待检测时间序列组进行数据预处理,得到多个待检测归一化时序组的步骤,包括:调用预设滑动窗口在所述待检测时间序列组包括的各种工业传感器的工业时序数据上进行滑动,并将对应窗口位置保持一致的所述多种工业传感器各自的工业时序片段数据集合为一个待处理工业时序组,其中每个待处理工业时序组所对应的数据采集时间段时长与所述预设滑动窗口的窗口时长保持一致;针对每个待处理工业时序组,对该待处理工业时序组包括的多种工业传感器各自的工业时序片段数据分别进行最大最小标准化处理,得到与该待处理工业时序组对应的待检测归一化时序组。3.根据权利要求1所述的方法,其特征在于,针对每个待检测归一化时序组,所述提取所述多种工业传感器在该待检测归一化时序组处的数据关联关系的步骤,包括:对该待检测归一化时序组包括的各种工业传感器的归一化工业时序片段进行采集特征提取处理,得到各种工业传感器在该待检测归一化时序组的数据采集时间段内的数据采集特征向量;基于图结构学习原理计算各种工业传感器在该待检测归一化时序组的数据采集时间段内的数据采集特征向量之间的数据相关度,得到所述多种工业传感器在该待检测归一化时序组处的数据关联关系。4.根据权利要求1所述的方法,其特征在于,所述多元时序重构模型包括自注意力单元、编码单元及解码单元,其中所述编码单元包括相互串联的多个编码模块,每个编码模块由长短期记忆网络及图卷积网络组成,所述解码单元包括相互串联的多个解码模块,每个编码模块对应一个解码模块;针对每个待检测归一化时序组,将该待检测归一化时序组所对应的所述多种工业传感器的归一化工业时序片段及数据关联关系输入到预存的多元时序重构模型中进行时序重构处理,得到对应的待匹配归一化时序组的步骤,包括:将该待检测归一化时序组所对应的所述多种工业传感器的归一化工业时序片段及数
据关联关系输入到所述编码单元中,调用所述编码单元中的每个编码模块通过长短期记忆网络从接收到的归一化时序数据处提取时间维度特征,而后通过图卷积网络将提取的时间维度特征嵌入到该待检测归一化时序组所对应的所述多种工业传感器的数据关联关系中进行时序编码,得到该编码模块输出的归一化编码时序数据;其中,所述编码单元中的排在串联首位的编码模块所接收到的归一化时序数据为该待检测归一化时序组所对应的所述多种工业传感器的归一化工业时序片段,所述编码单元中的除去排在串联首位的之外的每个编码模块所接收到的归一化时序数据为前一个编码模块输出的归一化编码时序数据;调用所述自注意力单元对多个编码模块各自在长短期记忆网络的最后一层网络架构处提取出的时间维度特征进行注意力评估,得到各个编码模块的注意力加权隐藏状态表示;调用所述解码单元中的所有解码模块各自基于对应编码模块的注意力加权隐藏状态表示以及自身接收到的归一化时序数据进行解码重构,得到所述解码单元最终输出的与该待检测归一化时序组对应的待匹配归一化时序组;其中,所述解码单元中的排在串联首位的解码模块所接收到的归一化时序数据为所述编码单元中的排在串联末位的编码模块所输出的归一化编码时序数据,所述解码单元中的除去排在串联首位的解码模块之外的每个解码模块接收到的归一化时序数据为前一个解码模块的解码重构结果。5.根据权利要求1所述的方法,其特征在于,所述待匹配归一化时序组包括所述多种工业传感器各自在对应数据采集时间段内的归一化重构时序片段,则针对每个待检测归一化时序组,将该待检测归一化时序组与对应的待匹配归一化时序组进行时序比对,得到所述待检测时间序列组的与该待检测归一化时序组对应的时序异常检测结果的步骤,包括:针对每种工业传感器,计算该种工业传感器所对应的归一化工业时序片段与归一化重构时序片段之间的误差异常分数;确定该种工业传感器在该待检测归一化时序组的数据采集时间段内的异常分数阈值;将该种工业传感器的误差异常分数与对应的异常分数阈值进行比较;在该种工业传感器的误差异常分数大于对应的异常分数阈值的情况下,判定该种工业传感器在所述待检测时间序列组处的与该待检测归一化时序组的数据采集时间段对应的工业时序片段数据存在异常。6.根据权利要求1-5中任意一项所述的方法,其特征在于,所述方法还包括:获取至少一种训练工业场景各自对应的数据正常的多个归一化训练时序组以及每个归一化训练时序组所对应的多种工业传感器的数据关联关系,其中每个归一化训练时序组包括多种工业传感器各自在对应数据采集时间段内的归一化训练时序数据;根据至少一种训练工业场景各自对应的多个归一化训练时序组以及每个归一化训练时序组所对应的多种工业传感器的数据关联关系,在基于图结构学习的自编码器集成学习模型上进行时序重构模型训练,得到所述多元时序重构模型。7.一种多元时序异常检测装置,其特征在于,所述装置包括:检测数据获取模块,用于获取目标工业场景下的待检测时间序列组,其中所述待检测时间序列组包括数据采集时机保持一致的多种工业传感器各自对应的工业时序数据;时序预处理模块,用于对所述待检测时间序列组进行数据预处理,得到多个待检测归一化时序组,其中每个待检测归一化时序组单独对应一个数据采集时间段,每个待检测归
一化时序组包括所述多种工业传感器各自在对应数据采集时间段内的归一化工业时序片段;关联关系提取模块,用于针对每个待检测归一化时序组,根据该待检测归一化时序组包括的多种工业传感器各自的归一化工业时序片段,提取所述多种工业传感器在该待检测归一化时序组处的数据关联关系;多元时序重构模块,用于将该待检测归一化时序组所对应的所述多种工业传感器的归一化工业时序片段及数据关联关系输入到预存的多元时序重构模型中进行时序重构处理,得到对应的待匹配归一化时序组;时序异常检测模块,用于将该待检测归一化时序组与对应的待匹配归一化时序组进行时序比对,得到所述待检测时间序列组的与该待检测归一化时序组对应的时序异常检测结果。8.根据权利要求7所述的装置,其特征在于,所述装置还包括:训练数据获取模块,用于获取至少一种训练工业场景各自对应的数据正常的多个归一化训练时序组以及每个归一化训练时序组所对应的多种工业传感器的数据关联关系,其中每个归一化训练时序组包括多种工业传感器各自在对应数据采集时间段内的归一化训练时序数据;重构模型训练模块,用于根据至少一种训练工业场景各自对应的多个归一化训练时序组以及每个归一化训练时序组所对应的多种工业传感器的数据关联关系,在基于图结构学习的自编码器集成学习模型上进行时序重构模型训练,得到所述多元时序重构模型。9.一种计算机设备,其特征在于,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机程序,所述处理器可执行所述计算机程序,以实现权利要求1-6中任意一项所述的多元时序异常检测方法。10.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现权利要求1-6中任意一项所述的多元时序异常检测方法。
技术总结
本申请提供一种多元时序异常检测方法及装置、计算机设备和存储介质,涉及信息技术领域。本申请通过对目标工业场景下的待检测时间序列组进行数据预处理,并针对处理出的每个待检测归一化时序组,根据其包括的多种工业传感器各自在对应数据采集时间段内的归一化工业时序片段,提取多种工业传感器的数据关联关系,接着将对应的归一化工业时序片段及数据关联关系输入到多元时序重构模型中进行时序重构,然后将该待检测归一化时序组与对应重构出的待匹配归一化时序组进行时序比对,得到待检测时间序列组的时序异常检测结果,从而在多元时间序列场景下结合多种信息变量之间的数据相关性从时间维度层面实现对复杂信息异常的精准检测效果。精准检测效果。精准检测效果。
技术研发人员:
郭晓辉 赵赢 牟许东 王瑞
受保护的技术使用者:
北京航空航天大学杭州创新研究院
技术研发日:
2022.11.25
技术公布日:
2023/3/24