1.本技术涉及云计算技术领域,特别是涉及一种监控告警方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术:
2.
单元是一个能完成所有业务操作的自包含集合,在这个集合中包含了所有业务所需的所有服务,以及分配给这个单元的数据。单元化架构就是把单元作为系统部署的基本单位,在全站所有机房中部署数个单元,任意一个单元都部署了系统所需的所有应用,数据则是全量数据按照某种维度(通常是客户维度)水平划分后的一部分。单元化是将服务和数据设计改造让其符合单元特征的过程。
3.单元化系统在运行过程中,会产生数据,如业务数据和日志数据。为了保证单元化系统的正常运行,需要对单元化系统的数据进行监控,以及时发现单元化系统的异常运行情况,并告警通知单元化系统的运维人员。
4.然而,目前缺乏适用于单元化系统的监控告警方法。
技术实现要素:
5.基于此,有必要针对上述技术问题,提供一种能够适用于单元化系统的监控告警方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
6.第一方面,本技术提供了一种监控告警方法。
所述方法包括:
7.基于预设的数据获取规则,获取已存储的单元化监控
信息;所述单元化监控信息包括单元化元数据和所述单元化元数据对应的监控数据;所述单元化元数据表示单元化系统中的单元的单元类型;
8.根据所述单元化监控信息、预设的监控告警类别和所述监控告警类别对应的告警判定规则,确定所述监控告警类别对应的告警判定信息;
9.根据所述告警判定信息和预设的告警方式规则,发送所述监控告警类别对应的告警信息;所述告警信息用于对单元化系统进行监控告警。
10.在其中一个实施例中,在监控告警类别为单元内流量告警的情况下,所述根据所述单元化监控信息、预设的监控告警类别和所述监控告警类别对应的告警判定规则,确定所述监控告警类别对应的告警判定信息包括:
11.按照单元类型,对所述单元化监控信息分类,确定各所述单元类型对应的单元化监控信息;
12.针对每一个单元类型,根据所述单元类型对应的单元化监控信息和预设的监控指标,计算在所述单元类型下的各所述监控指标的计算结果;
13.针对每一项监控指标,根据所述监控指标的计算结果,确定在所述单元类型下的所述监控指标对应的告警判定信息;所述告警判定信息用于表示是否触发告警动作;
14.将在各所述单元类型下的各所述监控指标对应的告警判定信息,构成所述单元内
流量告警对应的告警判定信息。
15.在其中一个实施例中,所述根据所述单元类型对应的单元化监控信息和预设的监控指标,计算在所述单元类型下的各所述监控指标的计算结果包括:
16.根据所述单元类型对应的单元化监控信息和预设的第一监控指标,计算并存储在单位时间内,在所述单元类型下的各所述第一监控指标的计算结果;
17.根据已存储的在各所述单位时间内,在所述单元类型下的各所述第一监控指标的计算结果和预设的第二监控指标,计算各所述第二监控指标的计算结果;所述第二监控指标包括所述第一监控指标的同比和所述第一监控指标的环比;
18.将各所述第一监控指标的计算结果和各所述第二监控指标的计算结果,构成在所述单元类型下的各所述监控指标的计算结果。
19.在其中一个实施例中,在监控告警类别为跨单元异常流量告警的情况下,所述根据所述单元化监控信息、预设的监控告警类别和所述监控告警类别对应的告警判定规则,确定所述监控告警类别对应的告警判定信息包括:
20.针对所述单元化监控信息中的每一笔交易,确定所述交易经过的各
节点;
21.针对每一个节点,将所述节点的时间戳与所述节点的节点信息之间建立映射关系;所述节点信息至少包括单元类型;
22.按照时间的先后顺序,对所述各节点对应的映射关系进行排序,并根据排序后的映射关系,确定所述交易经过所述各节点的节点顺序;
23.根据所述节点顺序中的节点的单元类型的单元类型数量,确定所述交易对应的告警判定信息;所述告警判定信息用于表示是否触发告警动作;
24.将各所述交易对应的告警判定信息,构成所述跨单元异常流量告警对应的告警判定信息。
25.在其中一个实施例中,所述告警方式规则包括告警等级判定规则和告警发送规则;所述根据所述告警判定信息和预设的告警方式规则,发送所述监控告警类别对应的告警信息包括:
26.根据目标告警模板和所述告警判定信息,生成告警内容;所述告警内容包括告警类型;
27.根据所述告警内容和预设的告警等级判定规则,确定所述告警内容对应的告警等级;
28.根据预设的告警发送规则、所述告警内容和所述告警等级,确定并发送所述监控告警类别对应的告警信息。
29.在其中一个实施例中,所述根据预设的告警发送规则、所述告警内容和所述告警等级,确定并发送所述监控告警类别对应的告警信息包括:
30.判断在已发送的各告警信息对应的告警类型中是否存在所述告警类型;
31.若在已发送的各告警信息对应的告警类型中存在所述告警类型,则更新所述告警类型的告警次数;
32.根据所述告警内容、所述告警等级和预设的扫描时间内的所述告警类型的告警次数,确定所述监控告警类别对应的告警信息,并发送所述告警信息。
33.在其中一个实施例中,所述方法还包括:
34.检查是否存在个性设置告警模板;
35.在存在所述个性设置告警模板的情况下,检查所述个性设置告警模板是否满足预设的告警模板条件;
36.在所述个性设置告警模板满足预设的告警模板条件的情况下,将所述个性设置告警模板,作为目标告警模板。
37.在其中一个实施例中,所述根据所述告警判定信息和预设的告警方式规则,发送所述监控告警类别对应的告警信息包括:
38.针对每一笔交易,检查所述交易对应的告警判定信息的告警信息接口是否关闭;
39.若所述告警信息接口未关闭,则根据所述交易对应的所述告警判定信息和预设的告警方式规则,发送所述交易对应的告警信息。
40.在其中一个实施例中,所述方法还包括:
41.接收单元化系统发送的切换告警指令;所述切换告警指令包括切换告警信息;所述切换告警信息是单元化系统根据所述单元化系统的节点切换情况生成的告警信息;
42.响应于所述切换告警指令,根据所述切换告警信息和预设的告警方式规则,发送告警信息。
43.第二方面,本技术还提供了一种监控告警装置。所述装置包括:
44.获取模块,用于基于预设的数据获取规则,获取已存储的单元化监控信息;所述单元化监控信息包括单元化元数据和所述单元化元数据对应的监控数据;所述单元化元数据表示单元化系统中的单元的单元类型;
45.第一确定模块,用于根据所述单元化监控信息、预设的监控告警类别和所述监控告警类别对应的告警判定规则,确定所述监控告警类别对应的告警判定信息;
46.第一发送模块,用于根据所述告警判定信息和预设的告警方式规则,发送所述监控告警类别对应的告警信息;所述告警信息用于对单元化系统进行监控告警。
47.在其中一个实施例中,在监控告警类别为单元内流量告警的情况下,所述第一确定模块,具体用于:
48.按照单元类型,对所述单元化监控信息分类,确定各所述单元类型对应的单元化监控信息;
49.针对每一个单元类型,根据所述单元类型对应的单元化监控信息和预设的监控指标,计算在所述单元类型下的各所述监控指标的计算结果;
50.针对每一项监控指标,根据所述监控指标的计算结果,确定在所述单元类型下的所述监控指标对应的告警判定信息;所述告警判定信息用于表示是否触发告警动作;
51.将在各所述单元类型下的各所述监控指标对应的告警判定信息,构成所述单元内流量告警对应的告警判定信息。
52.在其中一个实施例中,所述第一确定模块,具体用于:
53.根据所述单元类型对应的单元化监控信息和预设的第一监控指标,计算并存储在单位时间内,在所述单元类型下的各所述第一监控指标的计算结果;
54.根据已存储的在各所述单位时间内,在所述单元类型下的各所述第一监控指标的计算结果和预设的第二监控指标,计算各所述第二监控指标的计算结果;所述第二监控指标包括所述第一监控指标的同比和所述第一监控指标的环比;
55.将各所述第一监控指标的计算结果和各所述第二监控指标的计算结果,构成在所述单元类型下的各所述监控指标的计算结果。
56.在其中一个实施例中,在监控告警类别为跨单元异常流量告警的情况下,所述第一确定模块,具体用于:
57.针对所述单元化监控信息中的每一笔交易,确定所述交易经过的各节点;
58.针对每一个节点,将所述节点的时间戳与所述节点的节点信息之间建立映射关系;所述节点信息至少包括单元类型;
59.按照时间的先后顺序,对所述各节点对应的映射关系进行排序,并根据排序后的映射关系,确定所述交易经过所述各节点的节点顺序;
60.根据所述节点顺序中的节点的单元类型的单元类型数量,确定所述交易对应的告警判定信息;所述告警判定信息用于表示是否触发告警动作;
61.将各所述交易对应的告警判定信息,构成所述跨单元异常流量告警对应的告警判定信息。
62.在其中一个实施例中,所述告警方式规则包括告警等级判定规则和告警发送规则;所述第一发送模块,具体用于:
63.根据目标告警模板和所述告警判定信息,生成告警内容;所述告警内容包括告警类型;
64.根据所述告警内容和预设的告警等级判定规则,确定所述告警内容对应的告警等级;
65.根据预设的告警发送规则、所述告警内容和所述告警等级,确定并发送所述监控告警类别对应的告警信息。
66.在其中一个实施例中,所述第一发送模块,具体用于:
67.判断在已发送的各告警信息对应的告警类型中是否存在所述告警类型;
68.若在已发送的各告警信息对应的告警类型中存在所述告警类型,则更新所述告警类型的告警次数;
69.根据所述告警内容、所述告警等级和预设的扫描时间内的所述告警类型的告警次数,确定所述监控告警类别对应的告警信息,并发送所述告警信息。
70.在其中一个实施例中,所述装置还包括:
71.第一检查模块,用于检查是否存在个性设置告警模板;
72.第二检查模块,用于在存在所述个性设置告警模板的情况下,检查所述个性设置告警模板是否满足预设的告警模板条件;
73.第二确定模块,用于在所述个性设置告警模板满足预设的告警模板条件的情况下,将所述个性设置告警模板,作为目标告警模板。
74.在其中一个实施例中,所述第一发送模块,具体用于:
75.针对每一笔交易,检查所述交易对应的告警判定信息的告警信息接口是否关闭;
76.若所述告警信息接口未关闭,则根据所述交易对应的所述告警判定信息和预设的告警方式规则,发送所述交易对应的告警信息。
77.在其中一个实施例中,所述装置还包括:
78.接收模块,用于接收单元化系统发送的切换告警指令;所述切换告警指令包括切
换告警信息;所述切换告警信息是单元化系统根据所述单元化系统的节点切换情况生成的告警信息;
79.第二发送模块,用于响应于所述切换告警指令,根据所述切换告警信息和预设的告警方式规则,发送告警信息。
80.第三方面,本技术还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的步骤。
81.第四方面,本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述的步骤。
82.第五方面,本技术还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述第一方面所述的步骤。
83.上述监控告警方法、装置、计算机设备、存储介质和计算机程序产品,基于预设的数据获取规则,获取已存储的单元化监控信息;所述单元化监控信息包括单元化元数据和所述单元化元数据对应的监控数据;所述单元化元数据表示单元化系统中的单元的单元类型;根据所述单元化监控信息、预设的监控告警类别和所述监控告警类别对应的告警判定规则,确定所述监控告警类别对应的告警判定信息;根据所述告警判定信息和预设的告警方式规则,发送所述监控告警类别对应的告警信息;所述告警信息用于对单元化系统进行监控告警。这样,通过根据已存储的单元化监控信息,确定预设的监控告警类别对应的告警判定信息,并根据该监控告警类别对应的告警判定信息,发送该监控告警类别对应的告警信息,能够及时发现单元化系统的异常运行情况,实现对单元化系统的数据的监控告警。
附图说明
84.图1为一个实施例中单元化监控系统的结构图;
85.图2为一个实施例中单元化系统的结构图;
86.图3为一个实施例中监控告警方法的流程示意图;
87.图4为一个实施例中确定监控告警类别对应的告警判定信息步骤的流程示意图;
88.图5为一个实施例中计算在该单元类型下的各监控指标的计算结果步骤的流程示意图;
89.图6为另一个实施例中确定监控告警类别对应的告警判定信息步骤的流程示意图;
90.图7为一个实施例中发送该监控告警类别对应的告警信息步骤的流程示意图;
91.图8为一个实施例中确定并发送监控告警类别对应的告警信息步骤的流程示意图;
92.图9为另一个实施例中监控告警方法的流程示意图;
93.图10为另一个实施例中发送该监控告警类别对应的告警信息步骤的流程示意图;
94.图11为另一个实施例中监控告警方法的流程示意图;
95.图12为一个实施例中监控告警装置的结构框图;
96.图13为一个实施例中计算机设备的内部结构图。
具体实施方式
97.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
98.本技术实施例提供的监控告警方法,可以应用于如图1所示的应用环境中。其中,单元化监控系统100包括采集端102、数据处理节点104和服务器节点106。单元化监控系统用于对单元化系统进行监控。单元化监控系统可以通过云计算平台实现。例如,单元化监控系统可以通过平台即服务(platform as aservice,paas)实现。可以理解的是,单元化监控系统100包括的采集端102、数据处理节点104和服务器节点106可以用单独的硬件设备来实现,也可以用软件模块来实现。单元化系统为把单元作为系统部署的基本单位,任意一个单元都部署了系统所需的所有应用,任意一个单元的数据则是全量数据按照某种维度(通常是客户维度)水平划分后的一部分的系统。单元是一个能完成所有业务操作的自包含集合,在这个集合中包含了所有业务所需的所有服务,以及分配给这个单元的数据。单元可以为物理单元,也可以为逻辑单元。可以理解的是,单元可以为终端,也可以为服务器。服务器可以用独立的服务器或者是多个服务器组成的服务器集来实现。在一个实施例中,单元化系统包括:接入单元、分片单元和公共单元,如图2所示。接入单元包括应用节点a1。分片单元包括应用节点b1、应用节点c1、应用节点b2和应用节点c2。公共单元包括应用b代理层和应用节点d1。其中,接入单元为对数据接入的单元。分片单元为对数据进行处理的单元。公共单元为进行公共操作的单元。
99.在一个实施例中,如图3所示,提供了一种监控告警方法,以该方法应用于图1中的单元化监控系统为例进行说明,包括以下步骤:
100.步骤301,基于预设的数据获取规则,获取已存储的单元化监控信息。
101.其中,单元化监控信息包括单元化元数据和单元化元数据对应的监控数据。单元化元数据表示单元化系统中的单元的单元类型。
102.在本技术实施例中,监控数据可以是单元化系统的数据。单元化元数据为表示单元属性的元数据。单元化元数据可以包括物理元数据和逻辑元数据。物理元数据为表示物理单元属性的元数据。逻辑元数据为表示逻辑单元属性的元数据。物理单元为服务器等部署的机器环境所属的物理位置所在的单元。例如,a-001用于表示部署在地址a的001号单元的服务器。逻辑单元为具有一定业务含义的逻辑意义上的单元。例如,可以按照个人账户的卡尾号分成10个单元,person-01代表个人账户的卡尾号为1的单元。单元类型为单元化系统中单元的类型。例如,单元化系统可以包括:接入单元、分片单元和公共单元。接入单元为对数据接入的单元。分片单元为对数据进行处理的单元。公共单元为进行公共操作的单元。分片单元包括:分片单元1,分片单元2,分片单元3和分片单元4。分片单元1的单元类型为分片单元1。
103.服务器节点从存储单元化监控信息的存储空间中,获取单元化监控信息。其中,单元化监控信息可以为单元化监控系统采集后直接存储的监控信息,也可以为单元化监控系统对采集的数据进行数据处理后再存储得到的监控信息。
104.步骤302,根据单元化监控信息、预设的监控告警类别和监控告警类别对应的告警判定规则,确定监控告警类别对应的告警判定信息。
105.在本技术实施例中,服务器节点预先设定监控告警类别。其中,监控告警类别包括:单元内流量告警和跨单元异常流量告警。然后,服务器节点根据单元化监控信息、监控告警类别和监控告警类别对应的告警判定规则,确定监控告警类别对应的告警判定信息。
106.步骤303,根据告警判定信息和预设的告警方式规则,发送该监控告警类别对应的告警信息。
107.其中,告警信息用于对单元化系统进行监控告警。
108.在本技术实施例中,服务器节点根据告警判定信息和预设的告警方式规则,生成该监控告警类别对应的告警信息。然后,服务器节点发送该监控告警类别对应的告警信息。
109.上述流量观测方法中,基于预设的数据获取规则,获取已存储的单元化监控信息;根据单元化监控信息、预设的监控告警类别和监控告警类别对应的告警判定规则,确定监控告警类别对应的告警判定信息;根据告警判定信息和预设的告警方式规则,发送该监控告警类别对应的告警信息。这样,通过根据已存储的单元化监控信息,确定预设的监控告警类别对应的告警判定信息,并根据该监控告警类别对应的告警判定信息,发送该监控告警类别对应的告警信息,能够及时发现单元化系统的异常运行情况,实现对单元化系统的数据的监控告警。
110.在一个实施例中,如图4所示,在监控告警类别为单元内流量告警的情况下,根据单元化监控信息、预设的监控告警类别和监控告警类别对应的告警判定规则,确定监控告警类别对应的告警判定信息的具体过程包括以下步骤:
111.步骤401,按照单元类型,对单元化监控信息分类,确定各单元类型对应的单元化监控信息。
112.在本技术实施例中,服务器节点按照单元类型,对单元化监控信息分类,得到各单元类型对应的单元化监控信息。
113.在一个示例中,服务器节点预先设定正常数据条件。然后,服务器节点根据预设的正常数据条件和单元化监控信息,确定单元化监控信息中的正常数据。具体的,服务器节点将满足预设的正常数据条件的单元化监控信息,作为单元化监控信息中的正常数据。然后,服务器节点按照单元类型,对单元化监控信息中的正常数据分类,得到各单元类型对应的单元化监控信息。其中,正常数据条件为在单元化监控信息中确定正常数据的条件。正常数据条件可以为单元化监控信息包括单元化指标类型的类型标识,还可以为单元化监控信息包括的单元化指标类型的类型标识为预设的类型标识。类型标识用于表示单元化监控信息的单元化指标类型。单元化指标类型可以包括指标类、系统类和链路类。指标类的单元化监控信息为与交易动作有关、且不涉及交易链路的单元化监控信息,指标类的单元化监控信息用于衡量一个交易成功与否。指标类的单元化监控信息包括但不限于交易量、交易耗时、交易是否成功和交易异常类型。系统类的单元化监控信息为与交易有关的操作系统的数据。系统类的单元化监控信息包括但不限于操作系统的java虚拟机(java virtual machine,jvm)的监控数据和操作系统(operating system,os)的监控数据。链路类的单元化监控信息为与交易动作有关、且涉及交易链路的单元化监控信息,链路类的单元化监控信息用于表示交易链路。交易链路为一个交易会涉及的一连串的服务。例如,支付交易涉及多个服务,在支付前会调用协议查询服务、黑名单检验服务、客户鉴权服务等等一连串的服务,这整个链路的数据串在一起就是一个完成的支付交易。链路类的单元化监控信息包括
但不限于链路环节和调用关系。
114.步骤402,针对每一个单元类型,根据该单元类型对应的单元化监控信息和预设的监控指标,计算在该单元类型下的各监控指标的计算结果。
115.在本技术实施例中,服务器节点预先设定监控指标。其中,监控指标为对单元化系统进行监控的指标。监控指标包括但不限于交易笔数、平均响应耗时、失败笔数、失败异常类型、交易抖动次数、交易突增突降笔数和交易突增突降持续时间。然后,针对每一个单元类型,服务器节点根据该单元类型对应的单元化监控信息、各监控指标和各监控指标对应的计算规则,计算在该单元类型下的各监控指标的计算结果。
116.步骤403,针对每一项监控指标,根据该监控指标的计算结果,确定在该单元类型下的该监控指标对应的告警判定信息。
117.其中,告警判定信息用于表示是否触发告警动作。
118.在本技术实施例中,针对每一项监控指标,服务器节点预先设定该项监控指标的阈值。然后,服务器节点将该监控指标的计算结果与该项监控指标的阈值进行比较。若该监控指标的计算结果大于或等于该项监控指标的阈值,则触发告警动作。若该监控指标的计算结果小于该项监控指标的阈值,则不触发告警动作。
119.在一个实施例中,监控指标为平均响应时间。服务器节点预先设定平均响应时间的阈值为30毫秒。然后,服务器节点将该监控指标的计算结果与该项监控指标的阈值进行比较。若该监控指标的计算结果大于或等于该项监控指标的阈值,则触发告警动作。若该监控指标的计算结果小于该项监控指标的阈值,则不触发告警动作。
120.然后,服务器节点根据是否触发告警动作,确定在该单元类型下的该监控指标对应的告警判定信息。其中,告警判定信息至少包括是否触发告警动作。
121.在一个示例中,服务器节点将是否触发告警动作,作为在该单元类型下的该监控指标对应的告警判定信息。
122.在另一个示例中,服务器节点根据该监控指标是否触发告警动作,确定该监控指标对应的指标异常信息。其中,指标异常信息表示异常的监控指标。指标异常信息包括监控指标的监控指标标识。然后,服务器节点将是否触发告警动作和指标异常信息,作为在该单元类型下的该监控指标对应的告警判定信息。
123.步骤404,将在各单元类型下的各监控指标对应的告警判定信息,构成单元内流量告警对应的告警判定信息。
124.在本技术实施例中,服务器节点将在各单元类型下的各监控指标对应的告警判定信息,构成单元内流量告警对应的告警判定信息。
125.上述流量观测方法中,按照单元类型,对单元化监控信息分类,确定各单元类型对应的单元化监控信息;针对每一个单元类型,根据该单元类型对应的单元化监控信息和预设的监控指标,计算在该单元类型下的各监控指标的计算结果;针对每一项监控指标,根据该监控指标的计算结果,确定在该单元类型下的该监控指标对应的告警判定信息;将在各单元类型下的各监控指标对应的告警判定信息,构成单元内流量告警对应的告警判定信息。这样,通过对已存储的单元化监控信息按照单元类型进行汇聚计算,分别确定在各单元类型下的各监控指标对应的告警判定信息,再根据在各单元类型下的各监控指标对应的告警判定信息,确定该监控告警类别对应的告警判定信息,能够通过各项预设的监控指标对
单元化系统的数据进行监控,实时发现单元化系统的单元内流量的异常运行情况,并进行告警,提高对单元化系统的监控告警的即时性。
126.在一个实施例中,如图5所示,根据该单元类型对应的单元化监控信息和预设的监控指标,计算在该单元类型下的各监控指标的计算结果包括:
127.步骤501,根据该单元类型对应的单元化监控信息和预设的第一监控指标,计算并存储在单位时间内,在该单元类型下的各第一监控指标的计算结果。
128.在本技术实施例中,服务器节点预先设定单位时间。
129.在一个示例中,服务器节点接收到用户通过前端界面选择的设定时间。然后,服务器节点可以将该设定时间,作为单位时间。
130.在另一个示例中,若服务器节点未接收到用户通过前端界面选择的设定时间,服务器节点可以将该默认时间作为单位时间。例如,默认时间可以为1小时。
131.同时,服务器节点预先设定第一监控指标。其中,第一监控指标为在单位时间内对单元化系统进行监控的指标。第一监控指标包括但不限于交易笔数、平均响应耗时、失败笔数、失败异常类型、交易抖动次数、交易突增突降笔数和交易突增突降持续时间。然后,服务器节点根据该单元类型对应的单元化监控信息、各第一监控指标和各第一监控指标对应的计算规则,计算在单位时间内,在该单元类型下的各第一监控指标的计算结果。然后,服务器节点存储在单位时间内,在该单元类型下的各第一监控指标的计算结果。
132.在一个示例中,服务器节点将在单位时间内,在该单元类型下的各第一监控指标的计算结果,存储到单元内流量预警小时表中。
133.步骤502,根据已存储的在各单位时间内,在该单元类型下的各第一监控指标的计算结果和预设的第二监控指标,计算各第二监控指标的计算结果。
134.其中,第二监控指标包括第一监控指标的同比和第一监控指标的环比。
135.在本技术实施例中,服务器节点预先设定第二监控指标。其中,第二监控指标用于表示在各单位时间内的第一监控指标的变化。然后,服务器节点获取已存储的在各单位时间内,在该单元类型下的各第一监控指标的计算结果。在一个示例中,服务器节点可以定时扫描单元内流量预警小时表中的第一监控指标的计算结果。然后,服务器节点根据已存储的在各单位时间内,在该单元类型下的各第一监控指标的计算结果、各第二监控指标和各第二监控指标对应的计算规则,计算各第二监控指标的计算结果。
136.步骤503,将各第一监控指标的计算结果和各第二监控指标的计算结果,构成在该单元类型下的各监控指标的计算结果。
137.在本技术实施例中,服务器节点将各第一监控指标的计算结果和各第二监控指标的计算结果,构成在该单元类型下的各监控指标的计算结果。
138.上述流量观测方法中,根据该单元类型对应的单元化监控信息和预设的第一监控指标,计算并存储在单位时间内,在该单元类型下的各第一监控指标的计算结果;根据已存储的在各单位时间内,在该单元类型下的各第一监控指标的计算结果和预设的第二监控指标,计算各第二监控指标的计算结果;将各第一监控指标的计算结果和各第二监控指标的计算结果,构成在该单元类型下的各监控指标的计算结果。这样,通过对已存储的单元化监控信息按照单元类型进行汇聚计算,不仅计算第一监控指标的计算结果,还计算第二监控指标的计算结果,不仅能够在各单位时间内对单元化系统进行实时监控,还能够通过在各
单位时间内的第一监控指标的变化,预测单元化系统即将出现的异常,让运维人员提前介入,防患于未然,提高对单元化系统的监控告警的预见性,进一步提高对单元化系统的监控告警的即时性和有效性。同时,计算第二监控指标能够从更长的时间范围内对单元化系统的监控数据进行分析,从更广的视觉监控到数据的异常,实现从多角度监控单元化系统。
139.在一个实施例中,第一监控指标为平均响应耗时,单位时间为1小时,第一监控指标为平均响应耗时的环比增长速度。服务器节点获取已存储的1小时前的平均响应耗时为25毫秒,2小时前的平均响应耗时为15毫秒,3小时前的平均响应耗时为14毫秒。然后,服务器节点根据已存储的在各单位时间内,在该单元类型下的各第一监控指标的计算结果、第二监控指标和第二监控指标对应的计算规则,计算1小时前的平均响应耗时的环比增长速度为66.7%,计算2小时前的平均响应耗时的环比增长速度为7.1%。然后,服务器节点将第一监控指标的计算结果和第二监控指标的计算结果,构成在该单元类型下的监控指标的计算结果。然后,针对第一监控指标平均响应耗时,服务器节点将平均响应耗时的各计算结果与平均响应耗时的阈值30毫秒进行比较。平均响应耗时的各计算结果均小于平均响应耗时的阈值,则均不触发告警动作。同时,针对第二监控指标平均响应耗时的环比增长速度,服务器节点将平均响应耗时的环比增长速度的各计算结果与平均响应耗时的环比增长速度的阈值30%进行比较。2小时前的平均响应耗时的环比增长速度的计算结果小于平均响应耗时的环比增长速度的阈值,则不触发告警动作。1小时前的平均响应耗时的环比增长速度的计算结果大于平均响应耗时的环比增长速度的阈值,则触发告警动作。然后,服务器节点根据是否触发告警动作,确定在该单元类型下的各监控指标对应的告警判定信息。可见,虽然近三小时内的平均响应耗时都在监控阈值的正常范围内,但最近1小时比2小时前却又很大的增幅,这种增幅异常往往是程序出现异常的前兆。这样通过同时采用第一监控指标和第二监控指标,能够通过更广范围的监控将这些异常分析出来,让运维人员提前介入,防患于未然,提高对单元化系统的监控告警的预见性,进一步提高对单元化系统的监控告警的即时性和有效性。
140.在一个实施例中,如图6所示,在监控告警类别为跨单元异常流量告警的情况下,根据单元化监控信息、预设的监控告警类别和监控告警类别对应的告警判定规则,确定监控告警类别对应的告警判定信息的具体过程包括以下步骤:
141.步骤601,针对单元化监控信息中的每一笔交易,确定该交易经过的各节点。
142.在本技术实施例中,针对单元化监控信息中的每一笔交易,服务器节点根据该笔交易的交易信息,确定该交易经过的各节点。其中,单元化系统的单元内包括多个节点。节点可以为服务器节点。
143.步骤602,针对每一个节点,将该节点的时间戳与该节点的节点信息之间建立映射关系。
144.其中,节点信息至少包括单元类型。
145.在本技术实施例中,服务器节点根据该笔交易的交易信息,确定各节点对应的时间戳和各节点对应的节点信息。其中,节点信息为单元化系统的单元的信息。节点信息还可以包括耗时。然后,针对每一个节点,服务器节点将该节点的时间戳与该节点的节点信息之间建立映射关系。
146.步骤603,按照时间的先后顺序,对各节点对应的映射关系进行排序,并根据排序
后的映射关系,确定该交易经过各节点的节点顺序。
147.在本技术实施例中,服务器节点按照时间的先后顺序,对各节点对应的映射关系进行排序。然后,服务器节点按照排序后的映射关系中各节点的排序,作为该交易经过各节点的节点顺序。
148.步骤604,根据该节点顺序中的节点的单元类型的单元类型数量,确定该交易对应的告警判定信息。
149.其中,告警判定信息用于表示是否触发告警动作。
150.在本技术实施例中,服务器节点预先设定一笔交易对应的类别数阈值。其中,类别数阈值可以为3、4或5。例如,类别数阈值可以为5。然后,服务器节点根据在该节点顺序中的各节点对应的单元类型,计算该节点顺序中的单元类型的类别数。然后,服务器节点将该节点顺序对应的类别数与类别数阈值进行比较。若该节点顺序对应的类别数小于类别数阈值,则不触发告警动作。若该节点顺序对应的类别数大于或等于类别数阈值,则触发告警动作。
151.在一个示例中,服务器节点预先设定一笔交易对应的类别数阈值和分片单元数阈值。其中,分片单元数阈值可以为2。然后,服务器节点根据在该节点顺序中的各节点对应的单元类型,计算该节点顺序中的单元类型的类别数。然后,服务器节点将该节点顺序对应的类别数与类别数阈值进行比较。若该节点顺序对应的类别数小于类别数阈值,则不触发告警动作。若该节点顺序对应的类别数大于或等于类别数阈值,则触发告警动作。同时,服务器节点根据在该节点顺序中的各节点对应的单元类型,计算该节点顺序中的单元类型为分片单元的分片单元数。然后,服务器节点将该节点顺序对应的分片单元数与分片单元数阈值进行比较。若该节点顺序对应的分片单元数小于分片单元数阈值,则不触发告警动作。若该节点顺序对应的分片单元数大于或等于分片单元数阈值,则触发告警动作。
152.然后,服务器节点根据是否触发告警动作,确定该交易对应的告警判定信息。其中,告警判定信息至少包括是否触发告警动作。
153.在一个示例中,服务器节点将是否触发告警动作,作为该交易对应的告警判定信息。
154.在另一个示例中,在触发告警动作的同时,服务器节点生成该触发告警动作对应的跨单元异常流量告警标识。其中,跨单元异常流量告警标识用于表示跨单元异常流量告警的类别。跨单元异常流量告警的类别包括单元类型类别数异常和分片单元数异常。然后,服务器节点根据该交易的跨单元异常流量告警标识,确定该交易对应的跨单元异常信息。其中,跨单元异常信息包括跨单元异常流量告警标识。具体的,服务器节点可以将该交易的跨单元异常流量告警标识,作为该交易对应的跨单元异常信息。然后,服务器节点将是否触发告警动作和跨单元异常信息,作为该交易对应的告警判定信息。
155.步骤605,将各交易对应的告警判定信息,构成跨单元异常流量告警对应的告警判定信息。
156.在本技术实施例中,服务器节点将各交易对应的告警判定信息,构成跨单元异常流量告警对应的告警判定信息。
157.上述流量观测方法中,针对单元化监控信息中的每一笔交易,确定该交易经过的各节点;针对每一个节点,将该节点的时间戳与该节点的节点信息之间建立映射关系;按照
时间的先后顺序,对各节点对应的映射关系进行排序,并根据排序后的映射关系,确定该交易经过各节点的节点顺序;根据该节点顺序中的节点的单元类型的单元类型数量,确定该交易对应的告警判定信息;将各交易对应的告警判定信息,构成跨单元异常流量告警对应的告警判定信息。这样,通过一笔交易经过的节点的单元类型的数量,判断该笔交易是否存在跨单元异常,是否触发告警动作,能够从单元维度的流量分布是否均衡、流量经过单元个数、流量流向等多个角度对单元化系统进行监控分析,实现对单元化系统的跨单元异常流量的监控。并且,这样通过一笔交易的分片单元数对单元化系统的数据进行监控,能够及时发现单元化系统可能存在的跨单元异常运行情况,并进行告警,进一步提高对单元化系统的监控告警的即时性。
158.在一个实施例中,如图7所示,告警方式规则包括告警等级判定规则和告警发送规则;根据告警判定信息和预设的告警方式规则,发送该监控告警类别对应的告警信息的具体过程包括以下步骤:
159.步骤701,根据目标告警模板和告警判定信息,生成告警内容。
160.其中,告警内容包括告警类型。
161.在本技术实施例中,服务器节点预先确定目标告警模板。在一个示例中,服务器节点可以预先存储默认告警模板。然后,服务器节点可以将默认告警模板作为目标告警模板。其中,默认告警模板可以包括:告警时间和告警类型。例如,默认告警模板可以为在告警时间a,告警类型为b,涉及交易笔数为c,影响范围为d。告警类型为触发告警动作的异常事件的类型。告警类型可以包括:单元内流量告警和跨单元异常流量告警。单元内流量告警可以包括各监控指标异常告警。跨单元异常流量告警可以包括单元类型类别数异常告警和分片单元数异常告警。
162.然后,服务器节点根据告警判定信息,确定告警时间和告警类型。在一个示例中,服务器节点将告警判定信息生成的时间,作为告警时间。同时,服务器节点将告警判定信息中包括的监控指标标识或跨单元异常流量告警标识,确定告警类型。然后,服务器节点按照目标告警模板,将告警时间和告警类型转换成告警内容。
163.步骤702,根据告警内容和预设的告警等级判定规则,确定告警内容对应的告警等级。
164.在本技术实施例中,服务器节点预先设定告警等级判定规则。然后,服务器节点根据告警内容和告警等级判定规则,确定告警内容对应的告警等级。其中,告警等级判定规则用于判定告警内容对应的告警等级。告警等级表示告警的紧急程度。
165.在一个示例中,告警等级判定规则包括告警类型与告警等级之间的对应关系。然后,服务器节点根据告警类型与告警等级之间的对应关系、以及告警内容中的告警类型,确定告警内容对应的告警等级。
166.在一个实施例中,第二监控指标异常告警的告警类型对应的告警等级为仅次于紧急告警的告警等级。这样,针对单元化系统即将出现的异常,让运维人员尽快提前介入,防患于未然,进一步提高对单元化系统的监控告警的预见性,进一步提高对单元化系统的监控告警的即时性和有效性。
167.步骤703,根据预设的告警发送规则、告警内容和告警等级,确定并发送该监控告警类别对应的告警信息。
168.在本技术实施例中,服务器节点预先设定告警发送规则。其中,告警发送规则表示告警信息的发送方式。然后,服务器节点将告警内容和告警等级,构成该监控告警类别对应的告警信息。然后,服务器节点存储该报警信息。在一个示例中,服务器节点将该报警信息存储到告警列表中。同时,服务器节点根据告警发送规则,发送该告警信息。
169.在一个示例中,服务器节点根据告警发送规则和该告警信息的告警等级,确定该告警信息的发送时间。然后,服务器节点在该告警信息的发送时间,发送该告警信息。
170.上述流量观测方法中,根据目标告警模板和告警判定信息,生成告警内容;根据告警内容和预设的告警等级判定规则,确定告警内容对应的告警等级;根据预设的告警发送规则、告警内容和告警等级,确定并发送该监控告警类别对应的告警信息。这样,通过发送携带告警类型和告警等级的告警信息,使得工作人员能够根据告警类型及时确定单元化系统的故障,并根据告警等级合理安排对单元化系统的故障的处置时间,提高对单元化系统的监控告警的准确性和有效性。
171.在一个实施例中,如图8所示,根据预设的告警发送规则、告警内容和告警等级,确定并发送监控告警类别对应的告警信息的具体过程包括以下步骤:
172.步骤801,判断在已发送的各告警信息对应的告警类型中是否存在该告警类型。
173.在本技术实施例中,服务器节点获取已发送的各告警信息。在一个示例中,服务器节点从告警列表中获取已发送的各告警信息。然后,服务器节点将该告警类型与已发送的各告警信息对应的告警类型依次进行对比,判断在已发送的各告警信息对应的告警类型中是否存在该告警类型。
174.步骤802,若在已发送的各告警信息对应的告警类型中存在该告警类型,则更新该告警类型的告警次数。
175.在本技术实施例中,若在已发送的各告警信息对应的告警类型中存在该告警类型,则服务器节点将该告警类型的告警次数加1,完成该告警类型的告警次数的更新。
176.步骤803,根据告警内容、告警等级和预设的扫描时间内的该告警类型的告警次数,确定该监控告警类别对应的告警信息,并发送告警信息。
177.在本技术实施例中,服务器节点预先设定扫描时间。其中,扫描时间为一段时间。例如,扫描时间可以为5分钟。然后,服务器节点统计预设的扫描时间内的该告警类型的告警次数。然后,服务器节点将告警内容、告警等级和预设的扫描时间内的该告警类型的告警次数,构成该监控告警类别对应的告警信息。然后,服务器节点存储该报警信息。在一个示例中,服务器节点将该报警信息存储到告警列表中。同时,服务器节点根据告警发送规则,发送该告警信息。
178.在一个实施例中,监控告警类别对应的告警信息为“近五分钟内发生节点切换e次,请处理”。
179.上述流量观测方法中,判断在已发送的各告警信息对应的告警类型中是否存在该告警类型;若在已发送的各告警信息对应的告警类型中存在该告警类型,则更新该告警类型的告警次数;根据告警内容、告警等级和预设的扫描时间内的该告警类型的告警次数,确定该监控告警类别对应的告警信息,并发送告警信息。这样,通过对告警类型相同的告警信息进行告警压缩,并不直接发送大量重复的告警信息,而是将大量重复的告警信息压缩为一条发送给运维人员,减少了单元化系统异常发生后频繁告警导致的告警信息海啸的发
生,让运维人员关注有用的告警信息,防止被大量信息淹没,提高对单元化系统的监控告警的简洁性,进一步提高对单元化系统的监控告警的准确性和有效性。
180.在一个实施例中,如图9所示,监控告警方法还包括以下步骤:
181.步骤901,检查是否存在个性设置告警模板。
182.在本技术实施例中,服务器节点检查是否存在个性设置告警模板。具体的,服务器节点检查是否设置了个性化报警模板的标识。其中,个性设置告警模板为用户通过前端界面设置的非默认告警模板的告警模板。
183.步骤902,在存在个性设置告警模板的情况下,检查个性设置告警模板是否满足预设的告警模板条件。
184.在本技术实施例中,服务器节点预先设定告警模板条件。其中,告警模板条件用于衡量告警模板是否合格。告警模板条件可以包括告警内容长度和告警内容是否存在非法字符。例如,告警模板条件可以为告警内容长度小于1000个字和数字类型的告警内容是否存在非法字符。在存在个性设置告警模板的情况下,服务器节点检查个性设置告警模板是否满足告警模板条件。
185.在不存在个性设置告警模板的情况下,服务器节点将默认告警模板,作为目标告警模板。
186.步骤903,在个性设置告警模板满足预设的告警模板条件的情况下,将个性设置告警模板,作为目标告警模板。
187.在本技术实施例中,在个性设置告警模板满足预设的告警模板条件的情况下,服务器节点将个性设置告警模板,作为目标告警模板。
188.在个性设置告警模板不满足预设的告警模板条件的情况下,服务器节点将默认告警模板,作为目标告警模板。
189.上述流量观测方法中,检查是否存在个性设置告警模板;在存在个性设置告警模板的情况下,检查个性设置告警模板是否满足预设的告警模板条件;在个性设置告警模板满足预设的告警模板条件的情况下,将个性设置告警模板,作为目标告警模板。这样,在存在个性设置告警模板的情况下,对个性设置告警模板进行检查,将通过检查的个性设置告警模板作为目标告警模板,提高对单元化系统的监控告警的个性化。
190.在一个实施例中,如图10所示,根据告警判定信息和预设的告警方式规则,发送该监控告警类别对应的告警信息的具体过程包括以下步骤:
191.步骤1001,针对每一笔交易,检查该交易对应的告警判定信息的告警信息接口是否关闭。
192.在本技术实施例中,服务器节点预先提供各交易对应的告警判定信息的告警信息接口。其中,告警信息接口用于用户打开或者关闭该告警信息接口对应的告警信息。然后,针对每一笔交易,服务器节点检查该交易对应的告警判定信息的告警信息接口是否关闭。
193.步骤1002,若该告警信息接口未关闭,则根据该交易对应的告警判定信息和预设的告警方式规则,发送该交易对应的告警信息。
194.在本技术实施例中,若该告警信息接口未关闭,则服务器节点根据该交易对应的告警判定信息和预设的告警方式规则,发送该交易对应的告警信息。
195.若该告警信息接口关闭,则服务器节点根据预设的告警方式规则,不发送该交易
对应的告警信息。
196.上述流量观测方法中,针对每一笔交易,检查该交易对应的告警判定信息的告警信息接口是否关闭;若该告警信息接口未关闭,则根据该交易对应的告警判定信息和预设的告警方式规则,发送该交易对应的告警信息。单元化系统在部分场景下可能会发生跨单元,例如本单元内某个服务出现不可用,备用单元的服务接管了交易,则此时交易会转发到备用单元去,这时候一笔交易经过两个分片单元属于正常现象。这样,提供告警信息接口,当出现切换后会发生跨单元的场景,运维人员可调用告警信息接口将该告警信息关闭,并且,在后续发送告警信息之前,检测告警信息接口的开关,判断是否发送告警信息,能够结合单元化系统的实际情况,避免重复发送错误的告警信息,提高对单元化系统的监控告警的机动性,进一步提高对单元化系统的监控告警的准确性和有效性。
197.在一个实施例中,如图11所示,监控告警方法还包括以下步骤:
198.步骤1101,接收单元化系统发送的切换告警指令。
199.其中,切换告警指令包括切换告警信息。切换告警信息是单元化系统根据单元化系统的节点切换情况生成的告警信息。
200.在本技术实施例中,服务器节点接收单元化系统发送的切换告警指令。其中,切换告警指令用于指示服务器节点进行单元化系统的切换告警。切换告警信息表示单元化系统的切换情况。
201.单元化系统为分布式服务。当单元化系统的单元内服务出现异常等不可用场景时,单元化系统自动识别当前可用的节点,将交易转发到可用的节点进行处理。此时,单元化系统的服务运行态作了一次切换。然后,单元化系统根据转发情况,生成一条切换告警信息。例如,原本在x机器上交易,因为机器性能等其他原因导致x机器故障了,无法再交易,则单元化系统会将后续接入的交易转发至y机器,切换告警信息为“时间z发生x故障切换为y”。然后,单元化系统发送携带切换告警信息的切换告警指令。
202.步骤1102,响应于切换告警指令,根据切换告警信息和预设的告警方式规则,发送告警信息。
203.在本技术实施例中,服务器节点响应于切换告警指令,根据切换告警信息和预设的告警方式规则,生成告警信息。然后,服务器节点根据告警方式规则,发送告警信息。
204.上述流量观测方法中,接收单元化系统发送的切换告警指令;响应于切换告警指令,根据切换告警信息和预设的告警方式规则,发送告警信息。这样,通过提供接口,当分布式服务运行态产生告警时,将生成的切换告警信息通过调用接口告知服务器节点,服务器节点完成告警,实现对单元化系统监控的分布式流量切换告警,提高对单元化系统的监控告警的多样性。并且,由于单元化系统为分布式服务,存在大量的服务节点,且部署在云端容器中,当网络层抖动不可用时,存在大量节点间切换的场景。例如在5分钟内,可能发生数千笔切换,若直接发送数千条告警信息,会给运维人员造成很大的负担,并且重复类似的报警会导致运维人员忽略到其他有用的报警。若通过对告警类型相同的告警信息进行告警压缩,并不直接发送大量重复的告警信息,而是将大量重复的告警信息压缩为一条发送给运维人员,能够减少单元化系统异常发生后频繁告警导致的告警信息海啸的发生,让运维人员关注有用的告警信息,防止被大量信息淹没,提高对单元化系统的监控告警的简洁性,进一步提高对单元化系统的监控告警的准确性和有效性。
205.应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
206.基于同样的发明构思,本技术实施例还提供了一种用于实现上述所涉及的监控告警方法的监控告警装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个监控告警装置实施例中的具体限定可以参见上文中对于监控告警方法的限定,在此不再赘述。
207.在一个实施例中,如图12所示,提供了一种监控告警装置1200,包括:获取模块1210、第一确定模块1220和第一发送模块1230,其中:
208.获取模块1210,用于基于预设的数据获取规则,获取已存储的单元化监控信息;所述单元化监控信息包括单元化元数据和所述单元化元数据对应的监控数据;所述单元化元数据表示单元化系统中的单元的单元类型;
209.第一确定模块1220,用于根据所述单元化监控信息、预设的监控告警类别和所述监控告警类别对应的告警判定规则,确定所述监控告警类别对应的告警判定信息;
210.第一发送模块1230,用于根据所述告警判定信息和预设的告警方式规则,发送所述监控告警类别对应的告警信息;所述告警信息用于对单元化系统进行监控告警。
211.可选的,在监控告警类别为单元内流量告警的情况下,所述第一确定模块1220,具体用于:
212.按照单元类型,对所述单元化监控信息分类,确定各所述单元类型对应的单元化监控信息;
213.针对每一个单元类型,根据所述单元类型对应的单元化监控信息和预设的监控指标,计算在所述单元类型下的各所述监控指标的计算结果;
214.针对每一项监控指标,根据所述监控指标的计算结果,确定在所述单元类型下的所述监控指标对应的告警判定信息;所述告警判定信息用于表示是否触发告警动作;
215.将在各所述单元类型下的各所述监控指标对应的告警判定信息,构成所述单元内流量告警对应的告警判定信息。
216.可选的,所述第一确定模块1220,具体用于:
217.根据所述单元类型对应的单元化监控信息和预设的第一监控指标,计算并存储在单位时间内,在所述单元类型下的各所述第一监控指标的计算结果;
218.根据已存储的在各所述单位时间内,在所述单元类型下的各所述第一监控指标的计算结果和预设的第二监控指标,计算各所述第二监控指标的计算结果;所述第二监控指标包括所述第一监控指标的同比和所述第一监控指标的环比;
219.将各所述第一监控指标的计算结果和各所述第二监控指标的计算结果,构成在所述单元类型下的各所述监控指标的计算结果。
220.可选的,在监控告警类别为跨单元异常流量告警的情况下,所述第一确定模块
1220,具体用于:
221.针对所述单元化监控信息中的每一笔交易,确定所述交易经过的各节点;
222.针对每一个节点,将所述节点的时间戳与所述节点的节点信息之间建立映射关系;所述节点信息至少包括单元类型;
223.按照时间的先后顺序,对所述各节点对应的映射关系进行排序,并根据排序后的映射关系,确定所述交易经过所述各节点的节点顺序;
224.根据所述节点顺序中的节点的单元类型的单元类型数量,确定所述交易对应的告警判定信息;所述告警判定信息用于表示是否触发告警动作;
225.将各所述交易对应的告警判定信息,构成所述跨单元异常流量告警对应的告警判定信息。
226.可选的,所述告警方式规则包括告警等级判定规则和告警发送规则;所述第一发送模块1230,具体用于:
227.根据目标告警模板和所述告警判定信息,生成告警内容;所述告警内容包括告警类型;
228.根据所述告警内容和预设的告警等级判定规则,确定所述告警内容对应的告警等级;
229.根据预设的告警发送规则、所述告警内容和所述告警等级,确定并发送所述监控告警类别对应的告警信息。
230.可选的,所述第一发送模块1230,具体用于:
231.判断在已发送的各告警信息对应的告警类型中是否存在所述告警类型;
232.若在已发送的各告警信息对应的告警类型中存在所述告警类型,则更新所述告警类型的告警次数;
233.根据所述告警内容、所述告警等级和预设的扫描时间内的所述告警类型的告警次数,确定所述监控告警类别对应的告警信息,并发送所述告警信息。
234.可选的,所述装置1200还包括:
235.第一检查模块,用于检查是否存在个性设置告警模板;
236.第二检查模块,用于在存在所述个性设置告警模板的情况下,检查所述个性设置告警模板是否满足预设的告警模板条件;
237.第二确定模块,用于在所述个性设置告警模板满足预设的告警模板条件的情况下,将所述个性设置告警模板,作为目标告警模板。
238.可选的,所述第一发送模块1230,具体用于:
239.针对每一笔交易,检查所述交易对应的告警判定信息的告警信息接口是否关闭;
240.若所述告警信息接口未关闭,则根据所述交易对应的所述告警判定信息和预设的告警方式规则,发送所述交易对应的告警信息。
241.可选的,所述装置1200还包括:
242.接收模块,用于接收单元化系统发送的切换告警指令;所述切换告警指令包括切换告警信息;所述切换告警信息是单元化系统根据所述单元化系统的节点切换情况生成的告警信息;
243.第二发送模块,用于响应于所述切换告警指令,根据所述切换告警信息和预设的
告警方式规则,发送告警信息。
244.上述监控告警装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
245.在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图13所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过wifi、移动蜂窝网络、nfc(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种监控告警方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
246.本领域技术人员可以理解,图13中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
247.在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
248.在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述各方法实施例中的步骤。
249.在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
250.需要说明的是,本技术所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
251.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-only memory,rom)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(reram)、磁变存储器(magnetoresistive random access memory,mram)、铁电存储器(ferroelectric random access memory,fram)、相变存储器(phase change memory,pcm)、石墨烯存储器等。易失性存储器可包括随机存取存储器(random access memory,ram)或外部高速缓冲存储器等。作为说明而非局限,ram可以是多种形式,比如静态随机存取存储器(static random access memory,sram)或动态随机存取存储器(dynamic random access memory,dram)等。本技术所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,
不限于此。本技术所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
252.以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
253.以上所述实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本技术专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术的保护范围应以所附权利要求为准。
技术特征:
1.一种监控告警方法,其特征在于,所述方法包括:基于预设的数据获取规则,获取已存储的单元化监控信息;所述单元化监控信息包括单元化元数据和所述单元化元数据对应的监控数据;所述单元化元数据表示单元化系统中的单元的单元类型;根据所述单元化监控信息、预设的监控告警类别和所述监控告警类别对应的告警判定规则,确定所述监控告警类别对应的告警判定信息;根据所述告警判定信息和预设的告警方式规则,发送所述监控告警类别对应的告警信息;所述告警信息用于对单元化系统进行监控告警。2.根据权利要求1所述的方法,其特征在于,在监控告警类别为单元内流量告警的情况下,所述根据所述单元化监控信息、预设的监控告警类别和所述监控告警类别对应的告警判定规则,确定所述监控告警类别对应的告警判定信息包括:按照单元类型,对所述单元化监控信息分类,确定各所述单元类型对应的单元化监控信息;针对每一个单元类型,根据所述单元类型对应的单元化监控信息和预设的监控指标,计算在所述单元类型下的各所述监控指标的计算结果;针对每一项监控指标,根据所述监控指标的计算结果,确定在所述单元类型下的所述监控指标对应的告警判定信息;所述告警判定信息用于表示是否触发告警动作;将在各所述单元类型下的各所述监控指标对应的告警判定信息,构成所述单元内流量告警对应的告警判定信息。3.根据权利要求2所述的方法,其特征在于,所述根据所述单元类型对应的单元化监控信息和预设的监控指标,计算在所述单元类型下的各所述监控指标的计算结果包括:根据所述单元类型对应的单元化监控信息和预设的第一监控指标,计算并存储在单位时间内,在所述单元类型下的各所述第一监控指标的计算结果;根据已存储的在各所述单位时间内,在所述单元类型下的各所述第一监控指标的计算结果和预设的第二监控指标,计算各所述第二监控指标的计算结果;所述第二监控指标包括所述第一监控指标的同比和所述第一监控指标的环比;将各所述第一监控指标的计算结果和各所述第二监控指标的计算结果,构成在所述单元类型下的各所述监控指标的计算结果。4.根据权利要求1所述的方法,其特征在于,在监控告警类别为跨单元异常流量告警的情况下,所述根据所述单元化监控信息、预设的监控告警类别和所述监控告警类别对应的告警判定规则,确定所述监控告警类别对应的告警判定信息包括:针对所述单元化监控信息中的每一笔交易,确定所述交易经过的各节点;针对每一个节点,将所述节点的时间戳与所述节点的节点信息之间建立映射关系;所述节点信息至少包括单元类型;按照时间的先后顺序,对所述各节点对应的映射关系进行排序,并根据排序后的映射关系,确定所述交易经过所述各节点的节点顺序;根据所述节点顺序中的节点的单元类型的单元类型数量,确定所述交易对应的告警判定信息;所述告警判定信息用于表示是否触发告警动作;将各所述交易对应的告警判定信息,构成所述跨单元异常流量告警对应的告警判定信
息。5.根据权利要求1所述的方法,其特征在于,所述告警方式规则包括告警等级判定规则和告警发送规则;所述根据所述告警判定信息和预设的告警方式规则,发送所述监控告警类别对应的告警信息包括:根据目标告警模板和所述告警判定信息,生成告警内容;所述告警内容包括告警类型;根据所述告警内容和预设的告警等级判定规则,确定所述告警内容对应的告警等级;根据预设的告警发送规则、所述告警内容和所述告警等级,确定并发送所述监控告警类别对应的告警信息。6.根据权利要求5所述的方法,其特征在于,所述根据预设的告警发送规则、所述告警内容和所述告警等级,确定并发送所述监控告警类别对应的告警信息包括:判断在已发送的各告警信息对应的告警类型中是否存在所述告警类型;若在已发送的各告警信息对应的告警类型中存在所述告警类型,则更新所述告警类型的告警次数;根据所述告警内容、所述告警等级和预设的扫描时间内的所述告警类型的告警次数,确定所述监控告警类别对应的告警信息,并发送所述告警信息。7.根据权利要求5所述的方法,其特征在于,所述方法还包括:检查是否存在个性设置告警模板;在存在所述个性设置告警模板的情况下,检查所述个性设置告警模板是否满足预设的告警模板条件;在所述个性设置告警模板满足预设的告警模板条件的情况下,将所述个性设置告警模板,作为目标告警模板。8.根据权利要求4所述的方法,其特征在于,所述根据所述告警判定信息和预设的告警方式规则,发送所述监控告警类别对应的告警信息包括:针对每一笔交易,检查所述交易对应的告警判定信息的告警信息接口是否关闭;若所述告警信息接口未关闭,则根据所述交易对应的所述告警判定信息和预设的告警方式规则,发送所述交易对应的告警信息。9.根据权利要求1所述的方法,其特征在于,所述方法还包括:接收单元化系统发送的切换告警指令;所述切换告警指令包括切换告警信息;所述切换告警信息是单元化系统根据所述单元化系统的节点切换情况生成的告警信息;响应于所述切换告警指令,根据所述切换告警信息和预设的告警方式规则,发送告警信息。10.一种监控告警装置,其特征在于,所述装置包括:获取模块,用于基于预设的数据获取规则,获取已存储的单元化监控信息;所述单元化监控信息包括单元化元数据和所述单元化元数据对应的监控数据;所述单元化元数据表示单元化系统中的单元的单元类型;第一确定模块,用于根据所述单元化监控信息、预设的监控告警类别和所述监控告警类别对应的告警判定规则,确定所述监控告警类别对应的告警判定信息;第一发送模块,用于根据所述告警判定信息和预设的告警方式规则,发送所述监控告警类别对应的告警信息;所述告警信息用于对单元化系统进行监控告警。
11.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至9中任一项所述的方法的步骤。12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至9中任一项所述的方法的步骤。13.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至9中任一项所述的方法的步骤。
技术总结
本申请涉及一种监控告警方法、装置、计算机设备、存储介质和计算机程序产品,涉及云计算技术领域。所述方法包括:基于预设的数据获取规则,获取已存储的单元化监控信息;单元化监控信息包括单元化元数据和单元化元数据对应的监控数据;单元化元数据表示单元化系统中的单元的单元类型;根据单元化监控信息、预设的监控告警类别和监控告警类别对应的告警判定规则,确定监控告警类别对应的告警判定信息;根据告警判定信息和预设的告警方式规则,发送监控告警类别对应的告警信息;告警信息用于对单元化系统进行监控告警。采用本方法能够及时发现单元化系统的异常运行情况,实现对单元化系统的数据的监控告警。元化系统的数据的监控告警。元化系统的数据的监控告警。
技术研发人员:
王鹏培 杜楠 程鹏 唐月标
受保护的技术使用者:
中国工商银行股份有限公司
技术研发日:
2022.11.16
技术公布日:
2023/3/3