低保数据分析方法、系统及终端设备

阅读: 评论:0

著录项
  • CN201910203652.8
  • 20190318
  • CN110070450A
  • 20190730
  • 中科恒运股份有限公司
  • 许国杰;任晓德;钟秋发;鲍正
  • G06Q40/08
  • G06Q40/08 G06F16/25 G06F16/2458

  • 河北省石家庄市新石北路368号物联网大厦北楼1001-1020室
  • 河北(13)
  • 石家庄国为知识产权事务所
  • 米文智
摘要
本发明适用于数据分析技术领域,公开了一种低保数据分析方法、系统及终端设备,包括:获取低保数据,并对低保数据进行数据预处理;基于预处理后的低保数据,对低保家庭的各个属性进行相关性分析,得到不同属性之间的相关性系数;对预处理后的低保数据进行聚类分析,并统计聚类后的各个低保类别的特征;根据预处理后的低保数据,对低保家庭数量进行预测得到低保家庭预测量,并对保障房申请家庭数量进行预测得到保障房申请家庭预测量;根据预处理后的低保数据,对低保家庭的人均收入的各个影响因素进行分析,得到各个影响因素的排序。本发明能够对低保数据进行深入分析和挖掘,得到更多有效信息,供相关部门进行相关决策使用。
权利要求

1.一种低保数据分析方法,其特征在于,包括:

获取低保数据,并对所述低保数据进行数据预处理;

基于预处理后的低保数据,对低保家庭的各个属性进行相关性分析,得到不同属性之间的相关性系数;

对所述预处理后的低保数据进行聚类分析,并统计聚类后的各个低保类别的特征;

根据所述预处理后的低保数据,对低保家庭数量进行预测得到低保家庭预测量,并对保障房申请家庭数量进行预测得到保障房申请家庭预测量;

根据所述预处理后的低保数据,对低保家庭的人均收入的各个影响因素进行分析,得到各个影响因素的排序。

2.根据权利要求1所述的低保数据分析方法,其特征在于,所述基于预处理后的低保数据,对低保家庭的各个属性进行相关性分析,得到不同属性之间的相关性系数,包括:

获取用户选取的相关性分析模型;

根据所述相关性分析模型和所述预处理后的低保数据,对低保家庭的各个属性进行相关性分析,得到不同属性之间的相关性系数。

3.根据权利要求1所述的低保数据分析方法,其特征在于,所述对所述预处理后的低保数据进行聚类分析,并统计聚类后的各个低保类别的特征,包括:

获取用户选取的聚类模型和聚类后的类别数量;

根据所述聚类模型,对所述预处理后的低保数据进行聚类分析,将所述预处理后的低保数据划分为多个低保类别,所述低保类别的数量为所述聚类后的类别数量;

统计每个低保类别的聚类中心的属性值、每个低保类别包含的低保家庭的数量以及每个低保类别包含的低保家庭的数量占总低保家庭数量的比例。

4.根据权利要求1所述的低保数据分析方法,其特征在于,所述根据所述预处理后的低保数据,对人均收入的各个影响因素进行分析,得到各个影响因素的排序,包括:

根据所述预处理后的低保数据,获取历史低保家庭数量,并根据所述历史低保家庭数量,对预设的回归模型进行训练,得到训练完成后的回归模型;

根据所述训练完成后的回归模型,对低保家庭数量进行预测,得到低保家庭预测量;

根据所述预处理后的低保数据,获取历史保障房申请家庭数量;

对所述历史保障房申请家庭数量进行时序分析,并根据预设模型,对保障房申请家庭数量进行预测得到保障房申请家庭预测量。

5.根据权利要求1所述的低保数据分析方法,其特征在于,所述根据所述预处理后的低保数据,对低保家庭的人均收入的各个影响因素进行分析,得到各个影响因素的排序,包括:

根据所述预处理后的低保数据,计算低保家庭的人均收入的各个影响因素的影响度;

按照从大到小的顺序,对所述各个影响因素的影响度进行排序,得到各个影响因素的排序。

6.根据权利要求1至5任一项所述的低保数据分析方法,其特征在于,在所述根据所述预处理后的低保数据,对低保家庭的人均收入的各个影响因素进行分析,得到各个影响因素的排序之后,所述方法还包括:

根据所述相关性系数、所述各个低保类别的特征、所述低保家庭预测量、所述保障房申请家庭预测量和所述各个影响因素的排序,对所述预处理后的低保数据进行分析和挖掘。

7.一种低保数据分析系统,其特征在于,包括:

数据获取模块,用于获取低保数据,并对所述低保数据进行数据预处理;

相关性分析模块,用于基于预处理后的低保数据,对低保家庭的各个属性进行相关性分析,得到不同属性之间的相关性系数;

聚类分析模块,用于对所述预处理后的低保数据进行聚类分析,并统计聚类后的各个低保类别的特征;

预测模块,用于根据所述预处理后的低保数据,对低保家庭数量进行预测得到低保家庭预测量,并对保障房申请家庭数量进行预测得到保障房申请家庭预测量;

影响因素分析模块,用于根据所述预处理后的低保数据,对低保家庭的人均收入的各个影响因素进行分析,得到各个影响因素的排序。

8.根据权利要求7所述的低保数据分析系统,其特征在于,所述相关性分析模块包括:

相关性分析模型获取单元,用于获取用户选取的相关性分析模型;

相关性分析单元,用于根据所述相关性分析模型和所述预处理后的低保数据,对低保家庭的各个属性进行相关性分析,得到不同属性之间的相关性系数。

9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述低保数据分析方法的步骤。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被一个或多个处理器执行时实现如权利要求1至6任一项所述低保数据分析方法的步骤。

说明书
技术领域

本发明属于数据分析技术领域,尤其涉及一种低保数据分析方法、系统及终端设备。

低保数据分析是指以家庭低保为单位,评估低保和困难补助等社会福利申请者的经济情况,以便于相关部门根据分析结果进行相应的决策。

目前,低保数据分析只是简单核对低保家庭是否符合低保标准,低保金的发放是否正确等等,无法为相关部门进行决策提供有效信息。

有鉴于此,本发明实施例提供了一种低保数据分析方法、系统及终端设备,以解决现有技术中,只是简单核对低保家庭是否符合低保标准,低保金的发放是否正确等等,无法为相关部门进行决策提供有效信息的问题。

本发明实施例的第一方面提供了一种低保数据分析方法,包括:

获取低保数据,并对低保数据进行数据预处理;

基于预处理后的低保数据,对低保家庭的各个属性进行相关性分析,得到不同属性之间的相关性系数;

对预处理后的低保数据进行聚类分析,并统计聚类后的各个低保类别的特征;

根据预处理后的低保数据,对低保家庭数量进行预测得到低保家庭预测量,并对保障房申请家庭数量进行预测得到保障房申请家庭预测量;

根据预处理后的低保数据,对低保家庭的人均收入的各个影响因素进行分析,得到各个影响因素的排序。

本发明实施例的第二方面提供了一种低保数据分析系统,包括:

数据获取模块,用于获取低保数据,并对低保数据进行数据预处理;

相关性分析模块,用于基于预处理后的低保数据,对低保家庭的各个属性进行相关性分析,得到不同属性之间的相关性系数;

聚类分析模块,用于对预处理后的低保数据进行聚类分析,并统计聚类后的各个低保类别的特征;

预测模块,用于根据预处理后的低保数据,对低保家庭数量进行预测得到低保家庭预测量,并对保障房申请家庭数量进行预测得到保障房申请家庭预测量;

影响因素分析模块,用于根据预处理后的低保数据,对低保家庭的人均收入的各个影响因素进行分析,得到各个影响因素的排序。

本发明实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如第一方面所述低保数据分析方法的步骤。

本发明实施例的第四方面提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被一个或多个处理器执行时实现如第一方面所述低保数据分析方法的步骤。

本发明实施例与现有技术相比存在的有益效果是:本发明实施例首先获取低保数据,并对低保数据进行数据预处理,然后基于预处理后的低保数据,对低保家庭的各个属性进行相关性分析,得到不同属性之间的相关性系数,对预处理后的低保数据进行聚类分析,并统计聚类后的各个低保类别的特征,接着根据预处理后的低保数据,对低保家庭数量进行预测得到低保家庭预测量,并对保障房申请家庭数量进行预测得到保障房申请家庭预测量,最后根据预处理后的低保数据,对低保家庭的人均收入的各个影响因素进行分析,得到各个影响因素的排序,能够对低保数据进行深入分析和挖掘,得到更多有效信息,供相关部门进行相关决策使用。

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本发明一实施例提供的低保数据分析方法的实现流程示意图;

图2是本发明另一实施例提供的低保数据分析方法的实现流程示意图;

图3是本发明一实施例提供的低保数据分析系统的示意框图;

图4是本发明一实施例提供的终端设备的示意框图。

以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。

为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。

图1是本发明一实施例提供的低保数据分析方法的实现流程示意图,为了便于说明,仅示出了与本发明实施例相关的部分。本发明实施例的执行主体可以是终端设备。

如图1所示,该方法可以包括以下步骤:

步骤S101:获取低保数据,并对低保数据进行数据预处理。

在本发明实施例中,可以通过对接低保相关部门的系统来获取低保数据,也可以通过用户上传数据来获取低保数据。低保数据可以是历年来统计的低保家庭的相关信息,具体可以是历年来,每个月或每个季度统计的低保家庭的相关信息,可以包括历年来,每个月或每个季度统计的低保家庭的数量和每个低保家庭的属性。每个低保家庭的属性可以包括致贫原因、家庭人口数量、就业情况、人均收入、最差健康状况、最严重残疾等级、最高文化程度、家庭老幼占比、在读学生占比、残疾占比、重病占比、平均年龄和平均劳动能力等信息中的一种或多种。

对低保数据进行数据预处理可以包括对低保数据进行清洗和标准化,具体可以为采用现有方法,对不完整的数据、错误的数据和重复的数据进行一致性检查、无效值和缺失值处理;然后将数据标准化。

步骤S102:基于预处理后的低保数据,对低保家庭的各个属性进行相关性分析,得到不同属性之间的相关性系数。

在本发明实施例中,可以采用预设的相关性分析模型,根据预处理后的低保数据,对低保家庭的各个属性进行相关性分析,得到不同属性之间的相关性系数。

步骤S103:对预处理后的低保数据进行聚类分析,并统计聚类后的各个低保类别的特征。

在本发明实施例中,可以采用预设的聚类模型,将预处理后的低保数据划分为多个低保类别,并统计聚类后的各个低保类别的特征。

具体地,可以针对某一年、某个季度或某个月的低保数据进行聚类分析,获得该某一年、该某个季度或该某个月的低保家庭的特点。

步骤S104:根据预处理后的低保数据,对低保家庭数量进行预测得到低保家庭预测量,并对保障房申请家庭数量进行预测得到保障房申请家庭预测量。

在本发明实施例中,根据预处理后的低保数据,可以得到过去每年、每个季度或每个月的低保家庭数量和保障房申请家庭数量。

可以根据过去每年的低保家庭数量进行预测,得到未来每年的低保家庭预测量;可以根据过去每个季度的低保家庭数量进行预测,得到未来每个季度的低保家庭预测量;或者,可以根据过去每个月的低保家庭数量进行预测,得到未来每个月的低保家庭预测量。

可以根据过去每年的保障房申请家庭数量进行预测,得到未来每年的保障房申请家庭预测量;可以根据过去每个季度的保障房申请家庭数量进行预测,得到未来每个季度的保障房申请家庭预测量;或者,可以根据过去每个月的保障房申请家庭数量进行预测,得到未来每个月的保障房申请家庭预测量。

步骤S105:根据预处理后的低保数据,对低保家庭的人均收入的各个影响因素进行分析,得到各个影响因素的排序。

在本发明实施例中,对低保家庭的人均收入的影响因素可以根据专家经验给出,可以包括平均年龄、平均劳动能力、最高文化程度、家庭老幼占比、家庭人口数量、家庭重病占比、残疾占比、最差健康状况、最严重残疾等级和就业状况中的一种或多种。

可以根据预处理后的低保数据,得到低保家庭的人均收入和人均收入的各个影响因素的参数值,根据该参数值进行分析,得到各个影响因素的排序。

由上述描述可知,本发明实施例可以获取低保家庭的不同属性之间的相关性系数,可以对低保数据进行聚类分析,得到不同类别的低保家庭的特征,可以对低保家庭数量和保障房申请家庭数量进行预测,可以对低保家庭的人均收入的各个影响因素进行分析,能够对低保数据进行深入分析和挖掘,得到更多有效信息,供相关部门进行相关决策使用。

在本发明的一个实施例中,上述步骤S102可以包括以下步骤:

获取用户选取的相关性分析模型;

根据相关性分析模型和预处理后的低保数据,对低保家庭的各个属性进行相关性分析,得到不同属性之间的相关性系数。

在本发明实施例中,用户可以从预设的多个相关性分析模型中选取一个相关性分析模型。终端设备获取用户选取的相关性分析模型。

根据预处理后的低保数据,可以得到待进行相关性分析的低保家庭的各个属性的相关数据,根据该相关数据,采用用户选取的相关性分析模型,对低保家庭的各个属性进行相关性分析,得到不同属性之间的相关性系数。

示例性地,用户选取的相关性分析模式为皮尔逊相关系数模型,低保家庭的属性包括致贫原因、家庭人口数量、就业状况、最差健康状况、最严重残疾等级、最高文化程度、在读学生占比和残疾占比。从预处理后的低保数据中,获取与上述低保家庭的各个属性相关的属性特征数据,并采用皮尔逊相关系数模型,根据该属性特征数据,计算各个属性之间的相关性系数。

由上述描述可知,本发明实施例可以计算低保家庭的各个属性之间的相关性系数,可以根据该相关性系数确定各个属性之间是否存在某种依存关系。

在本发明的一个实施例中,上述步骤S103可以包括以下步骤:

获取用户选取的聚类模型和聚类后的类别数量;

根据聚类模型,对预处理后的低保数据进行聚类分析,将预处理后的低保数据划分为多个低保类别,低保类别的数量为聚类后的类别数量;

统计每个低保类别的聚类中心的属性值、每个低保类别包含的低保家庭的数量以及每个低保类别包含的低保家庭的数量占总低保家庭数量的比例。

在本发明实施例中,用户可以从预设的多个聚类模型中选取一个聚类模型,并设置聚类后的类别数量。终端设备获取用户选取的聚类模型和聚类后的类别数量。

可以从预处理后的低保数据中选取某一年、某个季度或某个月的低保数据,根据用户选取的聚类模型,将该某一年、该某个季度或该某个月的低保数据划分为多个低保类别,其中,低保类别的数量为用户设置的聚类后的类别数量。

根据聚类后的低保类别包含的各个低保家庭的相关信息,可以统计每个低保类别包含的低保家庭的数量和每个低保类别包含的低保家庭的数量占参加聚类分析的总的低保家庭的数量的比例;可以获取每个低保类别的聚类中心的属性值;可以展示聚类完成后的聚类图,即各个类别包含的低保家庭的分布图;还可以根据各个低保类别进一步统计不同类别的特点。

示例性地,用户选取的聚类模型为K均值聚类模型,设置的聚类后的低保类别为4。根据K均值聚类算法,对选取的某一年、某个季度或某个月的低保数据进行聚类分析,将该某一年、该某个季度或该某个月的低保数据划分为4个低保类别。统计4个低保类别分别包含的低保家庭的数量和占总的低保家庭的数量的比例,获取每个聚类中心的属性值,包括致贫原因、家庭人口数、平均劳动能力、最差健康状况、最高文化程度、在读学生占比、残疾占比和重病占比等属性值。

由上述描述可知,本发明实施例可以对低保数据进行聚类分析,将低保家庭划分为不同的类别,并统计不同类别的低保家庭的特征,帮助相关低保部门进行更有效的决策。

图2是本发明另一实施例提供的低保数据分析方法的实现流程示意图,为了便于说明,仅示出了与本发明实施例相关的部分。如图2所示,在上述实施例的基础上,上述步骤S104可以包括以下步骤:

步骤S201:根据预处理后的低保数据,获取历史低保家庭数量,并根据历史低保家庭数量,对预设的回归模型进行训练,得到训练完成后的回归模型。

其中,历史低保家庭数量可以包括过去每年的低保家庭数量、过去每个季度的低保家庭数量或过去每个月的低保家庭数量。预设的回归模型可以为逐步回归模型。

在本发明实施例中,可以根据过去每年的低保家庭数量对逐步回归模型进行训练,得到训练完成后的回归模型,将该回归模型称为第一回归模型,第一回归模型可以预测未来每年的低保家庭数量。

可以根据过去每个季度的低保家庭数量对逐步回归模型进行训练,得到训练完成后的回归模型,将该回归模型称为第二回归模型,第二回归模型可以预测未来每个季度的低保家庭数量。

或者,可以根据过去每个月的低保家庭数量对逐步回归模型进行训练,得到训练完成后的回归模型,将该回归模型称为第三回归模型,第三回归模型可以预测未来每个月的低保家庭数量。

步骤S202:根据训练完成后的回归模型,对低保家庭数量进行预测,得到低保家庭预测量。

其中,低保家庭预测量为预测的低保家庭的数量。

在本发明实施例中,可以根据第一回归模型,得到未来每年的低保家庭预测量;可以根据第二回归模型,得到未来每个季度的低保家庭预测量;或者,可以根据第三回归模型,得到未来每个月的低保家庭预测量。

步骤S203:根据预处理后的低保数据,获取历史保障房申请家庭数量。

其中,历史保障房申请家庭数量可以包括过去每年的保障房申请家庭数量、过去每个季度的保障房申请家庭数量或过去每个月的保障房申请家庭数量。

根据预处理后的低保数据,可以得到上述历史保障房申请家庭数量。

步骤S204:对历史保障房申请家庭数量进行时序分析,并根据预设模型,对保障房申请家庭数量进行预测得到保障房申请家庭预测量。

其中,预设模型可以为一次平滑模型。用户可以设置一次平滑模型的平滑系数。保障房申请家庭预测量为预测的保障房申请家庭的数量。

在本发明实施例中,可以对过去每年的保障房申请家庭数量进行时序分析,根据一次平滑模型,预测未来每年的保障房申请家庭数量;可以对过去每个季度的保障房申请家庭数量进行时序分析,根据一次平滑模型,预测未来每个季度的保障房申请家庭数量;或者,可以对过去每个月的保障房申请家庭数量进行时序分析,根据一次平滑模型,预测未来每个月的保障房申请家庭数量。

由上述描述可知,本发明实施例可以预测未来的低保家庭数量和保障房申请家庭的数量,可以为低保救助系统提前准备物资、资金和保障房提供数据依据,可以提高救助资金和物资的使用效率,确保每年的保障房满足需求。

在本发明的一个实施例中,上述步骤S105可以包括以下步骤:

根据预处理后的低保数据,计算低保家庭的人均收入的各个影响因素的影响度;

按照从大到小的顺序,对各个影响因素的影响度进行排序,得到各个影响因素的排序。

在本发明实施例中,可以根据专家经验确定对低保家庭的人均收入有影响的影响因素,利用现有方法,根据预处理后的低保数据,计算各个影响因素对低保家庭的人均收入的影响度。将各个影响因素的影响度按照从大到小的顺序进行排序,可以到对人均收入影响最大的影响因素。

由上述描述可知,本发明实施例可以分析得到各个影响因素对人均收入的影响程度,可以使低保救助部门有针对性地对低保人员进行救助,使低保救助部门在进行低保救助时效率更高。

在本发明的一个实施例中,在步骤S105之后,上述方法还可以包括:

根据相关性系数、各个低保类别的特征、低保家庭预测量、保障房申请家庭预测量和各个影响因素的排序,对预处理后的低保数据进行分析和挖掘。

在本发明实施例中,可以采用现有方法,根据相关性系数、各个低保类别的特征、低保家庭预测量、保障房申请家庭预测量和各个影响因素的排序,对低保数据进行进一步地分析和挖掘,以便于相关部门根据进一步分析和挖掘的结果,为低保家庭提供更好的帮助与支持。

应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。

图3是本发明一实施例提供的低保数据分析系统的示意框图,为了便于说明,仅示出与本发明实施例相关的部分。

在本发明实施例中,上述低保数据分析系统3可以包括:

数据获取模块31,用于获取低保数据,并对低保数据进行数据预处理;

相关性分析模块32,用于基于预处理后的低保数据,对低保家庭的各个属性进行相关性分析,得到不同属性之间的相关性系数;

聚类分析模块33,用于对预处理后的低保数据进行聚类分析,并统计聚类后的各个低保类别的特征;

预测模块34,用于根据预处理后的低保数据,对低保家庭数量进行预测得到低保家庭预测量,并对保障房申请家庭数量进行预测得到保障房申请家庭预测量;

影响因素分析模块35,用于根据预处理后的低保数据,对低保家庭的人均收入的各个影响因素进行分析,得到各个影响因素的排序。

可选地,相关性分析模块32可以包括:

相关性分析模型获取单元,用于获取用户选取的相关性分析模型;

相关性分析单元,用于根据相关性分析模型和预处理后的低保数据,对低保家庭的各个属性进行相关性分析,得到不同属性之间的相关性系数。

可选地,聚类分析模块33包括:

聚类模型获取单元,用于获取用户选取的聚类模型和聚类后的类别数量;

聚类分析单元,用于根据聚类模型,对预处理后的低保数据进行聚类分析,将预处理后的低保数据划分为多个低保类别,低保类别的数量为聚类后的类别数量;

统计单元,用于统计每个低保类别的聚类中心的属性值、每个低保类别包含的低保家庭的数量以及每个低保类别包含的低保家庭的数量占总低保家庭数量的比例。

可选地,预测模块34可以包括:

训练单元,用于根据预处理后的低保数据,获取历史低保家庭数量,并根据历史低保家庭数量,对预设的回归模型进行训练,得到训练完成后的回归模型;

第一预测单元,用于根据训练完成后的回归模型,对低保家庭数量进行预测,得到低保家庭预测量;

历史数据获取单元,用于根据预处理后的低保数据,获取历史保障房申请家庭数量;

第二预测单元,用于对历史保障房申请家庭数量进行时序分析,并根据预设模型,对保障房申请家庭数量进行预测得到保障房申请家庭预测量。

可选地,影响因素分析模块35可以包括:

影响度计算单元,用于根据预处理后的低保数据,计算低保家庭的人均收入的各个影响因素的影响度;

排序单元,用于按照从大到小的顺序,对各个影响因素的影响度进行排序,得到各个影响因素的排序。

可选地,上述低保数据分析系统3还可以包括:

分析和挖掘模块,用于根据相关性系数、各个低保类别的特征、低保家庭预测量、保障房申请家庭预测量和各个影响因素的排序,对预处理后的低保数据进行分析和挖掘。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述低保数据分析系统的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述装置中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

本发明一实施例提供了低保数据分析系统的总体架构。低保数据分析系统的总体架构包括数据采集层、存储计算层、业务应用、支撑服务层和前端展示层。

数据采集层是整个系统的基础,支撑应用架构中的数据获取功能,完成对外部数据源的抽取、转换、加载及清洗转换任务。所使用的ETL(Extract-Transform-Load,萃取-转置-加载)工具封装了JDBC、ODBC和JNDI接口,以元数据驱动和工作流的方式执行对数据库、文件系统、Excel、Xml、LDAP、SOAP/WebServcie、CSV文件和RSS等各种数据源的访问,并可实现对数据库集和数据分区的批量访问。系统同时提供图形化的配置界面和监控日志功能,能够大大提高数据采集效率。数据采集层可以与相关部门的系统进行对接,将相关部门的数据集中起来,实现部门间的信息资源共享。

存储计算层是整个系统的核心,存储计算层由数据仓库和大数据基础处理平台组成。其中数据仓库是由各部门先建立其各自的数据集市,然后在此基础上逐步建造全局的数据仓库。即先建立部门的数据集市,以递增、进化的方式实现数据仓库的建立。存储计算层可以根据数据量大小选择使用单机版存储方式(适用于数据量不大的情况)或者分布式版存储方式(适用于海量数据的情况)。

大数据基础计算平台同样可以根据计算任务量的大小程度来选择单机版或者是分布式版。单机版计算平台适用于数据量不大、计算任务简单的情况;而分布式版利用Map/Reduce分布式计算提供统一计算服务。统一计算是一个数据中心架构,在一个高可用性系统中整合了计算、网络、存储访问与虚拟化功能,可在显著降低数据中心总体成本的同时,有效提高灵活性和响应能力。

业务应用层以应用服务平台和应用构件为基础,向最终用户提供业务处理功能的各类应用系统,可以采用机器学习相关算法,利用采集的数据进行分析,包括:低保相关性分析、低保家庭聚类分析、低保家庭数量预测、保障房申请家庭数量预测和人均收入影响因素分析等。

支撑服务层为各类应用系统提供各种基础服务管理功能,包括系统管理和元数据管理。系统管理提供基于各个应用系统的任务管理、日志管理、权限管理和配置管理等功能。元数据管理提供基于各个应用系统的数据定义、数据管理、数据模型设计和数据立方体建模等功能。

前端展示层为用户访问和管理应用系统提供了统一入口和展示界面。界面风格人性化,界面风格适合大多数用户的体验效果,美观性好,可以增加用户使用的舒适度。界面的结构清晰且一致,风格统一,操作起来比较简单。

低保数据分析系统可以适应于多种平台,采用面向服务的架构设计,能够融合和充分利用已有的基础,集成低保相关信息资源,同时便于各系统快速地开发和易于扩展。用户在使用时,会有提示信息,在用户不知道怎样使用时或者用户在使用时出现错误时会出现相应的提示信息,让用户能迅速理解和转向正确方法;提供默认选项,让用户以最少的知识就能在常规场景下更好地使用;提供灵活性的选项,让用户可以组合出更强大的功能。

图4是本发明一实施例提供的终端设备的示意框图。如图4所示,该实施例的终端设备4包括:一个或多个处理器40、存储器41以及存储在所述存储器41中并可在所述处理器40上运行的计算机程序42。所述处理器40执行所述计算机程序42时实现上述各个低保数据分析方法实施例中的步骤,例如图1所示的步骤S101至S105。或者,所述处理器40执行所述计算机程序42时实现上述低保数据分析系统实施例中各模块/单元的功能,例如图3所示模块31至35的功能。

示例性地,所述计算机程序42可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器41中,并由所述处理器40执行,以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序42在所述终端设备4中的执行过程。例如,所述计算机程序42可以被分割成数据获取模块、相关性分析模块、聚类分析模块、预测模块和影响因素分析模块,各个模块的具体功能如下:

数据获取模块,用于获取低保数据,并对低保数据进行数据预处理;

相关性分析模块,用于基于预处理后的低保数据,对低保家庭的各个属性进行相关性分析,得到不同属性之间的相关性系数;

聚类分析模块,用于对预处理后的低保数据进行聚类分析,并统计聚类后的各个低保类别的特征;

预测模块,用于根据预处理后的低保数据,对低保家庭数量进行预测得到低保家庭预测量,并对保障房申请家庭数量进行预测得到保障房申请家庭预测量;

影响因素分析模块,用于根据预处理后的低保数据,对低保家庭的人均收入的各个影响因素进行分析,得到各个影响因素的排序。

其它模块或者单元可参照图4所示的实施例中的描述,在此不再赘述。

所述终端设备4可以是手机、平板电脑、笔记本等计算设备。所述终端设备4包括但不仅限于处理器40、存储器41。本领域技术人员可以理解,图4仅仅是终端设备的一个示例,并不构成对终端设备4的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备4还可以包括输入设备、输出设备、网络接入设备、总线等。

所述处理器40可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器41可以是所述终端设备的内部存储单元,例如终端设备的硬盘或内存。所述存储器41也可以是所述终端设备的外部存储设备,例如所述终端设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器41还可以既包括终端设备的内部存储单元也包括外部存储设备。所述存储器41用于存储所述计算机程序42以及所述终端设备所需的其他程序和数据。所述存储器41还可以用于暂时地存储已经输出或者将要输出的数据。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

在本申请所提供的实施例中,应该理解到,所揭露的低保数据分析系统和方法,可以通过其它的方式实现。例如,以上所描述的低保数据分析系统实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。

以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

本文发布于:2023-04-14 21:10:59,感谢您对本站的认可!

本文链接:https://patent.en369.cn/patent/4/86709.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 369专利查询检索平台 豫ICP备2021025688号-20 网站地图