1.本发明涉及聚类算法领域,尤其是利用聚类分析形成工程量清单
单价区间大
数据的方法。
背景技术:
2.工程量清单是编制招标工程标底价,投标报价和工程结算时调整工程量的依据。在招投标阶段,招标工程量清单为投标人的投标竞争提供了一个平等和共同的基础。工程量清单将要求投标人完成的工程项目及其相应工程实体数量全部列出,为投标人提供拟建工程的基本内容、实体数量和质量要求等信息。在招投标过程中,招标人根据工程量清单编制招标工程的招标控制价;投标人按照工程量清单所表述的内容,依据企业定额计算投标价格,自主填报工程量清单所列项目的单价与合价。但在具体审查投标单位报价时,会将各投标单位的报价进行汇总分析,与内部标底进行对比,工程量清单所列项目的单价过高或过低都不能够中标,工程量清单单价受多种因素影响,且每日的单价都在浮动,很难界定工程量清单的单价区间。
技术实现要素:
3.本发明的目的是通过提出一种利用聚类分析形成工程量清单单价区间大数据的方法,以解决上述背景技术中提出的缺陷。
4.本发明采用的技术方案如下:
5.提供一种利用聚类分析形成工程量清单单价区间大数据的方法,包括如下步骤:
6.s1.1:获取工程量清单中所有的工程项目一月内每日的单价区间,以及相似工程的工程量项目清单;
7.s1.2:对于每日工程项目的单价区间、同类工程的工程量项目清单进行预处理;
8.s1.3:对预处理后的数据进行聚类分析;
9.s1.4:根据聚类分析结果生成工程清单单价区间大数据。
10.作为本发明的一种优选技术方案:所述s1.2中,对每一项工程项目的单价区间根据人工费、材料费、机械使用费和综合费用整合成工程量清单单价区间。
11.作为本发明的一种优选技术方案:所述s1.2中,对同类工程的工程量项目清单的单价区间进行整合获取同类工程量项目清单单价区间,并滤除数据噪声。
12.作为本发明的一种优选技术方案:所述s1.3中,聚类分析的具体流程如下:
13.s2.1:对于整合后的工程量清单单价区间进行聚类处理;
14.s2.2:对同类工程量项目清单单价区间进行聚类处理;
15.s1.3:将整合后的工程量清单单价区间聚类运算得到的大数据与同类工程量项目清单单价区间聚类运算得到的大数据进行归一化处理。
16.作为本发明的一种优选技术方案:所述聚类处理的具体算法步骤如下:
17.设工程量清单的单价样本数据为每个数据为各项费用的区间
型样本数据,表示为建立如下的目标函数:
[0018][0019]
其中:隶属度β
bj
的约束条件如下:
[0020][0021]
其中,θj表示单价区间样本数据的每日各类费用系数,为各类费用区间与各个聚类中心的距离,为聚类中心矩阵,m为聚类参数。
[0022]
作为本发明的一种优选技术方案:以区间上限、下限两端分别取平均值法确定初始类聚中心为:
[0023][0024][0025]
其中,为初始聚类中心的区间下限,为初始聚类中心的区间上限,1≤b≤d,获得初始聚类中心为
[0026]
作为本发明的一种优选技术方案:各类费用区间与聚类中心的距离计算如下:
[0027][0028]
其中,分别表示区间样本的下限、上限。
[0029]
作为本发明的一种优选技术方案:将增广拉格朗日乘子法与聚类算法相结合解决各类费用数据中离点的问题,使用增广拉格朗日乘子法得:
[0030][0031]
对上式进行最优解求导,其中,μ、ρ均为学习因子,均为常数。
[0032]
作为本发明的一种优选技术方案:费用数据区间样本在某个聚类中心的区间值内,其隶属度为1,反之为0,当两类都不属于时,则其隶属度更新公式如下:
[0033][0034]
最优解求导计算后得到:
[0035]
[0036][0037]
迭代计算后得到工程量清单单价区间
[0038]
作为本发明的一种优选技术方案:所述s2.2中,对同类工程量项目清单单价区间进行聚类处理的算法步骤与对整合后的工程量清单单价区间进行聚类处理的算法步骤相同。
[0039]
本发明提供的利用聚类分析形成工程量清单单价区间大数据的方法,与现有技术相比,其有益效果有:
[0040]
本发明工程项目中的单价区间可以根据数据的实时更新重新生成新的单价区间大数据,得到的结果具有实时性;
[0041]
本发明利用聚类分析的方法,对工程项目清单中每个项目的单价区间以及同类工程的工程项目清单进行聚类处理生成单价区间大数据,并进行归一化操作得到最终的单价区间大数据,更具有可靠性。
附图说明
[0042]
图1为本发明优选实施例的方法流程图。
具体实施方式
[0043]
需要说明的是,在不冲突的情况下,本实施例中的实施例及实施例中的特征可以相互组合,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0044]
参照图1,本发明优选实施例提供了一种利用聚类分析形成工程量清单单价区间大数据的方法,包括如下步骤:
[0045]
s1.1:获取工程量清单中所有的工程项目一月内每日的单价区间,以及相似工程的工程量项目清单;
[0046]
s1.2:对于每日工程项目的单价区间、同类工程的工程量项目清单进行预处理;
[0047]
s1.3:对预处理后的数据进行聚类分析;
[0048]
s1.4:根据聚类分析结果生成工程清单单价区间大数据。
[0049]
所述s1.2中,对每一项工程项目的单价区间根据人工费、材料费、机械使用费和综合费用整合成工程量清单单价区间。
[0050]
所述s1.2中,对同类工程的工程量项目清单的单价区间进行整合获取同类工程量项目清单单价区间,并滤除数据噪声。
[0051]
所述s1.3中,聚类分析的具体流程如下:
[0052]
s2.1:对于整合后的工程量清单单价区间进行聚类处理;
[0053]
s2.2:对同类工程量项目清单单价区间进行聚类处理;
[0054]
s1.3:将整合后的工程量清单单价区间聚类运算得到的大数据与同类工程量项目
清单单价区间聚类运算得到的大数据进行归一化处理。
[0055]
所述聚类处理的具体算法步骤如下:
[0056]
设工程量清单的单价样本数据为每个数据为各项费用的区间型样本数据,表示为建立如下的目标函数:
[0057][0058]
其中:隶属度β
bj
的约束条件如下:
[0059][0060]
其中,θj表示单价区间样本数据的每日各类费用系数,为各类费用区间与各个聚类中心的距离,为聚类中心矩阵,m为聚类参数。
[0061]
以区间上限、下限两端分别取平均值法确定初始类聚中心为:
[0062][0063][0064]
其中,为初始聚类中心的区间下限,为初始聚类中心的区间上限,1≤b≤d,获得初始聚类中心为
[0065]
各类费用区间与聚类中心的距离计算如下:
[0066][0067]
其中,分别表示区间样本的下限、上限。
[0068]
将增广拉格朗日乘子法与聚类算法相结合解决各类费用数据中离点的问题,使用增广拉格朗日乘子法得:
[0069][0070]
对上式进行最优解求导,其中,μ、ρ均为学习因子,均为常数。
[0071]
费用数据区间样本在某个聚类中心的区间值内,其隶属度为1,反之为0,当两类都不属于时,则其隶属度更新公式如下:
[0072][0073]
最优解求导计算后得到:
[0074][0075][0076]
迭代计算后得到工程量清单单价区间
[0077]
所述s2.2中,对同类工程量项目清单单价区间进行聚类处理的算法步骤与对整合后的工程量清单单价区间进行聚类处理的算法步骤相同。
[0078]
本实施例中,以投标建造工厂为例。
[0079]
获取工厂工程量清单中所有的工程项目一月内每日的单价区间,并从计价软件获取往年工厂建造工程量清单,对于每日工程项目的单价区间、同类工程的工程量项目清单进行预处理,包括对于工程项目一月内每日的单价区间加上人工费、材料费、机械使用费和综合费用整合生成新的工程量清单单价区间,并将同类工程的工程量项目清单单价数据中不合理的数据进行剔除、修正等操作,以滤除工程量清单中的数据噪声生成工程量清单单价区间样本数据。对两类数据进行聚类处理,整合生成新的工程量清单单价区间样本数据每个数据为各项费用的区间型样本数据,表示为以区间上限、下限两端分别取平均值法确定初始类聚中心为:
[0080][0081][0082]
其中,为初始聚类中心的区间下限,为初始聚类中心的区间上限,1≤b≤d,获得初始聚类中心为
[0083]
建立目标函数:
[0084][0085]
其中:隶属度β
bj
的约束条件如下:
[0086][0087]
其中,θj表示单价区间样本数据的每日各类费用系数,为各类费用区间与各个聚类中心的距离,为聚类中心矩阵。
[0088][0089]
其中,分别表示区间样本的下限、上限。
[0090]
并将增广拉格朗日乘子法与聚类算法相结合解决各类费用数据中离点的问题。
[0091][0092]
对上式进行最优解求导:
[0093][0094][0095]
其中,μ、ρ均为学习因子,均为常数
[0096]
得到:
[0097][0098][0099][0100]
进行最优解求导
[0101][0102]
得到
[0103][0104][0105]
迭代计算后得到工程量清单单价区间
[0106]
根据聚类分析得到工程量清单单价区间大数据,对同类工程量项目清单单价区间进行与对整合后的工程量清单单价区间相同的聚类处理的算法步骤,生成同类工程量项目清单单价区间大数据,对两类单价区间大数据进行归一化处理,生成最终的工程量清单单价区间大数据。
[0107]
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有
变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
[0108]
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
技术特征:
1.利用聚类分析形成工程量清单单价区间大数据的方法,其特征在于:包括如下步骤:s1.1:获取工程量清单中所有的工程项目一月内每日的单价区间,以及相似工程的工程量项目清单;s1.2:对于每日工程项目的单价区间、同类工程的工程量项目清单进行预处理;s1.3:对预处理后的数据进行聚类分析;s1.4:根据聚类分析结果生成工程清单单价区间大数据。2.根据权利要求1所述的利用聚类分析形成工程量清单单价区间大数据的方法,其特征在于:所述s1.2中,对每一项工程项目的单价区间根据人工费、材料费、机械使用费和综合费用整合成工程量清单单价区间。3.根据权利要求1所述的利用聚类分析形成工程量清单单价区间大数据的方法,其特征在于:所述s1.2中,对同类工程的工程量项目清单的单价区间进行整合获取同类工程量项目清单单价区间,并滤除数据噪声。4.根据权利要求1所述的利用聚类分析形成工程量清单单价区间大数据的方法,其特征在于:所述s1.3中,聚类分析的具体流程如下:s2.1:对于整合后的工程量清单单价区间进行聚类处理;s2.2:对同类工程量项目清单单价区间进行聚类处理;s1.3:将整合后的工程量清单单价区间聚类运算得到的大数据与同类工程量项目清单单价区间聚类运算得到的大数据进行归一化处理。5.根据权利要求4所述的利用聚类分析形成工程量清单单价区间大数据的方法,其特征在于:所述聚类处理的具体算法步骤如下:设工程量清单的单价样本数据为每个数据为各项费用的区间型样本数据,表示为建立如下的目标函数:其中:隶属度β
bj
的约束条件如下:其中,θ
j
表示单价区间样本数据的每日各类费用系数,为各类费用区间与各个聚类中心的距离,为聚类中心矩阵,m为聚类参数。6.根据权利要求5所述的利用聚类分析形成工程量清单单价区间大数据的方法,其特征在于:以区间上限、下限两端分别取平均值法确定初始类聚中心为:征在于:以区间上限、下限两端分别取平均值法确定初始类聚中心为:其中,为初始聚类中心的区间下限,为初始聚类中心的区间上限,1≤b≤d,获得
初始聚类中心为7.根据权利要求6所述的利用聚类分析形成工程量清单单价区间大数据的方法,其特征在于:各类费用区间与聚类中心的距离计算如下:其中,分别表示区间样本的下限、上限。8.根据权利要求4所述的利用聚类分析形成工程量清单单价区间大数据的方法,其特征在于:将增广拉格朗日乘子法与聚类算法相结合解决各类费用数据中离点的问题,使用增广拉格朗日乘子法得:对上式进行最优解求导,其中,μ、ρ均为学习因子,均为常数。9.根据权利要求8所述的利用聚类分析形成工程量清单单价区间大数据的方法,其特征在于:费用数据区间样本在某个聚类中心的区间值内,其隶属度为1,反之为0,当两类都不属于时,则其隶属度更新公式如下:最优解求导计算后得到:最优解求导计算后得到:迭代计算后得到工程量清单单价区间10.根据权利要求4所述的利用聚类分析形成工程量清单单价区间大数据的方法,其特征在于:所述s2.2中,对同类工程量项目清单单价区间进行聚类处理的算法步骤与对整合后的工程量清单单价区间进行聚类处理的算法步骤相同。
技术总结
本发明涉及聚类算法领域,尤其为一种利用聚类分析形成工程量清单单价区间大数据的方法,包括如下步骤:获取工程量清单中所有的工程项目一月内每日的单价区间,以及相似工程的工程量项目清单;对于每日工程项目的单价区间、同类工程的工程量项目清单进行预处理;对预处理后的数据进行聚类分析;根据聚类分析结果生成工程清单单价区间大数据。本发明工程项目中的单价区间可以根据数据的实时更新重新生成新的单价区间大数据,得到的结果具有实时性;利用聚类分析的方法,对工程项目清单中每个项目的单价区间以及同类工程的工程项目清单进行聚类处理生成单价区间大数据,并进行归一化操作得到最终的单价区间大数据,更具有可靠性。靠性。靠性。
技术研发人员:
曾奎 赵翌
受保护的技术使用者:
青岛福莱易通软件有限公司
技术研发日:
2022.09.15
技术公布日:
2022/12/9