G06/F1730 G06/K962 G06/Q1010 G06/Q5008
1.一种公路工程肢解变更违规行为确定方法,其特征在于,所述确定方法包括:
获取工程变更申请的桩号;
根据所述工程变更申请的桩号,得到肢解变更待定集;
根据所述肢解变更待定集判断工程是否具有桩号肢解行为,得到第一判断结果;
根据所述肢解变更待定集判断工程是否具有变更内容拆分行为,得到第二判断结果;
若所述第一判断结果表示具有桩号肢解行为或者所述第二判断结果表示具有变更内容拆分行为,则所述公路工程存在违规行为;
若所述第一判断结果表示不具有桩号肢解行为并且所述第二判断结果表示不具有变更内容拆分行为,则所述公路工程不存在违规行为。
2.根据权利要求1所述的公路工程肢解变更违规行为确定方法,其特征在于,所述根据所述肢解变更待定集判断工程是否具有桩号肢解行为,具体包括:
对所述肢解变更待定集中的变更清单进行相似度计算,得到清单相似度;
判断所述清单相似度是否大于设定值;
若所述清单相似度小于设定值,则返回至获取工程变更申请桩号步骤;
若所述清单相似度大于设定值,则对所述肢解变更待定集中的变更内容进行相似度计算,得到段落相似度;
判断所述段落相似度是否大于设定值;
若所述段落相似度小于设定值,则不存在桩号肢解行为;
若所述段落相似度大于设定值,则存在桩号肢解行为。
3.根据权利要求1所述的公路工程肢解变更违规行为确定方法,其特征在于,所述根据所述肢解变更待定集判断工程是否具有变更内容拆分行为,具体包括:
对所述肢解变更待定集中的工程量清单进行主成分分析;
根据所述主成分分析计算所述分项工程和所述变更申请的主成分得分;
根据所述变更申请的主成分得分和和所述分项工程的主成分得分进行K-Means聚类分析,确定所述变更申请与所述分项工程的相似度;
根据所述相似度确定对应到聚类中心分项工程的变更申请;
将所述变更申请的主成分得分进行累加,得到主成分得分和;
获取聚类中心主成分得分;
根据所述主成分得分和与所述聚类中心主成分得分确定所述变更申请与所述分项工程的相对误差值;
判断所述相对误差值是否大于设定值;
若所述相对误差值小于设定值,则存在变更内容拆分行为;
若所述相对误差值大于设定值,则不存在变更内容拆分行为。
5.根据权利要求3所述的公路工程肢解变更违规行为确定方法,其特征在于,所述根据所述主成分分析计算所述分项工程和所述变更申请的主成分得分,具体包括:
根据所述主成分分析,得到主成分分析结果;
根据所述主成分分析结果提取所述工程量清单的突出主成分;
根据所述主成分分析结果构建突出主成分矩阵;
根据所述突出主成分和所述突出主成分矩阵计算变更申请与分项工程的主成分得分。
4.根据权利要求1所述的公路工程肢解变更违规行为确定方法,其特征在于,所述根据所述工程变更申请的桩号,得到肢解变更待定集,具体包括:
将所述工程变更申请按起止桩号从小到大的顺序进行排序,得到工程变更申请序列;
采用桩号相关性判断法对所述工程变更申请序列进行筛选,得到肢解变更待定集。
6.一种公路工程肢解变更违规行为确定系统,其特征在于,所述确定系统包括:
桩号获取模块,用于获取工程变更申请的桩号;
肢解变更待定集确定模块,用于根据所述工程变更申请的桩号,得到肢解变更待定集;
第一判断模块,用于根据所述肢解变更待定集判断工程是否具有桩号肢解行为,得到第一判断结果;
第二判断模块,用于根据所述肢解变更待定集判断工程是否具有变更内容拆分行为,得到第二判断结果;
违规行为确定模块,用于若所述第一判断结果表示具有桩号肢解行为或者所述第二判断结果表示具有变更内容拆分行为,则所述公路工程存在违规行为;
若所述第一判断结果表示不具有桩号肢解行为并且所述第二判断结果表示不具有变更内容拆分行为,则所述公路工程不存在违规行为。
7.根据权利要求6所述的公路工程肢解变更违规行为确定系统,其特征在于,所述第一判断模块,具体包括:
清单相似度确定单元,用于对所述肢解变更待定集中的变更清单进行相似度计算,得到清单相似度;
第一判断单元,用于判断所述清单相似度是否大于设定值;
若所述清单相似度小于设定值,则返回至获取工程变更申请桩号步骤;
段落相似度计算单元,用于若所述清单相似度大于设定值,则对所述肢解变更待定集中的变更内容进行相似度计算,得到段落相似度;
第二判断单元,用于判断所述段落相似度是否大于设定值;
若所述段落相似度小于设定值,则不存在桩号肢解行为;
桩号肢解行为确定单元,用于若所述段落相似度大于设定值,则存在桩号肢解行为。
8.根据权利要求6所述的公路工程肢解变更违规行为确定系统,其特征在于,所述第二判断模块,具体包括:
主成分分析单元,用于对所述肢解变更待定集中的工程量清单进行主成分分析;
主成分得分计算单元,用于根据所述主成分分析计算所述分项工程和所述变更申请的主成分得分;
相似度计算单元,用于根据所述变更申请的主成分得分和和所述分项工程的主成分得分进行K-Means聚类分析,确定所述变更申请与所述分项工程的相似度;
变更申请确定单元,用于根据所述相似度确定对应到聚类中心分项工程的变更申请;
主成分得分和计算单元,用于将所述变更申请的主成分得分进行累加,得到主成分得分和;
获取单元,用于获取聚类中心主成分得分;
相对误差值确定单元,用于根据所述主成分得分和与所述聚类中心主成分得分确定所述变更申请与所述分项工程的相对误差值;
第三判断单元,用于判断所述相对误差值是否大于设定值;
变更内容拆分行为确定单元,用于若所述相对误差值大于设定值,则存在变更内容拆分行为;
若所述相对误差值小于设定值,则不存在变更内容拆分行为。
10.根据权利要求8所述的公路工程肢解变更违规行为确定系统,其特征在于,所述主成分得分计算单元,具体包括:
主成分分析子单元,用于根据所述主成分分析,得到主成分分析结果;
提取子单元,用于根据所述主成分分析结果提取所述工程量清单的突出主成分;
构建子单元,用于根据所述主成分分析结果构建突出主成分矩阵;
主成分得分确定子单元,用于根据所述突出主成分和所述突出主成分矩阵计算变更申请与分项工程的主成分得分。
9.根据权利要求6所述的公路工程肢解变更违规行为确定系统,其特征在于,所述肢解变更待定集确定模块,具体包括:
排序单元,用于将所述工程变更申请按起止桩号从小到大的顺序进行排序,得到工程变更申请序列;
筛选单元,用于采用桩号相关性判断法对所述工程变更申请序列进行筛选,得到肢解变更待定集。
本发明涉及工程变更领域,特别是涉及一种公路工程肢解变更违规行为确定方法及系统。
长期以来,工程变更一直是导致公路建设工程项目“三超”现象出现的关键因素之一。目前,许多专家与学者对工程变更的管理方法与控制策略已有较多的研究成果,但在工程变更违规行为控制方面,缺乏一定的研究。现有技术中采用人工审核工程变更违规行为,但是效率低,工作量大,同时由于人工鉴别有一定的错误率,当变更数量大时结果的准确性可能降低。
本发明的目的是提供一种公路工程肢解变更违规行为确定方法及系统,能够提高工程变更违规行为判断的准确率。
为实现上述目的,本发明提供了如下方案:
一种公路工程肢解变更违规行为确定方法,所述确定方法包括:
获取工程变更申请的桩号;
根据所述工程变更申请的桩号,得到肢解变更待定集;
根据所述肢解变更待定集判断工程是否具有桩号肢解行为,得到第一判断结果;
根据所述肢解变更待定集判断工程是否具有变更内容拆分行为,得到第二判断结果;
若所述第一判断结果表示具有桩号肢解行为或者所述第二判断结果表示具有变更内容拆分行为,则所述公路工程存在违规行为;
若所述第一判断结果表示不具有桩号肢解行为并且所述第二判断结果表示不具有变更内容拆分行为,则所述公路工程不存在违规行为。
可选的,所述根据所述肢解变更待定集判断工程是否具有桩号肢解行为,具体包括:
对所述肢解变更待定集中的变更清单进行相似度计算,得到清单相似度;
判断所述清单相似度是否大于设定值;
若所述清单相似度小于设定值,则返回至获取工程变更申请桩号步骤;
若所述清单相似度大于设定值,则对所述肢解变更待定集中的变更内容进行相似度计算,得到段落相似度;
判断所述段落相似度是否大于设定值;
若所述段落相似度小于设定值,则不存在桩号肢解行为;
若所述段落相似度大于设定值,则存在桩号肢解行为。
可选的,所述根据所述肢解变更待定集判断工程是否具有变更内容拆分行为,具体包括:
对所述肢解变更待定集中的工程量清单进行主成分分析;
根据所述主成分分析计算所述分项工程和所述变更申请的主成分得分;
根据所述变更申请的主成分得分和和所述分项工程的主成分得分进行K-Means聚类分析,确定所述变更申请与所述分项工程的相似度;
根据所述相似度确定对应到聚类中心分项工程的变更申请;
将所述变更申请的主成分得分进行累加,得到主成分得分和;
获取聚类中心主成分得分;
根据所述主成分得分和与所述聚类中心主成分得分确定所述变更申请与所述分项工程的相对误差值;
判断所述相对误差值是否大于设定值;
若所述相对误差值小于设定值,则存在变更内容拆分行为;
若所述相对误差值大于设定值,则不存在变更内容拆分行为。
可选的,所述根据所述工程变更申请的桩号,得到肢解变更待定集,具体包括:
将所述工程变更申请按起止桩号从小到大的顺序进行排序,得到工程变更申请序列;
采用桩号相关性判断法对所述工程变更申请序列进行筛选,得到肢解变更待定集。
可选的,所述根据所述主成分分析计算所述分项工程和所述变更申请的主成分得分,具体包括:
根据所述主成分分析,得到主成分分析结果;
根据所述主成分分析结果提取所述工程量清单的突出主成分;
根据所述主成分分析结果构建突出主成分矩阵;
根据所述突出主成分和所述突出主成分矩阵计算变更申请与分项工程的主成分得分。
一种公路工程肢解变更违规行为确定系统,所述确定系统包括:
桩号获取模块,用于获取工程变更申请的桩号;
肢解变更待定集确定模块,用于根据所述工程变更申请的桩号,得到肢解变更待定集;
第一判断模块,用于根据所述肢解变更待定集判断工程是否具有桩号肢解行为,得到第一判断结果;
第二判断模块,用于根据所述肢解变更待定集判断工程是否具有变更内容拆分行为,得到第二判断结果;
违规行为确定模块,用于若所述第一判断结果表示具有桩号肢解行为或者所述第二判断结果表示具有变更内容拆分行为,则所述公路工程存在违规行为;
若所述第一判断结果表示不具有桩号肢解行为并且所述第二判断结果表示不具有变更内容拆分行为,则所述公路工程不存在违规行为。
可选的,所述第一判断模块,具体包括:
清单相似度确定单元,用于对所述肢解变更待定集中的变更清单进行相似度计算,得到清单相似度;
第一判断单元,用于判断所述清单相似度是否大于设定值;
若所述清单相似度小于设定值,则返回至获取工程变更申请桩号步骤;
段落相似度计算单元,用于若所述清单相似度大于设定值,则对所述肢解变更待定集中的变更内容进行相似度计算,得到段落相似度;
第二判断单元,用于判断所述段落相似度是否大于设定值;
若所述段落相似度小于设定值,则不存在桩号肢解行为;
桩号肢解行为确定单元,用于若所述段落相似度大于设定值,则存在桩号肢解行为。
可选的,所述第二判断模块,具体包括:
主成分分析单元,用于对所述肢解变更待定集中的工程量清单进行主成分分析;
主成分得分计算单元,用于根据所述主成分分析计算所述分项工程和所述变更申请的主成分得分;
相似度计算单元,用于根据所述变更申请的主成分得分和和所述分项工程的主成分得分进行K-Means聚类分析,确定所述变更申请与所述分项工程的相似度;
变更申请确定单元,用于根据所述相似度确定对应到聚类中心分项工程的变更申请;
主成分得分和计算单元,用于将所述变更申请的主成分得分进行累加,得到主成分得分和;
获取单元,用于获取聚类中心主成分得分;
相对误差值确定单元,用于根据所述主成分得分和与所述聚类中心主成分得分确定所述变更申请与所述分项工程的相对误差值;
第三判断单元,用于判断所述相对误差值是否大于设定值;
变更内容拆分行为确定单元,用于若所述相对误差值大于设定值,则存在变更内容拆分行为;
若所述相对误差值小于设定值,则不存在变更内容拆分行为。
可选的,所述肢解变更待定集确定模块,具体包括:
排序单元,用于将所述工程变更申请按起止桩号从小到大的顺序进行排序,得到工程变更申请序列;
筛选单元,用于采用桩号相关性判断法对所述工程变更申请序列进行筛选,得到肢解变更待定集。
可选的,所述主成分得分计算单元,具体包括:
主成分分析子单元,用于根据所述主成分分析,得到主成分分析结果;
提取子单元,用于根据所述主成分分析结果提取所述工程量清单的突出主成分;
构建子单元,用于根据所述主成分分析结果构建突出主成分矩阵;
主成分得分确定子单元,用于根据所述突出主成分和所述突出主成分矩阵计算变更申请与分项工程的主成分得分。
根据本发明提供的具体实施例,本发明公开了以下技术效果:本发明提供一种公路工程肢解变更违规行为确定方法,包括:获取工程变更申请的桩号;根据工程变更申请的桩号,得到肢解变更待定集;判断肢解变更待定集判断工程是否具有桩号肢解行为,得到第一判断结果;判断肢解变更待定集判断工程是否具有变更内容拆分行为,得到第二判断结果;若第一判断结果表示工程具有桩号肢解行为或者第二判断结果表示工程具有变更内容拆分行为,则工程变更存在违规行为;若第一判断结果表示工程不具有桩号肢解行为并且第二判断结果表示工程不具有变更内容拆分行为,则工程变更不存在违规行为。通过对两种行为的判断,能够提高公路工程变更中的肢解变更行为判断的效率,进而提高判断的准确率。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例公路工程肢解变更违规行为确定方法流程图;
图2为本发明实施例公路工程肢解变更违规行为确定系统结构图;
图3为变更内容相似度计算流程;
图4为段落加权二部图匹配模型;
图5为相似度阈值统计图。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明实施例公路工程肢解变更违规行为确定方法流程图。如图1所示,一种公路工程肢解变更违规行为确定方法,所述确定方法包括:
步骤101:获取工程变更申请的桩号;
步骤102:根据所述工程变更申请的桩号,得到肢解变更待定集;
步骤103:根据所述肢解变更待定集判断工程是否具有桩号肢解行为,得到第一判断结果;
步骤104:根据所述肢解变更待定集判断工程是否具有变更内容拆分行为,得到第二判断结果;
步骤105:若所述第一判断结果表示具有桩号肢解行为或者所述第二判断结果表示具有变更内容拆分行为,则所述公路工程存在违规行为;
步骤106:若所述第一判断结果表示不具有桩号肢解行为并且所述第二判断结果表示不具有变更内容拆分行为,则所述公路工程不存在违规行为。
步骤103,具体包括:
对所述肢解变更待定集中的变更清单进行相似度计算,得到清单相似度;
判断所述清单相似度是否大于设定值;
若所述清单相似度小于设定值,则返回至获取工程变更申请桩号步骤;
若所述清单相似度大于设定值,则对所述肢解变更待定集中的变更内容进行相似度计算,得到段落相似度;
判断所述段落相似度是否大于设定值;
若所述段落相似度小于设定值,则不存在桩号肢解行为;
若所述段落相似度大于设定值,则存在桩号肢解行为。
步骤104,具体包括:
对所述肢解变更待定集中的工程量清单进行主成分分析;
根据所述主成分分析计算所述分项工程和所述变更申请的主成分得分;
根据所述变更申请的主成分得分和和所述分项工程的主成分得分进行K-Means聚类分析,确定所述变更申请与所述分项工程的相似度;
根据所述相似度确定对应到聚类中心分项工程的变更申请;
将所述变更申请的主成分得分进行累加,得到主成分得分和;
获取聚类中心主成分得分;
根据所述主成分得分和与所述聚类中心主成分得分确定所述变更申请与所述分项工程的相对误差值;
判断所述相对误差值是否大于设定值;
若所述相对误差值小于设定值,则存在变更内容拆分行为;
若所述相对误差值大于设定值,则不存在变更内容拆分行为。
步骤102,具体包括:
将所述工程变更申请按起止桩号从小到大的顺序进行排序,得到工程变更申请序列;
采用桩号相关性判断法对所述工程变更申请序列进行筛选,得到肢解变更待定集。
步骤104中,所述根据所述主成分分析计算所述分项工程和所述变更申请的主成分得分,具体包括:
根据所述主成分分析,得到主成分分析结果;
根据所述主成分分析结果提取所述工程量清单的突出主成分;
根据所述主成分分析结果构建突出主成分矩阵;
根据所述突出主成分和所述突出主成分矩阵计算变更申请与分项工程的主成分得分。
本方法根据肢解变更这一工程变更违规行为的行为信息与数据特点,设计了肢解变更行为判断模型算法。根据肢解变更桩号行为特点,设计并实现了桩号相关性判断模型算法。根据自然语言处理技术,在变更清单和变更内容相似度计算这两个方面设计并且实现了桩号肢解判断模型算法。同时从变更清单主成分分析、主成分聚类分析这两方面入手设计并且实现了变更内容拆分判断模型算法,为各省市交通厅、交通建设造价监管部门提供了两种预防和查处肢解变更行为的辅助判断模型算法,减少不合理工程变更的产生,保障公路工程质量安全,规范公路建设市场行为,大幅度提高了相关部门工作人员的工作效率,效率高、成本低以及时效性强。
同时还体现在:
(1)有利于投资与建设规模的控制、投资风险的降低、投资资金利用率的提高等,规范公路工程建设市场行为;
(2)能减少不合理变更的产生,增加必要、合理的变更。有利于保证项目的正常建设进度,提高工程建设质量,实现成本控制的目标;
(3)保障公路工程质量安全,维护社会公共利益和市场主体合法权益,有效遏制和解决公路建设工程设计变更方面的突出问题。
图2为本发明实施例公路工程肢解变更违规行为确定系统结构图。如图2所示,一种公路工程肢解变更违规行为确定系统,所述确定系统包括:
桩号获取模块201,用于获取工程变更申请的桩号;
肢解变更待定集确定模块202,用于根据所述工程变更申请的桩号,得到肢解变更待定集;
第一判断模块203,用于根据所述肢解变更待定集判断工程是否具有桩号肢解行为,得到第一判断结果;
第二判断模块204,用于根据所述肢解变更待定集判断工程是否具有变更内容拆分行为,得到第二判断结果;
违规行为确定模块205,用于若所述第一判断结果表示具有桩号肢解行为或者所述第二判断结果表示具有变更内容拆分行为,则所述公路工程存在违规行为;
若所述第一判断结果表示不具有桩号肢解行为并且所述第二判断结果表示不具有变更内容拆分行为,则所述公路工程不存在违规行为。
所述第一判断模块203,具体包括:
清单相似度确定单元,用于对所述肢解变更待定集中的变更清单进行相似度计算,得到清单相似度;
第一判断单元,用于判断所述清单相似度是否大于设定值;
若所述清单相似度小于设定值,则返回至获取工程变更申请桩号步骤;
段落相似度计算单元,用于若所述清单相似度大于设定值,则对所述肢解变更待定集中的变更内容进行相似度计算,得到段落相似度;
第二判断单元,用于判断所述段落相似度是否大于设定值;
若所述段落相似度小于设定值,则不存在桩号肢解行为;
桩号肢解行为确定单元,用于若所述段落相似度大于设定值,则存在桩号肢解行为。
所述第二判断模块204,具体包括:
主成分分析单元,用于对所述肢解变更待定集中的工程量清单进行主成分分析;
主成分得分计算单元,用于根据所述主成分分析计算所述分项工程和所述变更申请的主成分得分;
相似度计算单元,用于根据所述变更申请的主成分得分和和所述分项工程的主成分得分进行K-Means聚类分析,确定所述变更申请与所述分项工程的相似度;
变更申请确定单元,用于根据所述相似度确定对应到聚类中心分项工程的变更申请;
主成分得分和计算单元,用于将所述变更申请的主成分得分进行累加,得到主成分得分和;
获取单元,用于获取聚类中心主成分得分;
相对误差值确定单元,用于根据所述主成分得分和与所述聚类中心主成分得分确定所述变更申请与所述分项工程的相对误差值;
第三判断单元,用于判断所述相对误差值是否大于设定值;
变更内容拆分行为确定单元,用于若所述相对误差值大于设定值,则存在变更内容拆分行为;
若所述相对误差值小于设定值,则不存在变更内容拆分行为。
所述肢解变更待定集确定模块202,具体包括:
排序单元,用于将所述工程变更申请按起止桩号从小到大的顺序进行排序,得到工程变更申请序列;
筛选单元,用于采用桩号相关性判断法对所述工程变更申请序列进行筛选,得到肢解变更待定集。
所述主成分得分计算单元,具体包括:
主成分分析子单元,用于根据所述主成分分析,得到主成分分析结果;
提取子单元,用于根据所述主成分分析结果提取所述工程量清单的突出主成分;
构建子单元,用于根据所述主成分分析结果构建突出主成分矩阵;
主成分得分确定子单元,用于根据所述突出主成分和所述突出主成分矩阵计算变更申请与分项工程的主成分得分。
肢解变更行为在公路工程实施阶段包括两种方式。第一,将一个公路桩号跨度较大的工程变更按照公路桩号划分为若干个变更内容相同或相似的公路桩号跨度较小的工程变更,即桩号肢解行为。第二,将相同公路桩号下一个变更内容较大的工程变更拆分成若干个变更内容较小的工程变更,即变更内容拆分行为。
表1变更申请表样例
表2变更详情表样例
变更原始数据来源于造价监督数据库(或类似系统),首先进行桩号相关性判断,旨在判断工程变更申请桩号之间是否有连续、交叉、包含、重合的关系,对符合判断条件的变更按规则放入待定集中;其次以待定集为源数据进行桩号肢解判断和变更内容拆分判断,这两个判断是并列的,有任一个符合判断条件都可将对应的变更(或变更集合)判定有肢解变更行为;最后将存在肢解变更行为的变更集合存入数据库,用于展示输出。
具体实施例1:
(1)桩号相关性判断
步骤1:将工程变更申请按起止桩号从小到大的顺序进行排序
步骤2:建立如下数学模型判断桩号相关性。
变量及函数操作定义如下:S为第i个工程变更申请的起始桩号;E为第i个工程变更申请的终止桩号;n为变更申请总数;C为第j个存在桩号相关性的工程变更申请集合;add(C)为向集合C中增加第i个变更申请;new(C)为新建第j个存在桩号相关性的工程变更申请集合;N为C集合中元素的数量。
可记第i份与第i+1份变更申请起始桩号与终止桩号关系函数为:
记j=0,存在桩号相关性的工程变更申请集合生成函数为:
步骤3:通过以上步骤筛选,得出肢解变更待定集。例如:某个肢解变更待定集为(其中集合元素为变更申请编号)
C1={A-BGL-T02-0004、A-BGL-T02-0007、A-BGL-T02-0132、A-BGL-T02-0092、
A-BGL-T02-0131、A-BGL-T02-0128}
(2-1)桩号肢解判断
对待定集中的工程变更申请进行变更清单相似度计算,如果超过阈值,再进行变更内容相似度计算,通过结果判断是否为桩号肢解行为。
步骤1:计算待定集中相邻两份工程变更申请之间的变更清单编号相似度。
例如:记A-BGL-T02-0004所拥有的变更清单编号为集合A,A-BGL-T02-0007所拥有的变更清单编号为集合B。
A={503-1-c,503-1-c,503-2-e,503-4-b,503-2-e,503-3-h}
B={503-1-a,503-2-c,503-2-i,503-3-b,503-3-e,503-3-h,503-3-i}
Jaccard相似系数是衡量两个集合相似度的一种指标,Jaccard相似系数越大,集合元素相似度越高,带入计算Jaccard相似系数J(A,B):
即可求得工程变更申请A-BGL-T02-0004、A-BGL-T02-0007之间的变更清单编号相似度。进一步可得出待定集中任何相邻的变更的清单编号相似度。
步骤2:计算待定集中相邻两份工程变更申请之间的变更内容相似度。
对于变更清单相似度超阈值的变更申请的变更理由进行变更内容相似度计算。对于相邻两个工程变更申请的变更内容,首先对变更内容中的每一个句子进行分词,并对词频进行统计,统计完成之后,使用TF-IDF算法分别计算两个变更申请变更内容中不同句子之间的句子相似度。句子相似度计算完成之后,将其作为二部图匹配模型中的权值,使用加权二部图匹配算法(优选回溯试探算法),计算两段变更内容之间的段落相似度。对于段落相似度超过一定阈值的变更申请,将其判定为存在桩号肢解行为。图3为变更内容相似度计算流程。
采用TF-IDF算法对变更内容进行相似度计算。以句子为单位,两句话用词越相似,它们描述同一概念的可能性就越大。首先通过分词,列出所有的词语,然后计算词频,写出词频向量,计算两个词频向量的余弦值,利用向量之间的夹角来衡量两个句子的相似度。夹角越小,句子相似度就越高。在n维向量空间中,A是[A,A,...,A],B是[B,B,...,B],则A与B的夹角θ的余弦等于:
这样就可以计算两个句子的相似度。
基于加权二部图匹配的段落相似度是将待检测段落中的句子作为二部图中A和B的顶点,两个段落句子之间的相似度为二部图中边的权值,将利用二部图的最大权值匹配之和的均值作为两个段落的相似度。二部图计算模型如下图所示。图中wij为句子i和句子j之间的相似度。
计算段落相似度的加权二部图算法,本方法采用回溯试探算法。算法输入二部图权值矩阵的行数m、列数n以及权值二维数组BTW[m][n],输出段落相似度S。图4为段落加权二部图匹配模型。
另外:在对桩号肢解行为进行判断之前,需对变更清单和变更内容相似度的阈值进行确定。下图给出了在使用桩号肢解判断模型的条件下,选取不同的相似度阈值,对某个造价监督数据库提供的50份存在桩号肢解行为的工程变更申请进行区分。图5为相似度阈值统计图。
由此,本方法认为变更清单相似度阈值取值为0.7,变更内容相似度阈值取值为0.8较为合理。
(2-2)变更内容拆分判断
在桩号相关性判断得出待定集后,对待定集中的变更申请进行工程量清单主成分分析、分项工程与变更申请主成分得分计算、以各分项工程为聚类中心对变更申请主成分聚类分析,通过结果判断是否为变更内容拆分行为。
步骤1:利用主成分分析算法(Principal ComponentAnalysis,PCA),对变更申请所在部位的分项工程的工程量清单进行主成分分析,得到主成分分析结果;提取工程量清单的主成分,以提取出来的主成分来代替原始的工程量清单。然后计算变更申请与分项工程的主成分得分。
以下结合例子将本步骤予以详述。
表3某个待定集中的变更申请表
根据变更申请中的变更部位,可以得知其所属的分项工程,一般来说,一个变更申请对应一个或多个分项工程,但待定集中的变更对应的分项工程可能会有交叉重叠。
表4待定集中变更对应的分项工程表
通过上述两个表,可以发现这5个变更对应到3个分项工程,有7项作业内容(清单名称),即有7个工程量变更清单编号。同时,由于每个分项工程的施工单位可能不同,其对每项作业内容的单价不同,这里假设有4个施工单位。
表5四家施工单位对7项作业内容的单价
a、分项工程原始数据表的建立
根据以上三个表(从造价监督数据库中提取),建立分项工程主成分分析原始数据表。
由于上表的计量单位不同,为了统一量纲,使用金额作为各变量的单位(根据单价*数量计算获得),以4个施工单位完成3个分项工程的7项作业内容的金额作为表的内容。
表6主成分分析原始数据表
附注2:为缩小数据差异,字段203-1-a与204-1-a的单位为百万元,其它字段单位为万元
上表中,前4行表示4个施工单位分别对分项工程A的金额,中间4行表示4个施工单位分别对分项工程B的金额,后4行表示4个施工单位分别对分项工程C的金额。
b、在获得主成分分析原始数据后,借助SPSS工具对其进行主成分分析,可得数据标准化和主成分分析结果。
表7数据标准化处理结果
表8主成分分析结果表
由于选取主成分的目的在于以尽可能少的主成分来尽可能充分的反应原样本空间的信息,因此应平衡复杂度和准确度选取主成分的个数。
本例中,前两个主成分特征值累计占了总方差的99.759%,后面的特征值的贡献越来越少。因此,使用主成分1,主成分2就能够代表原有指标的绝大部分信息。
表9主成分1,2的成分矩阵表
c、计算y、y,即分项工程与存在桩号相关性的工程变更申请的主成分得分。
根据上表,利用下式计算y1,y2。
y=0.585x-0.962x+0.999x-0.962x+0.247x+0.715x+0.247x
y=0.805x+0.272x+0.031x+0.271x-0.969x+0.697x-0.968x
x表示4个施工单位完成对应作业内容的金额平均值。例如,当计算分项工程A的y值时,x代表4个施工单位203-1-a的单价平均值*分项工程A中203-1-a的数量。
表10主成分得分表
步骤2:选用K-Means聚类算法,并根据实际特点,优化算法流程。首先根据主成分得分建立散点图。其次选取中心点(初始质心),即某个变更对应的分项工程所在点,即是此变更的中心点。然后计算变更所在点到中心点的距离,由于一个变更可能对应多个分项工程,如果计算结果不是最小,则需修改中心点,重新计算到分项工程所在点的距离,最后求得相对误差判断是否超过阈值。
采用欧式距离作为相似度计算方法,设分项工程A=(a,a,...,a)(n表示有n个主成分得分,如上例中n为2),变更申请A-BGL-T03-0082=(b,b,...,b),则分项工程A和变更申请B的相似度为(即两点之间的距离):
计算变更申请到每一个分项工程的距离,将变更申请聚集到离它距离最近的分项工程。
例如,上例中以y为横轴,y为竖轴得主成分得分散点图,计算各工程变更申请与各分项工程的距离。
表11工程变更申请到分项工程的距离
根据变更点到分项工程点的距离最小出其聚类的中心点。
表12聚类中心表
对于聚集到每一个聚类中心的多份变更申请,对其主成分得分进行累加,累加完成之后,计算变更与分项工程的相对误差的绝对值。
表13主成分累加值表
表14主成分相对误差绝对值
对于上表的前三个变更,根据主成分得分表,三个变更的y1值之和为28.8,而其聚类中心分项工程A的y1值为33.5,则相对误差为(33.5-28.8)/33.5=14%
对于相对误差的绝对值不符合要求的变更,本方法认为其之间存在变更内容拆分行为。
根据某造价监督数据库提供的50份存在变更内容拆分行为的工程变更申请。采用本变更内容拆分判断模型算法对这50份工程变更申请进行计算,计算结果显示工程量清单的相对误差绝对值范围在9%-17%。本方法将相对误差绝对值的阈值设定为20%。当y和y的绝对误差都小于等于20%时,认为变更申请是存在内容拆分行为。例如,上述例子中,本方法认为前三个变更是存在内容拆分行为的,而后两个不存在。
最后,将判断属于桩号肢解行为或内容拆分行为的变更集合,将其存入造价监督数据库,用于展示输出。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
本文发布于:2023-04-14 13:09:18,感谢您对本站的认可!
本文链接:https://patent.en369.cn/patent/1/87181.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |