基于信息生态理论和RF-GA-BP神经网络的平台专利价值评估方法

阅读: 评论:0

著录项
  • CN202010299550.3
  • 20200416
  • CN111680859A
  • 20200918
  • 北京信息科技大学
  • 倪渊;高宇东;王子焉;张健;杨露;蔡功山
  • G06Q10/06
  • G06Q10/06 G06N3/04 G06N3/06 G06N3/08 G06Q50/18

  • 北京市海淀区清河小营东路12号
  • 北京(11)
  • 北京卫平智业专利代理事务所(普通合伙)
  • 张新利;谢建玲
摘要
本发明公开了一种基于信息生态理论和RF?GA?BP神经网络的平台专利价值评估方法,包括以下步骤:以信息生态理论为基础分析网络平台专利价值影响因素;获取GA?BP神经网络的训练样本和测试样本;采用基于RF的特征选择法对平台专利价值影响因素进行降维处理,得到最优特征子集;设计BP神经网络拓扑结构,并设定相关参数;采用GA算法优化BP神经网络的权值和阈值;将RF选出的最优特征子集作为GA?BP神经网络模型的输入信号,对GA?BP神经网络进行训练和检验,最终构建出基于RF?GA?BP神经网络算法的平台专利价值评估模型。
权利要求

1.一种基于信息生态理论和RF-GA-BP神经网络的平台专利价值评估方法,其特征在于:包括以下步骤:

步骤1:以信息生态理论为基础分析网络平台专利价值影响因素;

步骤2:获取GA-BP神经网络模型的训练样本和测试样本;

步骤3:采用基于RF的特征选择法对平台专利价值影响因素进行降维处理,得到最优特征子集;

步骤4:设计BP神经网络拓扑结构,初始化相关参数;

步骤5:采用GA算法优化BP神经网络的权值和阈值;

步骤6:将步骤3中RF选出的最优特征子集作为GA-BP神经网络模型的输入信号,对GA-BP神经网络模型进行训练和检验。

2.如权利要求1所述的基于信息生态理论和RF-GA-BP神经网络的平台专利价值评估方法,其特征在于:所述步骤1具体为:参考已有专利信息生态以及生态性评价相关文献,构建网络平台专利价值的信息生态构成模型,从专利信息、专利信息人、专利信息环境、专利信息技术四个维度构建包含6个一级指标,20个二级指标的专利价值影响因素体系。

3.如权利要求2所述的基于信息生态理论和RF-GA-BP神经网络的平台专利价值评估方法,其特征在于:所述6个一级指标分别为技术信息、法律信息、专利发明人、专利权人、专利市场环境、网络平台技术,所述20个二级指标分别为专利类型、IPC分类数、引用专利数、引用科学文献数、被引用次数、说明书页数、权利要求项数、剩余有效期、同族专利数、发明人数量、发明人实力、专利权人类型、市场流通性、市场竞争力、市场经济效益、平台需求登记、平台信誉度、平台建设时间、主办机构类型、平台公司所在地。

4.如权利要求3所述的基于信息生态理论和RF-GA-BP神经网络的平台专利价值评估方法,其特征在于:所述步骤2具体为:通过两种方法获取训练样本和测试样本数据,一部分通过实地调研、网络爬虫技术采集来源于技E网、浙江知识产权交易中心、七弦琴、汇桔网和八戒知识产权5家网络专利交易平台的专利名称、申请号、交易价格和相关需求登记数据,以及专利交易平台的主办机构、年成交额、成立时间和所在地域经济状况平台属性信息数据;另一部分根据专利申请号通过中国知网、中国专利网检索相关专利信息,手工采集专利信息数据,专利信息数据包括所述的20个二级指标。

5.如权利要求4所述的基于信息生态理论和RF-GA-BP神经网络的平台专利价值评估方法,其特征在于:所述步骤3具体为:

步骤3.1,设置参数K值,K代表决策树的数量,训练生成RF模型,并利用OOB数据对RF模型进行误差估计,得到每个决策树的袋外误差

步骤3.2,在OOB数据集中任选一个特征指标xij并增添噪声,由此得到每个决策树新的袋外误差增添噪声公式表示为:

x’ij=xij+noise (1)

其中,i代表样本的序号,i=1,2,…,m,j代表特征指标的序号,j=1,2,…,n;

步骤3.3,计算特征指标xj的重要性,公式表示为:

步骤3.4,重复步骤3.2和步骤3.3,得到每个特征指标的重要性,并将特征指标按重要性大小进行排序;

步骤3.5,删去重要性最小的特征指标,形成新的特征子集,使用新的特征子集重新生成新的RF模型,并不断重复步骤3.1至步骤3.4直到消去所有特征指标为止;

步骤3.6,比较每个新的特征子集下RF模型的泛化误差,最终选择出使RF模型精度最高的最优特征子集。

6.如权利要求5所述的基于信息生态理论和RF-GA-BP神经网络的平台专利价值评估方法,其特征在于:所述步骤4具体为:构建BP神经网络拓扑结构,所述结构为三层,分别为输入层、隐含层和输出层;输入层神经元个数等于RF特征选择法所选出最优特征子集中向量的个数,为15个,输出层神经元个数为1个,隐含层神经元数量H计算公式为:

上式中z为经验值,P为输入层神经元数量,Q为输出层神经元数量;通过网络性能试验确定隐含层神经元个数为9;

设定各层间的传递函数均为Sigmoid型函数,BP神经网络学习速率为0.03,迭代次数为1000,允许误差为0.00001。

7.如权利要求6所述的基于信息生态理论和RF-GA-BP神经网络的平台专利价值评估方法,其特征在于:步骤4中所述相关参数包括训练迭代次数、允许误差范围。

8.如权利要求7所述的基于信息生态理论和RF-GA-BP神经网络的平台专利价值评估方法,其特征在于:所述步骤5具体为:将BP神经网络初始化后的权值和阈值编码,以便加入GA遗传算法;然后,确定遗传算法参数,包括种数、迭代次数、变异概率上下限、交叉概率上下限和适应度函数,其中交叉概率取值范围在区间(0.4,0.99),变异概率取值范围在区间(0.001,0.1),经过运算后输出BP神经网络最优权值和阈值。

9.如权利要求8所述的基于信息生态理论和RF-GA-BP神经网络的平台专利价值评估方法,其特征在于:GA遗传算法参数设置为种数量100,迭代次数300,变异概率0.05,交叉概率为0.7,将预测输出值和期望输出值的误差平方和取倒数作为适应度函数,公式表示为:

上式中m为样本数量,Q为输出层神经元数量,yq为输出层第q个神经元的实际输出值,tq为输出层第q个神经元的期望输出值。

10.如权利要求9所述的基于信息生态理论和RF-GA-BP神经网络的平台专利价值评估方法,其特征在于:所述步骤6具体为:将RF选出的最优特征子集作为GA-BP神经网络模型的输入信号,导入BP神经网络进行训练,计算出当前样本的输出,进而计算出期望输出与实际输出的均方误差,判断均方误差是否达到精度要求,若达到,则停止训练,否则反复迭代,直至满足精度要求或达到训练次数,则训练结束。

说明书
技术领域

本发明属于专利价值评估领域,具体涉及一种基于信息生态理论和RF-GA-BP神经网络的平台专利价值评估方法。

随着网络平台服务经济环境的发展,以专利为核心的技术交易平台纷纷上线,如技E网、八戒知识产权等,网络平台专利交易成为一种新兴的专利交易模式。相比于传统的专利交易,网络专利交易平台就像一座桥梁一样,可以有效连接供需双方,提供更加完备的服务,降低了专利交易成本,缓解了信息不对称现象,对促进我国科技成果转化具有重要价值。然而随着平台的快速发展,一些新的挑战也随之而来,集中表现在如何对网络平台环境下的专利价值进行有效评估。平台专利的市场环境、平台中介服务的运行特点以及平台的政府主导属性等都是影响专利价值高低的重要因素,由此,专利价值评估不仅要考虑专利自身价值,还要考虑平台、市场等相关因素,是一个多方面信息的综合反映。因此,如何准确评估网络平台环境下的专利价值是影响平台发展的关键。

目前专利价值评估方法可分为四大类:(一)传统资产评估法。传统资产评估法是采用评估无形资产的方法进行专利价值评估,包括成本法、市场法、现值收益法和实物期权法,该类评估方法涉及较多市场参数,适用于市场基准下的专利价值评估,对于网络平台上成熟度较低、尚未转化进入市场的专利,评估其价值则较为困难,存在主观性较强、准确度较低的缺点。(二)综合评价法。综合评价法通过构建专利价值评估指标体系,并结合不同的赋权方法综合评估专利价值。虽然当前专利价值评估指标体系已经较为完善,主客观相结合的赋权方法也体现其科学性,但是该类方法无法反映专利价值评估指标与专利价值之间的作用规律,同时该类方法受专利样本质量的影响也比较大,面对网络平台庞大且持续更新的专利数据,得到的专利价值评估结果的稳定性较弱,缺乏一定现实参考意义。(三)计量经济模型法。计量经济模型法是以专利价值影响因素为自变量,专利价值为因变量,建立探索它们之间线性关系的专利价值评估模型。该类方法前提需假设专利价值影响因素与专利价值呈线性关系,但实际上它们之间是复杂的非线性关系,因此该类方法在专利价值评估精准度上也存在一定局限性。(四)智能化方法。智能化方法即基于机器学习算法通过仿真动态模拟训练专利价值评估模型。新兴的专利价值智能化评估方法尚处于初步研究阶段,已有的评估模型大多仍以传统的专利价值评估指标为依据,缺乏对网络平台因素在专利价值评估中作用效果的探究,也存在一些方法模型有待改进优化,以提高其评估效果。

本发明的目的在于提出一种基于信息生态理论和RF-GA-BP神经网络的平台专利价值评估方法,构建了基于信息生态和RF-GA-BP神经网络的专利价值评估模型,以解决上述背景技术中提出的问题。

本发明是通过以下技术方案实现的:

一种基于信息生态理论和RF-GA-BP神经网络的平台专利价值评估方法,该方法包括以下步骤:

步骤1:以信息生态理论为基础分析网络平台专利价值影响因素;

步骤2:获取GA-BP神经网络模型的训练样本和测试样本;

步骤3:采用基于RF的特征选择法对平台专利价值影响因素进行降维处理,得到最优特征子集;

步骤4:设计BP神经网络拓扑结构,初始化相关参数;

步骤5:采用GA算法优化BP神经网络的权值和阈值;

步骤6:将步骤3中RF选出的最优特征子集作为GA-BP神经网络模型的输入信号,对GA-BP神经网络模型进行训练和检验。

进一步,所述步骤1具体为:参考已有专利信息生态以及生态性评价相关文献,构建网络平台专利价值的信息生态构成模型,认为专利价值信息生态是专利信息、专利信息技术、专利信息人以及专利信息环境四要素及其相互关系的总和。在较为全面均衡涵盖专利价值的技术、法律、市场三大传统特征因素的基础上,结合网络专利交易平台信息服务特性,从专利信息、专利信息人、专利信息环境、专利信息技术四个维度构建包含6个一级指标,20个二级指标的专利价值影响因素体系。

进一步,所述6个一级指标分别为技术信息、法律信息、专利发明人、专利权人、专利市场环境、网络平台技术,20个二级指标分别为专利类型、IPC分类数、引用专利数、引用科学文献数、被引用次数、说明书页数、权利要求项数、剩余有效期、同族专利数、发明人数量、发明人实力、专利权人类型、市场流通性、市场竞争力、市场经济效益、平台需求登记、平台信誉度、平台建设时间、主办机构类型、平台公司所在地。

进一步,所述步骤2具体为:通过两种方法获取训练样本和测试样本数据,一部分通过实地调研、网络爬虫技术等方法采集来源于技E网、浙江知识产权交易中心、七弦琴、汇桔网和八戒知识产权5家网络专利交易平台的专利名称、申请号、交易价格和相关需求登记数据,以及专利交易平台的主办机构、年成交额、成立时间和所在地域经济状况等平台属性信息数据。另一部分则是根据专利申请号通过中国知网、中国专利网检索相关专利信息,手工采集专利信息数据,专利信息数据包括所述的20个二级指标。

进一步,所述步骤3具体为:

步骤3.1,设置参数K值,K代表决策树的数量,训练生成RF模型,并利用OOB数据(袋外数据)对RF模型进行误差估计,得到每个决策树的袋外误差

步骤3.2,在OOB数据集中任选一个特征指标xij并增添噪声,由此得到每个决策树新的袋外误差增添噪声公式表示为:

x’ij=xij+noise (1)

其中,i代表样本的序号,i=1,2,…,m,j代表特征指标的序号,j=1,2,…,n。

步骤3.3,计算特征指标xj的重要性,公式表示为:

步骤3.4,重复步骤3.2和步骤3.3,得到每个特征指标的重要性,并将特征指标按重要性大小进行排序。

步骤3.5,删去重要性最小的特征指标,形成新的特征子集,使用新的特征子集重新生成新的RF模型,并不断重复步骤3.1至步骤3.4直到消去所有特征指标为止。

步骤3.6,比较每个新的特征子集下RF模型的泛化误差,最终选择出使RF模型精度最高的最优特征子集。

进一步,所述步骤4具体为:构建BP神经网络拓扑结构,所述结构为三层,分别为输入层、隐含层和输出层;输入层神经元个数等于RF特征选择法所选出最优特征子集中向量的个数15个,输出层神经元个数为1个,隐含层神经元数量H计算公式为:

上式中z为经验值(1≤z≤10),P为输入层神经元数量,Q为输出层神经元数量。

通过网络性能试验确定隐含层神经元个数为9。设定各层间的传递函数均为Sigmoid型函数,BP神经网络学习速率为0.03,迭代次数为1000,允许误差为0.00001。

步骤4中所述相关参数包括训练迭代次数、允许误差范围等。

进一步,所述步骤5具体为:将BP神经网络初始化后的权值和阈值编码,以便加入遗传算法;然后,确定遗传算法参数,包括种数、迭代次数、变异概率上下限、交叉概率上下限和适应度函数等,其中交叉概率取值范围一般在区间(0.4,0.99),变异概率取值范围一般在区间(0.001,0.1),经过运算后输出BP神经网络最优权值和阈值。

GA遗传算法参数设置为种数量100,迭代次数300,变异概率0.05,交叉概率为0.7,将预测输出值和期望输出值的误差平方和取倒数作为适应度函数,公式表示为:

上式中m为样本数量,Q为输出层神经元数量,yq为输出层第q个神经元的实际输出值,tq为输出层第q个神经元的期望输出值。

进一步,所述步骤6具体为:将RF选出的最优特征子集作为GA-BP神经网络模型的输入信号,导入BP神经网络进行训练,计算出当前样本的输出,进而计算出期望输出与实际输出的均方误差,判断均方误差是否达到精度要求,若达到,则停止训练,否则反复迭代,直至满足精度要求或达到训练次数,则训练结束。

有益效果:

本发明的有益效果在于:基于信息生态理论分析了网络平台专利价值的信息生态构成,将网络平台特征因素引入专利价值评估研究,探寻了网络平台服务经济环境对专利价格形成的作用机理,在挖掘的20个网络平台专利价值影响因素的基础上,提出了基于RF-GA-BP的网络平台专利价值评估模型,与其它专利价值评估模型相比具有以下3个优点:构建了信息生态视角下的平台专利价值影响因素体系,既较为全面的涵盖专利价值传统评估指标,也体现出专利交易平台信息服务特性,在网络平台服务经济环境下专利价值评估中具有适用性;采用基于RF的特征选择法对高效应专利价值影响因素进行筛选,不仅降低维度减少训练量提升模型运行效率,而且选择出最优特征子集有利于提高模型预测结果准确性;采用GA遗传算法对BP神经网络进行参数寻优,弥补了传统BP神经网络容易陷入局部最优的缺陷,增强其稳定性和泛化性,最终得到具有较高精度的专利价值预测模型。

为了使本发明的目的、技术方案和有益效果更加清楚,本发明提供如下附图进行说明:

图1为RF-GA-BP神经网络平台专利价值评估模型构建示意图。

图2为本方法流程图。

以下结合附图1-2对本发明作进一步详细说明。

为解决现有技术存在的问题,本发明提出了一种基于信息生态理论和RF-GA-BP神经网络的平台专利价值评估方法,首先通过信息生态理论构建网络平台专利价值影响因素体系,其次通过RF的特征选择法对高效应专利价值影响因素进行筛选,再次通过GA算法优化BP神经网络权值与阈值,最后将筛选后的专利价值影响因素作为输入信号在BP神经网络中进行训练,直到得到稳定泛华的模型,最终构建出平台专利价值评故模型,如图1所示。

如图2所示,实现一种信息生态理论和RF-GA-BP神经网络的平台专利价值评估方法的流程图,包括以下步骤:

步骤1:以信息生态理论为基础分析网络平台专利价值影响因素;

步骤2:获取GA-BP神经网络模型的训练样本和测试样本;

步骤3:采用基于RF的特征选择法对平台专利价值影响因素进行降维处理,得到最优特征子集;

步骤4:设计BP神经网络拓扑结构,初始化相关参数;

步骤5:采用GA算法优化BP神经网络的权值和阈值;

步骤6:将RF选出的最优特征子集作为GA-BP神经网络模型的输入信号,对GA-BP神经网络进行训练和检验。

步骤1进一步为:参考已有专利信息生态以及生态性评价相关文献,构建网络平台专利价值的信息生态构成模型,认为专利价值信息生态是专利信息、专利信息技术、专利信息人以及专利信息环境四要素及其相互关系的总和。在技术、法律、市场三大传统特征因素的基础上,结合网络专利交易平台信息服务特性,从专利信息、专利信息人、专利信息环境、专利信息技术四个维度构建包含6个一级指标,分别为技术信息、法律信息、专利发明人、专利权人、专利市场环境、网络平台技术,20个二级指标分别为专利类型、IPC分类数、引用专利数、引用科学文献数、被引用次数、说明书页数、权利要求项数、剩余有效期、同族专利数、发明人数量、发明人实力、专利权人类型、市场流通性、市场竞争力、市场经济效益、平台需求登记、平台信誉度、平台建设时间、主办机构类型、平台公司所在地的专利价值影响因素体系。

步骤2进一步为:通过两种方法获取训练样本和测试样本数据,一部分通过实地调研、网络爬虫技术等方法采集来源于技E网、浙江知识产权交易中心、七弦琴、汇桔网和八戒知识产权5家网络专利交易平台的专利名称、申请号、交易价格和相关需求登记数据,以及专利交易平台的主办机构、年成交额、成立时间和所在地域经济状况等平台属性信息数据。另一部分则是根据专利申请号通过中国知网、中国专利网检索相关专利信息,手工采集包括专利类型、专利发明人数等20项专利信息数据,此20项专利信息数据与上述20个二级指标相同。

步骤3进一步为:第一步,设置参数K值即决策树的数量,训练生成RF模型,并利用OOB数据对其进行误差估计,得到每个决策树的袋外误差。第二步,在OOB数据集中任选一个特征指标并对其增添噪声x’ij=xij+noise,其中i=1,2,…,m,得到每个决策树新的袋外误差;第三步,计算特征指标xj的重要性其中j=1,2,…,n。第四步,重复第二步和第三步,得到每个特征指标的重要性,并将其按重要性大小进行排序。第五步,删去重要性最小的特征指标,形成新的特征子集,使用新的特征子集重新生成新的RF模型,并不断重复第一到四步直到消去所有特征指标为止。第六步,比较每个新的特征子集下RF模型的泛化误差,最终选择出使RF模型精度最高的最优特征子集。

步骤4进一步为:构建三层BP神经网络拓扑结构,分别为输入层、隐含层和输出层;输入层神经元个数等于RF特征选择法所选出最优特征子集中向量的个数,为15个,输出层神经元个数为1个,隐含层神经元数量H通过公式确定为9个。

设定各层间的传递函数均为Sigmoid型函数,BP神经网络学习速率为0.03,迭代次数为1000,允许误差为0.00001。

步骤4中所述相关参数包括训练迭代次数、允许误差范围等。

步骤5进一步为:将BP神经网络初始化后的权值和阈值编码,以便加入GA遗传算法;然后,确定遗传算法参数,包括种数、迭代次数、变异概率上下限、交叉概率上下限和适应度函数等,其中交叉概率取值范围一般在区间(0.4,0.99),变异概率取值范围一般在区间(0.001,0.1),经过运算后输出BP神经网络输出最优权值和阈值。

GA遗传算法参数设置为种数量100,迭代次数300,变异概率0.05,交叉概率为0.7,将预测输出值和期望输出值的误差平方和取倒数作为适应度函数,其中m为样本数量,Q为输出层神经元数量,yq为输出层第q个神经元的实际输出值,tq为输出层第q个神经元的期望输出值;

进一步,所述步骤6具体为:将RF选出的最优特征子集作为GA-BP神经网络模型的输入信号,导入BP神经网络进行训练,计算出当前样本的输出,进而计算出期望输出与实际输出的均方误差,判断均方误差是否达到精度要求,若达到,则停止训练,否则反复迭代,直至满足精度要求或达到训练次数,训练结束。

以上所述仅为本发明的优选实施例,并不用以限制本发明,凡在本发明的形式和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

本说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。

本文发布于:2023-03-13 02:46:44,感谢您对本站的认可!

本文链接:https://patent.en369.cn/patent/3/68936.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 369专利查询检索平台 豫ICP备2021025688号-20 网站地图