一种专利文本自动分类方法
CN201810623455.7,一种专利文本自动分类方法,本发明公开了一种专利文本自动分类方法,该方法包括专利文本分词、专利文本特征选择及向量化、基于k近邻策略的专利文本概率超图构建及基于超图学习的专利文本自动分类;在专利文本特征表示方面选取标题、摘要及主权项三个最能代表专利技术主题和法律特性的元素,然后分别统计每个特征词在三个部分中的词频,最后通过引入位置加权因子来计算最终的特征词权重,相对于将整个专利文本看成一个整体处理的方式能够更加有效地描述专利文本的特征;在专利文本分类方面采用了基于概率超图半监
时间:2023-03-13 热度:23℃