一种专利技术关键词非监督提取方法
CN202110116540.6,一种专利技术关键词非监督提取方法,本发明公开了一种专利技术关键词非监督提取方法,包括步骤100:对专利文本预处理,以提取专利文本描述的技术相关信息的关键词,并通过句法分析对关键词进行相互依存关系分析;步骤200:对关键词及其相互依存关系进行分析和隐藏特征提取,并将多维的隐藏特征压缩至1D权重数值信息,并对1D权重数值信息进行重要程度的表征和排序;步骤300:通过通用词表对表征排序后的所述1D权重数值信息进行过滤以得到候选关键词集合。通过构建语法分析树识别专利文本关键词,通
时间:2023-03-13 热度:24℃