首页 > TAG信息列表 > 一种中文专利文本相似度计算方法
  • 一种中文专利文本相似度计算方法
    CN201810310198.1,一种中文专利文本相似度计算方法,本发明涉及一种中文专利文本相似度计算方法,包括:对文本进行分词;对分词结果计算TF?IDF值,抽取TF?IDF值较高的作为关键词,定位关键词所在的句子作为关键句,并将关键句中关键词最大的权值作为关键句的权值,得到每个文本的关键句集合;计算每个关键句的对文本的权重,依次选取待对比文本和对比文本的关键句,基于关键句的句子相似度计算文本的相似度。本发明利用已有的专利领域本体,分析专利文本中的语义关系,利用向量空间模型和领域本体来进行专利文本相似度
    时间:2023-03-13  热度:38℃
  • 一种中文专利文本相似度计算方法
    CN201910404981.9,一种中文专利文本相似度计算方法,本发明涉及一种一种中文专利文本相似度计算方法,基于SAO结构和向量空间模型相融合来计算文本相似度,包括:从专利文本中抽取出SAO三元组;计算SAO三元组中词语的相似度;计算SAO之间相似度;基于SAO计算专利文本相似度;把向量空间模型方法和基于SAO结构的方法进行融合。本发明提供的中文专利文本相似度计算方法,基于SAO结构和向量空间模型相融合的方法计算专利文本相似度,充分发挥了二者的优点,克服了二者的缺陷,得到了极佳的正确率、召回率和F值,
    时间:2023-03-13  热度:34℃
Copyright ©2019-2022 Comsenz Inc.Powered by © 369专利查询检索平台 豫ICP备2021025688号-20 网站地图