第16卷 第5期2019年 5月
China Invention & Patent
V ol.16 No.5
May 2019
王彩霞魏健波
(知识产权出版社有限责任公司,北京100081)
摘 要:本文概括介绍了中国药物专利数据库建设中的标引工作、标引词的选取、标引案例以及提高标引质量的几点思考。标引工作包括撰写新文摘、药物主题标引、药物疗效标引、分类号标引、化学物质信息标引、中药方剂信息标引,标引词应是对专利文献的发明点与创新点的归纳总结,标引词的选取是 标引工作的重要组成部分,选取的标引词可为正式标引词和非正式标引词,正式标引词可提高标引的一致性,正式标引词和非正式标引词的组配标引可有效地提高检索的查全率和查准率。
关键词:专利文献专利标引标引词药物专利
中图分类号:G306 文献标识码:A
0引言
药物的研发事关民生幸福、社会稳定和国家安全。在经济全球化的当下,药物的研发离不开知识产权,专利文献已成为药物专利信息的重要载体。在药物研发过程中,对药物专利信息的检索非常重要。药物专利信息检索可以促进新药研发、避免药物研究的重复以及规避专利侵权的风险。在医药领域,由于药物及其专利技术的高端性和复杂性,如药品名称、技术主题、医药用途的多样性以及用化学结构或生物序列来描述的新药[1],使得药物专利检索必须依靠经过规范化专利标引的深度加工数据库,才能实现检索的全面性和准确性。
中国药物专利数据库作为世界上唯一一个对中国药物专利进行深度加工标引的数据库,收录了自1985年以来公开的全部中国医药专利文献。中国药物专利数据库吸取了DIALOG、STN等国际联机检索系统和CA/PHARM/WPI等世界权威数据库的优点和先进的检索功能[1-2],在确保专利检索的查全率和查
准率的基础上,功能更加快捷、方便、专业,现已经成为药物专利审查的重要检索工具。从建库以来,经过专利标引的中国药物专利数据库在充分挖掘与利用药物专利信息、解决药物专利创造与运用的问题以及落实知识产权强国战略中,作出了突出的贡献。
1标引工作概述
标引是把文献主题的自然语言转化为检索语言的过程, 也就是对文献进行主题分析,并赋予某种检索标识的过程[3-5]。专利标引是建立中国药物专利数据库,进行专利检索的重要环节,是进行专利信息分析获取竞争情报的基础和关键[6]。针对中国药物专利数据库的专利标引是基于药物专利本身包含的信息内容(如国际分类、发明人、申请人,以及权利要求书和说明书中披露的发明组成、发明特征、发明效果等信息),辅以标引人员的智力劳动,发掘专利的创新点,提炼出专利的技术主题,并以此进行分类、分项标引。
标引的项目包括撰写新文摘、药物主题标引、药物疗效标引、分类号标引、化学物质信息标引、中药方剂信息标引。撰写的新文摘应对发明主题信息简明扼要、全面地概述,药物专利文摘的撰写应包括四个部分,分别为:给出主题、展开主题、新颖性描述、
作者简介:王彩霞(1988—),女,山东菏泽人,硕士,研究实习员,主要从事专利数据加工工作;魏健波(1990—),男,山东菏泽人,硕士,助理工程师,主要从事数据加工工作。
2019年第5期
用途。药物主题标引分为分析方法(ANA)、联合用药(MIX)、生物方法(BIO)、提取方法(EXT)、制剂方法(GAL)、物理方法(PHY)、化学方法(CHE)、新用途(NUS)。药物疗效标引包括相似疗效(ANEF)、作用(THEF)、药物相互作用(DINT)、毒副作用(TOXI)、诊断作用(DIAG)。分类号标引包括药物范畴分类号(PHC)和国际专利分类号(IPC)标引,药物范畴分类号是根据药物的或诊断应用范畴进行的分类,其包括:1-24、31-35,其中,每个数字代表不同的药物分类范畴,药物范畴分类号应该描述THEF、DIAG和TOXI所包含的内容。国际专利分类号是国际通用的专利文献分类和检索工具,在标引过程中,可根据药物疗效、药物主题中相关内容,给出补充分类号,使得经标引的专利信息分类更加细化,提高检索的查全率。化学物质信息标引是对与专利发明点紧密相关的化合物(如药物活性物质、中间体、赋形剂、被分析或检测的物质等)进行的结构或图形标引。中药方剂信息标引是对专利涉及的中药方剂组成及用量的标引。
2标引词的选取
在上文所述的标引项目中,特别是药物主题标引、药物疗效标引、化学物质信息标引、中药方剂信息标引,最基本的就是标引词。标引词是指标引文献时所用的关键词,这些关键词能够体现专利的新颖
性、创造性、实用性,是对专利文献的发明点与创新点的归纳总结。标引出最能体现药物专利文献信息的标引词,在药物专利数据库的建设方面和满足药物专利检索的需求方面起着至关重要的作用。标引词可分为正式标引词和非正式标引词(又称自由词)。
2.1正式标引词
正式标引词是词表中规范使用的词汇,这些词汇分布于不同的索引字段。词表包括药物主题部分的词表、药物疗效部分的词表,其中药物主题部分的词表包括IT词表、ANA词表、BIO词表、GAL词表;词表中的词都是正式标引词,这些正式标引词一般都是描述“上位概念”的,亦可称之为上位词,比如IT词表中的“食品添加剂;饲料添加剂;中间体;多糖;氨
基酸序列;肽;多肽;糖类;蛋白质”、 ANA词表中的“标记;核磁共振成像;电化学;免疫测定;引物;探针”、GAL词表中的“赋形剂;稳定作用;增溶作用;溶液剂;片剂;脂质体;微囊剂”等,上述的正式标引词是不用借助其他词汇就能表达一个确切概念的词。正式标引词能保证标引的一致性,提高检索的查全率和保证检索的高效性。
2.2非正式标引词
非正式标引词,即自由词,其是直接或间接来自于所标引的专利文献中的有意义的词。其中,直接来
自于所标引的专利文献中的有意义的词为原文自由词,间接来自于所标引的专利文献中的有意义的词为加工自由词。
原文自由词一般出现在专利文献的标题、文摘、正文和附图中,对表达专利文献主题内容具有实质的意义,对描述和揭示文献主题内容是重要的。原文自由词是基于申请人或发明人对专利文献的理解而给出的,其表达准确、直接。因此,在药物专利数据库的标引中,标引出原文自由词是尤其重要的,原文自由词可保证专利信息真实、可靠,提高专利信息的查全率和查准率。在标引体现发明点、创新点的原文标引词时,应一并标引出文中出现的此词的同义词,同义词包括其中文名称、英文名称、又名、俗名、缩略名等,使得标引词更加全面,这样才能保证药物专利信息检索的全面性。例如,申请号为201811013064的专利文献,“一种丙硫咪唑的制备新方法”,文中“丙硫咪唑(Albendazole)又名阿苯达唑”,其中Albendazole、阿苯达唑为丙硫咪唑的英文名称和又名,因此,应标引出:丙硫咪唑;Albendazole;阿苯达唑。当以“丙硫咪唑或Albendazole或阿苯达唑”作为检索词时,也可以快速地检索到该篇专利文献,保证了专利文献的查全率和查准率。
原文自由词可以分为专业性原文自由词和自创性原文自由词。专业性原文自由词一般为行业专业性词汇。如申请号为201711079161的专利文献“一种高活性甘草酸的提取方法”中,使用超临界CO2流体萃取甘草叶制备甘草酸,得到的甘草酸的提取率高、活性高,因此超临界二氧化碳提取甘草酸是本专利的创新
王彩霞,等:浅谈中国药物专利数据库建设中的药物专利标引工作
2019年第5期
点。甘草甜素又称甘草酸,甘草叶是甘草酸的来源。临界二氧化碳提取和甘草酸是专业性词汇,甘草甜素是甘草酸的同义词,可标引出:甘草叶提取物;超临界二氧化碳提取;甘草酸;甘草甜素。自创性原文自由词是专利申请人、发明人自创的,可能是非专业性词汇,对于这些自创性原文自由词,可以规范化、专业化处理。如申请号为201810802848的专利文献,“一种具有抗氧化活性的乳清蛋白肽-硒螯合物及其制备方法和应用”中“乳清蛋白肽-硒螯合物”是申请人或发明人自创的,我们对其进行拆分处理,得到的标引词为:乳清蛋白肽;乳清蛋白;硒螯合物。
间接来自于所标引的专利文献中的有意义的词为加工自由词,加工自由词一般在专利文献中没有直接的体现,一般可以根据专利文献创新点与发明点进行总结归纳而得。
在自由词和正式标引词表达一个相同的意思时,优先使用词表中的正式标引词,如,核磁共振是专利中自由词,核磁共振成像是正式词,核磁共振成像、核磁共振表达一个意思,因此在标引过程中,选取词表中的核磁共振成像作为标引词,以此保证标引的一致性。当在标引某特定自由词时,在词表中存在其上位概念时,应该标引出该词及其上位词。
3标引案例
3.1案例申请号
申请号为201810920417,“一种缬沙坦氨氯地平片及其制备方法”。
3.2标引案例分析
该专利申请保护了一种制剂及其制备方法。在该片的辅料中加入泊洛沙姆188,增加了缬沙坦的溶解度,并使其在胃肠道中滞留时间增长,吸收增加,从而提高缬沙坦氨氯地平片的生物利用度;在包衣液中添加了共聚维酮S630,提高了缬沙坦的溶解度和生物利用度。
因此,泊洛沙姆188、共聚维酮S630是该片剂的特殊赋形剂,缬沙坦、苯磺酸氨氯地平、泊洛沙姆188、共聚维酮S630是体现本专利文献创新点的标引词,其中,共聚维酮S630是一种聚合物,应给出其正式标引词“聚合物”。该制剂为片剂,因此需要标
引出GAL项。GAL项标引为:缬沙坦;苯磺酸氨氯地平;片剂;赋形剂;泊洛沙姆188;共聚维酮S630;聚合物。该片包含缬沙坦、苯磺酸氨氯地平以及一些辅料,该片剂中存在缬沙坦和苯磺酸氨氯地平的联合用药,因此需要标引MIX项。MIX项标引为:缬沙坦;苯磺酸氨氯地平。该缬沙坦氨氯地平片是一种血管紧张素受体拮抗剂(ARB)和钙离子通道阻滞剂(CCB),可用于原发性高血压,因此需要标引THEF项,THEF项标引为:钙通道阻滞剂;原发性高血压;血管紧张素受体拮抗剂;
ARB;CCB。再根据THEF项和GAL项中的正式标引词“片剂”查出相对应的IPC和PHC分类号,原发性高血压属于心脏病学、血管和淋巴管学,药物范畴分类号04表示心脏病学、血管和淋巴管学,PHC号应给出04。该专利保护了一种药物剂型,药物范畴分类号22表示药物剂型,因此PHC号应给出22。标引出的化合物缬沙坦、苯磺酸氨氯地平、泊洛沙姆188和共聚维酮S630为非蛋白质、非核酸、非多肽类化合物,给出的PHC为35。该片剂是一种抗高血压药物,查出其IPC为A61P009/12、A61K009/20,其中A61P009/12代表抗高血压药,A61K009/20代表片剂。然后对具体化合物缬沙坦、苯磺酸氨氯地平、泊洛沙姆188、共聚维酮S630进行化学物质信息标引。
原摘要为:本发明公开了一种缬沙坦氨氯地平片及其制备方法。本发明缬沙坦氨氯地平片,其原料包括下述质量份的物质:缬沙坦80份;苯磺酸氨氯地平(以氨氯地平计)5份;微晶纤维素PH102 50~100份;交联聚维酮XL 8~30份;泊洛沙姆188 0.1~10份;硬脂酸镁1~5份;共聚维酮S630 1~3份;胶态二氧化硅1~5份;薄膜包衣预混剂(胃溶型)4~10份。本发明中在药物辅料中加入泊洛沙姆188,增加了缬沙坦的溶解度,并使其在胃肠道中滞留时间增长,吸收增加,从而能提高缬沙坦氨氯地平片的生物利用度;在包衣液中添加了共聚维酮S630,也能提高缬沙坦的溶解度和生物利用度,进一步改善了缬沙坦氨氯地平片的生物利用度。本发明的制备方法稳定,适于规模化制备。
原摘要中存在具体化合物的用量,对该专利的检
王彩霞,等:浅谈中国药物专利数据库建设中的药物专利标引工作
2019年第5期
索而言,这些用量是无关信息,并且该专利保护了该制剂的制备方法,而原摘要中没有提及,原摘要亦缺乏相应的药物疗效。因此需要对原摘要进行改写。文摘的撰写应包括以下四个部分:给出主题、展开主题、创新点描述、用途。对于写入文摘中的词,其在专利文献中出现过的同义词、具体化合物的CAS号等应写入新文摘中。
3.3标引结果
文摘:一种缬沙坦(N-戊酰基-N-[[2'-(1H-四氮唑-5-基)联苯-4-基]甲基]-L-缬氨酸;CAS 137862-53-4)氨氯地平片及其制备方法。该片包含缬沙坦、苯磺酸氨氯地平((±)-2-[(2-氨基乙氧基)甲基]-4-(2-氯苯基)-1,4-二氢-6-甲基-3,5-吡啶二羧酸-5-甲酯,3-乙酯苯磺酸盐;CAS 111470-99-6)、微晶纤维素PH102、交联聚维酮XL、泊洛沙姆188、硬脂酸镁、共聚维酮S630、胶态二氧化硅、薄膜包衣预混剂(胃溶型)。该制备方法为:1)原辅料预处理:将交联聚维酮XL过筛40目,硬脂酸镁(外加)过筛80目;将缬沙坦、交联聚维酮XL、硬脂酸镁(内加)、苯磺酸氨氯地平、胶态二氧化硅、微晶纤维素PH102、泊洛沙姆188于湿法混合制粒机中混合后过筛40目分散;2)预混合:将步骤1)中过筛40目的混粉置于湿法混合制粒机中,混合;3)干法制粒:经步骤2)中预混合的混粉置于干法制粒机中制粒中,将过筛后细粉与原混粉约等量混合后重复制粒,直至原混粉消耗完毕后停
止制粒;4)总混:取步骤1)中过筛80目的硬脂酸镁(外加),加入步骤3)中干法制粒后的颗粒中,于三维运动混合机中混合,得到缬沙坦氨氯地平颗粒;5)压片:将所述缬沙坦氨氯地平颗粒压制成缬沙坦氨氯地平素片;6)包衣液配制:取纯化水,在搅拌状态下,加入薄膜包衣预混剂(胃溶型)及共聚维酮S630,搅拌,得到薄膜包衣预混剂水溶液,过筛80目,备用;7)包衣:以所述薄膜包衣预混剂水溶液作为包衣液对所述缬沙坦氨氯地平素片包衣,即得到缬沙坦氨氯地平片。该方法在药物辅料中加入泊洛沙姆188,增加了缬沙坦的溶解度,并使其在胃肠道中滞留时间增长,吸收增加,提高缬沙坦氨氯地平片的生物利用度;在包衣液中添加了共聚维酮S630,提高缬沙坦的溶解度和生物利用度,改善缬沙坦氨氯地平片的生物利用度。该缬沙坦氨氯地平片是一种血管紧张素受体拮抗剂(ARB)和钙离子通道阻滞剂(CCB),可用于原发性高血压。
IPC:A61P009/12;A61K009/20
PHC:04;22;35
GAL:缬沙坦;苯磺酸氨氯地平;片剂;赋形剂;泊洛沙姆188;共聚维酮S630;聚合物
MIX:缬沙坦;苯磺酸氨氯地平
THEF:钙通道阻滞剂;原发性高血压;血管紧张素受体拮抗剂;ARB;CCB
给出主题化合物缬沙坦、苯磺酸氨氯地平、泊洛沙姆188、共聚维酮S630的具体化学物质信息。
4有关提高标引质量的几点思考
对于药物专利文献的标引,其标引的一致性,是检索中查全和查准的基本要求,这对中国药物专利数据库的建设至关重要。对同一主题专利进行标引时,不同的标引人员或者同一标引人员不同的状态,由于其理解的差异,都可能影响标引的一致性。鉴于此,笔者有以下几点思考。
4.1过硬的业务素质是提高标引质量的重要前提
标引工作人员业务素质体现在对药物专业知识的储备和专利检索知识的掌握上,落实在具体的、精细化的标引工作中。由于药物专利本身的专业性,从事标引工作的人员具有一定的药物专业知识储备,才能保证标引专利文献的专业性,进而能够如实地提炼并标引出专利文献的创新点。面对逐渐庞大的专利数据库,检索策略层出不穷,只有标引人员掌握了完备的专利检索知识,标引出来的东西才能匹配检索所需,实现标引与检索的有效衔接。因此,标引工作人员注重药物专业知识和专利检索知识的强化学习,铸造过硬的业务素质,这才是提高药物专利标引质量的重要前提。
4.2词表的及时更新、标引规则的不断完善是提高标引质量的关键所在
专利申请数量越来越多,新概念、新名词、新术
王彩霞,等:浅谈中国药物专利数据库建设中的药物专利标引工作
2019年第5期
语不断涌现,这就要求我们结合药物专利的实际标引工作,及时更新词表和完善标引规则,如载入部分新生词汇以及使用规范的自由词。词表的及时更新,使得标引词更规范化,标引规则的不断完善,使得标引工作精细化,契合标引的一致性要求,这才是提高药物专利标引质量的关键所在。
4.3 完善的质检体系是提高标引质量的有效保障
我们已经建立了完善的质检体系,质检体系包括内部质检和第三方质检。实现内部多级化质检、第三方定期质检,同时完善内部反馈机制和外部反馈机制,促进标引人员、内部质检员、第三方质检员之间的交流协作,使得质检流程更加规范化、专业化,形成合理高效的质检体系。质检体系的完善和高效运行可切实提高药物专利标引的质量。(第二作者对本文贡献等同于第一作者)
王彩霞,等:浅谈中国药物专利数据库建设中的药物专利标引工作
参考文献:
[1] 孙艳玲,刘化冰,王海虹,等. 深度加工标引的中
国药物专利数据库[J]. 中国医药导刊,2008(10):22-26.
[2] 张迪,杨素言,苏向银. 专利信息资源检索与利用
的基石——浅谈专利数据深度加工[J]. 中国发明与专利,2007(5):34-35.
[3] 马琦. 浅析专利文献深度加工中标引词的发展趋势
[J].中国专利与发明,2015(9):34-35.
[4] 袁真富,杨敬涵. 专利标引维度及其应用研究[J].
电子知识产权,2018(5):75-84.
[5] 李宏芳,邹小筑. 中国专利数据库标引质量测评[J].
现代情报,2010,30(12):58-61.
[6] 姚倩. 浅谈在专利咨询智能知识库建设中的数据标
引工作[J]. 中国发明与专利,2017(9):80-82.
责任编辑唐宇
On the Pharmaceutical Patent Indexing in the Construction of Chinese
Pharmaceutical Patent Database
WANG Caixia, WEI Jianbo
(Intellectual Property Publishing House Co., Ltd., Beijing 100081)
Abstract: This paper briefly introduces the indexing work, the selection of indexing terms, the indexing cases and some thoughts on improving the indexing quality in the construction of Chinese pharmaceutical patent database. The indexing work includes writing new abstracts, pharmaceutical subject indexing, pharmaceutical effi cacy indexing, classifi cation number indexing, chemical substance information indexing and traditional Chinese medicine prescription information indexing. The indexing words should be a summary of the inventions and innovations of patent literature. The selection of indexing words is an important part of indexing work. The selected indexing words can be formal and informal indexing words. Formal indexing words can improve the consistency of indexing, and the combination indexing of formal and informal indexing words can effectively improve the recall and precision of retrieval.
Key words: patent literature; patent index; indexing term; pharmaceutical patent