G06F40/58 G06F40/242 G06F40/226
1.一种基于专利分类号的机器翻译校对方法,包括如下步骤:
在机器翻译后,获取专利文献的专利分类号;
依据专利分类号匹配专业词义译词校对机器翻译后专利文献;
其中,所述依据专利分类号匹配专业词义校对机器翻译的专利文献包括筛选出符合专利分类号的译词校对机器翻译后的专利文献。
2.根据权利要求1所述的基于专利分类号的机器翻译校对方法,其特征在于,所述匹配专业词义包括依据专利分类号匹配专业词典后匹配专业词义的步骤。
3.根据权利要求1所述的基于专利分类号的机器翻译校对方法,其特征在于,在所述机器翻译后,还包括语句校对的步骤。
4.根据权利要求1所述的基于专利分类号的机器翻译校对方法,其特征在于,所述专利分类号包括专利分类号、ECLA分类号、CCL分类号、FI分类号或CPC分类号。
5.根据权利要求1所述的基于专利分类号的机器翻译校对方法,其特征在于,所述机器翻译校对方法还包括在获取专利文献的专利分类号后对专利分类号进行识别的步骤。
6.根据权利要求5所述的基于专利分类号的机器翻译校对方法,其特征在于,所述识别专利分类号后还包括依据识别的专利分类号匹配专利文献语言的步骤。
7.根据权利要求1所述的基于专利分类号的机器翻译校对方法,其特征在于,校对机器翻译的专利文献包括分区域校对。
8.一种基于专利分类号的机器翻译校对系统,其特征在于,包括:
信息获取模块,被配置用于获取所述机器翻译后的专利文献的专利分类号;
匹配模块,被配置用于依据专利分类号匹配专业词义校对机器翻译的专利文献。
9.根据权利要求8所述的基于专利分类号的机器翻译校对系统,其特征在于,所述机器翻译系统还包括:
识别模块,被配置用于识别所述专利分类号所属的分类号类别。
10.根据权利要求8所述的基于专利分类号的机器翻译校对系统,其特征在于,所述机器翻译校对系统还包括:
分区模块,被配置用于对所述专利文献依据内容特征进行划分区域。
本发明涉及机器翻译领域,特别涉及一种基于专利分类号的机器翻译校对方法及其系统。
专利文献作为技术信息传递重要的载体,囊括了全球90%以上的最新技术情报。随着时代的发展,专利申请量也在逐年增多,世界知识产权组织(WIPO)2019年3月19日发布的数据显示,2018年全球通过该组织申请的国际专利数量达到创记录的25.3万件,较2017年增长3.9%。随着国际申请的增多,现有技术也不断扩大,在评估国内专利文献新创性时,外文专利也成了不可或缺的一部分。
机器翻译是获取外文专利文献中的现有技术的常用手段之一。但是,由于专利文献存在大量的技术用语,专有名词,因此,机器翻译的准确度较低,需要进行校对,通常校对的方式为人工校对或机器校对。但是,人工校对耗时耗力,成本较高;而机器校对,由于词汇的庞杂,单一单词的词义多样等问题,依旧存在校对准确率较低的问题。
针对现有技术中存在的不足之处,本发明的目的是提供一种基于专利分类号的机器翻译校对方法及其系统,其能够有效提升机器翻译后校对的速率。
为了实现根据本发明的上述目的和其他优点,本发明的第一目的是提供一种基于专利分类号的机器翻译校对方法,包括如下步骤:
在机器翻译后,获取专利文献的专利分类号;
依据专利分类号匹配专业词义译词校对机器翻译后专利文献;
其中,依据专利分类号匹配专业词义校对机器翻译的专利文献包括筛选出符合专利分类号的译词校对机器翻译后的专利文献。
作为优选,匹配专业词义包括依据专利分类号匹配专业词典后匹配专业词义的步骤。
作为优选,在机器翻译后,还包括语句校对的步骤。
作为优选,专利分类号包括专利分类号、ECLA分类号、CCL分类号、FI分类号或CPC分类号。
作为优选,机器翻译校对方法还包括在获取专利文献的专利分类号后对专利分类号进行识别的步骤。
作为优选,识别专利分类号后还包括依据识别的专利分类号匹配专利文献语言的步骤。
作为优选,校对机器翻译的专利文献包括分区域校对。
作为优选,分区域校对包括依据专利文献的内容特征对专利文献进行分区域校对。
作为优选,内容特征包括说明书摘要、权利要求书、说明书、说明书附图。
本发明的第二目的是提供一种基于专利分类号的机器翻译校对系统,其使用上述的专利翻译校对方法,包括:
信息获取模块,被配置用于获取所述机器翻译后的专利文献的专利分类号;
匹配模块,被配置用于依据专利分类号匹配专业词义校对机器翻译的专利文献。
作为优选,机器翻译系统还包括:
识别模块,被配置用于识别所述专利分类号所属的分类号类别。
作为优选,机器翻译校对系统还包括:
分区模块,被配置用于对所述专利文献依据内容特征进行划分区域。
与现有技术相比,本发明的有益效果是:
本发明在机器翻译专利文献后,获取专利文献的专利分类号,并依据分类号匹配专业词义对机器翻译后的专利文献进行校对,与现有技术的人工校对相比,其校对速率提升;与现有技术中的机器校对相比,由于其是依据专利分类号进行校对的,在一词多义的词组时,选用了较少的词进行翻译校对,不仅提升了翻译校对的准确率,而且提升了机器翻译校对时的速率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,并可依照说明书的内容予以实施,以下以本发明的较佳实施例并配合附图详细说明如后。本发明的具体实施方式由以下实施例及其附图详细给出。
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为根据本发明所述的基于专利分类号的机器翻译校对方法的流程图;
图2为根据本发明所述的基于专利分类号的机器翻译校对方法的实施例1的逻辑流程图;
图3为根据本发明所述的基于专利分类号的机器翻译校对方法的实施例2的逻辑流程图;
图4为根据本发明所述的基于专利分类号的机器翻译校对系统的结构框图;
图中:10、信息获取模块;20、匹配模块;30、分区模块;40、语句检查模块;50、识别模块。
下面,结合附图以及具体实施方式,对本发明做进一步描述,需要说明的是,在不相冲突的前提下,以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。
参照图1,一种基于专利分类号的机器翻译校对方法,包括如下步骤:
S01:机器翻译后,获取专利文献的专利分类号;
S02:依据专利分类号匹配专业词义校对机器翻译的专利文献。
其中,依据专利分类号匹配专业词义校对机器翻译的专利文献包括筛选出符合专利分类号的译词校对机器翻译后的专利文献。
本发明在专利文献机器翻译后,获取专利文献的专利分类号,随后依据专利分类号匹配专业词义校对机器翻译的专利文献,与传统人工校对相比,省时省力,节省了人力成本。与机器校对相比,由于先获得专利分类号,然后匹配专利词义进行翻译校对,首先,其通过专利分类号获得的专业词义进行校对,校对结果更准确,正确率高;其次,由于只考虑专利分类号匹配的专业词义,对于一词多义的词组,其所需校对匹配的词义更少,对词组的校对速率得到了提升,从而整体提高了校对的速率。综上两点,整体提高了专利文献翻译后的机器校对效率。
实施例1
参照图2,该实施例提供了一种基于专利分类号的机器翻译校对方法,具体包括如下步骤:
S11:机器翻译后,进行语句检查;
S12:若语句检查后通顺,则获取该专利文献的分类号;否则,对专利文献重新翻译,重新翻译后,回到步骤S01。
S13:在获取专利文献分类号后,识别专利分类号的所属类别并依据类别匹配相关预言词典校对机器翻译的专利文献。
S14:若校对后的翻译结果正确,则校对完成。否则,对专利文献重新翻译,重新翻译后,回到步骤S01。
在该实施例中,首先检查校对了翻译后的专利文献是否语句通顺,通过第一步校对,直接排除了语句不通的专利文献,节省了后续的校对的时间。在第一步校对后,获取专利文献的专利分类号,随后识别专利分类号的所属类别,并依据专利分类号所属类别匹配相关语言并进行专业词义校对,其中专利分类号的类别包括IPC分类号、ECLA分类号、CCL分类号、FI分类号或CPC分类号。通过获取分类号,并识别分类号所属类别,能够及时匹配校对时的语言,提升了专利文献翻译后校对的速率。
此外,所获取的专利分类号为初步分类,如获取IPC分类号的大类信息,在一般的专利文献中,其大类信息为统一信息,且通过大类信息就可获取专利文献的专业技术领域,通过专业技术领域就能够匹配相应的专业词典进行翻译专利文件的校对。而不用获取详细的专利分类号信息,进行专利校对。简化了步骤,避免了复杂情况的出现,保证了专利文献翻译校对时的准确率与速率。
在该实施例中,重新翻译包括人工翻译的步骤,对于校对过程中查出的翻译不正确的词组或句子,通过人工翻译进行校正;采用机器查校对,人工校正的模式,进一步提升了机器翻译校对的速率,同时,引入人工翻译,校正后词组的准确率高,不需要反复校对,不仅提高了翻译后专利文件校对的速度,而且提升了专利文件校正后的准确率。
实施例2
参照图3,该实施例提供了一种基于专利分类号的机器翻译校对方法,具体包括如下步骤:
S21:机器翻译后,进行语句检查;
S22:若语句检查后通顺,则获取该片专利文献的专利分类号并识别该专利分类号所属类别及大类信息;否则,对专利文献重新翻译,重新翻译后,回到步骤S01。
S23:在获取专利文献的大类信息后,对专利文献按内容特征进行区域划分,具体为按照专利文献的说明书摘要、权利要求、说明书、说明书附图进行区域划分。
S24:依据获取专利分类号所属类别及大类信息匹配相关语言的专业词典校对区域划分后的专利文献。
S25:若校对后的翻译结果正确,则校对完成。否则,对专利文献重新翻译,重新翻译后,回到步骤S01。
在该实施例中,加入了区域划分的步骤,通过区域划分的步骤,一方面,可以实现一篇专利文献多区域同时进行专利文献翻译机器校对的功能,节省了校对的时间,提升了校对的效率;另一方面,区域划分后可以按照专利文献的内容特征进行校对内容的侧重与优先分级。如说明书附图中并无关键词汇,不进行校对检查,而专利文献的说明书内容多于权利要求书多于摘要,则在专利文献翻译校对的优选级的分配上,以说明书为第一优先级,权利要求书为第二优先级,摘要为第三优先级。通过优先级分配,配置更多的资源与内存对说明书进行翻译校对,配置较少的资源与内存对摘要进行翻译校对。通过如此分配,一方面,保证了专业内容,核心内容的翻译后专利校对的准确率。另一方面,有利于提升专利翻译校对的速率。从而整体上提升专利文献翻译后校对工作的效率。
实施例3
参照图4,一种基于专利分类号的机器翻译校对系统,包括:
信息获取模块10,被配置用于获取所述机器翻译后的专利文献的专利分类号;
匹配模块20,被配置用于依据专利分类号匹配专业词义校对机器翻译的专利文献。
该机器翻译校对系统的工作原理如下:通过信息获取系统获取10获取机器翻译后的专利文献的专利分类号,随后将获取的专利分类号传输至匹配系统20,匹配系统20依据专利分类号匹配专业词义对机器翻译后的专利文献进行校对。
在一些优选的实施例中,机器翻译系统还包括分区模块30,其被配置依据专利文献的内容特征进行区域划分。通过分区系统,将专利文献拆解,分区校对,使校对速率得到了进一步提升。
在一些优选的实施例中,机器翻译系统还包括语句检查模块40,其被配置对翻译后的专利文献进行语句检查,具体而言,其被配置为检查翻译后的专利文献的语句是否通顺,通过语句检查模块40,进一步提升了机器翻译后校对的准确率。
在一些优选的实施例中,机器翻译系统还包括识别模块50,其被配置用于识别所述专利分类号所属的分类号类别。
在一些优选的实施例中,信息获取系统10被配置依据识别的专利分类号的所述类别匹配获取专利文献的语言。由于专利分类号所属类别不同,其所对应的语言也因分类号不同而不同,因此,在识别专利分类号后,可以依据分类号获取专利文献的语言,如IF类号为日本专利分类体系,其可匹配专利文献为日语。通过分类号匹配语言,与取专利文献中的词汇,再逐一匹配语言相比,其更省时,加快了机器校对的速度。
这里说明的设备数量和处理规模是用来简化本发明的说明的。对本发明的应用、修改和变化对本领域的技术人员来说是显而易见的。
尽管本发明的实施方案已公开如上,但其并不仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节和这里示出与描述的图例。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书一个或多个实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书实施例可提供为方法、系统、或计算机程序产品。因此,本说明书实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。
本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书实施例而已,并不用于限制本说明书一个或多个实施例。对于本领域技术人员来说,本说明书一个或多个实施例可以有各种更改和变化。凡在本说明书一个或多个实施例的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例的权利要求范围之内。本说明书一个或多个实施例本说明书一个或多个实施例本说明书一个或多个实施例本说明书一个或多个实施例。
本文发布于:2023-03-12 23:39:18,感谢您对本站的认可!
本文链接:https://patent.en369.cn/patent/3/68504.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |