一种引物设计方法、装置、设备及可读存储介质与流程

阅读: 评论:0



1.本技术属于基因捕获技术领域,尤其涉及一种引物设计方法、装置、设备及可读存储介质。


背景技术:



2.目前,基于聚合酶链式反应(polymerase chain reaction,pcr)技术进行基因捕获时,所采用的引物是以参考基因组上的脱氧核糖酸(deoxyribonucleic acid,dna)序列为基准设计的。其中,参考基因组中的dna的序列是通过人类基因组计划所检测出的,包括大多数生命体的遗传组基因。然而,由于不同生物存在个体上的差异,会基于参考基因组在不同程度上产生突变。因此,传统基于参考基因组设计得到的引物,对于捕获产生突变的目标区域片段时,容易存在特异性差,灵敏度较低的问题。


技术实现要素:



3.有鉴于此,本技术实施例提供了一种引物设计方法、装置、设备及可读存储介质,以解决现有技术中的传统引物存在的特异性差,灵敏度较低的问题。
4.本技术实施例的第一方面提供了一种引物设计方法,该方法包括:获取目标基因数据库,目标基因数据库中包括目标基因和目标基因的热点突变信息,热点突变信息包括:突变位点位置信息、突变序列和替换序列;对目标基因进行引物设计,生成目标野生型引物;根据热点突变信息,对目标野生型引物的基因序列进行突变处理,生成目标突变型引物;将目标野生型引物和目标突变型引物转化为目标引物,并将目标引物的集合确定为目标引物池。
5.结合第一方面,在第一方面的第一种可能实现方式中,在对目标基因进行引物设计时,引物的参考基因组为hg19;引物的最大错配数量为3;引物的最小长度为18,最大长度为25;引物的最小gc占比为20,最大gc占比为80。
6.结合第一方面,在第一方面的第二种可能实现方式中,对目标基因进行引物设计,生成目标野生型引物,包括:对目标基因进行引物设计,得到初始野生型基因序列;根据第一预设标准对初始野生型基因序列进行筛选,生成目标野生型引物;其中,第一预设标准为:rank等级为1;合并重复的初始野生型基因序列。
7.结合第一方面,在第一方面的第三种可能实现方式中,根据热点突变信息,对目标野生型引物的基因序列进行突变处理,生成目标突变型引物,包括:根据热点突变信息,对目标野生型引物的基因序列进行突变处理,得到初始突变型基因序列;基于第二预设标准对初始突变型基因序列进行筛选,得到目标突变型引物,第二预设标准为:突变位点位于初始突变型基因序列上;初始突变型基因序列的长度为17-24bp;合并重复的初始突变型基因序列。
8.结合第一方面,在第一方面的第四种可能实现方式中,在目标野生型引物所对应的基因序列为正义链时,根据热点突变信息,对目标野生型引物的基因序列进行突变处理,
得到初始突变型基因序列,包括:根据突变位点位置信息,将正义链中的突变序列替换为替换序列,得到初始突变型基因序列。
9.结合第一方面,在第一方面的第五种可能实现方式中,在目标野生型引物所对应的基因序列为反义链时,根据热点突变信息,对目标野生型引物的基因序列进行突变处理,得到初始突变型基因序列,包括:生成反义链的反互补基因序列;根据突变位点位置信息,将反互补基因序列中的突变序列替换为替换序列;对替换后的反互补基因序列进行反向互补处理,得到初始突变型基因序列。
10.结合第一方面,在第一方面的第六种可能实现方式中,将目标野生型引物和目标突变型引物转化为目标引物,包括:在目标野生型引物和目标突变型引物的基因序列的一端添加启动子,另一端添加尾部茎环结构的基因序列,形成第一引物;基于第三预设标准对第一引物进行筛选,得到目标引物;第三预设标准为:第一引物的基因序列为热点突变基因序列;第一引物的基因序列长度为17-24bp;self-complementarity≤1;错配数量为0;去除原型间隔邻接基序pam。
11.本技术实施例的第二方面提供了一种引物设计装置,该装置包括:获取单元,用于获取目标基因数据库,目标基因数据库中包括目标基因和目标基因的热点突变信息,热点突变信息包括:突变位点位置信息、突变序列和替换序列;引物设计单元,用于对目标基因进行引物设计,生成目标野生型引物;突变处理单元,用于根据热点突变信息,对目标野生型引物的基因序列进行突变处理,生成目标突变型引物;确定单元,用于将目标野生型引物和目标突变型引物转化为目标引物,并将目标引物的集合确定为目标引物池。
12.本技术实施例的第三方面提供了一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面任一项所述方法的步骤。
13.本技术实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面任一项所述方法的步骤。
14.本技术实施例与现有技术相比存在的有益效果是:本技术实施例提供的引物设计方法所得到的目标引物池,其在包括目标野生型引物的基础上还包括目标突变型引物。由于突变型引物是根据目标基因数据库中目标基因的热点突变信息确定的,因此,目标突变型引物的加入可以在基因捕获的过程中特异性结合变异的基因片段,实现对低频突变的靶向捕获,提高灵敏度和特异性,进而提高捕获效率,减少样本测序深度,有效节约测序成本。
附图说明
15.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
16.图1是本技术实施例提供的目标基因数据库的组成示意图;图2是本技术实施例提供的目标基因突变位点的结构示意图;
图3是本技术实施例提供的一种引物设计方法的流程示意图;图4是本技术实施例提供的正义链基因序列的突变过程的示意图;图5是本技术实施例提供的反义链基因序列的突变过程的示意图;图6是本技术实施例提供的目标引物结构的示意图;图7是本技术实施例提供的一种引物设计装置的结构示意图;图8是本技术实施例提供的电子设备的结构示意图。
具体实施方式
17.以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本技术。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本技术的描述。
18.以下结合具体的实施例对本技术提供的技术方案进行详细的解释说明。
19.引物(primer)是指在核苷酸聚合作用起始时,刺激合成的一种具有特定核苷酸序列的大分子,被广泛应用于聚合酶链式反应、测序和探针合成等。示例性的,在二代测序目标区域捕获技术中,基于pcr扩增技术进行基因捕获时,通常是在目标反应体系中加入两对以上的引物,该引物能够与各自相应位置的模板dna的碱基对配对,即a和t配对,c和g配对。每对引物在pcr的反应条件下,就可以与dna模板的目标区域结合,引发反应进而扩增出多个的核酸片段,从而捕获和富集目标反应体系中的目标区域片段。
20.需要说明的是,在二代测序目标区域捕获技术中,目标区域片段的基因序列及其引物的基因序列是部分或者全部互补的。
21.例如,若待捕获的目标区域片段解旋后的两个基因序列分别为:5
’‑
attgcgttatttggggcccctttcg-3’;和3
’‑
taacgcaataaaccccggggaaagc-5’。
22.那么,该目标区域片对应的两个引物分别可以是:3
’‑
taacgcaataaaccccggggaaagc-5’;和,5
’‑
attgcgttatttggggcccctttcg-3’。
23.目前,pcr技术中所采用的引物通常是以参考基因组上的dna序列为基准设计的。其中,参考基因组中的dna的序列是通过人类基因组计划所检测出的,包括大多数生命体的遗传组基因。然而,由于不同生物存在个体上的差异,会基于参考基因组在不同程度上产生突变。因此,传统基于参考基因组设计得到的引物,对于捕获产生突变的目标区域片段时,容易存在特异性差,灵敏度较低的问题。
24.为了解决传统技术中的引物对于捕获产生突变的目标区域片段时,容易存在特异性差,灵敏度较低的问题,本技术实施例提供了一种引物设计方法,通过本方法得到的引物池中包括目标野生型引物和目标突变型引物,通过该引物池进行基因捕获时,可以针对dna序列中突变的目标区域片段进行捕获,提高基因捕获的特异性和灵敏度。
25.本技术实施例中提供的引物设计方法,应用于电子设备,包括以下三个部分:(一)目标基因数据库的创建;(二)引物设计软件参数的优化;(三)引物设计。以下分别对上述三个部分的内容进行介绍。
26.(一)电子设备创建目标基因数据库。
27.本实施例中,目标基因数据库是目标基因的集合,参见图1中所示,包括若干常见的与致病基因相关的目标基因。在该目标基因数据库中还包括有各个目标基因所对应的基础参数。其中,该基础参数包括目标基因的核酸类型和该目标基因在该核酸类型中的染体(chromosome,chr)位置等。
28.另外,目标基因数据库中还包括目标基因和该目标基因的热点突变信息,其中,该热点突变信息包括:突变位点位置信息、突变序列和替换序列。突变位点位置信息包括热点突变基因所对应的目标基因的起始点位置坐标,以及热点突变基因在对应的目标基因中的突变位点位置的起始坐标和突变位点位置的终止坐标。在目标基因产生突变后,突变后的目标基因中包括正常基因和热点突变基因。应理解,dna分子序列上每一个碱基都可能发生突变,但实际上突变部位并非完全随机分布。dna分子上的各个部分有着不同的突变频率,即dna分子某些部位的突变频率大大高于平均数,这些部位就称为热点突变。比如,参见图2以及下表1所示,若图2中所示的为表1中7号染体的目标基因1在热点突变位置突变后的基因结构,则该7号染体的目标基因1的起始点位置坐标为7:55259507,热点突变基因对应的突变序列为gct,替换序列为gag,突变位点位置的起始坐标为7:55259513,突变位点位置的终止坐标为7:55259515。可见,当确定目标基因数据库中的各个与致病基因相关的目标基因后,即可确定该目标基因所对应的突变序列和替换序列,以及该突变序列和替换序列在所对应的目标基因中的突变位点位置信息。
29.在一个示例中,参见表1所示,该目标基因数据库包括:表1在一些实施例中,电子设备可以根据用户输入的常见的与致病基因相关的基因的标识信息,从cosmic
‑‑
遗传资源数据库中挖掘所需要的与致病基因相关的目标基因,最后基于所挖掘的所有的目标基因创建该目标基因的目标基因数据库。另外,电子设备也可以根据实际需要检测或者捕获的目标区域片段,在cosmic
‑‑
遗传资源数据库中挖掘特定的基因,并将该特定的基因添加至目标基因数据库中。
30.(二)电子设备对引物设计软件参数进行优化。
31.本实施例中基于chopchop软件设计引物,在进行引物设计前,需要对该软件中的参数进行优化。
32.在chopchop软件中,通常需要设置的优化参数包括:chopchop.py-target${region}-j-p-t1-mngg
‑‑
maxmismatches3-g20
‑‑
scoringmethoddoench_2016
‑‑
backboneaggctagtccgt-ghg19-tcoding-nn-r4-a20-filtergcmin20-filtergcmax80-3'product_size_min=150,product_size_max=290,primer_min_size=18,primer_max_size=25,primer_opt_size=22,primer_min_tm=57,primer_max_tm=63,primer_opt_tm=60'。
33.本实施例中通过以下参数对chopchop引物设计软件进行优化:-target,目标基因或者区域;-j,使用json创建可视化文件;-p, 使用primer3设计引物来识别突变;-t,选择模式,默认crisper/cas9:1;-m,pam模式:ngg;
‑‑
maxmismatches,最大错配数量:3;-g,guide rna大小:20;
‑‑
scoringmethod,打分方法:doench_2016;
‑‑
backbone,对自身互补区域罚分,相对于骨干区域:aggctagtccgt;-g,参考基因组:hg19;-t,目标区域类型,默认coding region:coding;-n,限制性内切酶公司:n;-r,限制性内切酶结合区域最小长度:4;-a,引物与目标位点间的最小距离:20;-filtergcmin,最小gc占比(默认0):20;-filtergcmax,最大gc占比(默认100):80;-3,引物选项:product_size_min,产物最小长度:150;product_size_max,产物最大长度:290;primer_min_size,引物最小长度:18;primer_max_size,引物最大长度:25;primer_opt_size,引物最佳长度:22;primer_min_tm,引物最低退火温度:57;primer_max_tm,引物最高退火温度:63;primer_opt_tm,引物最佳退火温度:60。
34.在本实施例中,电子设备通过以上参数对chopchop引物设计软件进行优化,优化完成后,该chopchop软件即可根据上述设置的参数进行引物设计。
35.需要说明的是,电子设备在通过上述参数完成后chopchop软件的优化后,chopchop软件即可完成针对于目标基因数据库中的每一条目标基因的引物设计。但是电子设备通过chopchop软件进行引物设计时,每次只能针对一条目标基因进行处理,而目标基因数据库中有若干条目标基因,当需要对目标基因数据库中的目标基因进行批量处理时,则需要对通过参数优化后的chopchop软件进行批量设计的再次优化。
36.在一些实施例中,电子设备可以基于用户输入的批量设计引物代码,实现
chopchop软件的批量设计功能。
37.chopchop软件经过批量设计优化后,即可对目标基因数据库中的目标基因进行引物的批量设计,从而提高引物设计的效率。
38.需要说明的是本实施例中将优化后的可以进行批量引物设计的chopchop软件称为目标软件。电子设备在执行后续的引物设计操作时,均是基于该目标软件进行设计的。
39.(三)电子设备进行引物设计图3为本技术实施例提供的引物设计方法流程图,参见图3所示,该方法包括以下步骤s301~s304。
40.s301、电子设备获取目标基因数据库,该目标基因数据库中包括目标基因的基础参数以及和目标基因的热点突变信息。
41.需要强调的是,本实施例中所涉及到的目标基因的基础参数包括:目标基因的核酸类型和该目标基因在该核酸类型中的染体位置;以及每一个目标基因所对应的热点突变基因以及该热点突变基因的坐标信息。
42.热点突变信息包括:突变位点位置信息、突变序列和替换序列。
43.s302、电子设备基于目标基因的基础参数以及第一预设标准,确定野生型引物池。
44.野生型引物池是指目标野生型引物的集合。
45.电子设备基于目标软件中的输入参数(比如参考基因组、最小gc占比以及引物与目标位点间的最小距离等),以及目标基因的基础参数(比如目标基因的坐标信息),对目标基因数据库中的目标基因进行批量设计,得到初始野生型基因序列;然后电子设备再基于第一预设标准,对该初始野生型基因序列进行筛选,得到目标野生型引物,然后将得到的所有目标野生型引物的集合确定为野生型引物池。
46.本实施例中,第一预设标准包括:1)rank等级为1。
47.2)合并重复的初始野生型基因序列。
48.其中,rank等级表示推荐等级,用于表征chopchop软件的输出结果,rank等级为1表示最佳序列;合并重复的基因序列表示,电子设备通过第一预设标准,对该初始野生型基因序列进行筛选时,需要合并基因序列重复的初始野生型基因序列。
49.电子设备在通过目标软件以及第一预设标准确定出目标野生型引物后,即可确定该目标野生型引物所对应的基因序列为正义链序列还是反义链序列,即野生型引物池中的目标野生型引物所对应的基因序列包括目标野生型基因序列(+)和目标野生型基因序列(-),其中,目标野生型基因序列(+)是指目标野生型引物所对应的基因序列为正义链,目标野生型基因序列(-)是指目标野生型引物所对应的基因序列为反义链。需要说明的是,正义链(也可以称为编码链、有意义链或正链(+))是指dna上携带有编码蛋白质氨基酸信息的核苷酸序列的链;反义链(也可以称为反链(-))是指核苷酸序列与正义链互补的链。
50.s303、电子设备根据目标基因的热点突变信息和第二预设标准对野生型引物池中的目标野生型引物进行处理,确定突变型引物池。
51.应理解,基于不同生命体的个体性差异,目标基因数据库中的每一个目标基因均存在对应的热点突变位点。在本实施例中,则根据各个目标基因所对应的热点突变基因以及该热点突变基因的坐标信息,对野生型引物池中的目标野生型引物进行处理,确定突变
型引物池。
52.突变型引物池是指对目标突变型引物的集合。以下对目标突变型引物的确定方式进行解释说明。
53.首先,电子设备确定初始突变型基因序列。
54.基于本实施例中的引物和目标基因是部分或者全部互补的,目标基因突变之后,引物也需要进行相应方式的突变,因此,电子设备可以根据目标基因的热点突变信息对目标野生型引物进行突变,获得目标突变型引物。换而言之,电子设备可以将目标基因的热点突变信息作为目标野生型引物的热点突变信息,对目标野生型引物进行突变,获得目标突变型引物。
55.本实施例中,电子设备对野生型引物池中各个目标野生型引物对应的突变操作包括两种不同的处理方式:当目标野生型引物所对应的基因序列为正义链,即目标野生型引物所对应的基因序列为目标野生型基因序列(+)时,参见图4中所示,电子设备首先获取目标野生型引物所对应的目标野生型基因序列(+)5'-ttttgggctggccaaactgctgg-3',然后按照目标野生型引物中热点突变基因序列的坐标信息,以及替换(alt)序列,替换目标野生型引物上对应突变位点,即可将目标野生型引物所对应的目标野生型基因序列(+)5'-ttttgggctggccaaactgctgg-3',替换得到初始突变型基因序列5'-ttttgggagggccaaactgctgg-3'。
56.当目标野生型引物所对应的基因序列为反义链,即目标野生型引物所对应的基因序列为目标野生型基因序列(-)时,参见图5中所示,电子设备首先获取目标野生型引物所对应的目标野生型基因序列(-)5'-gtccacgctggccatcacgtagg-3';然后根据目标野生型基因序列(-)生成目标野生型基因序列(-)的反互补基因序列5'-cctacgtgatggccagcgtggac-3'和3'-ggatgcactaccggtcgcacctg-5';进一步的,在反互补基因序列中确定热点突变基因序列的位置坐标信息以及替换序列,通过替换后得到5'-ccttccaggaagcctacgtgatggccagcgtggac-3'和3'-ggaaggtccttcggatgcactaccggtcgcacctg-5';最后再进行反向互补处理,得到初始突变型基因序列5'-gtccacgctggccatcacgtaaggtccttcggagg-3'。
57.最后,电子设备再基于第二预设标准对初始突变型基因序列进行筛选,得到目标突变型引物,然后将得到的所有目标突变型引物的集合确定为突变型引物池。
58.本实施例中,第二预设标准包括:1)突变位点位于初始突变型基因序列上;2)初始突变型基因序列的长度为17-24bp;3)合并重复的初始突变型基因序列。
59.其中,突变位点位于目标突变型引物所对应的基因序列上表示,所得到的目标突变型引物所对应的基因序列中存在热点突变基因序列;合并重复的基因序列表示,电子设备通过第二预设标准,对该初始突变型基因序列进行筛选时,需要合并基因序列重复的初始突变型基因序列。
60.电子设备确定出目标突变型引物后,该引物即可在二代测序目标区域捕获技术中,实现对产生突变的目标区域片段的捕获。
61.例如,若待捕获的目标区域片段解旋后的两个基因序列分别为:5
’‑
attgcgttatttggggcccctttcg-3’;和3
’‑
taacgcaataaaccccggggaaagc-5’。
62.在上述基因序列5
’‑
attgcgttatttggggcccctttcg-3’中,实验表明gcg序列容易突变为gac序列。通过传统方法设计到的引物则为3
’‑
taacgcaataaaccccggggaaagc-5’;可见,由于gcg序列容易突变为gac序列,因此,传统的方法所设计得到的引物并不能实现对5
’‑
attgacttatttggggcccctttcg-3’序列的捕获。而通过本方法,所得到的引物序列为3
’‑
taactgaataaaccccggggaaagc-5’,通过该引物序列即可实现对于突变后得到的5
’‑
attgacttatttggggcccctttcg-3’序列的捕获。
63.s304、电子设备根据野生型引物池以及突变型引物池确定混合型引物池。
64.电子设备将野生型引物池以及突变型引物池中的所有目标野生型引物以及目标突变型引物进行混合,并将混合后的所有引物的集合确定为混合型引物池。
65.s305、电子设备确定引物结构,并根据第三预设标准对混合型引物池中的基因序列进行筛选,确定目标引物。
66.首先,电子设备对混合引物池中的所有引物所对应的基因序列进行引物结构设计,即将混合引物池中所有引物所对应的基因序列按照引物结构增加启动子与尾部茎环结构的基因序列,得到第一引物,参见图6中所示。
67.其中,启动子可以为t7启动子,该t7启动子的基因序列为:5'-taatacgactcactataggg-3'。
68.尾部茎环结构的基因序列为:5'-gttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt-3'。
69.然后,电子设备基于第三预设标准对第一引物进行筛选,得到目标引物,然后将得到的所有目标引物的集合确定为目标型引物池。
70.本实施例中,第三预设标准包括:1)第一引物的基因序列为常见热点突变基因序列;2)第一引物的基因序列长度为17-24bp;3)self-complementarity≤1;其中,self-complementarity表示自身互补性,表示引物内及引物与标准骨干序列之间的互补性。
71.4)错配数量为0;5)去除pam。
72.其中,突变位点位于目标突变型引物所对应的基因序列上表示,所得到的目标引物所对应的基因序列中包括常见的热点突变基因序列;目标引物所对应的基因序列长度为17-24bp;self-complementarity≤1,错配(mismatch)数量为0,去除pam是指去除所得到的目标引物中的原型间隔邻接基序(protospacer adjacent motif,pam)。
73.应理解,基于成簇规律间隔短回文重复序列(clustered regularly interspaced short palindrome repeats,crispr)和crispr相关核酸酶(crispr associated proteins,cas)的细菌抵抗外源质粒或噬菌体感染的防御体系所研究开发的crispr-cas9系统,可以实现细胞和生物体内的基因进行编辑以及基因捕获。
74.本技术实施例中提供的引物设计方法所得到的目标引物,可以应用于该系统。在通过该系统进行基因捕获时,以本实施例中提供的目标引物池中的目标引物作为反应参数,将该目标引物加入crispr-cas9系统的目标反应体系中,通过目标引物引发反应进而扩增出多个目标区域的核酸片段,从而捕获和富集目标反应体系中的目标区域片段。通过将该目标引物池中的目标引物应用于crispr-cas9系统后,能够显著提高基因捕获技术的特异性与灵敏度,并且降低引物成本。
75.需要说明的是,通过上述实施例中提供的方法步骤s301~s303,所得到的混合引物池中的目标引物即可应用于基因捕获中,本技术实施例在该方法的基础上,加入了s304,是为了使得通过步骤s304进一步处理所得到的目标引物可以应用于上述crispr-cas9系统,从而基于crispr-cas9系统本身的高特异性、高灵敏度的特点,可以进一步提高基因捕获技术的特异性与灵敏度。
76.通过本技术实施例提供的引物池设计方法所得到的目标引物池,其在包括目标野生型引物的基础上还包括目标突变型引物。目标突变型引物的加入可以在基因捕获的过程中特异性结合变异的基因片段,实现对低频突变的靶向捕获,提高灵敏度和特异性,进而提高捕获效率,减少样本测序深度,有效节约测序成本。
77.应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本技术实施例的实施过程构成任何限定。
78.图7为本技术实施例提供的一种引物设计装置的示意图,如图7所示,该装置包括:获取单元,用于获取目标基因数据库,目标基因数据库中包括目标基因和目标基因的热点突变信息,热点突变信息包括:突变位点位置信息、突变序列和替换序列;引物设计单元,用于对目标基因进行引物设计,生成目标野生型引物;突变处理单元,用于根据热点突变信息,对目标野生型引物的基因序列进行突变处理,生成目标突变型引物;确定单元,用于将目标野生型引物和目标突变型引物转化为目标引物,并将目标引物的集合确定为目标引物池。
79.图8是本技术一实施例提供的电子设备的示意图。如图8所示,该实施例的电子设备8包括:处理器80、存储器81以及存储在所述存储器81中并可在所述处理器80上运行的计算机程序82,例如引物设计方法的程序。所述处理器80执行所述计算机程序82时实现上述各个引物设计方法实施例中的步骤。或者,所述处理器80执行所述计算机程序82时实现上述各装置实施例中各模块/单元的功能。
80.示例性的,所述计算机程序82可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器81中,并由所述处理器80执行,以完成本技术。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序82在所述电子设备8中的执行过程。
81.所述电子设备8可以是平板电脑、平板电脑、桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述电子设备可包括,但不仅限于,处理器80、存储器81。本领域技术人员可以理解,图8仅仅是电子设备8的示例,并不构成对电子设备8的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述电子设备还可以包括输入输出设备、网络接入设备、总线等。
82.所称处理器80可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器 (digital signal processor,dsp)、专用集成电路 (application specific integrated circuit,asic)、现场可编程门阵列 (field-programmable gate array,fpga) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
83.所述存储器81可以是所述电子设备8的内部存储单元,例如电子设备8的硬盘或内存。所述存储器81也可以是所述电子设备8的外部存储设备,例如所述电子设备8上配备的插接式硬盘,智能存储卡(smart media card, smc),安全数字(secure digital, sd)卡,闪存卡(flash card)等。进一步地,所述存储器81还可以既包括所述电子设备8的内部存储单元也包括外部存储设备。所述存储器81用于存储所述计算机程序以及所述电子设备所需的其他程序和数据。所述存储器81还可以用于暂时地存储已经输出或者将要输出的数据。
84.所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本技术的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
85.在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
86.本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
87.在本技术所提供的实施例中,应该理解到,所揭露的装置/电子设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/电子设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
88.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
89.另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单
元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
90.所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术实现上述实施例方法中的全部或部分流程,也可以通过计算机程序指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。
91.以上所述实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围,均应包含在本技术的保护范围之内。

技术特征:


1.一种引物设计方法,其特征在于,所述方法包括:获取目标基因数据库,所述目标基因数据库中包括目标基因和所述目标基因的热点突变信息,所述热点突变信息包括:突变位点位置信息、突变序列和替换序列;对所述目标基因进行引物设计,生成目标野生型引物;根据所述热点突变信息,对所述目标野生型引物的基因序列进行突变处理,生成目标突变型引物;将所述目标野生型引物和所述目标突变型引物转化为目标引物,并将所述目标引物的集合确定为目标引物池。2.根据权利要求1所述的方法,其特征在于,在对所述目标基因进行引物设计时,引物的参考基因组为hg19;引物的最大错配数量为3;引物的最小长度为18,最大长度为25;引物的最小gc占比为20,最大gc占比为80。3.根据权利要求1或2所述的方法,其特征在于,所述对所述目标基因进行引物设计,生成目标野生型引物,包括:对所述目标基因进行引物设计,得到初始野生型基因序列;根据第一预设标准对所述初始野生型基因序列进行筛选,生成所述目标野生型引物;其中,所述第一预设标准为:rank等级为1;合并重复的所述初始野生型基因序列。4.根据权利要求1所述的方法,其特征在于,所述根据所述热点突变信息,对所述目标野生型引物的基因序列进行突变处理,生成目标突变型引物,包括:根据所述热点突变信息,对所述目标野生型引物的基因序列进行突变处理,得到初始突变型基因序列;基于第二预设标准对所述初始突变型基因序列进行筛选,得到所述目标突变型引物,所述第二预设标准为:突变位点位于所述初始突变型基因序列上;所述初始突变型基因序列的长度为17-24bp;合并重复的所述初始突变型基因序列。5.根据权利要求4所述的方法,其特征在于,在所述目标野生型引物所对应的基因序列为正义链时,所述根据所述热点突变信息,对所述目标野生型引物的基因序列进行突变处理,得到初始突变型基因序列,包括:根据所述突变位点位置信息,将所述正义链中的所述突变序列替换为所述替换序列,得到所述初始突变型基因序列。6.根据权利要求4所述的方法,其特征在于,在所述目标野生型引物所对应的基因序列为反义链时,所述根据所述热点突变信息,对所述目标野生型引物的基因序列进行突变处理,得到初始突变型基因序列,包括:生成所述反义链的反互补基因序列;根据所述突变位点位置信息,将所述反互补基因序列中的所述突变序列替换为所述替
换序列;对替换后的所述反互补基因序列进行反向互补处理,得到所述初始突变型基因序列。7.根据权利要求1所述的方法,其特征在于,所述将所述目标野生型引物和所述目标突变型引物转化为目标引物,包括:在所述目标野生型引物和所述目标突变型引物的基因序列的一端添加启动子,另一端添加尾部茎环结构,形成第一引物;基于第三预设标准对所述第一引物进行筛选,得到所述目标引物;所述第三预设标准为:所述第一引物的基因序列为热点突变基因序列;所述第一引物的基因序列长度为17-24bp;self-complementarity≤1;错配数量为0;去除原型间隔邻接基序pam。8.一种引物设计装置,其特征在于,所述装置包括:获取单元,用于获取目标基因数据库,所述目标基因数据库中包括目标基因和所述目标基因的热点突变信息,所述热点突变信息包括:突变位点位置信息、突变序列和替换序列;引物设计单元,用于对所述目标基因进行引物设计,生成目标野生型引物;突变处理单元,用于根据所述热点突变信息,对所述目标野生型引物的基因序列进行突变处理,生成目标突变型引物;确定单元,用于将所述目标野生型引物和所述目标突变型引物转化为目标引物,并将所述目标引物的集合确定为目标引物池。9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述方法的步骤。10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述方法的步骤。

技术总结


本申请属于基因捕获技术领域,提出了一种引物设计方法、装置、设备及可读存储介质。该方法能够解决现有技术中的传统引物存在的特异性差,灵敏度较低的问题。该方法包括获取目标基因数据库,目标基因数据库中包括目标基因和目标基因的热点突变信息,该热点突变信息包括:突变位点位置信息、突变序列和替换序列;对目标基因进行引物设计,生成目标野生型引物;根据热点突变信息,对目标野生型引物的基因序列进行突变处理,生成目标突变型引物;将目标野生型引物和目标突变型引物转化为目标引物,并将目标引物的集合确定为目标引物池。并将目标引物的集合确定为目标引物池。并将目标引物的集合确定为目标引物池。


技术研发人员:

张家兵 李杰 苏艳芳 黄君君

受保护的技术使用者:

上海华测艾普医学检验所有限公司

技术研发日:

2023.01.10

技术公布日:

2023/3/10

本文发布于:2023-03-13 11:23:16,感谢您对本站的认可!

本文链接:https://patent.en369.cn/patent/3/69969.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:引物   基因   突变   目标
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 369专利查询检索平台 豫ICP备2021025688号-20 网站地图