最近在搞⼀个PCR法病原微⽣物检测产品的引物及探针设计项⽬,在进⾏调研初步了解后,发现此项⽬重难点在于序列数据库构建及模板序列的挖掘。福柯知识考古学
安瓦尔事件
序列数据库构建主要是因为数据量太⼤,不好下载;⽽且⼀个菌种⼀般对应多条参考序列,需要整理并选出代表性序列。数据下载上,没有好办法,只能⼀点点下载。数据整理,去冗余可以考虑只保留完整参考序列,其他的contig都去掉。选代表性序列,可以考虑排列组合计算两两间的相似度,最终选取与其他序列的平均相似度最⾼的那个作为代表性序列(多序列⽐对,考虑mummer软件)。东京国际动漫节
严格自律
模板序列要求要在菌种/属内保守,在菌种/属间及宿主上特异。物种内保守的区域获取:(1)⽂献查;(2)MEME预测motif;(3)滑动窗⼝法分割代表性序列,然后与物种内进⾏⽐对,计算保守性。三者任选其⼀,可以保证模板序列的保守性。除此之外,还需要考虑特异性:(1)设计出引物对后,将其他物种序列作为参考基因组,利⽤MFEprimer评价是否能扩出产物;(2)将选出的模板序列与其他物种序列进⾏⽐对,计算特异性,选取特异性好的模板序列。 预测⽐较耗时的是所有物种的代表性序列选取及其汇聚成的总序列⽂件的⽐对索引构建。
冶金材料最后,模板序列对应的引物及探针设计,利⽤primer3或者其他引物设计软件设计即可。多重引物及探针设计需要保证引物之间没有⼆聚体,所有探针及其产物间的分⼦量差值越⼤越好。