一种组合基因标志物及其检测试剂在制备乳腺癌预后制剂中的应用的制作方法

阅读: 评论:0



1.本发明属于生物医药领域,具体涉及一种组合基因标志物及其检测试剂在制备乳腺癌预后制剂中的应用。


背景技术:



2.乳腺癌是女性最常见的恶性肿瘤。
3.2021年globocan全球癌症统计数据显示,全球乳腺癌每年新发病例高达226万例,乳腺癌已取代肺癌成为全球第一大癌症。就我国而言,乳腺癌早已位居我国女性恶性肿瘤首位,每年有30余万女性被诊断出乳腺癌。在东部沿海地区及经济发达的大城市,乳腺癌发病率上升尤其明显。从发病年龄来看,我国乳腺癌发病率从20岁以后开始逐渐上升,45-50岁达到高值。其高死亡率严重影响女性的生活质量和身心健康。早期诊断、早期是降低乳腺癌死亡率、提高患者生活质量的关键。
4.根据雌激素受体、孕激素受体和人表皮生长因子受体-2的表达,组织病理学方面将乳腺癌分为luminala型、luminalb型、her-2阳性型、三阴性乳腺癌型以及claudin-low型乳腺癌。
5.乳腺癌的生存期与是否及时息息相关,能否及时的关键便是能否在乳腺癌发生的早期就诊断明确或及时发现转移病灶。因此,早期诊断乳腺癌的措施成为人们研究的主题。目前临床上对于乳腺癌的早期诊断分为以钼靶x线和ct为代表的影像学检查、以吸细胞学穿刺为代表的组织学检查以及血清肿瘤标志物检查等方式。不同分期的患者的肿瘤预后是不同的,无论哪个分期的肿瘤,对的反应和预后都有更大的异质性。因此,识别预后较差的患者,对指导有很大帮助。随着包括三代测序技术在内的基因测序技术的发展,对肿瘤发生和发展的认识越来越深入。除了dna突变外,基因表达水平或相应的调控机制也会影响肿瘤的和预后因此,高敏感度、高特异性的分子诊断方法的开发,成为乳腺癌领域的重要课题。


技术实现要素:



6.本技术的目的之一在于提供一种能够用于乳腺癌预后的基因标志物组合。
7.一种组合基因标志物,包括:
8.cs,smarce1,igsf9b,sytl4,cemip,emc2,fhl2,ramp3,cisd1,paics,tti2,fibcd1,zcchc9,vav3,limd2,tank,pak6,etfa,prdm16,adam15,nfkbiz,ddah1,cc2d1b,sh2b2,acyp2,endov,kbtbd11,al162595.1,pced1b,lysmd4,trmt2b,slc6a9,nos1ap,linc01291,psmb10,rpl12p38,znf888,al391845.1,linc02585,linc01431,ac099520.2,cep95,mir4713hg,rbm15b,ac061992.2中的至少一个;用于预测乳腺癌预后。
9.本技术的基因标志物组合,还包括了各基因标志物中的任意长度的片段,也就是说,来自本发明涉及的以上45个基因中各自任意一个片段(该片段可以为任意长度)组合,
均落入本技术的保护范围中。
10.本发明的第二个目的是提供所述的组合基因标志物的检测试剂在制备乳腺癌预后制剂中的应用,所述基因标志物包括:
11.cs,smarce1,igsf9b,sytl4,cemip,emc2,fhl2,ramp3,cisd1,paics,tti2,fibcd1,zcchc9,vav3,limd2,tank,pak6,etfa,prdm16,adam15,nfkbiz,ddah1,cc2d1b,sh2b2,acyp2,endov,kbtbd11,al162595.1,pced1b,lysmd4,trmt2b,slc6a9,nos1ap,linc01291,psmb10,rpl12p38,znf888,al391845.1,linc02585,linc01431,ac099520.2,cep95,mir4713hg,rbm15b,ac061992.2中的至少一个。
12.所述的检测试剂为基因表达量检测试剂。
13.可以通过检测上述基因的表达量,来单独或者综合对乳腺癌进行预后判断。
14.根据表2中的p值结果确定在乳腺癌高危组和低危组之间有显著差异的基因(p值带*号),可以用于单独或者综合起来预后。
15.所述乳腺癌包括:luminal-a型乳腺癌、luminal-b型乳腺癌、her2阳性乳腺癌、三阴性乳腺癌、claudin-low型乳腺癌。
16.所述检测试剂针对的待测样本选自原发性乳腺组织和/或细胞。
17.所述检测试剂为二代测序技术。针对的是在ncbi_gene数据库(https://www.ncbi.nlm.nih.gov/gene/?term=)中本发明涉及的45个基因的最长转录本。
18.进一步地,具体在应用时,将基因标志物的表达量代入模型公式,计算每个样本的风险评分;
19.其中,所述模型公式为rs=(0.008
×
tpmcs)+(-1.046
×
tpmsmarce1)+(1.907
×
tpmigsf9b)+(-0.238
×
tpmsytl4)+(0.280
×
tpmcemip)+(0.417
×
tpmemc2)+(0.029
×
tpmfhl2)+(0.014
×
tpmramp3)+(0.205
×
tpmcisd1)+(0.018
×
tpmpaics)+(0.043
×
tpmtti2)+(0.255
×
tpmfibcd1)+(0.419
×
tpmzcchc9)+(-0.055
×
tpmvav3)+(-0.210
×
tpmlimd2)+(-0.219
×
tpmtank)+(1.135
×
tpmpak6)+(0.491
×
tpmetfa)+(3.076
×
tpmprdm16)+(0.110
×
tpmadam15)+(-0.108
×
tpmnfkbiz)+(-0.033
×
tpmddah1)+(-0.756
×
tpmcc2d1b)+(-0.962
×
tpmsh2b2)+(1.815
×
tpmcayp2)+(-0.446
×
tpmendov)+(-0.360
×
tpmkbtbd11)+(1.335
×
tpmal162595.1)+(0.127
×
tpmpced1b)+(-1.180
×
tpmlysmd4)+(0.244
×
tpmtrmt2b)+(0.489
×
tpmslc6a9)+(-0.473
×
tpmnos1ap)+(-0.154
×
tpmlinc01291)+(-0.154
×
tpmpsmb10)+(3.272
×
tpmrpl12p38)+(0.841
×
tpmznf888)+(-11.240
×
tpmal391845.1)+(0.111
×
tpmlinc02585)+(2.142
×
tpmlinc01431)+(22.692
×
tpmac099520.2)+(-0.048
×
tpmcep95)+(0.092
×
tpmmir4713hg)+(-0.201
×
tpmrbm15b)+(-1.648
×
tpmac061992.2),其中,tpmcs为cs基因表达量归一化处理后的tpm值,tpmsmarce1为smarce1基因表达量归一化处理后的tpm值,tpmigsf9b为igsf9b基因表达量归一化处理后的tpm值,tpmsytl4为sytl4基因表达量归一化处理后的tpm值,tpmcemip为cemip基因表达量归一化处理后的tpm值,tpmemc2为emc2基因表达量归一化处理后的tpm值,tpmfhl2为fhl2基因表达量归一化处理后的tpm值,tpmramp3为ramp3基因表达量归一化处理后的tpm值,tpmcisd1为cisd1基因表达量归一化处理后的tpm值,tpmpaics为paics基因表达量归一化处理后的tpm值,tpmtti2为tti2基因表达量归一化处理后的tpm值,tpmfibcd1为fibcd1基因表达量归一化处理后的tpm值,tpmzcchc9为zcchc9基因表达量归
一化处理后的tpm值,tpmvav3为vav3基因表达量归一化处理后的tpm值,tpmlimd2为limd2基因表达量归一化处理后的tpm值,tpmtank为tank基因表达量归一化处理后的tpm值,tpmpak6为pak6基因表达量归一化处理后的tpm值,tpmetfa为etfa基因表达量归一化处理后的tpm值,tpmprdm16为prdm16基因表达量归一化处理后的tpm值,tpmadam15为adam15基因表达量归一化处理后的tpm值,tpmnfkbiz为nfkbiz基因表达量归一化处理后的tpm值,tpmddah1为ddah1基因表达量归一化处理后的tpm值,tpmcc2d1b为cc2d1b基因表达量归一化处理后的tpm值,tpmsh2b2为sh2b2基因表达量归一化处理后的tpm值,tpmacyp2为acyp2基因表达量归一化处理后的tpm值,tpmendov为endov基因表达量归一化处理后的tpm值,tpmkbtbd11为kbtbd11基因表达量归一化处理后的tpm值,tpmal162595.1为al162595.1基因表达量归一化处理后的tpm值,tpmpced1b为pced1b基因表达量归一化处理后的tpm值,tpmlysmd4为lysmd4基因表达量归一化处理后的tpm值,tpmtrmt2b为trmt2b基因表达量归一化处理后的tpm值,tpmslc6a9为slc6a9基因表达量归一化处理后的tpm值,tpmnos1ap为nos1ap基因表达量归一化处理后的tpm值,tpmlinc01291为linc01291基因表达量归一化处理后的tpm值,tpmpsmb10为psmb10基因表达量归一化处理后的tpm值,tpmrpl12p38为rpl12p38基因表达量归一化处理后的tpm值,tpmznf888为znf888基因表达量归一化处理后的tpm值,tpmal391845.1为al391845.1基因表达量归一化处理后的tpm值,tpmlinc02585为linc02585基因表达量归一化处理后的tpm值,tpmlinc01431为linc01431基因表达量归一化处理后的tpm值,tpmac099520.2为ac099520.2基因表达量归一化处理后的tpm值,tpmcep95为cep95基因表达量归一化处理后的tpm值,tpmmir4713hg为mir4713hg基因表达量归一化处理后的tpm值,tpmrbm15b为rbm15b基因表达量归一化处理后的tpm值,tpmac061992.2为ac061992.2基因表达量归一化处理后的tpm值。
20.根据计算得到的风险评价rs值,可以对样本患者的疾病预后水平进行预测。当rs≤62.606时,将样本划分为低危组,当rs》62.606时,将样本划分为高危组。在本发明中,根据模型的验证集数据分析,两组患者的生存曲线可见图9。
21.本发明还提供了一种预测乳腺癌预后的制剂,即上述的检测试剂。
22.本技术通过基因检测、标志物组合及数据挖掘算法的联合应用来建立基因标志物组合模型,利用多基因预测模型,评价原发乳腺癌的预后水平。主要包括以下步骤:
23.(1)收集原位乳腺癌的临床样本,针对样本进行二代测序,构建乳腺癌基因表达谱数据库;
24.(2)将测序数据通过归一化处理,计算出样本中45个基因的tpm(transcripts per million)值,将tpm数据代入回归公式,将根据算得的rs值水平来预测该原位乳腺癌样品的预后水平。根据计算得到的风险评价rs值,可以对样本患者的疾病预后水平进行预测。当rs≤62.606时,将样本划分为低危组,当rs》62.606时,将样本划分为高危组。在本发明中,根据模型的验证集数据分析,两组患者的生存曲线可见图9。
25.本发明构建统计分析模型,通过检测45个与乳腺癌相关的基因,预测乳腺癌预后,帮助临床医生进行用药指导,实现精准医疗,以提高乳腺患者的生存率。经验证,本发明试剂盒能准确预测乳腺癌预后,其适用范围广,准确率高,实验周期短,对患者进行精准具有重要的临床意义。
附图说明
26.图1显示了运用lasso回归构建本发明45基因预测乳腺癌模型的过程。
27.图2为本模型的偏似然偏差随log(λ)变化的曲线,显示了本模型的拟合水平。
28.图3为本发明涉及的45个基因的细胞组分富集图谱。
29.图4为本发明涉及的45个基因的分子功能富集图谱。
30.图5为本发明涉及的45个基因的生物过程富集图谱。
31.图6为本发明涉及的45个基因预测模型在训练集中的roc曲线。
32.图7为在训练集中经模型预测后高危组与低危组样本的kaplan-meier生存曲线。
33.图8为本发明涉及的45个基因预测模型在验证集中的roc曲线。
34.图9为在验证集中经模型预测后高危组与低危组样本的kaplan-meier生存曲线。
具体实施方式
35.下面结合具体实施例对本发明作进一步的详细说明,以使本领域的技术人员更加清楚地理解本发明。
36.以下各实施例,仅用于说明本发明,但不仅仅只用来限制本发明的范围。基于本发明中的具体实施例,本领域普通技术人员在没有做出创造性劳动的情况下,所获得的其他所有实施例,都属于本发明的保护范围。
37.术语"训练集"指用于建立两个变量之间的相关性的一组样品。例如,训练集是用于建立基因表达和患者的状况之间的相关性的一组患者样本。在本发明的背景下,训练集是来自tcga数据库中原发性乳腺癌患者的一组样品数据,包含临床诊断、肿瘤大小、生存数据等相关信息。训练集被用于建立表达概况和患者疾病分类之间的相关性。
38.术语"测试集"指用于验证使用训练集建立的相关性的一组样品。例如,测试集是来自对其基因表达和患者的状况都已知的患者的一组样品。该集被用于验证使用训练集确定的相关性是否将正确地预测患者的状况。在本发明的背景下,测试集是来自原发性乳腺癌患者的一组样品,与训练集中包含的数据类型相同。
39.从tcga(thecancergenomeatlas)中下载原发性乳腺癌转录组数据集,模型构建中训练集和验证集中的数据包括luminala型、luminalb型、her-2阳性型、三阴性乳腺癌型以及claudin-low型乳腺癌样本数据。通过整合多种机器学习算法,在训练集进行模型构建,并采用交叉验证的方式获取最佳模型参数,这一风险模型通过45个基因的mrna表达水平可以对乳腺癌患者进行风险评分。
40.进一步关于模型的验证部分,其方法所述如下:(1)提取tcga中乳腺癌的转录组数据集;(2)根据平台文件进行注释;(3)合并基因相同的mrna表达;(4)对每一样本的基因表达进行归一化;(5)提取归一化后的模型纳入基因的表达量;(6)根据模型公式计算每个样本的风险评分。
41.本方法适用的人为确诊为乳腺癌的患者。
42.为了有助于更加清楚的理解本发明的内容,结合具体的实施例详细介绍如下:
43.实施例1
44.s.1训练集样本收集及处理:
45.本发明分析了大量的乳腺癌生物学样品测序数据,根据相关基因表达数据,构建
乳腺癌基因表达数据库。
46.s.2乳腺癌预后相关基因的筛选:
47.根据基因表达丰度的测量值,发明人采用统计分析方法t检验从12263个基因中筛选出与乳腺癌预后检测密切相关的基因。这些基因在高危乳腺癌样本和低危乳腺癌样本中存在差异性表达。
48.实施例2:训练集模型构建:
49.本实施例中,为了构建具有鲁棒性的基于上述筛选出的特异基因为基础的预后风险模型,从tcga(thecancergenomeatlas)中下载乳腺癌转录组数据集,通过整合多种机器学习算法,在训练集进行模型构建,并采用交叉验证的方式获取最佳模型参数,这一风险模型通过45个基因的mrna表达水平可以对乳腺癌患者进行风险评分。
50.首先,通过randomforestsrc使用随机生存森林算法进一步缩小实施例1中筛选出的基因的范围。算法中参数“重要性=真"且所有其他参数设置为默认值。将变量按重要性排序取前60位的基因纳入惩罚回归分析。
51.其次,基于tcga-brca数据库中三分之一原位乳腺癌样本共379例中的表达模式,发明人采用lasso(least absolute shrinkage and seletion operator)模型,建立统计分析模型用于判别乳腺癌风险。该模型用于建立广义线性模型,在本实施例中用于构建预测乳腺癌预后的基因模型,该模型通过引入惩罚项λ,提高了模型的泛化能力。
52.根据最佳lamda值最终有45个基因纳入到模型,见表1。
53.表1
54.[0055][0056]
表2显示了在乳腺癌中本发明涉及的45个基因在乳腺癌高危组和低危组之间的风险因数以及p值。
[0057][0058]
模型的计算公式为
[0059]
rs=(0.008
×
tpmcs)+(-1.046
×
tpmsmarce1)+(1.907
×
tpmigsf9b)+(-0.238
×
tpmsytl4)+(0.280
×
tpmcemip)+(0.417
×
tpmemc2)+(0.029
×
tpmfhl2)+(0.014
×
tpmramp3)+(0.205
×
tpmcisd1)+(0.018
×
tpmpaics)+(0.043
×
tpmtti2)+(0.255
×
tpmfibcd1)+(0.419
×
tpmzcchc9)+(-0.055
×
tpmvav3)+(-0.210
×
tpmlimd2)+(-0.219
×
tpmtank)+(1.135
×
tpmpak6)+(0.491
×
tpmetfa)+(3.076
×
tpmprdm16)+(0.110
×
tpmadam15)+(-0.108
×
tpmnfkbiz)+(-0.033
×
tpmddah1)+(-0.756
×
tpmcc2d1b)+(-0.962
×
tpmsh2b2)+(1.815
×
tpmcayp2)+(-0.446
×
tpmendov)+(-0.360
×
tpmkbtbd11)+(1.335
×
tpmal162595.1)+(0.127
×
tpmpced1b)+(-1.180
×
tpmlysmd4)+(0.244
×
tpmtrmt2b)+(0.489
×
tpmslc6a9)+(-0.473
×
tpmnos1ap)+(-0.154
×
tpmlinc01291)+(-0.154
×
tpmpsmb10)+(3.272
×
tpmrpl12p38)+(0.841
×
tpmznf888)+(-11.240
×
tpmal391845.1)+(0.111
×
tpmlinc02585)+(2.142
×
tpmlinc01431)+(22.692
×
tpmac099520.2)+(-0.048
×
tpmcep95)+(0.092
×
tpmmir4713hg)+(-0.201
×
tpmrbm15b)+(-1.648
×
tpmac061992.2),其中,tpmcs为cs基因表达量归一化处理后的tpm值,tpmsmarce1为smarce1基因表达量归一化处理后的tpm值,tpmigsf9b为igsf9b基因表达量归一化处理后的tpm值,tpmsytl4为sytl4基因表达量归一化处理后的tpm值,tpmcemip为cemip基因表达量归一化处理后的tpm值,tpmemc2为emc2基因表达量归一化处理后的tpm值,tpmfhl2为fhl2基因表达量归一化处理后的tpm值,tpmramp3为ramp3基因表达量归一化处理后的tpm值,tpmcisd1为cisd1基因表达量归一化处理后的tpm值,tpmpaics为paics基因表达量归一化处理后的tpm值,tpmtti2为tti2基因表达量归一化处理后的tpm值,tpmfibcd1为fibcd1基因表达量归一化处理后的tpm值,tpmzcchc9为zcchc9基因表达量归一化处理后的tpm值,tpmvav3为vav3基
因表达量归一化处理后的tpm值,tpmlimd2为limd2基因表达量归一化处理后的tpm值,tpmtank为tank基因表达量归一化处理后的tpm值,tpmpak6为pak6基因表达量归一化处理后的tpm值,tpmetfa为etfa基因表达量归一化处理后的tpm值,tpmprdm16为prdm16基因表达量归一化处理后的tpm值,tpmadam15为adam15基因表达量归一化处理后的tpm值,tpmnfkbiz为nfkbiz基因表达量归一化处理后的tpm值,tpmddah1为ddah1基因表达量归一化处理后的tpm值,tpmcc2d1b为cc2d1b基因表达量归一化处理后的tpm值,tpmsh2b2为sh2b2基因表达量归一化处理后的tpm值,tpmacyp2为acyp2基因表达量归一化处理后的tpm值,tpmendov为endov基因表达量归一化处理后的tpm值,tpmkbtbd11为kbtbd11基因表达量归一化处理后的tpm值,tpmal162595.1为al162595.1基因表达量归一化处理后的tpm值,tpmpced1b为pced1b基因表达量归一化处理后的tpm值,tpmlysmd4为lysmd4基因表达量归一化处理后的tpm值,tpmtrmt2b为trmt2b基因表达量归一化处理后的tpm值,tpmslc6a9为slc6a9基因表达量归一化处理后的tpm值,tpmnos1ap为nos1ap基因表达量归一化处理后的tpm值,tpmlinc01291为linc01291基因表达量归一化处理后的tpm值,tpmpsmb10为psmb10基因表达量归一化处理后的tpm值,tpmrpl12p38为rpl12p38基因表达量归一化处理后的tpm值,tpmznf888为znf888基因表达量归一化处理后的tpm值,tpmal391845.1为al391845.1基因表达量归一化处理后的tpm值,tpmlinc02585为linc02585基因表达量归一化处理后的tpm值,tpmlinc01431为linc01431基因表达量归一化处理后的tpm值,tpmac099520.2为ac099520.2基因表达量归一化处理后的tpm值,tpmcep95为cep95基因表达量归一化处理后的tpm值,tpmmir4713hg为mir4713hg基因表达量归一化处理后的tpm值,tpmrbm15b为rbm15b基因表达量归一化处理后的tpm值,tpmac061992.2为ac061992.2基因表达量归一化处理后的tpm值。
[0060]
根据构建的模型,将训练集的379例患者数据代入公式计算rs值,当rs≤62.606时,将样本划分为低危组,当rs》62.606时,将样本划分为高危组。
[0061]
在训练集中,本模型对于1年生存期的预测auc为78.8%;3年生存期的预测auc为82.6%;5年生存期的预测auc为86.2%;7年生存期的预测auc为87.4%;10年生存期的预测auc为93.2%,见图6。
[0062]
kaplan-meier生存曲线显示,训练集队列中高危组的总生存期均显著低于低危组(p《0.05),见图7。
[0063]
实施例3:基于外部数据集对预后风险模型进行验证。
[0064]
关于模型的验证部分,其方法所述如下:(1)提取tcga中训练集以外的乳腺癌转录组数据集;(2)根据平台文件进行注释;(3)合并基因相同的mrna表达;(4)对每一样本的基因表达进行归一化转换为tpm值;(5)根据模型公式计算每个样本的风险评分;(6)根据模型的阈值对样本进行分组并进行组间生存分析。
[0065]
验证集测序数据集来自tcga-brca数据集,选中训练集外剩余的三分之二原发性乳腺癌共757例数据。
[0066]
首先测序标签进行基因注释,对应同一基因的不同探针按均值进行合并,接着对样本进行归一化处理。将纳入模型的基因代入公式为每个样本计算风险评分,按各队列风险评分中位数进行分组,并对亚组进行生存分析和auc值计算,评估模型的预后效能。
[0067]
根据计算得到的风险评价rs值,可以对样本患者的疾病预后水平进行预测。当rs
≤62.606时,将样本划分为低危组,当rs》62.606时,将样本划分为高危组。
[0068]
在验证集中,本模型对于1年生存期的预测auc为77.5%;3年生存期的预测auc为81.5%;5年生存期的预测auc为79.8%;7年生存期的预测auc为62.2%;10年生存期的预测auc为60.0%,见图8。
[0069]
kaplan-meier生存曲线显示,验证集队列中高危组的总生存期均显著低于低危组(p《0.05),见图9。
[0070]
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。

技术特征:


1.一种组合基因标志物,其特征在于,包括:cs,smarce1,igsf9b,sytl4,cemip,emc2,fhl2,ramp3,cisd1,paics,tti2,fibcd1,zcchc9,vav3,limd2,tank,pak6,etfa,prdm16,adam15,nfkbiz,ddah1,cc2d1b,sh2b2,acyp2,endov,kbtbd11,al162595.1,pced1b,lysmd4,trmt2b,slc6a9,nos1ap,linc01291,psmb10,rpl12p38,znf888,al391845.1,linc02585,linc01431,ac099520.2,cep95,mir4713hg,rbm15b,ac061992.2中的至少一个;用于乳腺癌预后。2.权利要求1所述的组合基因标志物的检测试剂在制备乳腺癌预后制剂中的应用,其特征在于,所述基因标志物包括:cs,smarce1,igsf9b,sytl4,cemip,emc2,fhl2,ramp3,cisd1,paics,tti2,fibcd1,zcchc9,vav3,limd2,tank,pak6,etfa,prdm16,adam15,nfkbiz,ddah1,cc2d1b,sh2b2,acyp2,endov,kbtbd11,al162595.1,pced1b,lysmd4,trmt2b,slc6a9,nos1ap,linc01291,psmb10,rpl12p38,znf888,al391845.1,linc02585,linc01431,ac099520.2,cep95,mir4713hg,rbm15b,ac061992.2中的至少一个。3.如权利要求2所述的应用,其特征在于,所述乳腺癌包括:luminal-a型乳腺癌、luminal-b型乳腺癌、her2阳性乳腺癌、三阴性乳腺癌、claudin-low型乳腺癌。4.如权利要求2所述的应用,其特征在于,所述检测试剂针对的待测样本选自原发性乳腺组织和/或细胞。5.如权利要求2所述的应用,其特征在于,所述检测试剂为二代测序技术。6.如权利要求2所述的应用,其特征在于,将基因标志物的表达量代入模型公式,计算每个样本的风险评分;其中,所述模型公式为rs=(0.008
×
tpmcs)+(-1.046
×
tpmsmarce1)+(1.907
×
tpmigsf9b)+(-0.238
×
tpmsytl4)+(0.280
×
tpmcemip)+(0.417
×
tpmemc2)+(0.029
×
tpmfhl2)+(0.014
×
tpmramp3)+(0.205
×
tpmcisd1)+(0.018
×
tpmpaics)+(0.043
×
tpmtti2)+(0.255
×
tpmfibcd1)+(0.419
×
tpmzcchc9)+(-0.055
×
tpmvav3)+(-0.210
×
tpmlimd2)+(-0.219
×
tpmtank)+(1.135
×
tpmpak6)+(0.491
×
tpmetfa)+(3.076
×
tpmprdm16)+(0.110
×
tpmadam15)+(-0.108
×
tpmnfkbiz)+(-0.033
×
tpmddah1)+(-0.756
×
tpmcc2d1b)+(-0.962
×
tpmsh2b2)+(1.815
×
tpmcayp2)+(-0.446
×
tpmendov)+(-0.360
×
tpmkbtbd11)+(1.335
×
tpmal162595.1)+(0.127
×
tpmpced1b)+(-1.180
×
tpmlysmd4)+(0.244
×
tpmtrmt2b)+(0.489
×
tpmslc6a9)+(-0.473
×
tpmnos1ap)+(-0.154
×
tpmlinc01291)+(-0.154
×
tpmpsmb10)+(3.272
×
tpmrpl12p38)+(0.841
×
tpmznf888)+(-11.240
×
tpmal391845.1)+(0.111
×
tpmlinc02585)+(2.142
×
tpmlinc01431)+(22.692
×
tpmac099520.2)+(-0.048
×
tpmcep95)+(0.092
×
tpmmir4713hg)+(-0.201
×
tpmrbm15b)+(-1.648
×
tpmac061992.2),其中,tpmcs为cs基因表达量归一化处理后的tpm值,tpmsmarce1为smarce1基因表达量归一化处理后的tpm值,tpmigsf9b为igsf9b基因表达量归一化处理后的tpm值,tpmsytl4为sytl4基因表达量归一化处理后的tpm值,tpmcemip为cemip基因表达量归一化处理后的tpm值,tpmemc2为emc2基因表达量归一化处理后的tpm值,tpmfhl2为fhl2基因表达量归一化处理后的tpm值,tpmramp3为ramp3基因表达量归一化处理后的tpm值,tpmcisd1为cisd1基因表达量归一化处理后的tpm值,tpmpaics为paics基因表达量归一化处理后的tpm值,tpmtti2为tti2基因表达量归一化处理后的tpm值,
tpmfibcd1为fibcd1基因表达量归一化处理后的tpm值,tpmzcchc9为zcchc9基因表达量归一化处理后的tpm值,tpmvav3为vav3基因表达量归一化处理后的tpm值,tpmlimd2为limd2基因表达量归一化处理后的tpm值,tpmtank为tank基因表达量归一化处理后的tpm值,tpmpak6为pak6基因表达量归一化处理后的tpm值,tpmetfa为etfa基因表达量归一化处理后的tpm值,tpmprdm16为prdm16基因表达量归一化处理后的tpm值,tpmadam15为adam15基因表达量归一化处理后的tpm值,tpmnfkbiz为nfkbiz基因表达量归一化处理后的tpm值,tpmddah1为ddah1基因表达量归一化处理后的tpm值,tpmcc2d1b为cc2d1b基因表达量归一化处理后的tpm值,tpmsh2b2为sh2b2基因表达量归一化处理后的tpm值,tpmacyp2为acyp2基因表达量归一化处理后的tpm值,tpmendov为endov基因表达量归一化处理后的tpm值,tpmkbtbd11为kbtbd11基因表达量归一化处理后的tpm值,tpmal162595.1为al162595.1基因表达量归一化处理后的tpm值,tpmpced1b为pced1b基因表达量归一化处理后的tpm值,tpmlysmd4为lysmd4基因表达量归一化处理后的tpm值,tpmtrmt2b为trmt2b基因表达量归一化处理后的tpm值,tpmslc6a9为slc6a9基因表达量归一化处理后的tpm值,tpmnos1ap为nos1ap基因表达量归一化处理后的tpm值,tpmlinc01291为linc01291基因表达量归一化处理后的tpm值,tpmpsmb10为psmb10基因表达量归一化处理后的tpm值,tpmrpl12p38为rpl12p38基因表达量归一化处理后的tpm值,tpmznf888为znf888基因表达量归一化处理后的tpm值,tpmal391845.1为al391845.1基因表达量归一化处理后的tpm值,tpmlinc02585为linc02585基因表达量归一化处理后的tpm值,tpmlinc01431为linc01431基因表达量归一化处理后的tpm值,tpmac099520.2为ac099520.2基因表达量归一化处理后的tpm值,tpmcep95为cep95基因表达量归一化处理后的tpm值,tpmmir4713hg为mir4713hg基因表达量归一化处理后的tpm值,tpmrbm15b为rbm15b基因表达量归一化处理后的tpm值,tpmac061992.2为ac061992.2基因表达量归一化处理后的tpm值;将纳入模型的基因代入公式为每个样本计算风险评分,按各队列风险评分中位数进行分组。7.根据权利要求6所述的应用,其特征在于,当rs≤62.606时,将样本划分为低危组,当rs>62.606时,将样本划分为高危组。8.一种乳腺癌预后制剂,其特征在于,包括权利要求2-7任一项中所述的检测试剂。

技术总结


本发明公开了一种组合基因标志物及其检测试剂在制备乳腺癌预后制剂中的应用。本发明通过研究发现:将本发明涉及的45个基因标志物的表达量代入模型公式,计算每个样本的风险评分可以用于预测乳腺癌预后水平。本发明涉及的基因标志物组合经验证,可以高灵敏、高特异地检测乳腺癌的预后情况,其预后分层独立于肿瘤病理分期,可应用于原发性乳腺癌患者,不同风险分层可降低乳腺癌的异质性,为患者的精准医学提供了重要指导意义有极高的临床应用价值。价值。价值。


技术研发人员:

杨眉 龙梅珺 王嘉杰

受保护的技术使用者:

杨眉

技术研发日:

2022.08.31

技术公布日:

2022/11/25

本文发布于:2022-11-26 11:33:25,感谢您对本站的认可!

本文链接:https://patent.en369.cn/patent/2/4962.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:基因   乳腺癌   模型   样本
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 369专利查询检索平台 豫ICP备2021025688号-20 网站地图