经修饰的表皮生长因子受体及其在追踪
细胞中的用途
发明领域
1.本发明涉及经修饰的表皮生长因子受体(egfr)。特别地,本发明涉及经修饰的egfr在选择、耗竭和追踪已被工程化以表达经修饰的egfr的细胞体中的用途。
2.发明背景
3.基因工程化细胞的施用,如工程化t细胞的过继性转移或工程化造血干细胞或祖细胞的移植,是例如感染性、赘生性和遗传性疾病的疗法中的有力工具。
4.在某些情况下,需要在施用于受试者之前选择工程化细胞,从而减少或消除缺乏功效的细胞。此外,在输注后追踪工程化细胞,并在出现毒性时将它们耗竭或消除,是遗传操纵的细胞产品的有利的能力。
5.已经使用了几种策略以在体外选择遗传工程化细胞或在体内追踪和耗竭遗传工程化细胞。已经采用了通过使用异种酶进行体外选择,然而此类方法遭受免疫原性问题。人细胞表面蛋白,如δngfr、cd34、cd19、cd20和cd4以及cd90,也已经被用作鉴定离体遗传修饰的细胞的替代标志物。然而,这些候选物都不是理想的,因为它们不是工程化造血细胞所独有的。事实上,它们在包括血液隔室在内的各种组织中表达,使得特定经修饰细胞的追踪具有挑战性,并在耗竭的情况下加剧的毒性。
6.已经提出了人表皮生长因子受体的功能惰性截短型式(egfrt)作为选择、追踪和耗竭经修饰细胞的候选物(wang et al.(2011)blood 118(5):1255-1263)。造血系统的细胞不表达egfr。为了生成egfrt,尽管保留了完整的西妥昔单抗(cetuximab)结合位点,但通过去除两个胞外结构域及其细胞质尾,使野生型受体不能结合配体和不具有信号传导活性。
7.egfrt必须在细胞表面高水平表达以达到最佳功能,如容许完全消除移植的细胞并且避免使用可能导致有害副作用的高剂量的单克隆抗体。然而,先前egfrt构建体的表达在一些情况下是低的,如当使用常规的转录启动子时。
8.这一问题尤其与以下情形有关:用双向的或双顺反子的载体(即表达来自相同转录本的两个基因产物,如通过内部核糖体进入
序列ires)转导细胞,或当egfrt与另一种产物融合时(即通过自切割肽),或在egfrt表达通过基因编辑与低表达靶基因座连接的情况下。当需要在体内选择、追踪细胞并在不良事件的情况下耗竭细胞时,这代表了重大的安全问题。
9.因此,在本领域中仍然存在对选择、耗竭和追踪遗传工程化细胞的方法的重大需求,特别是在引入的构建体可能处于弱表达控制系统的控制下的情况下。
10.发明概述
11.本发明的发明人开发了工程化的表皮生长因子受体,即使当其表达由弱启动子驱动时,其也展现出提高的在细胞表面上的稳定性和表达。
12.发明人已经优化了egfrt,以提高翻译和细胞表面稳定性,从而通过利用以下各项产生增强的egfrt(eegfrt):(i)非典型信号肽以有效驱动蛋白质翻译至内质网;(ii)稳定和增加egfr蛋白的细胞表面回收的工程化细胞质尾;和/或(iii)优化开放阅读框序列以增
加蛋白质翻译。通过应用这些修饰,发明人已经通过容许在体外回收遗传修饰的细胞以及通过施用较低剂量的单克隆抗体在体外和体内耗竭遗传修饰的细胞,证明了eegfrt标志物在遗传修饰的低表达细胞上的改善的效用。这种改善通过消除低表达细胞并降低所施用的耗竭性抗体的不想要的影响的风险,提高了在不良事件的情况下工程化细胞的安全性。
13.在一个方面,本发明提供了包含编码表皮生长因子受体(egfr)胞外表位的核苷酸序列的
多核苷酸,该表皮生长因子受体胞外表位可操作地连接至:
14.(a)ngfr或gms sfrα信号肽;
15.(b)egfr或ngfr跨膜结构域;和/或
16.(c)ngfr或egfr细胞质尾,
17.以及任选地回收信号。
18.在一些
实施方案中,细胞质尾包含以下氨基酸序列:(i)krwnrgil(seq id no:39);或(ii)rrrhivrk(seq id no:40);或具有多至三个氨基酸取代、添加或缺失的(i)或(ii)的变体。
19.在一些实施方案中,egfr胞外表位包含一个或多个egfr胞外结构域或其部分。在一些实施方案中,egfr胞外表位包含egfr结构域iii或其部分。在一些实施方案中,egfr胞外表位包含egfr结构域iv或其部分。在一些实施方案中,egfr胞外表位包含egfr结构域iii和egfr结构域iv或其部分。
20.在一些实施方案中,egfr胞外表位是截短的表皮生长因子受体(egfrt)。
21.在另一方面,本发明提供包含编码截短的表皮生长因子受体(egfrt)的核苷酸序列的多核苷酸,其中该多核苷酸进一步包含:
22.(a)编码ngfr信号肽的核苷酸序列;和/或
23.(b)编码包含以下氨基酸序列的多肽的核苷酸序列:(i)krwnrgil(seq id no:39);或(ii)rrrhivrk(seq id no:40);或具有多至三个氨基酸取代、添加或缺失的(i)或(ii)的变体。
24.在一些实施方案中:
25.(a)ngfr信号肽包含与seq id no:4具有至少70%同一性的氨基酸序列;和/或
26.(b)编码ngfr信号肽的核苷酸序列与seq id no:5具有至少70%的同一性。
27.在一些实施方案中,egfrt包含egfr结构域iii和egfr结构域iv。在一些实施方案中,egfrt还包含egfr跨膜结构域或ngfr跨膜结构域,优选egfr跨膜结构域。在一些实施方案中,egfrt不包含egfr结构域i、egfr结构域ii、egfr近膜结构域或egfr酪氨酸激酶结构域。
28.在一些实施方案中,egfrt包含与seq id no:2具有至少70%同一性的氨基酸序列。
29.在一些实施方案中,编码egfrt的核苷酸序列与seq id no:3具有至少70%的同一性。
30.在一些实施方案中,多核苷酸:
31.(a)编码与seq id no:17具有至少70%同一性的氨基酸序列;和/或
32.(b)包含与seq id no:16具有至少70%同一性的核苷酸序列。
33.在一些实施方案中,多核苷酸:
34.(a)编码与seq id no:19或21具有至少70%同一性的氨基酸序列;和/或
35.(b)包含与seq id no:18或20具有至少70%同一性的核苷酸序列。
36.在一些实施方案中,多核苷酸:
37.(a)编码与seq id no:23或25具有至少70%同一性的氨基酸序列;和/或
38.(b)包含与seq id no:22或24具有至少70%同一性的核苷酸序列。
39.在一些实施方案中,编码egfrt的核苷酸序列可操作地连接至弱启动子。
40.在一些实施方案中,多核苷酸还包含转基因。
41.在一些实施方案中,多核苷酸(例如包含转基因和/或egfrt编码序列的多核苷酸)用于通过基因编辑插入。
42.在一些实施方案中,转基因编码嵌合抗原受体。
43.在另一方面,本发明提供了由本发明的多核苷酸编码的egfrt蛋白。
44.在另一方面,本发明提供了包含本发明的多核苷酸的病毒载体。
45.在一些实施方案中,病毒载体是慢病毒载体、腺相关病毒(aav)载体或腺病毒载体。
46.在另一方面,本发明提供包含本发明的多核苷酸或病毒载体的细胞。
47.在另一方面,本发明提供了用于的本发明的多核苷酸、病毒载体或细胞。
48.在另一方面,本发明提供了本发明的多核苷酸、病毒载体或细胞在制备药物中的用途。
49.在另一方面,本发明提供了选择转导的细胞的方法,其包括以下步骤:
50.(a)用本发明的多核苷酸或病毒载体转导细胞体;
51.(b)使转导的细胞体与egfrt结合剂接触;和
52.(c)选择与egfrt结合剂结合的细胞。
53.在另一方面,本发明提供了耗竭转导的细胞的方法,其包括以下步骤:
54.(a)用本发明的多核苷酸或病毒载体转导细胞体;和
55.(b)使转导的细胞体与egfrt结合剂接触。
56.在一些实施方案中,egfrt结合剂可操作地连接至耗竭剂。在一些实施方案中,步骤(b)的细胞体与结合至egfrt结合剂的耗竭剂接触。在一些实施方案中,egfrt结合剂与细胞表面表达的egfrt的结合导致细胞死亡。在一些实施方案中,耗竭剂杀伤与egfrt结合剂结合的细胞。
57.在另一方面,本发明提供了追踪转导的细胞的方法,其包括以下步骤:
58.(a)用本发明的多核苷酸或病毒载体转导细胞体;
59.(b)使转导的细胞体与egfrt结合剂接触,其中该egfrt结合剂可操作地连接于可检测的标记;和
60.(c)检测与egfrt结合剂结合的细胞。
61.在一些实施方案中,方法是体外或离体方法。
62.在一些实施方案中,egfrt结合剂是抗体。在一些实施方案中,egfrt结合剂是西妥昔单抗。
63.在一些实施方案中,耗竭剂包括毒素。在一些实施方案中,耗竭剂包括皂草素(saporin)。
64.在另一方面,本发明提供了方法,其包括选择本发明的转导的细胞的方法、耗竭本发明的转导的细胞的方法和/或追踪本发明的转导的细胞的方法。
65.附图描述
66.图1
67.egfrt修饰改善了cd40lg基因编辑步骤后的蛋白质表面表达,容许工程化细胞的体外富集和体外/体内耗竭。(a)用于编辑cd4+t淋巴细胞的三种校正供体模板的示意图。在cd40lg基因座的内含子1中插入了具有500bp同源臂的校正供体模板,由剪接受体(sa)随后为cd40lg cdna(从外显子2至外显子5)及其内源性3'utr和polya组成。在cdna和3’utr序列之间克隆随后为egfrt基因(i)或eegfrt 1基因(ii)或eegfrt 2基因(iii)的ires序列。当编辑发生时,cd40lg内源性启动子驱动cd40lg基因和egfrt/经修饰的egfrt基因的表达。(b)使用相对平均荧光强度(mfi)显示的经编辑的cd4+非活化t细胞中egfr基因表达的代表性流式细胞术点图。(c)显示免疫磁性富集前(eegfrt 1/eegfrt 2条)和免疫磁性富集后(eegfr 1+/eegfr 2+条)eegfrt+编辑细胞的百分比的直方图。eegfr 1-和eegfr 2-条显示了选择步骤后保留在阴性部分中的eegfrt+细胞的百分比。(d)描绘体外用组装的免疫毒素(黑条)、仅抗体(红条)或仅毒素(绿条)处理后eegfr+修饰的细胞的百分比的直方图。(e)用西妥昔单抗腹膜内注射处理(红线)或未处理(蓝线)的异种移植nsg小鼠的外周血(pb)中回的eegfrt+t细胞百分比的时间进程。通过流式细胞术分析(i)和数字微滴pcr分子测定(ii)评估eegfrt+细胞的百分比。
68.图2
69.egfrt修饰改善双向慢病毒载体转导后的蛋白质表面表达。(a)双向慢病毒载体的示意图代表,该载体在hpgk启动子的控制下正义表达gfp报告基因,并通过最小cmv启动子驱动反义表达tegfr(图2ai)或经修饰的egfrt(eegfrt 1
–
图2aii)。(b)使用相对平均荧光强度(mfi)显示转导的t细胞中egfr基因表达的代表性流式细胞术点图。
70.图3
71.在基因编辑步骤后具有回收信号的egfrt修饰没有进一步改善egfr蛋白表达。显示经编辑的cd4+非活化的(基础水平)或活化的(刺激)t细胞中egfrt基因表达的代表性流式细胞术点图。
72.图4
73.在基因编辑步骤后无回收信号的egfrt修饰改善了egfr表面表达。使用相对平均荧光强度(mfi)显示经编辑的cd4+非活化的(基础水平)t细胞中egfrt基因表达的时间进程的代表性流式细胞术点图。
74.图5
75.将编辑的t细胞可以通过利用临床顺应性选择物egfrt而被特异性耗竭。(a)显示在pma/离子霉素刺激后0和8小时衍生自雄性hd的批量编辑的cd4+t细胞中egfrt表达的代表性绘图。用描绘于图1a中的三种构建体编辑细胞。(b)通过facs分析测量的对衍生自雄性hd的cd4+t细胞进行cd40lg编辑后17天t细胞亚中报告分子+细胞的百分比。用携带ngfr(n=7)、eegfrt 1(也称为egfrmod1;n=7)或eegfrt 2(也称为egfrmod2;n=4)的供体模板编辑细胞。配对wilcoxon检验。egfrmod2未包括在分析中,因为n=4。(c)衍生自雄性hd的ut t细胞(n=14)或来自(b)的批量编辑的t细胞的体组成。lme模型,随后进行事后分析。
egfrmod2未包括在分析中,因为n=4。平均值
±
sem。(d)通过rfi测量的pma/离子霉素刺激后cd40l表面表达(归一化为报道分子-细胞;左图)和来自(b)的经编辑的或未编辑的t细胞的百分比(右图)(每组n=4,除了报道分子-n=12)的时间进程。(e)通过elispot测定评估的分泌igg+的b细胞。从hd的pb中分离b细胞,并与雄性hd分选的ngfr/egfr+、ngfr/egfr-和ut t细胞共培养,静止(r)或用小珠(b)或pma/离子霉素(pi)刺激。单独培养(-)或在scd40l(+)存在下培养的b细胞分别用作阴性和阳性对照(每组n=2)。(f)在从hd的pb分离的并与来自(e)的雄性hd t细胞共培养的同种异体分选的b细胞中,通过细胞示踪稀释测定分析b细胞增殖能力。单独培养(-)或在scd40l(+)存在下培养的b细胞分别用作阴性和阳性对照(每组n=2)。(g)显示用免疫毒素(左)、抗体(中)或毒素(右)处理后3天的衍生自雄性hd的批量编辑的cd4+t细胞中hegfrt表达的代表性绘图。(h)显示通过facs分析测量的用5nm或1nm免疫毒素、抗体或毒素处理后3天的hegfrt+t细胞百分比的直方图。弗里德曼(friedman)检验以及邓恩(dynn)多重比较。将不同的剂量条件用作统一的组进行统计分析。
76.发明详述
77.本文所用的术语“包含(comprising)”、“包含(comprises)”和“包含(comprised of)”与“包括(including)”或“包括(includes)”;或者“含有(containing)”或“含有(contains)”同义,并且是包容的或开放式的,并且不排除另外的、未列举的成员、元素或步骤。术语“包含(comprising)”、“包含(comprises)”和“包含(comprised of)”也包括术语“由
……
组成(consisting of)”。
78.嵌合选择物
79.发明人已经开发了工程化细胞表面蛋白,其可以用于选择、耗竭和追踪表达它的细胞。该蛋白在本文中可以称为“嵌合选择物”,其包含表皮生长因子受体(egfr)的胞外表位,并且即使当其表达由弱启动子驱动时,其在细胞表面上也展现出提高的稳定性和表达。egfr胞外表位可以例如选择性地被抗egfr抗体(如西妥昔单抗)结合。
80.在一个方面,本发明提供了包含编码表皮生长因子受体(egfr)胞外表位的核苷酸序列的多核苷酸,该表皮生长因子受体胞外表位可操作地连接至:
81.(a)ngfr或gms sfrα信号肽;
82.(b)egfr或ngfr跨膜结构域;和/或
83.(c)ngfr或egfr细胞质尾,
84.以及任选地回收信号。
85.在一些实施方案中,细胞质尾包含以下氨基酸序列:(i)krwnrgil(seq id no:39);或(ii)rrrhivrk(seq id no:40);或具有多至三个氨基酸取代、添加或缺失的(i)或(ii)的变体。
86.在一些实施方案中,egfr胞外表位包含一个或多个egfr胞外结构域或其部分。在一些实施方案中,egfr胞外表位包含egfr结构域iii或其部分。在一些实施方案中,egfr胞外表位包含egfr结构域iv或其部分。在一些实施方案中,egfr胞外表位包含egfr结构域iii和egfr结构域iv或其部分。
87.在一些实施方案中,egfr胞外表位是截短的表皮生长因子受体(egfrt)。
88.表皮生长因子受体(egfr)
89.表皮生长因子受体(egfr)也称为erbb1和her1,是胞外配体的表皮生长因子家族成员的细胞表面受体。
90.人egfr的示例性序列是:
[0091][0092]
成熟野生型egfr可以包含(从n端到c端)称为结构域i、ii、iii和iv的四个胞外结构域;跨膜结构域;近膜结构域;酪氨酸激酶结构域;和调控区(参见ferguson,k.m.(2008)annu rev biophys 37:353-373)。技术人员将能够使用已知的序列比较工具容易地鉴定egfr序列中的结构域。
[0093]
例如,基于遵循惯例的氨基酸编号,在seq id no:1中egfr结构域可以如下,其中将seq id no:1的n端甲硫氨酸指定为残基1:信号肽(氨基酸1-24);结构域i(氨基酸25-189);结构域ii(氨基酸190-334);结构域iii(氨基酸335-504);结构域iv(氨基酸505-644);跨膜结构域(氨基酸645-667);近膜结构域(氨基酸668-709);酪氨酸激酶结构域(氨基酸710-977);和调节区(氨基酸978-1210)。技术人员将能够通过与seq id no:1进行序列比对来容易地确定同源蛋白质中的类似的结构域。
[0094]
先前已经提出了表皮生长因子受体的功能惰性截短型式作为经修饰的细胞的选择、追踪和耗竭的候选物(wang et al.(2011)blood 118(5):1255-1263)。为了生成wang et al.中截短的egfr,通过去除两个胞外结构域(结构域i和ii)及其细胞质尾(包括近膜结构域和酪氨酸激酶结构域),使野生型受体不能结合配体和不具有信号传导活性。
[0095]
发明人已经开发了改善的截短的表皮生长因子受体,即使当其表达由弱启动子驱动时,其在细胞表面上也展现出提高的稳定性和表达。
[0096]
在一个方面,本发明提供了包含编码截短的表皮生长因子受体(egfrt)的核苷酸序列的多核苷酸,其中该多核苷酸进一步包含:
[0097]
(a)编码ngfr信号肽的核苷酸序列;和/或
[0098]
(b)编码包含以下氨基酸序列的多肽的核苷酸序列:(i)krwnrgil(seq id no:39);或(ii)rrrhivrk(seq id no:40);或具有多至三个氨基酸取代、添加或缺失的(i)或(ii)的变体。
[0099]
在另一方面,本发明提供了包含编码截短的表皮生长因子受体(egfrt)的核苷酸
序列的多核苷酸,其中该多核苷酸进一步包含:
[0100]
(a)编码gms sfrα信号肽的核苷酸序列;和/或
[0101]
(b)编码包含以下氨基酸序列的多肽的核苷酸序列:(i)krwnrgil(seq id no:39);或(ii)rrrhivrk(seq id no:40);或具有多至三个氨基酸取代、添加或缺失的(i)或(ii)的变体。
[0102]
在一些实施方案中,多核苷酸包含编码截短的表皮生长因子受体(egfrt)的核苷酸序列和编码ngfr信号肽的核苷酸序列。
[0103]
在一些实施方案中,多核苷酸包含编码截短的表皮生长因子受体(egfrt)的核苷酸序列和编码gms sfrα信号肽的核苷酸序列。
[0104]
在一些实施方案中,多核苷酸包含编码截短的表皮生长因子受体(egfrt)的核苷酸序列和编码包含krwnrgil(seq id no:39)的氨基酸序列或其具有多至三个氨基酸取代、添加或缺失的变体的多肽的核苷酸序列。在一些实施方案中,多核苷酸包含编码截短的表皮生长因子受体(egfrt)的核苷酸序列和编码包含rrrhivrk(seq id no:40)的氨基酸序列或其具有多至三个氨基酸取代、添加或缺失的变体的多肽的核苷酸序列。
[0105]
krwnrgil(seq id no:39)或rrrhivrk(seq id no:40)的氨基酸序列在本文中可以称为“细胞质尾”或“细胞质结构域”。krwnrgil(seq id no:39)在本文中可以称为ngfr细胞质尾。rrrhivrk(seq id no:40)在本文中可以称为egfr细胞质尾。
[0106]
在一些实施方案中,多核苷酸包含编码截短的表皮生长因子受体(egfrt)的核苷酸序列,其中该多核苷酸进一步包含:(a)编码ngfr信号肽的核苷酸序列;和(b)编码包含krwnrgil(seq id no:39)的氨基酸序列或其具有多至三个氨基酸取代、添加或缺失的变体的多肽的核苷酸序列。在一些实施方案中,多核苷酸包含编码截短的表皮生长因子受体(egfrt)的核苷酸序列,其中该多核苷酸进一步包含:(a)编码ngfr信号肽的核苷酸序列;和(b)编码包含rrrhivrk(seq id no:40)的氨基酸序列或其具有多至三个氨基酸取代、添加或缺失的变体的多肽的核苷酸序列。
[0107]
在一些实施方案中,多核苷酸包含编码截短的表皮生长因子受体(egfrt)的核苷酸序列,其中该多核苷酸进一步包含:(a)编码gms sfrα信号肽的核苷酸序列;和(b)编码包含krwnrgil(seq id no:39)的氨基酸序列或其具有多至三个氨基酸取代、添加或缺失的变体的多肽的核苷酸序列。在一些实施方案中,多核苷酸包含编码截短的表皮生长因子受体(egfrt)的核苷酸序列,其中该多核苷酸进一步包含:(a)编码gms sfrα信号肽的核苷酸序列;和(b)编码包含rrrhivrk(seq id no:40)的氨基酸序列或其具有多至三个氨基酸取代、添加或缺失的变体的多肽的核苷酸序列。
[0108]
优选地,本发明的egfrt是包含egfr胞外表位的截短的egfr,该egfr胞外表位可以例如选择性地被抗egfr抗体(如西妥昔单抗)结合。优选地,egfrt缺乏信号传导或运输活性。
[0109]
在一些实施方案中,egfrt包含egfr结构域iii和egfr结构域iv。在一些实施方案中,egfrt进一步包含egfr跨膜结构域或ngfr跨膜结构域,优选egfr跨膜结构域。
[0110]
在一些实施方案中,egfrt包含egfr结构域iii、egfr结构域iv和egfr跨膜结构域。在一些实施方案中,egfrt由egfr结构域iii、egfr结构域iv和ngfr跨膜结构域组成。
[0111]
在一些实施方案中,egfrt不包含egfr结构域i。在一些实施方案中,egfrt不包含
egfr结构域ii。在一些实施方案中,egfrt不包含egfr近膜结构域。在一些实施方案中,egfrt不包含egfr酪氨酸激酶结构域。
[0112]
在一些实施方案中,egfrt不包含egfr结构域i、egfr结构域ii、egfr近膜结构域或egfr酪氨酸激酶结构域。
[0113]
示例性egfrt氨基酸序列为:
[0114][0115]
示例性编码egfrt的核苷酸序列为:
[0116][0117]
在一些实施方案中,egfrt包含与seq id no:2具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列。在一些实施方案中,egfrt由与seq id no:2具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列组成。优选地,egfrt包含可被抗体(如西妥昔单抗)识别的表位。优选地,egfrt缺乏信号传导或运输活性。
[0118]
在一些实施方案中,egfrt包含seq id no:2的氨基酸序列。在一些实施方案中,egfrt由seq id no:2的氨基酸序列组成。
[0119]
在一些实施方案中,egfrt包含与seq id no:2或其片段具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列。在一些实施方案中,egfrt由与seq id no:2或其片段具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列组成。优选地,egfrt或其片段包含可被抗体(如西妥昔单抗)识别的表位。优选地,egfrt或其片段缺乏信号传导或运输活性。
[0120]
在一些实施方案中,egfrt包含seq id no:2的氨基酸序列或其片段。在一些实施方案中,egfrt由seq id no:2的氨基酸序列或其片段组成。
[0121]
在一些实施方案中,编码egfrt的核苷酸序列是密码子优化的。优选地,编码egfrt的核苷酸序列是为了在人中表达而密码子优化的。
[0122]
在一些实施方案中,编码egfrt的核苷酸序列与seq id no:3具有至少70%、75%、
80%、85%、90%、95%、96%、97%、98%或99%的同一性。优选地,egfrt包含可被抗体(如西妥昔单抗)识别的表位。优选地,egfrt缺乏信号传导或运输活性。
[0123]
在一些实施方案中,编码egfrt的核苷酸序列是seq id no:3。
[0124]
在一些实施方案中,编码egfrt的核苷酸序列与seq id no:3或其片段具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的同一性。优选地,egfrt或其片段包含可被抗体(如西妥昔单抗)识别的表位。优选地,egfrt或其片段缺乏信号传导或运输活性。
[0125]
在一些实施方案中,编码egfrt的核苷酸序列是seq id no:3或其片段。
[0126]
信号肽
[0127]
多核苷酸优选包含编码信号肽例如ngfr或gms sfrα信号肽优选ngfr信号肽的核苷酸序列。
[0128]
如本文所用,术语“gms sfrα信号肽”或“ngfr信号肽”可分别指由gms sfrα或ngfr天然编码序列编码的信号肽。此类信号肽将蛋白质的表达引导至细胞表面。信号肽可以在加工过程中从未成熟的蛋白质中切割。
[0129]
在一些实施方案中,多核苷酸包含编码ngfr信号肽的核苷酸序列。
[0130]
示例性ngfr信号肽为:
[0131][0132]
示例性编码ngfr信号肽的核苷酸序列为:
[0133][0134]
在一些实施方案中,ngfr信号肽包含与seq id no:4具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列。在一些实施方案中,ngfr信号肽由与seq id no:4具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列组成。优选地,ngfr信号肽将egfrt的表达引导至细胞表面。
[0135]
在一些实施方案中,ngfr信号肽包含seq id no:4的氨基酸序列。在一些实施方案中,ngfr信号肽由seq id no:4的氨基酸序列组成。
[0136]
在一些实施方案中,编码ngfr信号肽的核苷酸序列与seq id no:5具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的同一性。
[0137]
在一些实施方案中,编码ngfr信号肽的核苷酸序列是seq id no:5。
[0138]
在一些实施方案中,ngfr信号肽包含与seq id no:4或其片段具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列。在一些实施方案中,ngfr信号肽由与seq id no:4或其片段具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列组成。优选地,ngfr信号肽或其片段将egfrt的表达引导至细胞表面。
[0139]
在一些实施方案中,ngfr信号肽包含seq id no:4的氨基酸序列或其片段。在一些实施方案中,ngfr信号肽由seq id no:4的氨基酸序列或其片段组成。
[0140]
在一些实施方案中,编码ngfr信号肽的核苷酸序列与seq id no:5或其片段具有
至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的同一性。
[0141]
在一些实施方案中,编码ngfr信号肽的核苷酸序列是seq id no:5或其片段。
[0142]
在其他实施方案中,多核苷酸包含编码gms sfrα信号肽的核苷酸序列。
[0143]
示例性gms sfrα信号肽为(wang et al.(2011)blood 118:1255-1263):
[0144]
mlllvtslllcelphpafllip
[0145]
(seq id no:6)
[0146]
示例性编码gms sfrα信号肽的核苷酸序列为:
[0147][0148][0149]
在一些实施方案中,gms sfrα信号肽包含与seq id no:6具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列。在一些实施方案中,gms sfrα信号肽由与seq id no:6具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列组成。优选地,gms sfrα信号肽将egfrt的表达引导至细胞表面。
[0150]
在一些实施方案中,gms sfrα信号肽包含seq id no:6的氨基酸序列。在一些实施方案中,gms sfrα信号肽由seq id no:6的氨基酸序列组成。
[0151]
在一些实施方案中,编码gms sfrα信号肽的核苷酸序列与seq id no:7具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的同一性。
[0152]
在一些实施方案中,编码gms sfrα信号肽的核苷酸序列是seq id no:7。
[0153]
在一些实施方案中,gms sfrα信号肽包含与seq id no:6或其片段具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列。在一些实施方案中,gms sfrα信号肽由与seq id no:6或其片段具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列组成。优选地,gms sfrα信号肽或其片段将egfrt的表达引导至细胞表面。
[0154]
在一些实施方案中,gms sfrα信号肽包含seq id no:6的氨基酸序列或其片段。在一些实施方案中,gms sfrα信号肽由seq id no:6的氨基酸序列或其片段组成。
[0155]
在一些实施方案中,编码gms sfrα信号肽的核苷酸序列与seq id no:7或其片段具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的同一性。
[0156]
在一些实施方案中,编码gms sfrα信号肽的核苷酸序列是seq id no:7或其片段。
[0157]
在优选的实施方案中,信号肽(例如ngfr或gms sfrα信号肽,优选ngfr信号肽)可操作地连接于egfrt。
[0158]
如本文所用,术语“可操作地连接”可以意为两个组分以能够使两者基本上不受阻碍地实施其功能的方式连接在一起。例如,信号肽可以将egfrt的表达引导至细胞表面。
[0159]
例如,信号肽可以位于egfrt的氨基末端。在一些实施方案中,信号肽紧邻egfrt的氨基末端。
[0160]
细胞质结构域
[0161]
多核苷酸优选包含编码细胞质尾的核苷酸序列。合适地,该多核苷酸可以包含编码包含以下氨基酸序列的多肽的核苷酸序列:(i)krwnrgil(seq id no:39);或(ii)
rrrhivrk(seq id no:40);或具有多至三个氨基酸取代、添加或缺失的(i)或(ii)的变体。
[0162]
在一些实施方案中,(i)或(ii)的变体具有三个氨基酸取代、添加或缺失。在一些实施方案中,(i)或(ii)的变体具有两个氨基酸取代、添加或缺失。在一些实施方案中,(i)或(ii)的变体具有一个氨基酸取代、添加或缺失。
[0163]
示例性编码(i)的核苷酸序列为:
[0164][0165]
示例性编码(ii)的核苷酸序列为:
[0166][0167]
在一些实施方案中,编码(i)或(ii)的核苷酸序列与seq id no:8或9具有至少95%、96%、97%、98%或99%的同一性。
[0168]
在一些实施方案中,编码(i)或(ii)的核苷酸序列分别为seq id no:8或9。
[0169]
在一些实施方案中,编码(i)或(ii)的核苷酸序列与seq id no:8或9或其片段具有至少95%、96%、97%、98%或99%的同一性。
[0170]
在一些实施方案中,编码(i)或(ii)的核苷酸序列分别为seq id no:8或9或其片段。
[0171]
细胞质结构域(例如(i)、(ii)或其变体)可以在c末端进一步包含氨基酸序列丙氨酸-丝氨酸(as)。因此,本发明进一步设想,seq id no:39和40可以分别被krwnrgilas(seq id no:41)和rrrhivrkas(seq id no:42)替代。“as”序列可以由核苷酸序列gctagc编码。因此,本发明进一步设想,seq id no:8和9分别被aagcggtggaaccggggcatcctggctagc(seq id no:43)和cggcggagacacatcgtgcggaaggctagc(seq id no:44)替代。本发明进一步设想,seq id no:8和9分别被aagcggtggaaccggggcatcctggctagc(seq id no:43)和cggcggagacacatcgtgcggaaggctagc(seq id no:44)或其片段取代。
[0172]
优选地,(i)、(ii)或其变体的氨基酸序列可操作地连接于egfrt。例如,(i)、(ii)或其变体的氨基酸序列可以增加egfrt在细胞表面的稳定性和表达。
[0173]
例如,(i)、(ii)或其变体的氨基酸序列可以位于egfrt的羧基末端。在一些实施方案中,(i)、(ii)或其变体的氨基酸序列紧邻egfrt的羧基末端。
[0174]
在优选的实施方案中,(i)、(ii)或其变体的氨基酸序列可以位于egfrt跨膜结构域的羧基末端。在优选的实施方案中,(i)、(ii)或其变体的氨基酸序列紧邻egfrt跨膜结构域的羧基末端。在其他实施方案中,(i)、(ii)或其变体的氨基酸序列通过接头(如接头肽)连接到egfrt跨膜结构域的羧基末端。
[0175]
跨膜结构域
[0176]
在一些实施方案中,多核苷酸包含编码egfr跨膜结构域的核苷酸序列。在一些实施方案中,多核苷酸包含编码ngfr跨膜结构域的核苷酸序列。
[0177]
示例性egfr跨膜结构域为:
[0178]
[0179]
示例性编码egfr跨膜结构域的核苷酸序列为:
[0180][0181]
在一些实施方案中,egfr跨膜结构域包含与seq id no:10具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列。在一些实施方案中,egfr跨膜结构域由与seq id no:10具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列组成。优选地,egfr跨膜结构域将egfrt锚定在细胞膜上。
[0182]
在一些实施方案中,egfr跨膜结构域包含seq id no:10的氨基酸序列。在一些实施方案中,egfr跨膜结构域由seq id no:10的氨基酸序列组成。
[0183]
在一些实施方案中,编码egfr跨膜结构域的核苷酸序列与seq id no:11具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的同一性。
[0184]
在一些实施方案中,编码egfr跨膜结构域的核苷酸序列是seq id no:11。
[0185]
在一些实施方案中,egfr跨膜结构域包含与seq id no:10或其片段具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列。在一些实施方案中,egfr跨膜结构域由与seq id no:10或其片段具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列组成。优选地,egfr跨膜结构域或其片段将egfrt锚定在细胞膜上。
[0186]
在一些实施方案中,egfr跨膜结构域包含seq id no:10的氨基酸序列或其片段。在一些实施方案中,egfr跨膜结构域由seq id no:10的氨基酸序列或其片段组成。
[0187]
在一些实施方案中,编码egfr跨膜结构域的核苷酸序列与seq id no:11或其片段具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的同一性。
[0188]
在一些实施方案中,编码egfr跨膜结构域的核苷酸序列是seq id no:11或其片段。
[0189]
示例性ngfr跨膜结构域为:
[0190][0191]
示例性编码ngfr跨膜结构域的核苷酸序列为:
[0192][0193]
在一些实施方案中,ngfr跨膜结构域包含与seq id no:12具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列。在一些实施方案中,ngfr跨膜结构域由与seq id no:12具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列组成。优选地,ngfr跨膜结构域将egfrt锚定在细胞膜上。
[0194]
在一些实施方案中,ngfr跨膜结构域包含seq id no:12的氨基酸序列。在一些实施方案中,ngfr跨膜结构域由seq id no:12的氨基酸序列组成。
[0195]
在一些实施方案中,编码ngfr跨膜结构域的核苷酸序列与seq id no:13具有至少
70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的同一性。
[0196]
在一些实施方案中,编码ngfr跨膜结构域的核苷酸序列是seq id no:13。
[0197]
在一些实施方案中,ngfr跨膜结构域包含与seq id no:12或其片段具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列。在一些实施方案中,ngfr跨膜结构域由与seq id no:12或其片段具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列组成。优选地,ngfr跨膜结构域或其片段将egfrt锚定在细胞膜上。
[0198]
在一些实施方案中,ngfr跨膜结构域包含seq id no:12或其片段的氨基酸序列。在一些实施方案中,ngfr跨膜结构域由seq id no:12或其片段的氨基酸序列组成。
[0199]
在一些实施方案中,编码ngfr跨膜结构域的核苷酸序列与seq id no:13或其片段具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的同一性。
[0200]
在一些实施方案中,编码ngfr跨膜结构域的核苷酸序列是seq id no:13或其片段。
[0201]
回收信号
[0202]
在一些实施方案中,多核苷酸进一步包含编码回收信号的核苷酸序列。在其他实施方案中,多核苷酸不包含编码回收信号的核苷酸序列。
[0203]
示例性回收信号序列为:
[0204][0205]
示例性编码回收信号的核苷酸序列为:
[0206][0207]
在一些实施方案中,回收信号包含与seq id no:14具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列。在一些实施方案中,回收信号由与seq id no:14具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列组成。优选地,回收信号促进egfrt向细胞膜的回收。
[0208]
在一些实施方案中,回收信号包含seq id no:14的氨基酸序列。在一些实施方案中,回收信号由seq id no:14的氨基酸序列组成。
[0209]
在一些实施方案中,编码回收信号的核苷酸序列与seq id no:15具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的同一性。
[0210]
在一些实施方案中,编码回收信号的核苷酸序列是seq id no:15。
[0211]
在一些实施方案中,回收信号包含与seq id no:14或其片段具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列。在一些实施方案中,回收信号由与seq id no:14或其片段具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列组成。优选地,回收信号或其片段促进egfrt向细胞膜的回收。
[0212]
在一些实施方案中,回收信号包含seq id no:14或其片段的氨基酸序列。在一些实施方案中,回收信号由seq id no:14或其片段的氨基酸序列组成。
[0213]
在一些实施方案中,编码回收信号的核苷酸序列与seq id no:15或其片段具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的同一性。
[0214]
在一些实施方案中,编码回收信号的核苷酸序列是seq id no:15或其片段。
[0215]
构建体
[0216]
本发明的示例性egfrt构建体包括:
[0217]
[0218]
[0219]
[0220][0221]
在一些实施方案中,多核苷酸编码与seq id no:17、19、21、23或25具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列。
[0222]
在一些实施方案中,多核苷酸编码seq id no:17、19、21、23或25的氨基酸序列。
[0223]
在一些实施方案中,多核苷酸包含与seq id no:16、18、20、22或24具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的核苷酸序列。
[0224]
在一些实施方案中,多核苷酸包含seq id no:16、18、20、22或24的核苷酸序列。
[0225]
在一些实施方案中,多核苷酸由与seq id no:16、18、20、22或24具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的核苷酸序列组成。
[0226]
在一些实施方案中,多核苷酸由seq id no:16、18、20、22或24的核苷酸序列组成。
[0227]
在一些实施方案中,多核苷酸编码与seq id no:17、19、21、23或25或其片段具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列。
[0228]
在一些实施方案中,多核苷酸编码seq id no:17、19、21、23或25的氨基酸序列或其片段。
[0229]
在一些实施方案中,多核苷酸包含与seq id no:16、18、20、22或24或其片段具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的核苷酸序列。
[0230]
在一些实施方案中,多核苷酸包含seq id no:16、18、20、22或24的核苷酸序列或其片段。
[0231]
在一些实施方案中,多核苷酸由与seq id no:16、18、20、22或24或其片段具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的核苷酸序列组成。
[0232]
在一些实施方案中,多核苷酸由seq id no:16、18、20、22或24或其片段的核苷酸序列组成。
[0233]
进一步的示例性egfrt构建体包括:
[0234]
[0235]
[0236]
[0237][0238]
在一些实施方案中,多核苷酸编码与seq id no:29、31、33或35具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列。
[0239]
在一些实施方案中,多核苷酸编码seq id no:29、31、33或35的氨基酸序列。
[0240]
在一些实施方案中,多核苷酸包含与seq id no:28、30、32或34具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的核苷酸序列。
[0241]
在一些实施方案中,多核苷酸包含seq id no:28、30、32或34的核苷酸序列。
[0242]
在一些实施方案中,多核苷酸由与seq id no:28、30、32或34具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的核苷酸序列组成。
[0243]
在一些实施方案中,多核苷酸由seq id no:28、30、32或34的核苷酸序列组成。
[0244]
在一些实施方案中,多核苷酸包含与seq id no:37或38具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的核苷酸序列。
[0245]
在一些实施方案中,多核苷酸包含seq id no:37或38的核苷酸序列。
[0246]
在一些实施方案中,多核苷酸由与seq id no:37或38具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的核苷酸序列组成。
[0247]
在一些实施方案中,多核苷酸由seq id no:37或38的核苷酸序列组成。
[0248]
在一些实施方案中,多核苷酸编码与seq id no:29、31、33或35或其片段具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列。
[0249]
在一些实施方案中,多核苷酸编码seq id no:29、31、33或35的氨基酸序列或其片段。
[0250]
在一些实施方案中,多核苷酸包含与seq id no:28、30、32或34或其片段具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的核苷酸序列。
[0251]
在一些实施方案中,多核苷酸包含seq id no:28、30、32或34或其片段的核苷酸序列。
[0252]
在一些实施方案中,多核苷酸由与seq id no:28、30、32或34或其片段具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的核苷酸序列组成。
[0253]
在一些实施方案中,多核苷酸由seq id no:28、30、32或34的核苷酸序列或其片段组成。
[0254]
在一些实施方案中,多核苷酸包含与seq id no:37或38或其片段具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的核苷酸序列。
[0255]
在一些实施方案中,多核苷酸包含seq id no:37或38或其片段的核苷酸序列。
[0256]
在一些实施方案中,多核苷酸由与seq id no:37或38或其片段具有至少70%、
75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的核苷酸序列组成。
[0257]
在一些实施方案中,多核苷酸由seq id no:37或38或其片段的核苷酸序列组成。
[0258]
在一些实施方案中,编码egfrt的核苷酸序列可操作地连接至启动子,优选弱启动子。
[0259]
在一些实施方案中,编码egfrt的核苷酸序列可操作地连接至双向启动子。双向启动子可以进一步可操作地连接至转基因。
[0260]
在一些实施方案中,多核苷酸进一步包含ires。在一些实施方案中,编码egfrt的核苷酸序列位于ires的下游。
[0261]
转基因
[0262]
在一些实施方案中,多核苷酸进一步包含转基因。多核苷酸可以是例如双顺反子载体或包含双向启动子。双顺反子载体可以包含ires。
[0263]
优选地,转基因产生效果。
[0264]
在优选的实施方案中,多核苷酸包含编码嵌合抗原受体(car)的核苷酸序列。
[0265]
在一些实施方案中,多核苷酸包含编码嵌合抗原受体(car)的核苷酸序列,其中多核苷酸进一步包含双向启动子。双向启动子可以例如控制转基因和egfrt二者的表达。
[0266]
在一些实施方案中,多核苷酸包含编码嵌合抗原受体(car)的核苷酸序列,其中多核苷酸是双顺反子载体。双顺反子载体可以包含ires。
[0267]
嵌合抗原受体(car)
[0268]
car包含胞外配体结合域,最常见的是单克隆抗体的单链可变片段(scfv)连接于胞内信号传导组分,该信号传导组分最常见的是单独的cd3ζ或与一种或多种共刺激结构域组合。通常在胞外抗原结合结构域和跨膜部分之间添加间隔物以优化与靶标的相互作用。
[0269]
用于本发明的car可以包含:
[0270]
(i)抗原特异性靶向结构域;
[0271]
(ii)跨膜结构域;
[0272]
(iii)任选地至少一个共刺激结构域;和
[0273]
(iv)胞内信号传导结构域。
[0274]
优选地,抗原特异性靶向结构域包含抗体或其片段,更优选单链可变片段。
[0275]
跨膜结构域的实例包括t细胞受体复合物、cd28和cd8a的ζ链的跨膜结构域。
[0276]
共刺激结构域的实例包括来自cd28、cd137(4-1bb)、cd134(ox40)、daplo、cd27、cd2、cd5、icam-1、lfa-1、lck、tnfr-i、tnfr-ii、fas、cd30和cd40的共刺激结构域。
[0277]
在一些实施方案中,共刺激结构域是来自cd28的共刺激结构域。
[0278]
胞内信号传导结构域的实例包括人cd3ζ链、fcyriii、fcsri、fc受体的细胞质尾和带有细胞质受体的基于酪氨酸的免疫受体激活基序(itam)。
[0279]
如本文所用,术语“嵌合抗原受体”(“car”)是指能够赋予细胞(例如,t细胞,如幼稚t细胞、中央记忆t细胞、效应记忆t细胞或它们的组合)抗原特异性的工程化受体。car也称为人工t细胞受体、嵌合t细胞受体或嵌合免疫受体。
[0280]
抗原特异性靶向结构域为car提供与感兴趣的靶抗原结合的能力。抗原特异性靶向结构域优选靶向临床感兴趣的抗原,期望针对该抗原触发效应免疫应答。
[0281]
抗原特异性靶向结构域可以是具有特异性识别和结合生物分子的能力的任何蛋
白质或肽。抗原特异性靶向结构域包括任何天然存在的、合成的、半合成的或重组产生的感兴趣的生物分子的结合伴侣。
[0282]
例证性抗原特异性靶向结构域包括抗体或抗体片段或衍生物、受体的胞外结构域、细胞表面分子/受体的配体或它们的受体结合结构域。
[0283]
在优选的实施方案中,抗原特异性靶向结构域是抗体或衍生自抗体。抗体衍生的靶向结构域可以是抗体的片段或抗体的一个或多个片段的基因工程化产物,该片段参与与抗原的结合。实例包括可变区(fv)、互补决定区(cdr)、fab、单链抗体(scfv)、重链可变区(vh)、轻链可变区(vl)和骆驼抗体(vhh)。
[0284]
在优选的实施方案中,结合结构域是单链抗体(scfv)。scfv可以是例如鼠、人或人源化scfv。
[0285]
关于抗体或其抗原结合片段的术语“互补决定区”(“cdr”)是指抗体重链或轻链可变区中的高度可变环。cdr可以与抗原构象相互作用,并在很大程度上决定与抗原的结合(尽管已知一些框架区参与结合)。重链可变区和轻链可变区各自含有3个cdr。
[0286]“重链可变区”(“vh”)是指抗体重链的片段,该片段含有三个插入在称为框架区的侧翼延伸段之间的cdr,该框架区比cdr更加高度保守,并且形成支持cdr的支架。
[0287]“轻链可变区”(“vl”)是指抗体轻链的片段,该片段含有三个插入在框架区之间的cdr。
[0288]“fv”是指带有完整的抗原结合位点的抗体的最小片段。fv片段由单个轻链可变区结合到单个重链可变区组成。
[0289]“单链fv抗体”(“scfv”)是指由彼此直接连接或经由肽接头序列连接的轻链可变区和重链可变区组成的工程化抗体。
[0290]
特异性结合靶抗原的抗体可以使用本领域熟知的方法制备。此类方法包括噬菌体展示、产生人或人源化抗体的方法、或使用工程化转基因动物或植物以产生人抗体的方法。部分或完全合成的抗体的噬菌体展示文库是可用的,并且可以筛选该文库得到可以与靶分子结合的抗体或其片段。人抗体的噬菌体展示文库也是可用的。一旦经鉴定,可以分离和/或确定编码抗体的氨基酸序列或多核苷酸序列。
[0291]
本发明中使用的car还可以包含一个或多个共刺激结构域。该结构域可以增强细胞增殖、细胞存活和记忆细胞的发育。
[0292]
每个共刺激结构域包含例如tnfr超家族成员cd28、cd137(4-1bb)、cd134(ox40)、daplo、cd27、cd2、cd5、icam-1、lfa-1、lck、tnfr-1、tnfr-ii、fas、cd30、cd40或它们的组合中的任何一种或多种的共刺激结构域。来自其他蛋白质的共刺激结构域也可以与本发明中使用的car一起使用。
[0293]
本发明中使用的car还可以包含胞内信号传导结构域。该结构域可以是细胞质的,并且可以转导效应物功能信号并引导细胞执行其专门的功能。胞内信号传导结构域的实例包括但不限于t细胞受体的ζ链或其任何同源物(例如η链、fcεr1γ和β链、mb1(igα)链、b29(igβ)链等)、cd3多肽(δ、δ和ε)、syk家族酪氨酸激酶(syk、zap 70等)、src家族酪氨酸激酶(lck、fyn、lyn等)和参与t细胞转导的其他分子,如cd2、cd5和cd28。胞内信号传导结构域可以是人cd3ζ链、fcyriii、fcsri、fc受体的细胞质尾、带有细胞质受体的基于酪氨酸的免疫受体激活基序(itam)或它们的组合。
27)也可以用作基因编辑的合适的核酸酶。
[0307]
crispr/cas系统是rna引导的dna结合系统(van der oost et al.(2014)nat.rev.microbiol.12:479-92),其中可以选择引导rna(grna)以使cas9结构域被靶向特定的序列。grna的设计方法是本领域已知的。此外,最近开发了完全正交的cas9蛋白,以及cas9/grna核糖核蛋白复合物和grna结构/组成的修饰以结合不同的蛋白质,以同时和定向地将不同的效应物结构域靶向细胞的期望的基因组位点(esvelt et al.(2013)nat.methods 10:1116-21;zetsche,b.et al.(2015)cell pii:s0092-8674(15)01200-3;dahlman,j.e.et al.(2015)nat.biotechnol.2015oct 5.doi:10.1038/nbt.3390.[epub ahead of print];zalatan,j.g.et al.(2015)cell 160:339-50;paix,a.et al.(2015)genetics 201:47-54),并且适用于本发明。
[0308]
多核苷酸
[0309]
本发明的多核苷酸可以包含dna或rna,优选dna。它们可以是单链或双链。优选地,多核苷酸是分离的多核苷酸。本领域技术人员将会理解,由于遗传密码的简并性,许多不同的多核苷酸可以编码相同的多肽。此外,应当理解,技术人员可以使用常规技术进行不影响由本发明的多核苷酸编码的多肽序列的核苷酸替换,以反映将在其中表达本发明的多肽的任何特定宿主生物体的密码子使用。
[0310]
多核苷酸可以通过本领域中可用的任何方法进行修饰。可以进行此类修饰以增强本发明的多核苷酸的体内活性或寿命。
[0311]
多核苷酸如dna多核苷酸可以重组、合成或通过本领域技术人员可用的任何方法产生。它们也可以通过标准技术克隆。
[0312]
较长的多核苷酸通常将使用重组方法产生,例如使用聚合酶链式反应(pcr)克隆技术。这将涉及制备一对在期望克隆的靶序列侧翼的引物(例如约15至30个核苷酸),使引物与从动物或人细胞中获得的mrna或cdna接触,在引起期望的区域扩增的条件下进行聚合酶链式反应,分离扩增的片段(例如通过用琼脂糖凝胶纯化反应混合物)并回收扩增的dna。可以将引物设计为含有合适的限制酶识别位点,从而可以将扩增的dna克隆到合适的载体中。
[0313]
细胞
[0314]
在另一方面,本发明提供了包含本发明的多核苷酸的细胞。
[0315]
在一些实施方案中,细胞是t细胞、淋巴细胞或干细胞,如造血干细胞或诱导多能干细胞(ips)。
[0316]
在一些实施方案中,细胞是造血干细胞或祖细胞。在一些实施例中,细胞是t细胞。
[0317]
例如,细胞可以选自由以下项组成的组:cd4细胞、cd8细胞、th0细胞、tc0细胞、th1细胞、tc1细胞、th2细胞、tc2细胞、th17细胞、th22细胞、γ/δt细胞、自然杀伤(nk)细胞、自然杀伤t(nkt)细胞、双阴性t细胞、幼稚t细胞、记忆干t细胞、中央记忆t细胞、效应记忆t细胞、效应t细胞、细胞因子诱导的杀伤(cik)细胞、造血干细胞和多能干细胞。
[0318]
细胞可以是从受试者中分离的。
[0319]
本发明的细胞可以提供用于过继性细胞转移。如本文所用,术语“过继性细胞转移”是指向患者施用细胞体。通常,细胞是从受试者中分离的t细胞,并且然后在向患者施用之前进行体外基因修饰和培养。
[0320]
过继性细胞转移可以是同种异体的或自体的。
[0321]
通过“自体细胞转移”,应当理解的是,起始细胞体(然后该细胞体用根据本发明的多核苷酸或载体转导)是从与施用转导的细胞体相同的受试者中获得的。自体转移是有利的,因为它避免了与免疫不相容相关的问题,并且无论是否有基因匹配的供体,对受试者都是有用的。
[0322]
通过“同种异体细胞转移”,应当理解的是,起始细胞体(然后该细胞体用根据本发明的多核苷酸或载体转导)是从与施用转导的细胞体不同的受试者中获得的。优选地,供体将与施用细胞的受试者基因匹配以最小化免疫不相容的风险。可选地,供体可以与患者不匹配并且与患者无关。
[0323]
载体
[0324]
在一些实施方案中,多核苷酸是载体。优选地,载体是病毒载体,如逆转录病毒载体、慢病毒载体、腺相关病毒(aav)载体或腺病毒载体。在一些实施方案中,多核苷酸是病毒基因组。
[0325]
在另一方面,本发明提供了包含本发明的多核苷酸的病毒载体。
[0326]
在一些实施方案中,病毒载体是逆转录病毒载体、慢病毒载体、腺相关病毒(aav)载体或腺病毒载体。
[0327]
在一些实施方案中,病毒载体是病毒载体颗粒的形式。
[0328]
载体是容许或促进实体从一个环境转移到另一个环境的工具。根据本发明,并且举例来说,在重组核酸技术中使用的一些载体容许实体如核酸节段(例如异源dna节段,如异源cdna节段)被转移到靶细胞中。载体可以起到维持细胞内的异源核酸(dna或rna)、促进包含核酸节段的载体的复制和/或促进由核酸节段编码的蛋白质的表达的作用。
[0329]
可以使用本领域已知的各种技术(如转染、转导和转化)将包含本发明中使用的多核苷酸的载体引入细胞中。
[0330]
转染可以指将核酸并入细胞中的一般过程,并且包括使用非病毒载体以将多核苷酸递送至细胞的过程。转导可以指使用病毒载体将核酸并入细胞中的过程。
[0331]
逆转录病毒和慢病毒载体
[0332]
逆转录病毒载体可以衍生自或可以来源于任何合适的逆转录病毒。已经鉴定出大量不同的逆转录病毒。实例包括鼠白血病病毒(mlv)、人t细胞白血病病毒(htlv)、小鼠乳腺肿瘤病毒(mmtv)、劳斯肉瘤病毒(rsv)、藤浪(fujinami)肉瘤病毒(fusv)、莫洛尼(moloney)鼠白血病病毒(mo-mlv)、fbr鼠骨肉瘤病毒(fbr msv)、莫洛尼鼠肉瘤病毒(mo-msv)、爱柏森(abelson)鼠白血病病毒(a-mlv)、禽骨髓细胞瘤病病毒-29(mc29)和禽成红细胞增多病病毒(aev)。逆转录病毒的详细列表可以参见coffin,j.m.et al.(1997)retroviruses,cold spring harbour laboratory press,758-63。
[0333]
逆转录病毒可以大致分为两类,“简单”和“复杂”。逆转录病毒甚至可以进一步分为七类。其中五组代表具有致癌潜力的逆转录病毒。剩余的两组是慢病毒和泡沫病毒。
[0334]
逆转录病毒和慢病毒基因组的基本结构共享许多共同的特征,如5'ltr和3'ltr。在这些特征之间或内部定位有使基因组能够被包装的包装信号、引物结合位点、使其能够整合到宿主细胞基因组中的整合位点,以及编码包装组分的gag、pol和env基因——这些是病毒颗粒组装所需的多肽。慢病毒具有额外的特征,如hiv中的rev和rre序列,其使得整合
的前病毒的rna转录本能够从细胞核有效地输出到感染的靶细胞的细胞质。
[0335]
在前病毒中,这些基因的两端被称为长末端重复(ltr)的区域包围。ltr负责前病毒的整合和转录。ltr也充当增强子-启动子序列,并且可以控制病毒基因的表达。
[0336]
ltr本身是相同的序列,其可以分为三种元件:u3、r和u5。u3衍生自rna的3'端特有的序列。r衍生自rna两端重复的序列。u5衍生自rna的5'端特有的序列。三种元件的大小在不同的逆转录病毒之间可以非常地不同。
[0337]
在缺陷的逆转录病毒载体基因组中,gag、pol和env可以缺失或没有功能。
[0338]
在典型的逆转录病毒载体中,复制所必需的一个或多个蛋白质编码区的至少一部分可以从病毒中去除。这使得病毒载体复制有缺陷。病毒基因组的部分也可以被编码可操作地连接于载体基因组中的调节控制区和报道部分的候选调节部分的文库所取代,以产生包含候选调节部分的载体,该载体能够转导靶宿主细胞和/或将其基因组整合到宿主基因组中。
[0339]
慢病毒载体是较大的逆转录病毒载体组的部分。慢病毒的详细列表可以参见coffin,j.m.et al.(1997)retroviruses,cold spring harbour laboratory press,758-63。简言之,慢病毒可以分为灵长类和非灵长类组。灵长类慢病毒的实例包括但不限于人免疫缺陷病毒(hiv)、人获得性免疫缺陷综合征(aids)的病原体;以及猴免疫缺陷病毒(siv)。非灵长类慢病毒的实例包括原型“慢病毒”维斯纳梅迪(visna/maedi)病毒(vmv)、以及相关的山羊关节炎-脑炎病毒(caev)、马传染性贫血病毒(eiav)、以及最近描述的猫免疫缺陷病毒(fiv)和牛免疫缺陷病毒(biv)。
[0340]
慢病毒家族与逆转录病毒的不同之处在于慢病毒具有感染分裂细胞和非分裂细胞的能力(lewis,p et al.(1992)embo j.11:3053-8;lewis,p.f.et al.(1994)j.virol.68:510-6)。比较而言,其他逆转录病毒(如mlv)不能感染非分裂或缓慢分裂的细胞,如构成例如肌肉、脑、肺和肝组织的那些细胞。
[0341]
如本文所用,慢病毒载体是包含至少一种来源于慢病毒的组分的载体。优选地,该组分参与载体感染细胞、表达基因或复制的生物学机制。
[0342]
慢病毒载体可以是“灵长类”载体。慢病毒载体可以是“非灵长类”载体(即衍生自不主要感染灵长类尤其是人的病毒)。非灵长类慢病毒的实例可以是不会天然感染灵长类的慢病毒科的任何成员。
[0343]
作为基于慢病毒的载体的实例,下文描述了基于hiv-1和hiv-2的载体。
[0344]
hiv-1载体含有同样存在于简单逆转录病毒中的顺式作用元件。已经显示,延伸到gag开放阅读框中的序列对于hiv-1的包装是重要的。因此,hiv-1载体通常含有翻译起始密码子已经突变的gag的相关部分。此外,大多数hiv-1载体还含有包括rre的env基因的部分。rev与rre结合,允许全长或单剪接的mrna从细胞核运输到细胞质。在rev和/或rre不存在的情况下,全长hiv-1rna在细胞核中积累。可选地,来自某些简单逆转录病毒(如梅森-辉瑞猴病毒)的组成型运输元件可以用于缓解对rev和rre的需求。从hiv-1ltr启动子的有效转录需要病毒蛋白tat。
[0345]
大多数基于hiv-2的载体在结构上与hiv-1载体非常相似。与基于hiv-1的载体类似,hiv-2载体也需要rre来有效运输全长或单剪接的病毒rna。
[0346]
优选地,用于本发明的病毒载体具有最小的病毒基因组。
[0347]
通过“最小病毒基因组”,应当理解,病毒载体已经过操纵以去除非必需的元件并保留必需的元件,从而提供所需的功能以感染、转导并向靶宿主细胞递送感兴趣的核苷酸序列。该策略的进一步的细节可以参见wo1998/017815。
[0348]
优选地,用于在宿主细胞/包装细胞内产生病毒基因组的质粒载体将具有足够的慢病毒遗传信息,以容许在包装组分的存在下将rna基因组包装成病毒颗粒,该病毒颗粒能够感染靶细胞但不能独立复制以在最终的靶细胞内产生感染性病毒颗粒。优选地,载体缺乏功能性gag-pol和/或env基因和/或复制所必需的其他基因。
[0349]
然而,用于在宿主细胞/包装细胞内产生病毒基因组的质粒载体还将包括可操作地连接于慢病毒基因组的转录调节控制序列,以指导宿主细胞/包装细胞中基因组的转录。这些调节序列可以是与转录的病毒序列相关的天然序列(即5'u3区),或者它们可以是异源启动子,如另一个病毒的启动子(例如cmv启动子)。
[0350]
载体可以是其中病毒增强子和启动子序列已经被删除的自失活(sin)载体。sin载体可以以与野生型载体的效力相似的效力在体内产生并转导非分裂细胞。sin前病毒中长末端重复(ltr)的转录失活应防止有复制能力的病毒的启动。这还应通过消除ltr的任何顺式作用效应,使来自内部启动子的基因表达得到调节。
[0351]
载体可以是整合缺陷的。整合缺陷慢病毒载体(idlv)可以例如通过用催化失活的整合酶(如在催化位点带有d64v突变的hiv整合酶;naldini,l.et al.(1996)science 272:263-7;naldini,l.et al.(1996)proc.natl.acad.sci.usa93:11382-8;leavitt,a.d.et al.(1996)j.virol.70:721-8)包装载体或通过修饰或删除来自载体ltr的必需的att序列(nightingale,s.j.et al.(2006)mol.ther.13:1121-32)或通过上述的组合来产生。
[0352]
腺相关病毒(aav)载体
[0353]
aav载体可以包含aav基因组或其片段或衍生物。
[0354]
aav基因组是多核苷酸序列,它可以编码aav颗粒的产生所需的功能。这些功能包括在宿主细胞中aav的复制和包装周期中运行的功能,包括将aav基因组衣壳化进aav颗粒。天然存在的aav是复制缺陷的,并且依赖于在提供反式辅助功能来完成复制和包装周期。因此,本发明的aav载体的aav基因组通常是复制缺陷的。
[0355]
aav基因组可以是单链形式,正义或反义,或者可选地是双链形式。使用双链形式容许绕过在靶细胞中的dna复制步骤,因此可以加速转基因表达。
[0356]
aav基因组可以来自任何自然衍生的aav血清型、分离物或分支。因此,aav基因组可能是天然存在的aav的全基因组。如本领域技术人员所知,自然界中存在的aav可以根据各种生物学系统进行分类。
[0357]
通常,aav是指它们的血清型。血清型对应于aav的变体亚种,由于其衣壳表面抗原的表达概况,aav的变体亚种具有可以用于将其与其他变体亚种区分开的独特的反应性。通常,具有特定aav血清型的病毒不能有效地与任何其他aav血清特异的中和抗体发生交叉反应。
[0358]
aav血清型包括aav1、aav2、aav3、aav4、aav5、aav6、aav7、aav8、aav9、aav10和aav11,以及最近从灵长类大脑中鉴定的重组血清型,如rec2和rec3。
[0359]
在一些实施方案中,aav是aav1、aav6、aav6.2、aav7、aav9、rh10、rh39或rh43血清型。在一些实施方案中,aav载体颗粒包含aav1、aav6、aav6.2、aav7、aav9、rh10、rh39或rh43
血清型衣壳蛋白。在一些实施方案中,aav载体颗粒是aav1、aav6、aav6.2、aav7、aav9、rh10、rh39或rh43载体颗粒。
[0360]
在一些实施方案中,aav是aav9;aav9 php.b;aav9 php.eb;或aavrh10血清型。在一些实施方案中,aav载体颗粒包含aav9;aav9 php.b;aav9 php.eb;或aavrh10血清型衣壳蛋白。
[0361]
衣壳蛋白可以是人工的或突变的衣壳蛋白。
[0362]
如本文所用的术语“人工衣壳”意指衣壳颗粒包含自然界中不存在或包含已经从天然存在的衣壳氨基酸序列工程化(例如修饰)的氨基酸序列的氨基酸序列。
[0363]
换言之,在人工衣壳氨基酸序列与亲本衣壳氨基酸序列进行比对的情况下,与衍生其的亲本衣壳的序列相比,人工衣壳蛋白在氨基酸序列中包含突变或变异。序列比对的方法是本领域公知的并在本文中引用。
[0364]
aav血清型的综述可以参见choi et al.(2005)curr.gene ther.5:299-310和wu et al.(2006)molecular therapy 14:316-27。用于本发明的aav基因组或aav基因组的元件的序列(包括itr序列、rep或cap基因)可以衍生自aav全基因组序列的以下登录号:腺相关病毒1nc_002077、af063497;腺相关病毒2nc_001401;腺相关病毒3nc_001729;腺相关病毒3b nc_001863;腺相关病毒4nc_001829;腺相关病毒5y18065、af085716;腺相关病毒6nc_001862;禽aav atcc vr-865ay186198、ay629583、nc_004828;禽aav株da-1nc_006263、ay629583;牛aav nc_005889、ay388617。
[0365]
aav也可以指分支或克隆。这是指天然衍生的aav的系统发育关系,通常是指可以追溯到共同祖先的aav系统发育组,包括其所有后代。此外,aav可以指特定的分离物,即自然界中发现的特定aav的基因分离物。术语基因分离物描述了aav的体,其与其他天然存在的aav发生了有限的基因混合,从而在基因水平上定义了可识别的不同的体。
[0366]
技术人员可以基于他们的公知常识选择用于本发明的aav的合适的血清型、分支、克隆或分离物。
[0367]
aav血清型决定了aav病毒感染的组织特异性(或嗜性)。
[0368]
通常,天然衍生的aav血清型、分离物或分支的aav基因组包含至少一个反向末端重复序列(itr)。itr序列以顺式作用提供复制的功能性复制起点,并容许在细胞的基因组中整合载体和从细胞的基因组中切除载体。在优选实施方案中,一个或多个itr序列位于本文公开的核苷酸序列的侧翼。aav基因组还可以包含包装基因,如编码aav颗粒的包装功能的rep和/或cap基因。rep基因编码蛋白rep78、rep68、rep52和rep40或它们的变体中一种或多种。cap基因编码一种或多种衣壳蛋白,如vp1、vp2和vp3或它们的变体。这些蛋白质构成aav颗粒的衣壳。
[0369]
启动子将可操作地连接于每个包装基因。此类启动子的具体实例包括p5、p19和p40启动子(laughlin et al.(1979)proc.natl.acad.sci.usa76:5567-5571)。例如,p5和p19启动子通常用于表达rep基因,而p40启动子通常用于表达cap基因。
[0370]
如上文所述,本发明的aav载体中使用的aav基因组因此可以是天然存在的aav的全基因组。例如,包含完整aav基因组的载体可以用于体外制备aav载体或载体颗粒。然而,虽然此类载体原则上可以施用于患者,但在实践中很少这样做。优选地,aav基因组将被衍生化以为了施用于患者的目的。此类衍生化在本领域是标准的,并且本发明涵盖了aav基因
组的任何已知的衍生物的用途,以及可以通过应用本领域已知的技术产生的衍生物。上文引用的coura and nardi(2007)virology journal 4:99以及choi et al.和wu et al.中对aav基因组和aav衣壳的衍生化进行了综述。
[0371]
aav基因组的衍生物包括容许在体内表达来自本发明的aav载体的转基因的任何截短的或经修饰的形式的aav基因组。通常,有可能显著地截短aav基因组以包括最小的病毒序列但保留上述功能。出于安全原因,这是优选的以降低载体与野生型病毒重组的风险,并且也为了避免因靶细胞中病毒基因蛋白的存在而触发细胞免疫应答。
[0372]
通常,衍生物将包括至少一个反向末端重复序列(itr),优选多于一个itr,如两个或更多个itr。itr的一种或多种可以衍生自具有不同血清型的aav基因组,或者可以是嵌合的或突变的itr。优选的突变的itr是具有trs(末端解离位点)缺失的突变的itr。这种缺失容许基因组的持续复制,以产生含有编码序列和互补序列两者的单链基因组,即自互补aav基因组。这容许绕过在靶细胞中的dna复制,从而使转基因表达加速。
[0373]
在一些实施方案中,aav载体包含至少一个,如两个aav1、2、3、4、5、6、7、8、9、10或11itr。在一些实施方案中,aav载体包含至少一个aav9 itr。
[0374]
在一些实施方案中,aav载体包含两个aav9 itr。
[0375]
一个或多个itr将优选在本文公开的核苷酸序列的任一端的侧翼。优选包含一个或多个itr以帮助本发明的载体在宿主细胞的细胞核中的多联体形成,例如在通过宿主细胞dna聚合酶的作用下将单链载体dna转化为双链dna之后。在宿主细胞的寿命期间,此类游离型多联体的形成保护载体构建体,从而容许转基因在体内的长期表达。
[0376]
在优选实施方案中,itr元件将是衍生物中从天然aav基因组中保留的唯一序列。因此,衍生物将优选不包括天然基因组的rep和/或cap基因以及天然基因组的任何其他序列。出于上述原因,这是优选的,并且还降低了载体整合到宿主细胞基因组中的可能性。此外,减少aav基因组的大小容许在将除转基因之外的其他序列元件(如调控元件)整合到载体内时增加灵活性。
[0377]
因此,在本发明的衍生物中可以去除以下部分:一个反向末端重复(itr)序列、复制(rep)和衣壳(cap)基因。然而,在一些实施方案中,衍生物可以额外地包括aav基因组的一个或多个rep和/或cap基因或其他病毒序列。天然存在的aav在人染体19上的特定位点以高频率整合,并且显示出可忽略的随机整合频率,使得载体整合能力的保留在环境中是可耐受的。
[0378]
当衍生物包含衣壳蛋白即vp1、vp2和/或vp3时,该衍生物可以是一种或多种天然存在的aav的嵌合、改组或衣壳修饰的衍生物。特别地,本发明涵盖在同一载体(即假型载体)内提供来自不同的aav血清型、分支、克隆或分离物的衣壳蛋白序列。因此,在一个实施方案中,aav载体是假型aav载体颗粒的形式。
[0379]
通常选择嵌合、改组或衣壳修饰的衍生物来为aav载体提供一种或多种期望的功能。因此,与包含天然存在的aav基因组(如aav2基因组)的aav载体相比,这些衍生物可以展示出提高的基因递送效率、降低的免疫原性(体液或细胞)、改变的嗜性范围和/或提高的特定细胞类型的靶向性。基因递送效率的提高可以受到以下方面的影响:改善的细胞表面的受体或共受体结合、改善的内化、改善的细胞内和向细胞核内的运输、改善的病毒颗粒的脱壳以及改善的单链基因组向双链形式的转化。提高的效率还可以与改变的嗜性范围或特定
细胞体的靶向性有关,使得载体剂量不因施用到不需要该载体的组织而被稀释。
[0380]
嵌合衣壳蛋白包括通过天然存在的aav血清型的两种或多种衣壳编码序列之间的重组产生的衣壳蛋白。这可以例如通过标记获救方法来进行,其中一种血清型的非感染性衣壳序列与不同血清型的衣壳序列共转染,并且使用定向选择来选择具有期望的特性的衣壳序列。不同血清型的衣壳序列可以通过细胞内的同源重组来改变,以产生新的嵌合衣壳蛋白。
[0381]
嵌合衣壳蛋白还包括通过衣壳蛋白序列的工程化以在两种或更多种衣壳蛋白之间(例如在不同血清型的两种或更多种衣壳蛋白之间)转移特定的衣壳蛋白结构域、表面环或特定的氨基酸残基来产生的衣壳蛋白。
[0382]
改组或嵌合衣壳蛋白也可以通过dna改组或易错pcr来产生。杂交aav衣壳基因可以通过将相关的aav基因的序列(例如编码多种不同血清型的衣壳蛋白的基因)随机片段化,然后随后在自吸式聚合酶反应中重新组装片段来产生,这也可以导致序列同源性区域的交叉。可以对以这种方式通过改组几种血清型的衣壳基因建立的杂交aav基因文库进行筛选以鉴定具有期望的功能的病毒克隆。类似地,易错pcr可以用于随机突变aav衣壳基因以建立多样化的变体文库,然后可以对该文库进行选择以获得期望的特性。
[0383]
衣壳基因的序列也可以经基因修饰以引入相对于天然野生型序列的特定缺失、取代或插入。特别地,衣壳基因可以通过在衣壳编码序列的开放阅读框内或衣壳编码序列的n和/或c末端插入无关的蛋白质或肽的序列来修饰。
[0384]
无关的蛋白质或肽可以有利地是充当特定细胞类型的配体的蛋白质或多肽,从而赋予改善的对靶细胞的结合或改善载体靶向特定细胞体的特异性。无关的蛋白质也可以是作为生产过程的一部分辅助病毒颗粒纯化的蛋白质(即表位或亲和标签)。通常将选择插入位点以便不干扰病毒颗粒的其他功能,例如病毒颗粒的内化、运输。技术人员可以基于他们的公知常识来鉴定合适的插入位点。
[0385]
本发明另外涵盖以与天然aav基因组不同的顺序和构造提供aav基因组的序列。本发明还涵盖用来自另一种病毒的序列或由来自超过一种病毒的序列组成的嵌合基因替换一个或多个aav序列或基因。此类嵌合基因可以由来自不同病毒种类的两种或更多种相关病毒蛋白的序列组成。
[0386]
本发明的aav颗粒包括转衣壳形式,其中具有一种血清型itr的aav基因组或衍生物被包装在不同血清型的衣壳中。本发明的aav颗粒还包括镶嵌形式,其中来自两种或更多种不同血清型的未修饰的衣壳蛋白的混合物构成病毒衣壳。aav颗粒还包括带有吸附在衣壳表面的配体的化学修饰形式。例如,此类配体可以包括用于靶向特定细胞表面受体的抗体。
[0387]
aav载体可以包含本文提及的核苷酸序列的多个拷贝(例如2个、3个等)。
[0388]
腺病毒载体
[0389]
腺病毒是双链、线性dna病毒,其不经过rna中间体。存在超过50种不同的人腺病毒血清型,这些血清型基于基因序列同源性分为6个亚组。腺病毒的天然靶标是呼吸道和胃肠道上皮,通常只会引起轻微的症状。血清型2和5(具有95%的序列同源性)最常用于腺病毒载体系统,并且通常与年轻人的上呼吸道感染相关。
[0390]
腺病毒已被用作基因和异源基因表达的载体。大的(36kb)基因组可容纳多达
8kb的外源插入dna,并能够在补充细胞系中有效复制以产生高达10
12
的非常高的滴度。因此,腺病毒是研究原代非复制细胞中基因表达的最佳系统之一。
[0391]
腺病毒基因组中病毒或外源基因的表达不需要复制的细胞。腺病毒载体通过受体介导的内吞作用进入细胞。一旦进入细胞,腺病毒载体很少整合到宿主染体中。相反,它们在宿主细胞核中作为线性基因组游离地(独立于宿主基因组)发挥功能。因此,重组腺病毒的使用减轻了与随机整合到宿主基因组中相关的问题。
[0392]
选择、耗竭和追踪的方法
[0393]
在另一方面,本发明提供了选择转导的细胞的方法,其包括以下步骤:
[0394]
(a)用本发明的多核苷酸或病毒载体转导细胞体;
[0395]
(b)使转导的细胞体与egfrt结合剂接触;和
[0396]
(c)选择与egfrt结合剂结合的细胞。
[0397]
选择的方法可以富集包含egfr表位或egfrt的细胞。
[0398]
在另一方面,本发明提供了追踪转导的细胞的方法,其包括以下步骤:
[0399]
(a)用本发明的多核苷酸或病毒载体转导细胞体;
[0400]
(b)使转导的细胞体与egfrt结合剂接触,其中该egfrt结合剂可操作地连接于可检测的标记;和
[0401]
(c)检测与egfrt结合剂结合的细胞。
[0402]
优选地,egfrt结合剂基本上特异性结合egfrt。在一些实施方案中,egfrt结合剂是抗体。结合egfrt的试剂和抗体是本领域已知的,并且包括西妥昔单抗。在一些实施方案中,egfrt结合剂是西妥昔单抗。
[0403]
可以选择性地纯化细胞体以从不展现出特定表型或特征或展现出较低程度的表型或特征的其他细胞中获得展现出特定表型或特征的细胞。例如,表达特定标志物(例如本发明的egfr表位或egfrt)的细胞体可以从起始细胞体中纯化。
[0404]“富集”某种类型的细胞的细胞体应当理解为该类型的细胞的浓度在体中增加。其他类型的细胞的浓度可以随之降低。
[0405]
纯化或富集可以导致细胞体中基本上没有其他类型的细胞。
[0406]
表达特定标志物(例如本发明的egfr表位或egfrt)的细胞体的纯化或富集可以通过使用与该标志物结合、优选基本上特异性地与该标记结合的试剂来实现。与细胞标记物结合的试剂可以是抗体,例如与本发明的egfr表位或egfrt结合的抗体。
[0407]
术语“抗体”是指能够与选择的靶标结合的完整抗体或抗体片段,并且包括fv、scfv、f(ab’)和f(ab’)2、单克隆和多克隆抗体、工程化抗体(包括嵌合抗体、cdr移植抗体和人源化抗体)以及使用噬菌体展示或可替代的技术产生的人工选择的抗体。
[0408]
此外,经典抗体的替代物也可以用于本发明,例如“avibody”、“avimer”、“anticalin”、“纳米抗体”和“darpin”。
[0409]
可以使用本领域已知的许多技术中的任何一种来标记与特定标志物结合的试剂,以使其可鉴定。该试剂可以固有地被标记,或者可以通过将标记与其缀合来修饰。“缀合”应当理解为试剂和标记是可操作地连接的。这意味着试剂和标记以能够使两者基本上不受阻碍地执行其功能(例如,与标志物结合,容许荧光鉴定,或当置于磁场中时容许分离)的方式连接在一起。合适的缀合方法是本领域公知的,并且技术人员容易识别。
[0410]
例如,标记可以容许被标记的试剂及其结合的任何细胞从其环境中纯化(例如,可以用磁珠或亲和标签(如亲和素)标记试剂)、被检测或两者。适合用作标记的可检测标志物包括荧光团(例如绿、樱桃、蓝绿和橙荧光蛋白)和肽标签(例如his标签、myc标签、flag标签和ha标签)。
[0411]
本领域已知许多用于分离表达特定标志物的细胞体的技术。这些技术包括基于磁珠的分离技术(例如基于磁珠的闭路式分离)、流式细胞术、荧光激活细胞分选术(facs)、亲和标签纯化(例如使用亲和柱或小珠(如生物素柱)来分离亲和素标记的试剂)和基于显微镜的技术。
[0412]
还可能使用不同技术的组合进行分离,如基于磁珠的分离步骤,随后通过流式细胞术针对一种或多种额外的(阳性或阴性)标志物对所得的细胞体进行分选。
[0413]
例如,可以使用系统(miltenyi)进行临床分级。这是基于磁珠的闭路式分离技术的实例。
[0414]
本领域已知许多用于检测(任选地用于定量检测)表达特定标志物的细胞体的技术。这些技术包括流式细胞术、荧光激活细胞分选术(facs)和基于显微镜的技术。
[0415]
在另一方面,本发明提供了耗竭转导的细胞的方法,其包括以下步骤:
[0416]
(a)用本发明的多核苷酸或病毒载体转导细胞体;和
[0417]
(b)使转导的细胞体与egfrt结合剂接触。
[0418]
在一些实施方案中,egfrt结合剂结合的细胞被例如由巨噬细胞介导的抗体依赖性细胞毒性作用(adcc)杀伤。
[0419]
在一些实施方案中,egfrt结合剂可操作地连接于耗竭剂。在一些实施方案中,步骤(b)的细胞体与结合于egfrt结合剂的耗竭剂接触。例如,egfrt结合剂可以可操作地连接于生物素,并且耗竭剂可以包括链霉亲和素,反之亦然。
[0420]
耗尽剂可以杀伤、优选选择性地杀伤egfrt结合剂结合的细胞。在一些实施方案中,耗竭剂包括毒素。在一些实施方案中,耗竭剂包括皂草素(saporin)。
[0421]
在一些实施方案中,该方法是体外或离体方法。
[0422]
方法
[0423]
在另一方面,本发明提供了用于的本发明的多核苷酸、病毒载体或细胞。
[0424]
在另一方面,本发明提供了方法,其包括本发明的选择、耗竭或追踪方法。
[0425]
本文中对的所有引用包括治愈性、姑息性和预防性。优选哺乳动物,尤其是人。人和兽医都在本发明的范围内。
[0426]
药物组合物和注射溶液
[0427]
尽管用于本发明的试剂可以单独施用,但它们通常与药物载体、赋形剂或稀释剂混合施用,特别是用于人的。
[0428]
本发明的药物,例如载体颗粒,可以配制成药物组合物。除药物外,这些组合物可以包含药学上可接受的载体、稀释剂、赋形剂、缓冲剂、稳定剂或本领域熟知的其他材料。此类材料应该是无毒的且不应该干扰活性成分的功效。载体或其他材料的精确性质可以由技术人员根据施用路径(例如静脉内或动脉内)确定。
[0429]
药物组合物通常为液体形式。液体药物组合物通常包括液体载体,如水、石油、动物或植物油、矿物油或合成油。可以包括生理盐水溶液、氯化镁、右旋葡萄糖或其他糖溶液、
或二醇类(如乙二醇、丙二醇或聚乙二醇)。在一些情况下,可以使用表面活性剂,如0.001%的普朗尼克酸(pf68)。在一些情况下,组合物中可以使用血清白蛋白。
[0430]
对于注射,活性成分可以是无热原的水溶液形式,并且具有合适的ph、等渗性和稳定性。技术人员能够很好地使用例如等渗载体(如氯化钠注射液、林格氏注射液或乳酸林格氏注射液)制备合适的溶液。可以根据需要包括防腐剂、稳定剂、缓冲剂、抗氧化剂和/或其他添加剂。
[0431]
对于延迟释放,药物可以根据本领域已知的方法被包含在配制用于缓慢释放的药物组合物中,如在由生物相容性聚合物形成的微胶囊中或在脂质体载体系统中。
[0432]
细胞产品的处理优选按照细胞的fact-jacie国际标准进行。
[0433]
施用
[0434]
在一些实施方案中,将多核苷酸、载体或细胞向受试者全身施用。
[0435]
在一些实施方案中,将多核苷酸、载体或细胞向受试者局部施用。
[0436]
如本文所用的术语“全身递送”或“全身施用”意指将本发明的试剂施用到循环系统中,例如为了实现试剂的广泛分布。比较而言,表面或局部施用将试剂的递送限制到局部区域。
[0437]
在一些实施方案中,多核苷酸、载体或细胞经血管内、经静脉内或经动脉内施用。
[0438]
剂量
[0439]
本领域技术人员可以容易地确定向受试者施用本发明的试剂的合适的剂量。通常,医师将确定最适合单个患者的实际的剂量,这将取决于多种因素,包括所采用的特定化合物的活性、该化合物的代谢稳定性和该化合物的作用时长,年龄、体重、健康状况、性别、饮食、施用方式和时间,排泄速率,药物组合,特定病症的严重程度以及经受的个体。当然,可以存在应受较高或较低剂量范围的个别情况,此类情况在本发明的范围内。
[0440]
受试者
[0441]
如本文所用的术语“受试者”是指人或非人动物。
[0442]
非人动物的实例包括脊椎动物,例如哺乳动物,如非人灵长类动物(特别是高等灵长类动物)、狗、啮齿动物(例如小鼠、大鼠或豚鼠)、猪和猫。非人动物可以是伴侣动物。
[0443]
优选地,受试者是人。
[0444]
变体、衍生物、类似物、同源物和片段
[0445]
除了本文提及的特定蛋白质和核苷酸之外,本发明还涵盖其变体、衍生物、类似物、同源物和片段。
[0446]
在本发明的上下文中,任何给定序列的“变体”是这样的序列,其中特定的残基序列(无论是氨基酸还是核酸残基)以使得所考虑的多肽或多核苷酸保留其内源性功能的至少一种的方式进行修饰。变体序列可以通过天然存在的多肽或多核苷酸中存在的至少一个残基的添加、缺失、取代、修饰、替换和/或变异而获得。
[0447]
如本文所用的与本发明的蛋白质或多肽相关的术语“衍生物”包括从序列中或向序列中进行一个(或多个)氨基酸残基的任何取代、变异、修饰、替换、删除和/或添加,条件是所得的蛋白质或多肽保留其内源性功能的至少一种。
[0448]
如本文所用的与多肽或多核苷酸相关的术语“类似物”包括任何模拟物,即具备其模拟的多肽或多核酸的内源性功能的至少一种的化合物。
[0449]
通常,可以进行氨基酸取代,例如从1、2或3个到10或20个取代,条件是经修饰的序列保留所需的活性或能力。氨基酸替代可以包括非天然存在的类似物的使用。
[0450]
在本发明中使用的蛋白质也可以具有氨基酸残基的缺失、插入或取代,这些缺失、插入或取代产生沉默的改变并导致功能上等同的蛋白质。可以基于残基的极性、电荷、溶解性、疏水性、亲水性和/或两亲性的相似性进行有意的氨基酸取代,只要保留内源性功能即可。例如,带负电荷的氨基酸包括天冬氨酸和谷氨酸;带正电荷的氨基酸包括赖氨酸和精氨酸;具有类似亲水性值的不带电荷的极性头部基团的氨基酸包括天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸和酪氨酸。
[0451]
例如,可以根据下表进行保守的取代。第二列中同一格内的氨基酸并且优选第三列中同一行内的氨基酸可以互相取代:
[0452][0453]
如本文所用的术语“同源物”意指与野生型氨基酸序列或野生型核苷酸序列具有一定同源性的实体。术语“同源性”可以等同于“同一性”。
[0454]
在本文上下文中,认为同源序列包括可以与主题序列具有至少50%、55%、65%、75%、85%或90%同一性,优选具有至少95%、96%或97%或98%或99%同一性的氨基酸序列。通常,同源物将包含与主题氨基酸序列相同的活性位点等。尽管同源性也可以依据相似性(即具有相似的化学特性/功能的氨基酸残基)来考虑,但在本发明的上下文中,优选依据序列同一性来表达同源性。
[0455]
在本文上下文中,认为同源序列包括可以与主题序列具有至少50%、55%、65%、75%、85%或90%同一性,优选具有至少95%、96%或97%或98%或99%同一性的核苷酸序列。尽管同源性也可以依据相似性来考虑,但在本发明的上下文中,优选依据序列同一性来表达同源性。
[0456]
优选地,提及与本文详述的任何一个seq id no具有百分比同一性的序列是指在提及的seq id no的整个长度上具有所述的百分比同一性的序列。
[0457]
同源性比较可以通过肉眼进行,或者更常见的是,借助于容易获得的序列比较程序。这些可商购的计算机程序可以计算两个或更多个序列之间的百分比同源性或同一性。
[0458]
可以计算连续序列的百分比同源性,即一个序列与另一个序列比对,并且一个序列中的每个氨基酸或核苷酸与另一个序列中相应的氨基酸或核苷酸直接比较,每次一个残基。这称为“无空位(ungapped)”比对。通常,此类无空位比对仅在相对短的数量的残基上进行。
[0459]
尽管这是非常简单和一致的方法,但它没有考虑到,例如,在其他方面相同的一对序列中,氨基酸或核苷酸序列中的一个插入或缺失可以导致随后的残基或密码子无法比对,从而在进行全局比对时可能导致百分比同源性的大幅降低。因此,大多数序列比较方法被设计为产生最佳比对,该比对考虑可能的插入和缺失而不会过度损害整体的同源性得分。这是通过在序列比对中插入“空位”以试图最大化局部同源性来实现的。
[0460]
然而,这些更复杂的方法将“空位罚分”分配给比对中出现的每个空位,因此,对于相同数量的相同的氨基酸或核苷酸,具有尽可能少的空位的序列比对(反映出两个比较的序列之间较高的关联性)将获得比具有许多空位的序列比对更高的得分。“仿射空位成本”通常用于对空位的存在收取相对高的成本,并对空位中每个随后的残基收取较小的罚分。这是最常用的空位评分系统。高的空位罚分当然会产生具有较少空位的优化的比对。大多数比对程容许修改空位罚分。然而,当使用此类软件进行序列比较时,最好使用默认值。例如,当使用gcg wisconsin bestfit软件包时,氨基酸序列的默认空位罚分为空位-12以及每个扩展-4。
[0461]
因此,计算最大百分比同源性首先需要产生最佳比对,考虑空位罚分。用于实施此类比对的合适的计算机程序是gcg wisconsin bestfit软件包(威斯康星大学,美国;devereux et al.(1984)nucleic acids research 12:387)。可以进行序列比较的其他软件的实例包括但不限于blast软件包(参见ausubel et al.(1999)ibid
–
ch.18)、fasta(atschul et al.(1990)j.mol.biol.403-410)和geneworks比较工具套件。blast和fasta都可用于离线和在线搜索(参见ausubel et al.(1999)ibid,第7-58至7-60页)。然而,对于一些应用,最好使用gcg bestfit程序。另一种工具blast 2序列也可用于比较蛋白质和核苷酸序列(fems microbiol.lett.(1999)174(2):247-50;fems microbiol.lett.(1999)177(1):187-8)。
[0462]
尽管最终的百分比同源性可以用同一性来衡量,但比对过程本身通常不是基于全或无配对比较。相反,通常使用缩放的相似性得分矩阵,该矩阵基于化学相似性或进化距离为每个成对比较分配得分。此类常用矩阵的实例是blosum62矩阵(blast程序套件的默认矩阵)。gcg wisconsin程序通常使用公共默认值或使用自定义符号比较表(如果提供的话)(更多详细信息请参见用户手册)。对于一些应用,最好使用gcg软件包的公共默认值,或者在其他软件的情况下,使用默认矩阵,如blosum62。
[0463]
一旦软件产生了最佳比对,就可以计算百分比同源性,优选百分比序列同一性。软件通常将此作为序列比较的部分并生成数值结果。
[0464]“片段”也是变体,该术语通常指多肽或多核苷酸的选定区域,该区域在功能上或例如在测定中是感兴趣的。因此,“片段”是指作为全长多肽或多核苷酸的一部分的氨基酸或核酸序列。
[0465]
此类变体可以使用标准的重组dna技术如定点突变来制备。当要进行插入时,可以制备合成dna,其编码插入以及与插入位点两侧的天然存在的序列相对应的5’和3’侧翼区域。侧翼区域将含有与天然存在的序列中的位点相对应的方便的限制性位点,使得可以用合适的酶切割该序列并将合成的dna连入该切口。然后依据本发明表达dna以制备所编码的蛋白。这些方法仅是本领域已知的用于操作dna序列的许多标准方法的例证,并且也可以使用其他已知的技术。
[0466]
密码子优化
[0467]
本发明中使用的多核苷酸可以是密码子优化的。先前已经在wo 1999/41397和wo 2001/79518中描述了密码子优化。不同的细胞在特定密码子的使用方面存在不同。这种密码子偏好性对应于细胞类型中特定trna的相对丰度的偏差。通过改变序列中的密码子,使得它们在修改后与相应trna的相对丰度相匹配,有可能增加表达。同样地,有可能通过故意选择已知其相应的trna在特定细胞类型中稀有的密码子来减少表达。因此,可以获得额外程度的翻译控制。本领域已知哺乳动物细胞以及多种其他生物体的密码子使用表。
[0468]
本领域技术人员将理解,他们可以组合本文所公开的本发明的所有特征而不脱离所公开的本发明的范围。
[0469]
现在将通过非限制性实例来描述本发明的优选的特征和实施方案。
[0470]
除非另有说明,本发明的实践将采用化学、生物化学、分子生物学、微生物学和免疫学的常规技术,这些技术在本领域普通技术人员的能力范围内。此类技术在文献中有解释。参见例如sambrook,j.,fritsch,e.f.and maniatis,t.(1989)molecular cloning:alaboratory manual,2nd edition,cold spring harbor laboratory press;ausubel,f.m.et al.(1995年以及定期增补)current protocols in molecular biology,ch.9,13and 16,john wiley&sons;roe,b.,crabtree,j.and kahn,a.(1996)dna isolation and sequencing:essential techniques,john wiley&sons;polak,j.m.and mcgee,j.o’d.(1990)in situ hybridization:principles and practice,oxford university press;gait,m.j.(1984)oligonucleotide synthesis:a practical approach,irl press;以及lilley,d.m.and dahlberg,j.e.(1992)methods in enzymology:dna structures part a:synthesis and physical analysis of dna,academic press。这些通用文本中的每一个通过引用并入本文。
实施例
[0471]
实施例1
[0472]
结果
[0473]
为了评估egfrt蛋白表面表达的改善,我们利用了基因编辑方法来纠正cd40lg基因,其中的突变导致x连锁免疫缺陷伴高免疫球蛋白m(higm1)。我们将携带密码子优化型式的cd40lg cdna(从外显子2到外显子5)的纠正构建体整合到cd40lg基因的第一内含子中,该密码子优化型式的cd40lg cdna与ires序列和egfrt(图1ai)或经修饰的egfrt(图1aii/iii)序列偶联,随后是cd40lg内源性3'utr和polya。采用这种策略,cd40lg启动子驱动cd40lg基因和egfrt或经修饰的egfrt基因的表达。正常情况下,cd40lg仅在淋巴细胞活化后在cd4+t细胞表面表达,而在基础水平时该蛋白无法检测到,这是因为严格调控的蛋白易位,并且最重要的是,因为弱的cd40lg启动子激活状态。因此,我们利用非活化的cd4+t细胞,所述cd4+t细胞用携带egfrt或经修饰的egfrt基因的不同纠正构建体进行编辑,以研究egfrt稳定性和表面表达的增强。
[0474]
我们通过以下方式制备了经修饰的egfrt序列:i)对开放阅读框序列进行密码子优化,以通过使用更频繁的密码子促进蛋白质翻译;ii)引入新的信号肽;和iii)引入取自dngfr基因(图1aii)或内源性egfr基因(图1aiii)的新的8-氨基酸细胞质尾,以将该蛋白质
锚定并稳定到膜中。
[0475]
实验构建体的核苷酸序列包括:
[0476]
未修饰的egfrt
[0477][0478]
要点:
[0479]
sa.cd40lg
[0480]
ires
[0481]
具有原始信号肽的egfrt
[0482]
cd40lg 3’utr和polya
[0483]
具有ngfr信号肽和ngfr细胞质结构域的经修饰的egfrt
[0484][0485][0486]
要点:
[0487]
sa.cd40lg
[0488]
ires
[0489]
dngfr信号肽
[0490]
egfrt
[0491]
dngfr细胞质结构域
[0492]
cd40lg 3’utr和polya
[0493]
具有ngfr信号肽和egfr细胞质结构域的经修饰的egfrt
[0494][0495]
[0496]
要点:
[0497]
sa.cd40lg
[0498]
ires
[0499]
dngfr信号肽
[0500]
egfrt
[0501]
egfr细胞质结构域
[0502]
cd40lg 3’utr和polya
[0503]
我们发现,当通过cd40lg内源性启动子表达时,只有经修饰的egfrt(eegfrt)蛋白在经编辑的非活化cd4+t细胞的表面是可测量的(图1b),增加了多至5倍的表面蛋白表达。此外,由于eegfrt蛋白在cd4+t细胞表面上可以明显检测到,我们能够通过使用生物素化的西妥昔单抗利用免疫磁性纯化在体外富集靶细胞(图1c)。
[0504]
我们还制备了进一步修饰的egfrt序列,其通过接头将dngfr跨膜结构域和细胞质结构域二者整合至egfrt胞外结构域。我们测试了具有回收信号(图3)或不具有回收信号(图4)的所有构建体,以评估对细胞表面上蛋白质回收的加强。简言之,我们发现,对于密码子优化的序列,经修饰的egfrt中回收信号的存在没有改善egfrt的表达(图3),无论是在基础水平还是在t细胞活化时。然而,在没有任何回收信号的情况下,所有经修饰的egfrt基因都改善了egfrt表面表达,与密码子优化的基因(1)相比,在基础水平上显示出稳定和较高的表达(以mfi测量)(图4)。
[0505]
然后,我们通过用特定的免疫毒素(由组装有生物素化的西妥昔单抗(抗体)的链霉亲和素-皂草素(毒素)组成),评估体外eegfrt+编辑的细胞的耗竭。使用这种方法,我们观察到,仅当在组装的免疫毒素存在下培养时,eegfrt+细胞相对于单独使用毒素或单独使用抗体处理的淋巴细胞减少1.8倍(图1d)。最后,我们通过将人批量编辑的t细胞异种移植到nod-scid-gamma(nsg)小鼠中,评估了体内eegfrt+细胞的耗竭。尽管缺乏t、b和nk细胞,这些小鼠仍保留有限的巨噬细胞功能。因此,我们假设通过使用西妥昔单抗处理小鼠,利用巨噬细胞介导的抗体依赖性细胞毒性作用(adcc),eegfrt+t细胞将被耗竭(至少部分)。因此,我们发现在西妥昔单抗处理后,表达eegfrt的细胞从nsg小鼠中消除(图1e)。
[0506]
因此,通过使用经修饰的供体模板编辑细胞,即使在没有刺激的情况下,egfrt蛋白也在经编辑的t细胞表面表达(图5a),并且重要的是,与之前的模板相比,我们观察到类似的基因编辑效率(图5b)、培养物组成(图5c)、经调节的cd40l表达(图5d)和功能(图5e、f)。为了评估经编辑的细胞是否适合耗竭,我们探索了在体外用免疫毒素选择性消除携带egfrt的细胞的策略。通过在与蛋白质合成抑制剂毒素皂草素缀合的西妥昔单抗(西妥昔单抗-sap)或作为对照的单独的抗体和单独的毒素存在下培养经编辑的t细胞,我们观察到在两种测试的剂量下表达egfrt的淋巴细胞基本上耗竭(约50%)(图5g、h),证实了egfrt适合于选择和耗竭经编辑的细胞。
[0507]
为了证实在另一种基因环境中取得的改善,我们利用了慢病毒载体。我们克隆了两个双向慢病毒载体,其在hpgk启动子的控制下正义表达gfp报告子基因并且通过最小cmv启动子驱动反义表达tegfr(图2ai)或我们的经修饰的型式(eegfrt 1
–
图2aii)。为了模拟car-t细胞的环境,用这些载体转导t细胞并测量egfrt的表达。eegfrt蛋白表面表达增加了多至39倍。
[0508]
总之,我们已经证明,通过所述修饰,即使在低表达细胞中,我们也能够改善egfrt选择基因的使用,容许在体外回收经修饰的细胞以及在体内将它们耗竭,从而提高工程化细胞的安全性。
[0509]
材料和方法
[0510]
原代细胞
[0511]
使用ficoll通过连续离心从血沉棕黄层(buffy coat)新鲜纯化外周血单核细胞(pbmc)。血沉棕黄层是根据《赫尔辛基宣言》的规定作为匿名的献血残留物而获得的,在健康献血者签署特定机构的血液制品捐献的知情同意书后使用。根据制造商的说明,使用cd4 t细胞分离试剂盒(miltenyi biotech)通过免疫磁性分离来分离cd4 t细胞,并使用与抗cd3/抗cd28抗体缀合的磁珠(dynabeads人t活化剂cd3/cd28,thermo fisher)进行刺激(细胞:小珠的比例为1:3)。将细胞保持在iscove改良的dulbecco培养基(imdm;corning)中,该培养基补充有10% fbs(euroclone)、青霉素(100iu/ml)、链霉素(100μg/ml)、2%谷氨酰胺和il-7(5ng/ml;preprotech)和il-15(5ng/ml;preprotech)。培养6天后去除dynabeads。在所有实验中,t细胞衍生自男性健康供体。
[0512]
将t细胞扩增21天以进行流式细胞术和功能分析以及pma/离子霉素刺激。当指示时,根据制造商的说明用抗生物素微珠(miltenyi biotech)并使用生物素化的西妥昔单抗抗体(克隆#hu1,r&d systems),富集egfrt+编辑的细胞。使用ls柱进行磁性分离。
[0513]
所有细胞在37℃、5% co2加湿空气中培养。
[0514]
供体模板和核酸酶
[0515]
hdr的aav6供体模板从含有aav2反向末端重复的构建体生成,由tigem vector core通过三重转染方法产生,并通过在氯化铯梯度超速离心纯化。用于转导的慢病毒(lv)供体模板是利用hiv衍生的第三代自失活转移构建体产生的。如前文所述制备lv储备物并滴定(lombardo,a.et al.(2007)nat biotechnol 25:1298-306)。
[0516]
通过在25℃下以1:2摩尔比将s.p.cas9蛋白(aldvron)与合成的cr:tracrrna(integrated dnatechnologies)孵育10分钟来组装核糖核蛋白(rnp)。
[0517]
原代细胞的基因工程
[0518]
刺激3天后,对原代细胞进行基因编辑。用pbs洗涤106个原代t细胞,并用1.25μm的核糖核蛋白(rnp-p3原代细胞4d-nucleofector x试剂盒,程序ds-130;lonza)进行电穿孔,并在电穿孔后15分钟以5x10
4 vg/细胞的剂量用aav6进行转导。
[0519]
刺激2天后,进行lv转导。以100的moi用idlv感染106个原代t细胞。
[0520]
流式细胞术分析
[0521]
在配备diva软件的facs canto ii(bd pharmingen)上进行细胞荧光分析,并使用fsc express软件(第6版,de novo software)进行分析。根据制造商的说明,在用于流式细胞术的样品制备物中包含7-氨基放线菌素(7-aminoactinomycin)(sigma aldrich)以从分析中排除死细胞。
[0522]
pma/离子霉素
[0523]
电穿孔后6至12天,在无细胞因子培养基中用佛波醇12-肉豆蔻酸酯13-乙酸酯(pma,10ng/ml;calbiochem)和离子霉素(500ng/ml,sigma-aldrich)刺激t细胞5小时,然后洗涤并在完全培养基中培养t细胞。通过系列流式细胞术分析(活化后0、3、6、8、24、48小
时),在24/48小时的时间进程内追踪t细胞上cd40l的表面表达。
[0524]
经编辑的t细胞的离体功能研究
[0525]
根据制造商的说明,使用人幼稚b细胞分离试剂盒ii(miltenyi biotec)通过免疫磁性阴性选择从外周血单核细胞中分离幼稚b细胞。所有细胞在含有1%的青霉素/链霉素(p/s)(thermo fisher scientific)、20% fbs、20mm n-2-羟乙基哌嗪-n
’‑
2-乙磺酸(hepes)(均来自sigma-aldrich)、1% l-谷氨酰胺(life technologies)和55μm 2-巯基乙醇(gibco-life technologies)的rpmi 1640(corning)中培养。
[0526]
在共培养之前,将cd4 t细胞洗涤并在无细胞因子的培养基中静止过夜。然后使用两种不同的刺激物活化t细胞5小时:
[0527]
1.cd3/cd28 dynabeads(gibco-life technologies),小珠:细胞比例为1:1;
[0528]
2.佛波醇肉豆蔻酸酯乙酸酯(pma1ng/ml,sigma aldrich)加离子霉素(500ng/ml,sigma aldrich)。
[0529]
在去除dynabeads和pma/离子霉素并用完全培养基洗涤细胞后,将b和t细胞在96孔板平底(corning)中以1:3的b细胞:t细胞比例在200ul先前描述的培养基中共培养。
[0530]
在il-2(50ng/ml)、il-7(5ng/ml)和il-15(5ng/ml)(所有均来自peprotech)的存在下将t和b细胞保持培养5天,使用以下细胞因子的各种组合刺激b细胞:il-21(100ng/ml)(peprotech)、人toll样受体9(tlr9)激动剂cpg寡脱氧核苷酸(odn)1826(2,5ug/ml)(invivogen)、抗iga+igg+igm(15ug/ml,山羊抗人iga+igg+igm)(jackson immunoresearch)和可溶性cd40l(3ug/ml)(enzo life sciences)。
[0531]
为了评估b细胞增殖,遵循制造商的说明,用celltrace
tm violet细胞增殖试剂盒(thermofisher scientific)标记幼稚b细胞,然后遵循先前描述的方案与t细胞共培养。在t/b共培养5天后通过facs分析增殖。
[0532]
在共培养5天后通过elispot测定来分析分泌免疫球蛋白的细胞,该测定在包被有抗igg或抗igm(均来自southern biotech)的硝酸纤维素膜(merk millipore)的平板中进行。用pbs(corning)和1% bsa(sigma-aldrich)封闭后,加入总细胞的连续稀释液(从0.5x104至0.25x104),并在37℃下孵育过夜。然后用同种型特异性第二抗体(均来自southern biotech)孵育平板,然后用链霉亲和素-hrp(thermofisher)孵育,最后用3-氨基-9-乙基咔唑(sigma aldrich)作为显底物进行显。使用自动化elisa点测定视频分析系统(aelvis)扫描和计数平板以确定点/孔的数量。
[0533]
分子分析
[0534]
对于数字微滴pcr(ddpcr)分析,根据制造商的说明,使用qx200微滴数字pcr系统(biorad)分析5-50ng的基因组dna。在供体序列和靶基因座之间的连接处以及用于标准化的对照序列上设计hdr ddpcr引物和探针(人ttc5基因,primepcr ddpcr拷贝数测定,biorad)。退火和延伸的热条件调整如下:55℃1分钟,72℃2分钟。
[0535]
体外耗竭
[0536]
对于体外耗竭,在96孔圆形底板中将5000个t细胞/孔接种于完全培养基中。通过将生物素化的西妥昔单抗抗体(克隆#hu1,r&d systems)与链霉亲和素-sap缀合物(每个链霉亲和素2.3个皂草素分子,advanced targeting systems)以1:1的摩尔比组合来制备αegfr-sap免疫毒素,并在使用前立即以两种剂量(5nm、1nm)在pbs中稀释。将免疫毒素以及
相同量的单独的抗体或单独的毒素加入细胞达三天,然后收集淋巴细胞用于流式细胞术分析。
[0537]
体内耗竭
[0538]
在培养的第20天,将10x106个批量编辑的cd4 t细胞经静脉内注射到7至10周龄的雄性nsg小鼠中。通过可用的处理的细胞的总计数确定样品大小。移植后两周,一半的实验小鼠通过腹膜内注射用1mg/小鼠的西妥昔单抗(erbitux;merck,5mg/ml)4天。每个实验组的小鼠归属是随机的。通过从小鼠眼睛连续采集血液来监测基因编辑的细胞的存在(通过facs和ddpcr)。每周对小鼠进行监测和称重,最终观察移植物抗宿主病的迹象的出现。
[0539]
上述说明书中提及的所有出版物通过引用并入本文。在不脱离本发明的范围和精神的情况下,本发明公开的多核苷酸、蛋白质、载体、细胞、用途和方法的各种修饰和变化对技术人员来说是显而易见的。尽管本发明已经结合特定的优选实施方案而公开,应当理解,所要求保护的本发明不应过度地局限于此类特定的实施方案。事实上,对于技术人员显而易见的用于实施本发明的公开的模式的各种修饰旨在落入以下权利要求的范围内。
技术特征:
1.多核苷酸,其包含编码表皮生长因子受体(egfr)胞外表位的核苷酸序列,所述表皮生长因子受体胞外表位可操作地连接至:(a)ngfr或gms sfrα信号肽;(b)egfr或ngfr跨膜结构域;和/或(c)ngfr或egfr细胞质尾,任选地,其中所述细胞质尾包含以下氨基酸序列:(i)krwnrgil(seq id no:39);或(ii)rrrhivrk(seq id no:40);或具有多至三个氨基酸取代、添加或缺失的(i)或(ii)的变体,以及任选的回收信号,并且进一步任选地,其中所述egfr胞外表位是截短的表皮生长因子受体(egfrt)。2.多核苷酸,其包含编码截短的表皮生长因子受体(egfrt)的核苷酸序列,其中所述多核苷酸进一步包含:(a)编码ngfr信号肽的核苷酸序列;和/或(b)编码包含以下氨基酸序列的多肽的核苷酸序列:(i)krwnrgil(seq id no:39);或(ii)rrrhivrk(seq id no:40);或具有多至三个氨基酸取代、添加或缺失的(i)或(ii)的变体。3.权利要求1或2所述的多核苷酸,其中:(a)所述ngfr信号肽包含与seq id no:4或其片段具有至少70%同一性的氨基酸序列;和/或(b)编码所述ngfr信号肽的核苷酸序列与seq id no:5或其片段具有至少70%的同一性。4.前述权利要求中任一项所述的多核苷酸,其中所述egfrt包含egfr结构域iii、egfr结构域iv和egfr跨膜结构域。5.前述权利要求中任一项所述的多核苷酸,其中所述egfrt不包含egfr结构域i、egfr结构域ii、egfr近膜结构域或egfr酪氨酸激酶结构域。6.前述权利要求中任一项所述的多核苷酸,其中所述egfrt包含与seq id no:2或其片段具有至少70%同一性的氨基酸序列。7.前述权利要求中任一项所述的多核苷酸,其中编码所述egfrt的核苷酸序列与seq id no:3或其片段具有至少70%的同一性。8.前述权利要求中任一项所述的多核苷酸,其中所述多核苷酸:(a)编码与seq id no:17或其片段具有至少70%同一性的氨基酸序列;和/或(b)包含与seq id no:16或其片段具有至少70%同一性的核苷酸序列。9.前述权利要求中任一项所述的多核苷酸,其中所述多核苷酸:(a)编码与seq id no:19或21或其片段具有至少70%同一性的氨基酸序列;和/或(b)包含与seq id no:18或20或其片段具有至少70%同一性的核苷酸序列。10.前述权利要求中任一项所述的多核苷酸,其中所述多核苷酸:(a)编码与seq id no:23或25或其片段具有至少70%同一性的氨基酸序列;和/或(b)包含与seq id no:22或24或其片段具有至少70%同一性的核苷酸序列。11.前述权利要求中任一项所述的多核苷酸,其中编码所述egfrt的核苷酸序列可操作地连接至弱启动子。
12.前述权利要求中任一项所述的多核苷酸,其中所述多核苷酸进一步包含转基因,任选地其中ires元件位于所述转基因和编码所述egfrt的核苷酸序列之间。13.前述权利要求中任一项所述的多核苷酸,其中所述多核苷酸例如包含所述转基因和/或egfrt编码序列的多核苷酸用于通过基因编辑插入。14.权利要求12所述的多核苷酸,其中所述转基因编码嵌合抗原受体。15.egfrt蛋白,其由前述权利要求中任一项所述的多核苷酸编码。16.病毒载体,其包含权利要求1-14中任一项所述的多核苷酸。17.权利要求16所述的病毒载体,其中所述病毒载体是慢病毒载体、腺相关病毒(aav)载体或腺病毒载体。18.细胞,其包含权利要求1-14中任一项所述的多核苷酸或权利要求16或17所述的病毒载体。19.权利要求1-14或16-18中任一项所述的多核苷酸、病毒载体或细胞,其用于。20.选择转导的细胞的方法,其包括以下步骤:(a)用权利要求1-14、16或17中任一项所述的多核苷酸或病毒载体转导细胞体;(b)使所述转导的细胞体与egfrt结合剂接触;和(c)选择与所述egfrt结合剂结合的细胞。21.耗竭转导的细胞的方法,其包括以下步骤:(a)用权利要求1-14、16或17中任一项所述的多核苷酸或病毒载体转导细胞体;和(b)使所述转导的细胞体与egfrt结合剂接触,任选地,其中(i)所述egfrt结合剂可操作地连接至耗竭剂,或(ii)步骤(b)的细胞体与结合至所述egfrt结合剂的耗竭剂接触,其中所述耗竭剂杀伤与所述egfrt结合剂结合的细胞。22.追踪转导的细胞的方法,其包括以下步骤:(a)用权利要求1-14、16或17中任一项所述的多核苷酸或病毒载体转导细胞体;(b)使所述转导的细胞体与egfrt结合剂接触,其中所述egfrt结合剂可操作地连接至可检测的标记;和(c)检测与所述egfrt结合剂结合的细胞。23.权利要求20-22中任一项所述的方法,其中所述方法是体外或离体方法。24.权利要求20-23中任一项所述的方法,其中所述egfrt结合剂是抗体,任选地,其中所述egfrt结合剂是西妥昔单抗。25.权利要求21、23或24中任一项所述的方法,其中所述耗竭剂包含毒素,任选地,其中所述耗竭剂包含皂草素。26.方法,其包括权利要求21-25中任一项所述的方法。
技术总结
包含编码表皮生长因子受体(EGFR)胞外表位的核苷酸序列的多核苷酸,该表皮生长因子受体胞外表位可操作地连接至:(a)NGFR或GMS SFRα信号肽;(b)EGFR或NGFR跨膜结构域;和/或(c)NGFR或EGFR细胞质尾。NGFR或EGFR细胞质尾。NGFR或EGFR细胞质尾。
技术研发人员:
L.纳尔迪尼 P.杰诺维斯 V.瓦瓦索里
受保护的技术使用者:
特莱索恩基金会
技术研发日:
2021.05.14
技术公布日:
2023/3/28