TAF1 RNA 聚合酶 II,TATA 框结合蛋白相关因子,250-KD; TAF1
- TATA框结合蛋白相关因子 1
- TATA框结合蛋白相关因子 2A;TAF2A
- TBP 相关因子,RNA 聚合酶 II,250-KD;TAFII250
- 细胞周期,G1 期缺陷;CCG1
- 细胞周期基因 1
- 细胞周期模块,G1-TO-S;CCGS
- BA2R
此条目中代表的其他实体:
- 包含转录因子 IID;TFIID,包括;TF2D,包含
- TATA 结合蛋白复合物,包含
HGNC 批准的基因符号:TAF1
细胞遗传学位置:Xq13.1 基因组坐标(GRCh38):X:71,366,357-71,530,525(来自 NCBI)
▼ 说明
转录因子 IID(TFIID) 是 RNA 聚合酶 II(参见 POLR2A;180660)介导的真核细胞中许多(如果不是全部)蛋白质编码基因转录所需的 DNA 结合蛋白复合物。其他通用转录因子有 TFIIA(600519, 600520)、TFIIB(189963)、TFIIE(189962, 189964)、TFIIF(189968)、TFIIG/J 和 TFIIH(189972)。TFIID 在起始过程中发挥着关键作用,因为它与 TATA 元件结合形成复合物,使其他组件的组装成核形成预起始复合物,并且在多轮转录中可能保持稳定。TAF1 或 TAFII250 是 TFIID 的最大亚基。TFIID 的其他蛋白质亚基包括 TATA 框结合蛋白(TBP;600075)和许多其他 TBP 相关因子(TAF;参见 600475)。TFIID 被认为与 TFIIA 相互作用,这可能会稳定其结合,
▼ 克隆与表达
通过体细胞杂交,Jha 和 Ozer(1977) 在 X 染色体上发现了人类 HGPRT(308000) 的同线性,以及纠正特定小鼠细胞系中 DNA 合成中温度敏感缺陷的人类基因。贾等人(1980) 将这个被他们称为 BA2R 的基因分配给 Xq13-q27。施瓦茨等人(1977, 1979) 发现仓鼠细胞中的温度敏感突变(BHK21) 也是 X 连锁的,并且可以由人类 X 染色体互补。关口等人(1987) 研究了从仓鼠细胞系 BHK21/13 中分离出的温度敏感突变体,该突变体在异亮氨酸剥夺释放后,在 39.5 摄氏度下无法进入 S 期(Nishimoto 等人(1982) 对该突变细胞系进行了最初的描述。)突变细胞用来自人类细胞的高分子量 DNA 转染,并发现一些人类DNA条带在3个耐温转化循环中得以保留。通过对人-小鼠杂交细胞的研究,将 70 kb 的人类 DNA 带定位到 Xpter-q21 区域。
关口等人(1988) 克隆了 X 连锁基因,可纠正温度敏感仓鼠细胞系的缺陷。他们利用人类总 DNA 和粘粒载体的 DNA 介导的基因转移,从二次 ts(+) 转化体中分离出该基因,并将其称为 CCG1。分离的 cDNA 补充了 G1 期(细胞增殖控制最重要的阶段)中明显缺陷的温度敏感突变。克隆的基因组cDNA长5.3 kb,开放解读码组为4,662 bp,编码近180 kD的蛋白质。关口等人(1991)表明先前克隆的CCG1基因的cDNA是截短的形式;真实的 CCG1 cDNA 为 6.0 kb,编码分子量为 210 kD 的蛋白质。
鲁珀特等人(1993) 描述了转录因子 IID、TAFII250 的 250-kD 亚基的克隆、表达和特性,发现其与 CCG1 相同(另参见 Hisatake 等人(1993))。
Nolte 等人通过使用基于 PCR 的富集方法筛选人胎儿脑、白细胞和胎盘 cDNA 文库,然后对尾状核 RNA 进行 RT-PCR(2003) 鉴定了 TAF1 的 8 个剪接变体,其中包含新的 3-prime 外显子,他们将其称为 DYT3 转录本。其中 6 个变体在其 5 素末端含有先前鉴定的 TAF1 编码外显子,而其中 2 个变体仅含有新的 3 素外显子。
赫兹菲尔德等人(2007) 指出 TAF1 基因的前 38 个外显子编码高度保守的 TFIID 250-kD 亚基。通过对人胎儿大脑和尾状核进行 RT-PCR,他们鉴定了几个以外显子 26 起始、跳过外显子 38 并包含 Nolte 等人报道的一些 3-prime 外显子的选择性剪接转录本(2003)。这些 3-prime 外显子编码不包含在 250 kb 亚基中的序列。
▼ 基因结构
Nolte 等人(2003)指出TAF1基因至少包含38个外显子,并且他们鉴定了另外5个下游外显子。赫兹菲尔德等人(2007) 将这 5 个下游外显子称为 d1 至 d5。他们的分析表明,这些下游外显子比前 38 个高度保守的外显子要年轻得多,并且是在大约 3000 万年前添加的。在外显子 d2 的上游区域,Herzfeld 等人(2007) 在 CpG 岛内鉴定了一个无 TATA 的启动子,该启动子包含一个起始元件和几个假定转录因子的结合位点,包括功能性 Ikaros(参见 603023)结合位点。
▼ 测绘
布朗等人(1989) 通过研究分离各种 X 常染色体易位部分的体细胞杂交体,将人类 CCG1 基因分配给 Xq11-q13,该基因补充了温度敏感的仓鼠细胞周期突变 BN462 和 ts13。Derry 和 Barnard(1989) 表明,小鼠的等效物 Ccg1 位于 X 染色体上。他们确定了它相对于其他 7 个 X 连锁基因标记的位置。发现与肌肉磷酸化酶激酶α亚基基因(PHKA1;311870)有非常密切的连锁,并且发现该基因座位于近端雄激素受体基因座和远端磷酸甘油酸激酶基因座之间。假设基因顺序保守,这支持了 Xq 上人类 CCG1 基因座的位置,可能位于 Xq11-q13 区域。该位置与 Nelson 等人提出的兆碱基规模上 pter 7 Mb 基因的定位一致(1995)。
▼ 基因功能
人 TFIID 的最大亚基 TAFII250 包含丝氨酸/苏氨酸激酶结构域,可以自磷酸化和转磷酸化基础因子 TFIIF 的大亚基(Dikstein 等,1996)。O'Brien 和 Tjian(1998) 确定了激酶活性必需的 N 末端激酶结构域区域(氨基酸 1-414),并检查了其体内功能。激酶结构域中 2 个氨基酸片段内的点突变会降低自磷酸化和转磷酸化活性。N 端激酶结构域内携带 TAFII250 的突变表现出拯救表达温度敏感 TAFII250 的 ts13 细胞的能力显着降低。而且,
雅各布森等人(2000) 证明 TFIID 250-kD 亚基包含 2 个串联溴结构域模块,可选择性结合多乙酰化组蛋白 H4 肽。双溴结构域的 2.1 埃晶体结构揭示了 2 个并排的 4 螺旋束,具有高度极化的表面电荷分布。每个束在其中心包含一个 N(ε)-乙酰赖氨酸结合袋,从而形成非常适合识别二乙酰化组蛋白 H4 尾部的结构。雅各布森等人(2000) 得出结论,TFIID 可能靶向特定的染色质结合启动子,并可能在染色质识别中发挥作用。
p53(TP53; 191170) 响应 DNA 损伤的乙酰化增强了其结合 DNA 和招募转录共激活因子到 p53 响应启动子的能力。李等人(2007) 表明 p53 上 lys373 和 lys382 的乙酰化导致它们与 TAF1 的串联溴结构域直接相互作用。p53 将 TAF1 招募到 p21(CDKN1A; 116899) 启动子上的远端 p53 结合位点,然后 DNA 形成环,将 TAF1 带到包含 TATA 框的核心启动子上。
Flynn 等人使用肽阵列(2015) 发现,除了乙酰化赖氨酸(Kac) 之外,TAF1 还能识别组蛋白中的丁酰化赖氨酸(Kbu)。TAF1 溴结构域中的“看门人”酪氨酸负责这种扩展的酰基识别。此外,TAF1 的第二个溴结构域可以识别具有巴豆酰化赖氨酸(Kcr) 的组蛋白。
转录因子IID
Starr 和 Hawley(1991) 以及 Lee 等人(1991) 证明,与大多数序列特异性 DNA 结合蛋白不同,TFIID 主要在 DNA 螺旋的小沟内相互作用。TFIID 的结合似乎是形成具有转录能力的复合物的第一步,随后是 TFIIB、RNA 聚合酶 II 和其余因子。TFIID 还可以将转录控制与细胞周期联系起来。
RNA 聚合酶 II 的高水平基因转录取决于转录起始和重新起始的高速率。启动需要将完整的转录机制募集至启动子,这一过程由激活剂和染色质重塑因子促进。重新启动被认为是通过不同的途径发生的。启动后,转录机器的一个子集保留在启动子处,形成用于组装第二个转录复合物的平台。尤德科夫斯基等人(2000) 描述了酵母中重新起始中间体的分离,其中包括转录因子 TFIID、TFIIA、TFIIH、TFIIE 和 Mediator(参见 602984)。该中间体可以充当形成功能性重新引发复合物的支架。该支架的形成依赖于 ATP 和 TFIIH。在酵母中,
Christova 和 Oelgeschlager(2002) 发现 TFIID 可以充当“书签”来识别先前活跃的基因,以便在细胞分裂后快速重新激活。在异步和有丝分裂人类细胞群的染色质浓缩和有丝分裂过程中,TFIID 和 TFIIB 仍然与活性基因启动子相关,而 RNA 聚合酶 II 被取代,NC2(参见 601482)从一些但不是全部基因启动子中被取代。Christova 和 Oelgeschlager(2002) 得出结论,TFIID-启动子复合物可以承受染色质凝结成转录沉默染色体,因此可以通过细胞分裂遗传细胞类型特异性基因表达模式。
下游核心启动子元件(DPE) 是调节序列,可为 RNA 聚合酶 II 转录基因的启动子结构增添多样性。尽管 TFIID 和 DPE 的存在之间存在功能相关性,Lewis 等人(2005) 发现 TFIID 不足以在 HeLa 细胞中进行 DPE 特异性转录。使用功能转录测定与常规生物化学相结合,他们发现蛋白激酶 CK2(参见 CSNK2A1;115440)与共激活剂 PC4(600503) 结合,建立了 DPE 特异性转录。
组蛋白 H3(参见 602810)在 lys4(H3K4me3) 处的三甲基化是活性人类启动子的标志。Vermeulen 等人在基于细胞培养(SILAC) 的蛋白质组筛选中使用氨基酸稳定同位素标记(2007) 表明 TFIID 通过 TFIID 亚基 TAF3(606576) 的植物同源结构域(PHD) 直接与 H3K4me3 结合。H3K4me3 的选择性丢失减少了体内启动子子集的转录和 TFIID 与启动子子集的结合。平衡结合测定和竞争实验表明TAF3 PHD指对H3K4me3具有高度选择性。在瞬时测定中,TAF3 可以以 PHD 指依赖性方式充当转录激活剂。H3 在 arg2 处的不对称二甲基化选择性抑制 TFIID 与 H3K4me3 的结合,而 H3 在 lys9 和 lys14 处的乙酰化则增强了 TFIID 与 H3K4me3 的相互作用。韦尔默伦等人。
皮纳佩尔等人(2013) 表明 TFIID 复合物的敲低会影响小鼠胚胎干(ES) 细胞的多能回路并抑制成纤维细胞的重编程。TFIID 亚基和 OSKM 因子 Oct4(164177)、Sox2(184429)、Klf4(602253) 和 Myc(190080) 形成前馈环以诱导和维持稳定的转录状态。值得注意的是,TFIID 亚基的瞬时表达极大地增强了重编程。皮纳佩尔等人(2013) 得出结论,TFIID 对于转录因子介导的重编程至关重要。
▼ 生化特征
冷冻电子显微镜
帕派等人(2010) 使用冷冻电子显微镜确定了由 TFIID、TFIIA(参见 600519)、转录激活子 RAP1(605061) 和酵母增强子-启动子 DNA 组成的核蛋白复合物的结构。这些结构揭示了 RAP1 和 TFIIA 与 TFIID 的结合模式,以及 TFIIA 与 RAP1 相互作用诱导的重组。帕派等人(2010) 提出这种位置的改变增加了 TFIID 内 TATA 框结合蛋白的暴露,从而增强了其与启动子相互作用的能力。激活剂结合位点和近端启动子区域之间形成一个大的 RAP1 依赖性 DNA 环。该环在拓扑上被折叠在 DNA 上的 TFIIA-RAP1 蛋白桥锁定。这些结果强调了 TFIIA 在转录激活中的作用,
帕特尔等人(2018)利用冷冻电子显微镜、化学交联质谱和生化重构确定了TFIID的完整分子结构,并定义了TFIID在将TATA框结合蛋白(TBP;600075)加载到启动子DNA的过程中的构象景观。结构分析揭示了在 TFIIA 和启动子 DNA 存在的情况下 TFIID 的 5 种结构状态,表明 TFIID 与下游启动子的初始结合定位了上游 DNA,并有利于 TBP 扫描 TATA 框以及启动子的后续接合。帕特尔等人(2018) 的结论是,他们的发现为 TFIID 将 TBP 特异性负载到启动子上提供了一个机制模型。
晶体结构
弗林等人(2015)发现与Kbu复合的TAF1的晶体结构采用了与Kbu复合的BRD9(618465)相似的构象。然而,TAF1-Kcr 复合物的结构表明,巴豆酰基团将 2 个保守结构水分子从其通常的位置上取代,并产生了由 5 个而不是 6 个水分子组成的显着改变的网络。
▼ 分子遗传学
X连锁肌张力障碍-帕金森症
X连锁肌张力障碍-帕金森症(XDP;314250)的特征是严重进行性扭转肌张力障碍,随后出现帕金森症。在菲律宾班乃岛,其患病率特别高(每 10 万人中有 5.24 人患病)。牧野等人(2007) 对 Xq13.1 上的完整 XDP 位点(指定为 DYT3)进行了基因组测序,以寻找疾病特异性突变。该研究包括来自居住在班乃(Panay) 16 个家庭的 67 名菲律宾人(20 名受影响男性)。作者在 TAF1 的内含子中发现了疾病特异性 SVA(短散布核元件、可变数量的串联重复和 Alu 复合物)逆转录转座子插入,TAF1 编码转录因子 IID(TFIID) 复合物的最大组成部分。XDP 死后大脑研究表明,尾状核中 TAF1 和多巴胺受体 D2 基因(DRD2;126450)的表达水平显着降低。牧野等人(2007) 还发现了患者尾状核基因组中逆转录转座子 DNA 甲基化的异常模式,这可能是 TAF1 表达下降的原因。研究结果被解释为表明 TAF1 基因神经元特异性表达的减少与 XDP 相关。
SVA 逆转录转座子插入被认为在人类基因组中很活跃,并改变导致疾病的邻近基因的表达水平。SVA反转录转座子的核苷酸序列中GC含量高(约70%)且CpG位点多(超过150个),因此其插入位点经常发生高甲基化。牧野等人(2007) 表明,在 XDP 中,神经元特异性 TA14-391 同工型以及可能其他 TAF1 同工型的表达减少,导致许多神经元基因的转录失调,包括编码多巴胺受体 DR(DRD2; 126450) 的基因。他们认为 XDP 中的发现支持涉及 TFIID 的“转录综合征”概念(Vermeulen 等,1994),其中包括先天性白内障、面部畸形、和神经病综合征(CCFDN;604168),由 RNA 聚合酶 II 部分缺陷(CTDP1;604927)引起;齿状红核-苍白球路易体萎缩(DRPLA; 125370),由 TFIID 信号干扰引起;和脊髓小脑性共济失调 17(SCA17; 607136),由 TATA 结合蛋白(TBP; 600075) 中扩展的聚谷氨酰胺引起。
X 连锁综合征性智力发育障碍 33
O'Rawe 等人对来自 9 个不相关家庭的 12 名患有 X 连锁综合征型智力发育障碍 33(MRXS33; 300966) 的男孩进行了研究(2015) 鉴定了 TAF1 基因中的 9 种不同的半合子突变(参见,例如 313650.0002-313650.0006)。大多数突变是从头发生的,尽管有 3 个突变是从未受影响的母亲那里继承的,其中 1 个突变表现出偏向的 X 失活。尚未进行功能研究,但许多变体影响对与 TAF7(600573) 相互作用至关重要的结构域中的高度保守残基,并预计会破坏这种相互作用。对 1 个具有错义突变(I1337T; 313650.0002) 的家族进行的基因表达研究表明,该表型与一组受 E框 蛋白调节的基因的下调有关。这些突变是通过多种策略发现的,包括全基因组测序、
▼ 历史
Maile 等人(2004) 报道组蛋白 H2B 的丝氨酸 33(参见 609904)(H2B-S33) 是 TAF1 C 末端激酶结构域(CTK) 的生理底物,并且 H2B-S33 磷酸化对于促进细胞周期进展和发育的转录激活事件至关重要。由于图像处理导致数据、结果和结论不可靠,《科学》杂志撤回了 Maile 等人的论文(2004)应加州大学河滨分校和 Frank Sauer 博士的要求。
▼ 动物模型
O'Rawe 等人(2015) 发现斑马鱼中 taf1 基因的敲除导致视顶盖相对面积减少 10%,表明存在神经元缺陷。
▼ 等位基因变异体(6 个选定示例):.
0001 肌张力障碍-帕金森病、X 连锁
TAF1、SVA 逆转录转座子插入
Makino 等人(2007) 证明,生活在班乃岛(DYT3; 314250) 的菲律宾人中非常常见的 X 连锁肌张力障碍帕金森病是由 TAF1 基因内含子 32 中的 SVA 逆转录转座子插入引起的。插入长度为 2,627 bp。
.0002 智力发育障碍,X 连锁,综合症 33
TAF1,ILE1337THR
O'Rawe 等人的 2 名欧洲血统青少年兄弟患有 X 连锁综合征型智力发育障碍 33(MRXS33;300966)(2015) 在 TAF1 基因中发现了一个半合子 c.4010T-C 转换(chrX.70,621,541TC, GRCh37),导致高度保守残基处的 ile1337 到 thr(I1337T) 取代。该突变遗传自未受影响的母亲,她表现出高度偏斜的 X 失活。在 dbSNP(版本 137)、1000 Genomes Project、Exome Variant Server 或 ExAC 数据库中未发现该突变。没有对该变异进行功能研究,但血液基因表达分析显示,受影响的男孩和非携带者家庭成员之间有超过 200 个基因的差异表达,与 E框 蛋白调节的一组基因的下调有关。
.0003 智力发育障碍,X 连锁,综合征 33
TAF1,CYS807ARG
在一名患有 X 连锁综合征智力发育障碍 33(MRXS33;300966) 的欧洲血统 5 岁男孩中,O'Rawe 等人(2015) 在 TAF1 基因中发现了一个从头半合子 c.2419T-C 转变(chrX.70,607,243TC, GRCh37),导致中央结构域(DUF3591) 中高度保守的残基发生 cys807 到 arg(C807R) 取代,该中央结构域包含与 TAF7 相互作用的 HAT 结构域(600573)。尽管未进行体外功能研究,但预计 C807R 突变会破坏该区域的稳定性并干扰 TAF1 和 TAF7 之间的相互作用。在 dbSNP(版本 137)、1000 Genomes Project、Exome Variant Server 或 ExAC 数据库中未发现该突变。
.0004 智力发育障碍,X 连锁,综合征 33
TAF1,ARG1246TRP
在一名患有 X 连锁综合征智力发育障碍 33(MRXS33;300966) 的欧洲血统 6 岁男孩中,O'Rawe 等人(2015) 在 TAF1 基因中发现了一个从头半合子 c.3736C-T 转变(chrX.70,618,477CT, GRCh37),导致在与 TAF7(600573) 结合非常重要的高度保守残基处发生 arg1246 到 -trp(R1246W) 的取代。尽管未进行体外功能研究,但预计 R1246W 突变会干扰 TAF1 和 TAF7 之间的相互作用。在 dbSNP(版本 137)、1000 Genomes Project、Exome Variant Server 或 ExAC 数据库中未发现该突变。
.0005 智力发育障碍,X 连锁,综合征 33
TAF1,PRO596SER
在 3 名患有 X 连锁综合征智力发育障碍 33 的哥伦比亚后裔男孩中(MRXS33;300966),O'Rawe 等人(2015) 在 TAF1 基因中发现了一个半合子 c.1786C-T 转换(chrX.70,602,671CT, GRCh37),导致中央结构域(DUF3591) 中高度保守的残基发生 pro596 到 Ser(P596S) 取代,该中央结构域包含与 TAF7 相互作用的 HAT 结构域(600573)。尽管未进行体外功能研究,但预计 P596S 突变会干扰 TAF1 和 TAF7 之间的相互作用。该突变遗传自未受影响的母亲,在 dbSNP(版本 137)、1000 基因组计划、外显子组变异服务器或 ExAC 数据库中均未发现。
.0006 智力发育障碍,X 连锁,综合征 33
TAF1,ASP976HIS
对于一名患有 X 连锁综合征智力发育障碍 33(MRXS33;300966) 的 3 岁西班牙裔男孩,O'Rawe 等人(2015) 鉴定出 TAF1 基因中的从头半合子 c.2926G-C 颠换(chrX.70,612,503GC, GRCh37),导致中央结构域(DUF3591) 中高度保守的残基发生 asp976-to-his(D976H) 取代,该中央结构域包含与 TAF7 相互作用的 HAT 结构域(600573)。尽管未进行体外功能研究,但预计 D976H 突变会干扰 TAF1 和 TAF7 之间的相互作用。在 dbSNP(版本 137)、1000 Genomes Project、Exome Variant Server 或 ExAC 数据库中未发现该突变。