H2A 组蛋白家族,成员 Z
组蛋白包裹 DNA 形成核小体颗粒,压缩真核基因组。每个核小体核心颗粒由一个八聚体包裹的 DNA 组成,该八聚体包含 2 个分子,每个分子高度保守的组蛋白 H2A(见613499)、H2B(见609904)、H3(见602810)和 H4(见602822)。H1 组蛋白(见142709) 占据核小体之间的接头 DNA。典型组蛋白基因聚集在重复阵列中,它们的转录与 DNA 复制紧密耦合。相比之下,非规范变体组蛋白基因在基因组中单独发现,组成型表达,并编码初级氨基酸序列与其规范旁系同源物不同的组蛋白。与主要在基因组包装和基因调控中起作用的典型组蛋白不同,变异组蛋白在 DNA 修复、减数分裂重组、染色体分离、转录起始和终止、性染色体浓缩和精子染色质包装中起作用。H2AFZ 是 H2A 家族的变体组蛋白(Talbert 和 Henikoff 综述,2010 年)。
H2AZ 是正常基因表达所必需的,分布在整个基因组中,并且似乎是适当募集 RNA 聚合酶 II(参见180660)和 TATA 结合蛋白(TBP;600075)所必需的(Wong 等人,2007)。
有关组蛋白、组蛋白基因簇和 H2A 组蛋白家族的其他背景信息,请参阅 HIST1H2AA( 613499 )。
▼ 克隆与表达
Hatch 和 Bonner(1990)克隆并测序了人类 H2AZ 基因。
波佩斯库等人(1994)注意到 H2A 氨基酸序列的比较表明 H2AZ 蛋白包含与其他 H2A 蛋白物种的低同源性区域与高同源性区域交替。H2AZ 基因包含内含子并编码多腺苷酸化的 mRNA 种类,而复制相关的组蛋白基因缺乏内含子并编码以茎环结构终止的短 mRNA 种类。
▼ 基因功能
保守的组蛋白变体 H2AZ 在基因表达的调节(Redon 等人,2002 年)和为沉默异染色质的遗传建立缓冲剂(Meneghini 等人,2003 年)方面具有重要作用。水口等人(2004)发现在酿酒酵母中,Swr1 是一种 Swi2/Snf2 相关的 ATP 酶,是多亚基组蛋白变体交换器的催化核心,可在核小体阵列中有效地用组蛋白 H2AZ 代替常规组蛋白 H2A。Swr1 是组蛋白 H2AZ 在体内特定染色体位置沉积所必需的,Swr1 和 H2AZ 通常调节酵母基因的一个子集。
通过对人肺癌细胞系进行染色质免疫沉淀分析,Wong 等人(2007)发现,人类 Swr1 的直系同源物 SRCAP 被招募到活性和非活性启动子中,在活性 SP1( 189906 )、G3BP( 608431 ) 和 FAD 合成酶(FLAD1; 610595 ) 启动子上的 SRCAP 水平最高。这些启动子上的 SRCAP 募集位点重叠或发生在 H2AZ 和乙酰化 H2AZ 的沉积位点附近。SRCAP 表达的敲低导致 H2AZ 和乙酰化 H1AZ 的沉积减少以及 SP1、G3BP 和 FAD 合成酶 mRNA 的水平降低。黄等人(2007)得出结论,SRCAP 介导 H2AZ 的体内沉积。
金等人(2009 年)表征了 HeLa 细胞中含有 H3.3(H3F3A;601128)和/或 H2A.Z 的核小体核心颗粒的全基因组分布。他们发现含有 H3.3 和 H2A.Z 的高度不稳定的粒子在活性促进剂、增强剂和绝缘体区域富集。金等人(2009)建议含有 H3.3 和 H2A.Z 的不稳定粒子可能充当容易被转录因子取代的占位符。
他等人(2010)在双氢睾酮(DHT) 刺激之前和之后,对上游雄激素受体(AR; 313700 ) 结合增强剂的 LNCaP 前列腺癌细胞中标记有二甲基化 H3K4(H3K4me2) 的核小体进行了全基因组定位。他们发现 3 个含有 H3K4me2 的核小体在没有 DHT 的情况下与 AR 结合位点相关,包括 2 个相距约 200 bp 的稳定侧翼核小体,以及一个封闭实际 AR 结合位点的不稳定中央核小体。刺激后,仅在 2 个侧翼位点检测到 H3K4me2。中央封闭核小体的A/T含量高于侧翼核小体,其组蛋白八聚体更可能含有H2A.Z变体。他等人(2010)得出结论,核小体稳定性的明显差异可能是由于 DNA 序列、组蛋白八聚体组成和转录因子结合的组合造成的。
卢克等人(2010)发现用 2 个 H2AZ-H2B 二聚体替换核小体中的 2 个 H2A-H2B 二聚体在酿酒酵母中是逐步和单向的。SWR1 复合物的 ATP 水解被含 H2A 的核小体和另外的 H2AZ-H2B 二聚体特异性激活,导致组蛋白置换。
Cuadrado 等人使用染色质免疫沉淀和定量 PCR 分析(2010)发现 Znhit1( 618617 ) 和 H2az在小鼠肌肉分化的早期阶段被招募到肌细胞生成素(MYOG; 159980 ) 的启动子。H2az 在肌细胞生成素启动子的积累是肌肉分化早期转录事件之前的一个重要步骤,并且需要 p38 MAPK 磷酸化 Znhit1(参见600289)。Znhit1 下调阻止 C2C12 小鼠成肌细胞的分化,而 Znhit1 过表达诱导肌肉特异性基因表达。免疫沉淀分析表明 Znhit1 和 H2az 相互作用并与 SRCAP 复合物组分 Arp6 和 Yl1(VPS72;600607),分别。Znhit1 的磷酸化是其与 Arp6 的相互作用以及在肌生成过程中调节 H2az 与 Yl1 结合所必需的。
H2A.Z 沉积由 SWR-C 染色质重塑酶控制,这些酶催化典型 H2A 与 H2A 与 H2A.Z 的核小体交换。渡边等人(2013 年)报道,赖氨酸 56(H3-K56Ac)上组蛋白 H3 的乙酰化改变了 SWR-C 的底物特异性,导致混杂的二聚体交换,其中 H2A.Z 或 H2A 可以从核小体交换。这一结果在体内得到了证实,其中全基因组分析表明具有高乙酰化 H3K56 的酵母突变体中 H2A.Z 水平普遍降低。渡边等人(2013)得出结论,保守的 SWR-C 亚基可能起到“锁”的作用,防止 H2A.Z 从核小体中去除。
通过使用一组赖氨酸甲基转移酶(KMT) 筛选人类 H2AZ 底物,Binda 等人(2013)将 SETD6( 616424 ) 和 SETD7( 606594 ) 确定为 H2AZ 的主要 KMT。突变分析和 KMT 分析表明,SETD6 主要甲基化 H2AZ 的 lys7,其中 lys4 是可能的次要位点。SETD7 甲基化 lys13 和可能的其他 lys 残基。用短发夹 RNA 去除 SETD6 会降低 lys7 处甲基化 H2AZ 的水平。小鼠胚胎干细胞的自我更新依赖于Setd6。宾达等人(2013)得出结论,SETD6 在 lys7 处单甲基化 H2AZ,并且 ESC 分化后 lys4 和 lys7 在 H2AZ 上甲基化,ESC 自我更新需要 SETD6。
奥布里等人(2014)报道了人类蛋白质 ANP32E( 609611 ) 作为 H2A.Z 特异性伴侣蛋白的鉴定和表征,并表明 ANP32E 是推测的 H2A.Z 组蛋白交换复合物 p400( 606265 )/TIP60(KAT5) 的成员;601409 )。ANP32E 通过称为 H2A.Z 相互作用域(ZID) 的基序与 H2A.Z 的对接域的一个短区域相互作用。
佐夫基奇等人(2014)表明,组蛋白 H2AZ 是组蛋白 H2A 的一种变体,响应于海马和皮质中的恐惧条件反射,它会积极交换,它在其中介导基因表达并抑制近期和远程记忆的形成。数据提供了 H2AZ 参与认知功能的证据,并特别暗示 H2AZ 作为海马巩固和系统巩固的负调节剂,可能通过对基因表达的下游影响。此外,系统整合后期 H2AZ 结合的变化表明该组蛋白具有介导记忆保留所需的稳定分子修饰的能力。佐夫基奇等人(2014)得出的结论是,他们的数据将组蛋白变异交换作为一种有助于认知功能分子基础的新机制,并暗示 H2AZ 作为记忆障碍的潜在治疗靶点。
龙等人(2020)表明,在 HeLa 细胞中,含有组蛋白变体 H2A.Z 的核小体富含组蛋白 H4,组蛋白 H4 在其赖氨酸 20 残基(H4K20me2) 上被二甲基化,并具有结合的起源识别复合物(ORC)。体外研究表明,含 H2A.Z 的核小体直接与组蛋白赖氨酸甲基转移酶 SUV420H1( 610881 ) 结合,促进 H4K20me2 沉积,而这反过来又是 ORC1 所必需的( 601902)) 捆绑。全基因组研究表明,来自 H4K20me2、ORC1 和新生 DNA 链的信号与 H2A.Z 共定位,而 H2A.Z 的消耗导致整个基因组中的 H4K20me2、ORC1 和新生链信号减少。与其他来源相比,H2A.Z 调节的复制起点具有更高的激发效率和早期复制时间。龙等人(2020)得出结论,他们的结果表明组蛋白变体 H2A.Z 表观遗传调节早期复制起点的许可和激活,并通过 SUV420H1-H4K20me2-ORC1 轴维持复制时间。
▼ 生化特征
晶体结构
奥布里等人(2014)确定了 ANP32E-ZID 和 H2A.Z/H2B 二聚体之间形成的复合物的 1.48 埃分辨率晶体结构;生化数据支持 H2A.Z/H2B 从核小体驱逐的潜在分子机制,以及 ANP32E 通过 H2A.Z 羧基末端 α-螺旋的特定延伸使其稳定。最后,通过染色质免疫沉淀分析 H2A.Z 在 ANP32E-null 细胞中的定位,然后进行测序,显示 H2A.Z 在特定染色质控制区域的全基因组富集、重新分布和积累,特别是在增强子和绝缘体处。
▼ 基因结构
Hatch 和 Bonner(1990)确定 H2AZ 基因包含 5 个外显子。
▼ 测绘
波佩斯库等人(1994)通过研究人/仓鼠杂交细胞系将 H2AZ 基因定位到染色体 4,并通过荧光原位杂交将分配区域化到 4q24。