组蛋白基因簇 1,H1 组蛋白家族,成员 A
核小体是真核染色质的基本重复单元。核小体核心颗粒由 2 个核心组蛋白 H2A(参见613499)、H2B(参见609904)、H3(参见602810)和 H4(参见602822)形成的八聚体组成,DNA 包裹在其周围。第五个组蛋白,即接头 H1 组蛋白,通过与进出核小体核心颗粒的 DNA 相互作用来完成核小体。H1 组蛋白,如 HIST1H1A,参与高级染色质结构的形成,它们调节调节蛋白、染色质重塑因子和组蛋白修饰酶对其靶位点的可及性(Izzo 等人(2008) 综述)和哈佩尔和多内克(2009))。
有关组蛋白、组蛋白基因簇和 H1 组蛋白家族的其他背景信息,请参阅下面的基因家族。
▼ 基因家族
H1 组蛋白家族是最多样化的组蛋白类别,人类中至少存在 11 种不同的 H1 组蛋白。H1 组蛋白具有三部分结构,由富含碱性氨基酸的短 N 端结构域、参与 DNA 结合的中央保守球状结构域和富含赖氨酸、丝氨酸和脯氨酸的长 C 端尾组成。与其他组蛋白一样,H1 组蛋白可以根据其时间表达进行分组。复制依赖性组蛋白,例如 H1.1 到 H1.5(HIST1HB; 142711 ) 和 H1T(HIST1H1T; 142712 ),主要在 S 期表达。相反,复制无关组蛋白或替代组蛋白,例如 H1.0(H1F0; 142708 )、H1T2(H1FNT)、H1OO(H1FOO)、H1X(H1FX; 602785) 和 HILS1( 608101),在整个细胞周期中表达。所有依赖于复制的 H1 组蛋白基因以及其他核心组蛋白基因都位于染色体 6p22-p21 上的组蛋白基因簇 1(HIST1) 内。另外两个组蛋白基因簇 HIST2 和 HIST3 分别位于染色体 1q21 和 1q42 上,但它们没有 H1 基因。在小鼠中,Hist1、Hist2 和 Hist3 基因簇分别位于染色体 13A2-A3、3F1-F2 和 11B2 上。所有依赖于复制的组蛋白基因都是无内含子的,它们编码的 mRNA 缺少 poly(A) 尾,而是以保守的茎环序列结束。与复制依赖性组蛋白基因不同,复制非依赖性组蛋白基因是位于染色体上的孤立基因,与任何其他 H1 或核心组蛋白基因分开。一些不依赖复制的组蛋白基因包含内含子并编码带有 poly(A) 尾的 mRNA。H1 组蛋白以及核心组蛋白也可以根据其空间表达进行分组。体细胞 H1 组蛋白(H1.1 到 H1.5 和 H1X)普遍表达,而其他 H1 组蛋白主要在终末分化细胞(H1.0)或生殖细胞(H1T、H1T2、H1OO 和 HILS1)中表达(总结经过Marzluff 等人(2002),伊佐等人(2008 年),以及Happel 和 Doenecke(2009 年))。
▼ 克隆与表达
艾克等人(1989)克隆了编码 H1.1 和 H1.2 的基因(HIST1H1C; 142710 )。
使用 Northern 印迹分析,Burfeind 等人(1994)发现 H1.1 基因在睾丸和胸腺中表达,但在其他人体组织中不表达。在睾丸中,它仅限于属于减数分裂后精子细胞部分的早期圆形精子细胞。伯芬德等人(1994)发现 H1.1 基因在高等灵长类动物中高度保守,而与其他哺乳动物物种(如小鼠、大鼠、仓鼠和公牛)的 DNA 未检测到交叉杂交。
▼ 基因功能
组蛋白 H1 在将染色质压缩成更高阶结构的过程中起作用,这些结构源自重复的“串珠”核小体聚合物。H1 结合活性的调节被认为是染色质结构增强/去增强转录的重要步骤。人们普遍认为,H1 与染色质中 DNA 的结合不如其他组蛋白那么紧密,并且可以很容易地在活细胞中交换。已显示组蛋白 H1 和绿色荧光蛋白(GFP) 的融合蛋白以与天然组蛋白 H1 明显相同的方式与染色质结合,提供了一种研究活细胞中组蛋白 H1-染色质相互作用的方法。杠杆等(2000)使用具有稳定整合的 H1.1-GFP 融合蛋白的人类细胞,通过活细胞中光漂白后的荧光恢复直接监测组蛋白 H1 的运动。他们发现浓缩和去浓缩染色质的交换都很快,发生在整个细胞周期中,并且不需要纤维-纤维相互作用。用改变蛋白质磷酸化的药物治疗显着降低了交换率。杠杆等(2000)得出结论,体内组蛋白 H1 交换是快速的,通过可溶性中间体发生,并且受一种或多种蛋白质的磷酸化调节,尚未确定。
使用类似于Lever 等人的技术(2000),米斯特利等人(2000)表明几乎所有的 H1-GFP 种群在任何 1 时间都与染色质结合;然而,H1-GFP 在染色质区域之间不断交换。在常染色质和异染色质中,H1-GFP 在交换事件之间在染色质上的停留时间都是几分钟。除了移动部分,Misteli 等人(2000)检测到一种动力学上不同的、流动性较低的部分。核心组蛋白高度乙酰化后,H1-GFP 的停留时间减少,表明染色质重塑后的交换率更高。米斯特利等人(2000)得出的结论是,他们的结果支持一个模型,其中接头组蛋白以停走模式动态结合染色质。
Hizume 等人(2005)指出,向重组核小体添加组蛋白 H1 会抑制转录活性并防止核心组蛋白沿 DNA 滑动。他们使用从 HeLa 细胞中纯化的核小体核心颗粒和组蛋白 H1 进行体外核小体重组分析。在最佳盐浓度下,核小体核心颗粒单独在质粒 DNA 上形成串珠染色质纤维。然而,添加纯化的组蛋白 H1 以浓度依赖性方式诱导更高阶折叠。Hizume 等人(2005)提出了一种染色质纤维形成模型,其中纤维压实取决于当地盐环境和组蛋白 H1 可用性。
Krishnakumar 等人(2008)使用基因组和基因特异性方法表明,组蛋白 H1 和 PARP1( 173870 ) 这两个因子在许多 RNA 聚合酶 II 转录的启动子处表现出染色质结合的相互模式。PARP1 被富集,而 H1 在这些启动子处被耗尽。这种结合模式与积极转录的基因有关。此外,Krishnakumar 等人(2008)表明 PARP1 的作用是将 H1 从 PARP1 刺激的启动子子集中排除,这表明 PARP1 和 H1 在核小体结合水平上存在功能相互作用。Krishnakumar 等人(2008)得出的结论是,尽管 H1 和 PARP1 在体外具有相似的核小体结合特性和对染色质结构的影响,但它们在确定体内基因表达方面具有不同的作用。
评论
多内克等人(1994)回顾了 H1 组蛋白和 H1 替代组蛋白基因的组织和表达。
伊佐等人(2008 年)回顾了 H1 组蛋白家族并讨论了 H1 蛋白的特定作用,这些作用挑战了 H1 仅仅是染色质的结构成分和转录的一般抑制因子的概念。
Happel 和 Doenecke(2009)回顾了 H1 组蛋白的结构和功能方面,重点介绍了 H1 组蛋白的结构作用和对染色质功能状态的影响。
▼ 测绘
通过对一组人/啮齿动物体细胞杂交体的染色体 DNA 进行 PCR 分析,Albig 等人(1993)发现 5 个人类 H1 组蛋白基因 H1.1 到 H1.5,以及编码睾丸特异性 H1T 亚型的基因位于 6 号染色体上。他们发现 H1.0 亚型,与核心不相邻组蛋白基因,对应到22号染色体。通过与人类中期染色体的荧光原位杂交和仅携带6号染色体片段的体细胞杂交DNA的PCR分析,他们证明组蛋白基因聚集在6p22.2-p21.1区域.
通过对人类/啮齿动物细胞杂交 DNA 的 PCR 分析,Burfeind 等人(1994)证实了组蛋白 H1.1 定位于 6 号染色体,并通过放射性原位杂交将该基因座定位到 6p21.3。
通过用辐射杂交和长程脉冲场凝胶电泳对 H1 组蛋白基因进行详细定位,Volz 等人(1997)发现 6 号染色体短臂上的组蛋白基因被组织成 2 个簇。6p22-p21.3 的主要簇包含 32 个组蛋白基因,包括 H1 基因 H1.1、H1.2、H1.3(HIST1H1D;142210)、H1.4(HIST1H1E;142220)和 H1T,众多核心组蛋白基因和HFE基因(613609)。
通过分析 YAC 重叠群,Albig 等人(1997)将 H1.1 基因对应到染色体 6p21.3 中的 35 个组蛋白基因簇中,包括 H1.1 到 H1.4 和 H1T。他们发现 H1.5 基因位于主簇着丝粒约 2 Mb 的 6p 上的第二个簇中。Albig and Doenecke(1997)在染色体 6p 上的第二个簇中含有组蛋白基因的粘粒的重叠群中发现H1基因(H1.5)1个,H2A基因5个,H2B基因4个,H2B假基因1个,H3基因3个,H4基因3个,H4假基因1个。该簇延伸约 80 kb,组蛋白基因排列无序。二核苷酸重复多态性标记 D6S105 位于该组蛋白基因簇的端粒末端。几乎所有当时分离的人类组蛋白基因都位于 6p 上的 2 个簇或 1 号染色体上的一小群组蛋白基因中。
Albig 和 Doenecke(1997)回顾了小鼠组蛋白基因的组织结构。人和小鼠组蛋白基因簇都存在于 2 条染色体上,并且具有几乎相同的基因组成和数量。人类染色体 6p 上的 2 个组蛋白基因簇对应于位于小鼠 13 号染色体上的 2 个簇。组蛋白 H1 和 H3 基因的相对定位似乎是高度保守的。这两个簇在小鼠中相距 0.6 Mb,在人类中相距 2 Mb。3 号染色体上的第三组小鼠组蛋白基因对应于位于 1 号染色体上的人类基因组。作者表示,到那时,已在小鼠中鉴定出总共 55 个组蛋白基因。阿尔比格和多内克(1997)给出了其他组蛋白基因图谱的图形表示,以及保存在 EMBL 核苷酸序列数据库中的人类组蛋白基因序列的表格摘要。
通过基因组序列分析,Marzluff 等人(2002)确定染色体 6p22-p21 上的 HIST1 簇包含 55 个组蛋白基因,包括所有 6 个复制依赖性 H1 基因。HIST1 簇跨越超过 2 Mb,包括 2 个大间隙(每个超过 250 kb),其中没有组蛋白基因,但有许多其他基因。染色体 13A2-A3 上小鼠 Hist1 簇中组蛋白基因的组织与人类 HIST1 中的基本相同。染色体 1q21 上的 HIST2 簇包含 6 个组蛋白基因,染色体 1q42 上的 HIST3 簇包含 3 个组蛋白基因。Hist2 和 Hist3 分别位于小鼠染色体 3F1-F2 和 11B2 上。
▼ 命名法
Marzluff 等人(2002)提供了位于 HIST1、HIST2 和 HIST3 簇内的复制依赖性组蛋白基因的命名法。这些基因的符号都以 HIST1、HIST2 或 HIST3 开头,根据它们所在的簇。H1 基因都位于 HIST1 中,根据它们的小鼠同源物命名。因此,HIST1H1A 与小鼠 H1a 同源,HIST1H1B 与小鼠 H1b 同源,依此类推。相比之下,H2A、H2B、H3 和 H4 基因根据它们在 HIST1、HIST2 和 HIST3 簇中的位置系统地命名。例如,HIST1H4A( 602822 ) 是 HIST1 中最端粒的 H4 基因,而 HIST1H4L( 602831 ) 是最着丝粒的。