原钙粘蛋白-α基因簇; PCDHA@

PCDH-α基因簇;聚二羟基二苯乙醇胺

HGNC 批准的基因符号:PCDHA@

细胞遗传学位置:5q31 基因组坐标(GRCh38):5:131,200,001-145,100,000

▼ 正文

该条目代表历史上被认为是染色体 5q31 上的基因簇。该簇内的 15 个串联排列的基因:PCDHA1(606307)、PCDHA2(606308)、PCDHA3(606309)、PCDHA4(606310)、PCDHA5(606311)、PCDHA6(606312)、PCDHA7(606313)、PCDHA8(606314)、PCDHA9(606315)、PCDHA10(606316)、PCDHA11(606317)、PCDHA12(606318)、PCDHA13(606319)、PCDHAC1(606320) 和 PCDHAC2(606321),用作“变量”;外显子分别剪接到下游恒定区(PCDHACT) 以形成不同的 PCDHA 转录本。

▼ 说明

PCDHA 基因簇编码钙粘蛋白样细胞表面蛋白家族,这些蛋白在神经元中表达并存在于突触连接处。通过将单个可变外显子剪接到 3 个恒定区外显子来产生多个 PCDHA mRNA。每个可变外显子前面都有一个启动子,编码 6 个钙粘蛋白样胞外域、一个跨膜域和一部分胞质域。恒定区外显子编码细胞质结构域的其余部分(Ribich 等,2006)。

▼ 克隆与表达

高村等人(1998) 描述了小鼠中钙粘蛋白相关的神经元受体(CNR)。通过 EST 数据库搜索钙粘蛋白样序列,Wu 和 Maniatis(1999) 在人类染色体 5q31 上鉴定出 52 个新基因,这些基因组织成 3 个紧密相连的串联簇:α、β(604967) 和 γ(604968)。大约 2,400 个核苷酸的独特大的、不间断的外显子编码每个原钙粘蛋白的 6 个 N 末端胞外结构域和跨膜结构域。 PCDHA 和 PCDHG 蛋白的 C 末端在每个簇内是相同的,并且由位于 N 末端外显子阵列下游的 3 个小外显子编码。每个大外显子孤立剪接至编码胞内结构域的第一个外显子。 Wu 和 Maniatis(1999) 将细胞外部分称为可变区,将细胞质部分称为恒定区。与 PCDHA 和 PCDHG 簇相反,PCDHB 基因簇没有下游恒定区,因此 PCDHB 蛋白的 C 端胞质结构域由单外显子 PCDHB 基因编码(Vanhalst 等,2001)。 Wu 和 Maniatis(1999) 提出了 4 个模型来解释原钙粘蛋白基因调控。

Wu 和 Maniatis(1999) 确定 PCDHA 簇包含至少 15 个编码蛋白质的基因,这些蛋白质的序列与小鼠 CNR 蛋白质的序列最相似。 PCDHAC 可变外显子与 PCDHG 簇中的 C 型原钙粘蛋白的相关性比与其他 PCDHA 可变外显子的相关性更密切。所有 PCDHA 蛋白都具有相同的 152 个氨基酸 C 端胞质区域。 PCDHA 和 PCDHG 蛋白的细胞质区域是不同的,尽管两者具有相似的富含赖氨酸基序。 PCDHA 恒定区的前 2 个外显子编码 2 个 PXXP 基序,即推定的 SH3 蛋白结合位点,而 PCDHG 恒定区的前 2 个外显子则不然。

杉野等人(2000) 鉴定了小鼠和人类 PCDHA9 的 3 个剪接变体,它们在 3-prime 恒定区上有所不同,并且他们证实小鼠 Cnr1(PCDHA4) 也产生这些变体。 A型恒定区包括3个外显子,编码最长的胞质结构域。在B型恒定区中,最3素的恒定外显子被分成2个,产生中等长度的C末端。 O型变体完全缺乏恒定区外显子,而是包含紧随可变外显子之后的内含子序列,包括内含子poly(A)序列。小鼠大脑的RT-PCR显示O型Cnr1变体的表达水平高于A型和B型Cnr1变体。

通过原位杂交和 PCR 分析,Zou 等人(2007) 发现一些 Pcdha 和 Pcdhg 亚型在大鼠不同脑区和脊髓的特定细胞类型中广泛表达。在大多数中枢神经系统区域中,用恒定区探针进行的标记比用单个可变外显子探针进行的标记更强并且出现在更多的细胞中,这与可变外显子与一组共同的恒定外显子的剪接一致。然而,在某些情况下,例如 PCDHA 簇的小脑,来自恒定区探针的信号并不比来自单个可变外显子探针的信号强多少,这表明仅表达可变亚型。

PCDHA 反义转录本

顺式-反义基因对定义为位于同一基因座的相反链上的一对基因,其中一个基因的至少1个外显子与另一个基因的至少1个外显子重叠。顺式反义转录本在转录和转录后水平的基因调控中发挥作用。 Lipovich 等人通过对 PCDH 基因簇进行计算机分析(2006) 鉴定了 12 个顺式反义转录单位。 EST 支持最多的是抗 PCDHA12、抗 PCDHB3 和抗 PCDH5 假基因,所有这些假基因似乎都是非编码的。这些反义转录本在黑猩猩和恒河猴中保守,但在小鼠中则不然。 PCR 分析验证了这些反义转录本在成人和胎儿大脑以及恒河猴大脑中的表达,并且反义转录本的存在与所有直向同源物的有义表达水平显着降低相关。

▼ 基因家族

钙粘蛋白是钙依赖性细胞间粘附分子家族,介导神经细胞间相互作用。 Sperry(1963) 提出,神经元通过数百万个指定分子介导的锁与钥匙相互作用来识别其突触伙伴。基于钙粘蛋白的神经位置、粘附多样性以及维持突触间隙大小约 200 埃的粘附相互作用的结构生物学,钙粘蛋白可能是锁钥匙机制的候选成分(Shapiro 和 Colman,1999)。神经钙粘蛋白(CDH2; 114020) 以及上皮钙粘蛋白(CDH1; 192090)、胎盘钙粘蛋白(CDH3; 114021) 和视网膜钙粘蛋白(CDH4; 603006) 具有同亲结合特异性,因为它们优先粘附于表达相同钙粘蛋白类型的细胞。 “经典”钙粘蛋白类型具有约 110 个氨基酸的高度保守的胞外序列基序(重复 5 次)以及约 200 个氨基酸的高度保守的胞质结构域,其通过连环蛋白(参见 CTNNA1; 116805)。 “非经典”钙粘蛋白的不同之处在于它们可能具有 6 或 7 个重复的胞外结构域或具有连接中间丝(例如结蛋白;125660)而不是肌节蛋白的胞质结构域。原钙粘蛋白构成非经典钙粘蛋白的一个亚家族。

▼ 基因功能

脊椎动物大脑中表达多种 PCDHA 基因。 Esumi 等人利用多态性区分 C57BL/6 和 MSM 小鼠品系(2005) 分析了单个神经元中 Pcdha 基因簇的等位基因表达。使用多个 RT-PCR 反应对浦肯野细胞进行单细胞分析,显示 Pcdha 基因中每个可变外显子的单等位基因和组合表达。惠美等人(2005)指出,这是对中枢神经系统中多样化受体家族的等位基因表达的首次描述,并得出结论,Pcdha 基因的不同可变外显子的等位基因和组合表达是在中枢神经系统中指定神经元身份的潜在机制。脑。

里比奇等人(2006) 鉴定了 15 个 DNase I 超敏感位点(HS),分布在小鼠 Pcdha 基因簇 3 素端的 77 kb 范围内。 HS5 至 HS1(HS5-1) 聚集在第三恒定区外显子下游 30 kb 处。里比奇等人(2006) 发现 HS5-1 和 HS7 在小鼠胚胎中以组织特异性方式驱动报告基因的表达,其中 HS5-1 显示出对中枢神经系统的偏好,特别是皮质和嗅球,而 HS7 显示出对感觉的偏好器官,特别是胡须和眉毛毛囊、耳朵和眼睛。在分化的小鼠胚胎干细胞中,HS5-1的缺失降低了Pcdha1至Pcd​​ha12和Pcdhac1的表达,表明HS5-1是除Pcdhac2之外的所有Pcdha启动子的最大表达所必需的。

蒙图法里斯等人(2017) 表明 PCDH-α、PCDH-β(604967) 和 PCDH-γ(604968) 基因簇在功能上协同作用,为个体小鼠嗅觉感觉神经元提供组装成嗅觉中不同肾小球所需的细胞表面多样性电灯泡。尽管删除单个 Pcdh 簇会产生微妙的表型后果,但所有 3 个簇的丢失会导致严重的轴突树枝化缺陷和自我回避能力的丧失。相比之下,当内源性 Pcdh 多样性被单三簇基因库(α、β 和 γ)的表达所覆盖时,嗅觉感觉神经元轴突无法汇聚形成肾小球,这可能是由于表达相同组合的轴突之间接触介导的排斥所致Pcdh 亚型。

▼ 基因结构

Wu 和 Maniatis(1999) 确定 PCDHA 基因簇跨度约 230 kb,包含 15 个基因,其功能为可变的第一个外显子,随后是 3 个小的恒定区外显子。

杉野等人(2000) 指出,小鼠和人类 PCDHA 簇显示出高度相似的可变外显子和恒定外显子排列,但它们并不相同。

通过比较序列分析,Wu 等人(2001) 确定小鼠 CNR 簇和人类 PCDHA 簇具有几乎相同的组织。与旁系同源序列相比,直系同源序列具有更保守的 DNA 序列,可变区外显子上游具有丰富的 CpG 岛阵列。这一发现表明每个可变区都有一个独特的启动子。此外,α 和 γ 簇中最后一个 C 型可变区外显子下游的区域 PCDHAC2 和 PCDHGC5(606306) 也分别是保守的。

塔西克等人(2002) 表明每个 PCDH 可变外显子前面都有一个启动子,并且启动子的选择决定了 PCDH mRNA 中包含哪个可变外显子。此外,他们提供的证据表明,基因簇内可变外显子的选择性剪接是通过顺式剪接机制发生的。然而,几乎每个可变外显子都可以与来自另一个簇的恒定外显子进行反式剪接,尽管水平要低得多。

▼ 测绘

通过基因组序列分析,Wu 和 Maniatis(1999) 将 PCDHA 基因簇定位到染色体 5q31。使用 FISH,Sugino 等人(2000) 证实了人类 PCDHA 基因簇在 5q31 上的定位,并将小鼠 CNR 簇定位到 18 号染色体。

▼ 分子遗传学

在 96 个欧洲裔美国人中,Noonan 等人(2003) 对所有 13 个 PCDHA 基因的启动子进行了测序,并鉴定了 8 个启动子的多态性。在这些启动子中,11 个常见的 SNP 处于广泛的连锁不平衡(LD),形成 2 个单倍型,长 48 kb,频率相同,延伸从 PCDHA1 到 PCDHA7 基因。对东亚人和非裔美国人的启动子进行测序表明,虽然广泛的 LD 是 PCDHA 簇的一个古老特征,但它随着时间的推移而受到侵蚀。作者还发现了一个 16.7 kb 的缺失,截断了 PCDHA8 基因并完全去除了 PCDHA9 和 PCDHA10 基因。这种删除出现在“正常”状态下。来自多个群体的个体,表明原钙粘蛋白基因数量的减少并不明显有害。

三木等人(2005) 在 104 名日本人的 PCDHA 基因簇中发现了许多 SNP。在 PCDHA 的胞外域 1 编码区中检测到许多非同义 SNP。广泛连锁不平衡的 48 kb 区域具有从 PCDHA1 延伸到 PCDHA7 的 2 个单倍型,Miki 等人(2005) 在这 2 个单倍型中鉴定出 15 个氨基酸交换。他们还鉴定出似乎代表 PCDHA4 到 PCDHA8 基因转换的 SNP。