免疫球蛋白重变异簇
免疫球蛋白(Ig) 是 B 细胞的抗原识别分子。Ig 分子由通过二硫键连接的 2 条相同的重链和 2 条相同的轻链(参见147200 )组成,因此每条重链连接到一条轻链,两条重链连接在一起。每条 Ig 重链都有一个包含抗原结合位点的 N 端可变(V) 区和一个由 C 区基因(例如 IGHG1, 147100 ) 编码的 C 端恒定(C) 区,提供效应器或信号传导职能。重链 V 区由 3 种基因编码:V 基因、连接(J) 基因(见147010)和多样性(D) 基因(见146910)。仅随机选择每种类型的 1 个基因来组装 V 区,这说明了 Ig 分子中 V 区的巨大多样性。14号染色体上的重链基因座含有大约40个功能性V基因,随后是大约25个功能性D基因和大约6个功能性J基因。由于多态性,功能性 V、J 和 D 基因的数量在个体之间存在差异(Janeway 等人,2005 年)。
已在兔中广泛研究了免疫球蛋白链 V 区的同种异型变异。在人免疫球蛋白的 V 区鉴定的第一个同种异型决定簇被命名为 Hv1( Wang et al., 1978 )。Hv1 位于 G、M 和 A 类人免疫球蛋白重(H) 链的 V 区。它作为常染色体显性遗传,白人的基因频率为 0.189,黑人的基因频率为 0.278。潘迪等人(1980)证明 Hv1 和 2 个 C 区标记之间缺乏联系:Gm(IgG H 链)和 Km(κ 型轻链)。
基因转换为维持大量不剧烈偏离的免疫球蛋白可变区基因提供了解释。它是已知的两类机制中的一类,可以作用于基因家族以保持其序列同源性;另一个是不平等的交叉(巴尔的摩,1981)。沃尔特和考克斯(1988)研究了重链可变区V(H)基因以确定遗传变异的程度和所选多态位点的分布。通过使用限制性内切酶位点多态性,他们发现了 V(H2) 和 V(H3) 亚类基因座之间的连锁不平衡和广泛的变异。他们对 V(H) 基因数量的初步估计为 50。作者假设在这些位点观察到的遗传变异可能与免疫反应的遗传差异和对自身免疫性疾病的不同易感性有关。
施罗德等人(1988)发现有助于胎儿重链库的独特 V(H) 基因片段是最接近编码 mu 链恒定区的基因的 V(H) 基因片段,位于 77 kb J(H) 区域的 5 素数边。
Buluwela 和 Rabbitts(1988)证明了一个距 C-mu 基因约 95 kb 的 V(H) 基因,并提出这可能是重链复合物的第一个功能性 V(H) 片段。
Capra 和 Tucker(1989)回顾了当前关于人类免疫球蛋白重链基因的知识。
沃尔特等人(1990)描述了人免疫球蛋白重链基因复合物的物理结构。二维 DNA 电泳用于绘制 V(H) 区域。他们展示了一个 80 kb 的常见插入/缺失多态性,涉及 3 个 V(H) 基因片段。他们估计大约有 76 个 V(H) 基因片段:大约 25 V(H)1、5 V(H)2、28 V(H)3、14 V(H)4、3 V(H)5、和 1 V(H)6。
Walter 和 Cox(1991)表征了 V(H)2、V(H)3、V(H)4 和 V(H)5 家族的 10 个 V(H) 多态位点。他们确定了 2 个区域,一个在 V(H) 区域,一个在 C(H) 区域,具有低连锁不平衡;在这些区域,连锁不平衡值大约是在 IGH 区域其他部分观察到的值的 1/3,000。因此,在 14 号染色体亚端粒部分观察到的大量重组似乎是特定重组热点的结果,而不是普遍增加。
V(H) 片段对应到 3 个位点:14 号染色体、15 号染色体(Cherif 和 Berger,1990 年)和 16 号染色体(Matsuda 等人,1990 年)。然而,只有 14 号染色体基因座包含对 V 基因的体细胞产生至关重要的 J 片段。V(H) 区段在染色体 15 和 16 上的表达需要染色体间重组,这在 B 淋巴细胞中尚未得到证实。如脉冲场凝胶电泳所示,14 号染色体上的 IGH 区域总共跨越约 2.5-3 Mb。松田等人(1993)构建了 0.8-Mb DNA 片段的物理图谱,该片段包含 3 个素数 64 个可变区基因片段。他们估计人类V(H)段的总数约为120个,其中至少包括7个孤子(Orphons 是来自串联重复家族或基因簇的分散的单个假基因。Orphons 可以作为可以进化新功能的序列库,并且可能是高等生物进化的重要因素。)
Wintle 和 Cox(1994)将 4 个 V(H) 基因片段对应到人类 16 号染色体和 2 号染色体到 15 号染色体。使用粘粒和酵母人工染色体克隆,Tomlinson 等人(1994)扩增和测序来自体细胞杂交体的 24 个 V(H) 片段,并将它们分配给 15q11.2 和 16p11.2。此外,他们在 15q11.2 上定位了一组 D 段,以前认为位于 14q32.3 上。他们提出 16 号染色体上的片段是由染色体间重复产生的,并确定了 14 号染色体上的相应区域。结合完成 14q32.3 上的人类 V(H) 基因座图谱,V(H) 的总数) 到那时确定的片段是 117,占大多数(如果不是全部)人类生殖系 V(H) 片段。汤姆林森等人(1994)注意到虽然15号和16号染色体上的10个V(H)片段具有开放解读码组(ORF),并且至少有1个具有明显的功能性重组信号,但它们都没有在体内产生功能性抗体。
萨索等人(1995)指出,根据序列同源性,V(H) 基因分为 7 类,编号为 1 到 7。大约一半的 V(H) 种系基因属于最大的家族,V(H)3。单倍体基因组包含超过 100 个 V(H) 基因。功能库由比总数少得多的基因占主导地位,因为许多是假基因,并且由于不清楚的原因,许多V(H)基因的表达频率高于随机使用的预期。
松田等人(1998)报道了 957-kb DNA 的完整图谱和核苷酸序列的测定,该 DNA 包含与 14q 端粒相邻的 V(H) 基因座。该基因座由 123 个 V(H) 段组成。松田等人(1998)根据结构和利用将这些片段分为 39 个功能性基因、1 个转录基因、4 个 ORF 基因和 79 个假基因。
Wang 等人使用焦磷酸测序研究巴布亚新几内亚人的 IGHV1、IGHV3 和 IGHV4 基因亚群(2011)鉴定了一种新的 IGHV3 基因,IGHV3-NL1*01,它与之前报道的最近的基因相差 15 个核苷酸。他们还鉴定了 16 个新的 IGHV 等位基因。王等人(2011)得出结论,可以使用高通量焦磷酸测序在不同人群中有效探索 Ig 基因的遗传变异。
袁等人(2020)分析了 294 种抗 SARS-CoV-2 抗体,发现免疫球蛋白 G 重链可变区 3-53(IGHV3-53) 是最常用于靶向刺突蛋白受体结合域的 IGHV 基因。2 种具有受体结合结构域的 IGHV3-53 中和抗体的共晶体结构,有或没有 Fab CR3022,分辨率为 2.33 至 3.20 埃,表明种系编码的残基主导血管紧张素 I 转换酶 2(ACE2; 300335 )-结合位点。这种结合模式将 IGHV3-53 抗体限制为短的互补决定区 H3 环,但适应轻链多样性。这些 IGHV3-53 抗体显示出最小的亲和力成熟和高效力。