序列相似性家族120,成员C; FAM120C
- 染色体 X 开放解读码组 17; CXORF17
HGNC 批准的基因符号:FAM120C
细胞遗传学位置:Xp11.22 基因组坐标(GRCh38):X:54,068,323-54,183,283(来自 NCBI)
▼ 克隆与表达
通过对 X 染色体富含基因的区域进行序列分析,然后对成人大脑 cDNA 文库进行 PCR 和 5-prime 和 3-prime RACE,Holden 和 Raymond(2003) 克隆了全长 FAM120C(他们将其称为 CXORF17A)和剪接变体(他们将其称为 CXORF17B)。 推导的 1,096 个氨基酸的 CXORF17A 蛋白的计算分子量为 120.6 kD。 它有一个富含脯氨酸的细胞内 N 末端区域,并包含短的富含谷氨酰胺和富含组氨酸的延伸段,后面是 5 个假定的跨膜片段。 CXORF17A 还具有 2 个潜在的 N-糖基化位点。 CXORF17B 变体含有替代的第二外显子,并编码推导的 238 个氨基酸的蛋白质,该蛋白质与 CXORF17A 的 N 末端相同,除了最后 5 个氨基酸外。 CXORF17B 转录物还包含第二个 ORF,如果使用,将编码预测的 132 个氨基酸蛋白质。 FAM120C 的小鼠直系同源物,Holden 和 Raymond(2003)将其称为 Orf34,编码全长 1,091 个氨基酸的蛋白质,与 CXORF17A 具有 92% 的同一性。 数据库分析表明,CXORF17属于包含FAM120A(612265)和FAM120B(612266)的新型跨膜蛋白家族,这些蛋白的直系同源物存在于脊索动物中,但不存在于原核生物或低等真核生物中。 RT-PCR 检测到所有成人和胎儿人体组织中 CXORF17 转录物的可变表达。 CXORF17A 转录物是除成人骨骼肌之外的所有组织中的主要形式,在成人骨骼肌中几乎不表达。
▼ 基因结构
Holden 和 Raymond(2003) 确定 FAM120C 基因包含 16 个编码外显子,跨度超过 111 kb。 它还具有另一个第二外显子,即外显子 2B,源自内含子 1 中的正向 MLT1E 重复序列。FAM120C 基因的 5 引物末端位于 CpG 岛内。
▼ 测绘
通过基因组序列分析,Holden 和 Raymond(2003) 将 FAM120C 基因定位到染色体 Xp11.2。 他们将小鼠同源物对应到染色体 XF2。