TCGA编码
TCGA-02-0001-01C-01D-0182-01,TCGA命名每个字段的意义,如下:
Project-TSS-Participant-Sample&Vial-Portion&Analyte-Plate-Center
TCGA:Project, 所有TCGA样本名均以这个开头,标志
A6:Tissue source site,组织来源编码,如A6就表示来源于Christiana Healthcare中心的结肠癌组织。更多编码所代表的意义详见:https://gdc.cancer.gov/resources-tcga-users/tcga-code-tables/tissue-source-site-codes
6650:Participant, 参与者编号
01:Sample, 这两个数字可以说是最关键、最被大家注意的,其中编号01~09表示肿瘤,10~19表示正常对照,如下:https://gdc.cancer.gov/resources-tcga-users/tcga-code-tables/sample-type-codes
所以在TCGA样本名中,这个位置最常见的就是01和11,当然偶尔也会有其他的数字
A:Vial, 在一系列患者组织中的顺序,绝大多数样本该位置编码都是A; 很少数的是B,表示福尔马林固定石蜡包埋组织,已被证明用于测序分析的效果不佳,所以不建议使用-01B的样本数据:
所以命名至此,已经可以开始用于区别不同的样本了,以下将是更细节的描述:
11:Portion, 同属于一个患者组织的不同部分的顺序编号,同一组织会分割为100-120mg的部分,分别使用
R:Analyte, 分析的分子类型,对应关系如下所示:https://gdc.cancer.gov/resources-tcga-users/tcga-code-tables/portion-analyte-codes
1774:Plate, 在一系列96孔板中的顺序,值大表示制板越晚
07:Center, 测序或鉴定中心编码,更多编码详见:https://tcga-data.nci.nih.gov/datareports/codeTablesReport.htm?codeTable=center
————————————————
版权声明:本文为CSDN博主「Mr番茄蛋」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_35203425/article/details/80851862
图2 部分主要代码简称的意义
对于有多次检测的测序样本,如何筛选呢?请看下面这个例子:
图3 重复检测样本的选择示例
参考资料:
1. TCGA 概述及 Barcode 详解 - 知乎 (zhihu.com)
2. TCGA样本命名详解_tcga命名规则-CSDN博客