热点新闻
TCGA数据挖掘系列之一:搞懂编码规则
2023-10-14 04:59  浏览:2097  搜索引擎搜索“手机晒展网”
温馨提示:信息一旦丢失不一定找得到,请务必收藏信息以备急用!本站所有信息均是注册会员发布如遇到侵权请联系文章中的联系方式或客服删除!
联系我时,请说明是在手机晒展网看到的信息,谢谢。
展会发布 发布信息 广告合作 软文发布



TCGA编码

TCGA-02-0001-01C-01D-0182-01,TCGA命名每个字段的意义,如下:

Project-TSS-Participant-Sample&Vial-Portion&Analyte-Plate-Center

TCGA:Project, 所有TCGA样本名均以这个开头,标志

A6:Tissue source site,组织来源编码,如A6就表示来源于Christiana Healthcare中心的结肠癌组织。更多编码所代表的意义详见:https://gdc.cancer.gov/resources-tcga-users/tcga-code-tables/tissue-source-site-codes

6650:Participant, 参与者编号


01:Sample, 这两个数字可以说是最关键、最被大家注意的,其中编号01~09表示肿瘤,10~19表示正常对照,如下:https://gdc.cancer.gov/resources-tcga-users/tcga-code-tables/sample-type-codes

所以在TCGA样本名中,这个位置最常见的就是01和11,当然偶尔也会有其他的数字


A:Vial, 在一系列患者组织中的顺序,绝大多数样本该位置编码都是A; 很少数的是B,表示福尔马林固定石蜡包埋组织,已被证明用于测序分析的效果不佳,所以不建议使用-01B的样本数据:

所以命名至此,已经可以开始用于区别不同的样本了,以下将是更细节的描述:

11:Portion, 同属于一个患者组织的不同部分的顺序编号,同一组织会分割为100-120mg的部分,分别使用

R:Analyte, 分析的分子类型,对应关系如下所示:https://gdc.cancer.gov/resources-tcga-users/tcga-code-tables/portion-analyte-codes

1774:Plate, 在一系列96孔板中的顺序,值大表示制板越晚

07:Center, 测序或鉴定中心编码,更多编码详见:https://tcga-data.nci.nih.gov/datareports/codeTablesReport.htm?codeTable=center

————————————————

版权声明:本文为CSDN博主「Mr番茄蛋」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。

原文链接:https://blog.csdn.net/qq_35203425/article/details/80851862




图2 部分主要代码简称的意义

对于有多次检测的测序样本,如何筛选呢?请看下面这个例子:




图3 重复检测样本的选择示例

参考资料:

1. TCGA 概述及 Barcode 详解 - 知乎 (zhihu.com)

2. TCGA样本命名详解_tcga命名规则-CSDN博客

发布人:d5a5****    IP:117.173.23.***     举报/删稿
展会推荐
让朕来说2句
评论
收藏
点赞
转发