如何使用TCGAbiolinks进行数据预处理?
如何使用TCGAbiolinks进行数据预处理?引言:在前面我们了解了如何使用TCGAbiolinks检索并获取TCGA数据库的公开数据。今天小编就用前面涉及到的代码,下载今天数据
引言:在前面我们了解了如何使用TCGAbiolinks检索并获取TCGA数据库的公开数据。今天小编就用前面涉及到的代码,下载今天数据准备需要用到的TCGA样本数据。
一、数据下载阶段
第一步:GDCquery()筛选我们需要的数据,TCGAbiolinks包下载TCGA数据进行表达差异分析-肝癌案例
library("TCGAbiolinks")
query <- GDCquery(project = "TCGA-LIHC",
data.category = "Transcriptome Profiling",
data.type = "Gene expression Quantification",
workflow.type = "HTSeq - Counts")
上图为通过TCGA GDC链接中根据筛选条件查看的符合要求结果。下图为通过GDCquery()函数中传入对应的参数得到的结果。两者对比,我们可以发现,两者是一模一样的。说明代码执行正确。前面一期中,我们有详细谈及 GDCquery,可做参考。
samplesDown <- getResults(query,cols=c("cases"))
#getResults(query, rows, cols)根据指定行名或列名从query中获取结果,此处用来获得样本的barcode
# 此处共检索出424个barcodes
getResults()中用到的参数:
参数用法query
来自GDCquery的结果rows用于指定特定的行cols用于指定特定的列
# 从samplesDown中筛选出TP(实体肿瘤)样本的barcodes
# TCGAquery_SampleTypes(barcode, typesample)
# TP代表PRIMARY SOLID TUMOR;NT-代表Solid Tissue Normal(其他组织样本可参考学习文档)
##此处共检索出371个TP样本barcodes
dataSmTP <- TCGAquery_SampleTypes(barcode = samplesDown,
typesample = "TP")
# 从samplesDown中筛选出NT(正常组织)样本的barcode
#此处共检索出50个NT样本barcodes
dataSmNT <- TCGAquery_SampleTypes(barcode = samplesDown,
typesample = "NT")
TCGAquery_SampleTypes中的参数详解:
参数用法barcodeTCGA中的barcodes列表typesample用于指定筛选哪种类型的组织样本,如肿瘤组织“TP”,正常组织“NT”
补充TCGA中的组织样本类型:
TPPRIMARY SOLID TUMORTMmetastaticTRRECURRENT SOLID TUMORTAMAdditional metastaticTBPrimary Blood Derived Cancer-Peripheral BloodTHOCHuman Tumor Original CellsTRBMRecurrent Blood Derived Cancer-Bone MarrowTBM Primary Blood Derived Cancer-Bone MarrowTAPAdditional-New PrimaryNB Blood Derived Normal NTSolid Tissue NormalNBCBuccal Cell Normal???NEBVEBV Immortalized NormalNBMBone Marrow Normal
3 首页 下一页 上一页 尾页-
专访沃趣科技魏兴华:云原生和数据库的结合将成未来趋势2021-01-06
-
数据中心:实现“碳中和”的路径探讨2021-01-05
-
论文研究:从工业大数据角度探讨PHM技术2021-01-05
-
大数据训练学习在物种识别上的应用——基于手绘草图的树叶种类识别2021-01-05
-
大数据在零售业的应用2021-01-04
-
聚焦“新四化”行业发展趋势,上汽通用汽车最新销量数据新鲜出炉!2021-01-04
-
全球性制药公司Servier深耕肿瘤治疗领域2021-01-04
-
“奥林帕斯悬红”:能否为数据存储的产学研开拓出一条新路?2021-01-01
-
浪潮存储:深入研究数据需求 不断提升数据价值2020-12-31
-
产业数字化浪潮下,百度地图数据如何达成产业服务?2020-12-31
-
以毒攻毒的医学新解,砒霜的靶向治疗肿瘤能力2020-12-31
-
如何通过数据守护珠峰保护区生态?2020-12-30
-
R语言教程:数据结构+导入数据!2020-12-29
-
迎风而上2021 如何破题五大数据挑战?2020-12-28
-
诺诚健华-B肿瘤创新药奥布替尼获国家药监局批准上市2020-12-28