生信论文套路
-
ONCOMINE从全景、亚型两个维度做表达差异分析;
-
临床标本从蛋白水平确认(或HPA数据库),很重要;
-
Kaplan-Meier Plotter从临床意义的角度阐明其重要性;
-
cBio-portal数据库做基因组学的分析(机制一);
-
STRING互作和GO/KEGG分析探讨可能的信号通路(机制二);
-
TIMER和TISIDB等数据库免疫浸润分析(机制三)。
生信分析技能
-
差异分析 (differential expression);
-
生存分析 (survial analysis);
-
相关分析 (correlation analysis);
-
统计分析 (statistical analysis);
-
组学分析 (genomic alterations);
-
突变分析 (mutational analysis);
-
免疫分析 (tumor infiltration analysis);
-
富集分析(enrichment analysis)。
第59篇生信文章的分享。果友留言说很多生信期刊已经被列上黑名单,列为水刊,确实投稿时候需要避开。但是,Frontier系列的诸多期刊文章质量还是有保证的。
今天我们来分享其中一篇生信论文。
这篇论文是完全符合生信论文的套路,没有湿实验,从文章讨论到生信技能,包括文章题目也很简单。但是文章中所选择的分子是很有讲究的——BTLA,是CD28基因超家族的成员,与PD-1和CTLA-4有类似的结构,可以调控T细胞激活和抑制。
下面是文献的摘要。背景,方法,结果,结论和关键词,具体根据杂志的要求而定。目标是介绍疾病的现状,引出并提出科学问题,最后给出解决的途径,也就是自己的研究怎么解决问题的。
首先是oncomine数据库和TCGA数据库分析肿瘤组织和正常组织中BTLA的表达情况,确认其在肿瘤组织中低表达,并进行验证。当然,最好有标本进行验证。
接下来用TCGA数据库的数据进一步验证,分析BTLA表达差异与病理因素的相关性,属于相关分析。该图用GEPIA和TIMER数据库,以及KM plotter都是可以完成的,不局限于表格形式。
最重要的是生存分析,用R语言包完成,从多个角度分析BTLA表达差异与生存参数的关系。这里,作者的高明之处在于将TCGA数据库的数据进行个性化处理,是值得借鉴和学习的地方,相当于自己的标本,有特色。
接下来是统计资料的三线图展示。从TCGA数据库下载数据后,进行统计分析即可得到下表中的结果。
免疫浸润分析,作者以差异和相关性的形式展示,使用 CIBERSORT数据库进行分析。这里,作者的高明之处在于自行下载数据,然后处理分析,比TIMER和TISIDB数据库多了自主处理的空间,极具特色性。
表格形式展示BTLA表达与免疫细胞marker之间的相关性,属于常见分析,我们可以借鉴其中的Gene markers,展示方式已经分享过很多次了。
最后,作者用KEGG和GO分析展示BTLA调节免疫浸润可能的分子机制。这对于免疫相关分子当然不难,而且很有意义。但是对于不是免疫分子的基因,富集分析的结果往往意义不大。
总体来说,这篇论文的难度不大,最精彩的地方便是TCGA数据自行下载和处理,使得结果极富有特色和个性化。当然,数据的展示方式是多样而丰富,只要能说明问题就行。
一起学习,共同成长,愿2021年多发论文,在精进的道路上,收获越来越多!