肿瘤细胞系多组学加上药物作用数据库-CCLE

癌细胞系百科全书(Cancer Cell Line Encyclopedia,CCLE)是一个肿瘤细胞系多组学加上药物作用数据库。网址:https://portals.broadinstitute.org/ccle

 我会尽量劝说每个人跟我学习生信的小伙伴加入我们知识整理和分享的队伍,我与生信技能树的一年多 这个故事的主人翁HY也终于要开启她的笔记生涯啦!

下面是HY的投稿

首先先简要介绍一下癌细胞系百科全书(CCLE)从2012年起发表的相关文章及其主要成果

  • 2012年美国Broad研究所、Dana-Farber癌症研究所和Novartis生物医学研究所的多个课题组于合作完成了癌细胞系百科全书(Cancer Cell LineEncyclopedia, CCLE)计划,对来源于三十多种组织的947种人类癌细胞系进行了大规模深度测序,整合了DNA突变、基因表达和染色体拷贝数等遗传信息。
  • 2015年发表的相关文章证实,从两个公开可用的大型药物基因组学资源:癌症细胞系百科全书和癌症数据库中的药物敏感性基因组学显示了药物敏感性测量和相关基因组预测物之间的基本一致和生物学一致性。

随着多组学测序技术和癌症精准医学向纵深发展,CCLE数据库也不断在癌细胞系数量和测序信息维度等方向上进行着更新。2019年的文章中报道了 CCLE的重大更新,在以往的分子数据的基础上,对大于1000个细胞系又全面地更新了遗传突变, RNA 剪接, DNA甲基化,组蛋白修饰, miRNA 表达和蛋白质表达的数据。

首先通过网址进入https://portals.broadinstitute.org/ccle,可以再检索框中输入基因名和细胞系进行查找。

可以看到主页的左上方分别有Home、About、Data以及Contact,点进about可以看到下图,点进How to Use,就可以看到关于CCLE的相关用法。

综述

CCLE(癌症细胞系百科全书)项目是Broad研究所与诺华生物医学研究所及其诺华研究基金会的基因组学研究所之间的合作,旨在对一大批人类癌症模型进行详细的遗传和药理学表征,开发将不同药理学漏洞与基因组模式相关联的综合计算分析,并将细胞系整合基因组学转化为癌症患者分层。CCLE提供对1100多个细胞系的基因组数据分析和可视化的公共访问。

  • 基因表达数据可以显示为箱形图,也可以与散点图中的其他表达值进行比较。每个基因都有多个数据集和数据标识符。五个主要的数据集类型是拷贝数,mRNA表达(Affy芯片),反向蛋白质阵列(reverse-phase protein array, RPPA,简化重亚硫酸盐测序(reduced representation bisulfide sequencing, RRBS)和RNA测序(RNA-sequencing)。

  • 基因甲基化也可以通过气泡图可视化。

  • 单个细胞系的突变数据是可见和可下载的。

CCLE是一个正在进行的项目,一些数据还没有完成。本中心网站将定期进行修改和改进。请经常访问!

该项目由诺华资助。

用法

1.基因可视化

有四种不同的基因可视化方法:箱形图、散点图、突变数据和气泡图。要查看一个基因的信息,可以在首页搜索。搜索是自动完成的。在框图和散点图按钮下面下载轴特定数据。该文件将以tab分隔。要在不同的可视化之间切换,请单击它们所在的选项卡。第一个标签是框图,第二个标签是散点图,第三个标签是突变数据,第四个标签是甲基化数据。

基因信息,在这里就以网站中介绍的基因为例。

基因的名称、描述和Entrez ID列在基因页面的顶部。

其中的Entrez ID会链接到NCBI (国家生物技术信息中心)数据库,即得到下图基因的详细信息。

箱线图

第一个可视化显示了给定数据集的基因表达数据的分布。箱线图是根据基因表达在谱系中的平均分布来排序和着色的。世系是由来自身体同一区域或同一系统的许多细胞系组成的。沿袭名称旁边的数字表示沿袭中有多少细胞系。最高的平均分布是在左边,颜色是红色的。方框中的虚线是平均值。

默认数据集为mRNA expression(RNAseq)。若要更改显示的数据集,请从下拉菜单中选择数据集。

这张图具有很强的互动性。您可以缩放、平移和取消选择特定家系。若要放大,请单击并拖动要放大的图形区域。要平移,从工具提示中选择平移工具。要将图形保存为图像,请从工具提示中选择“download plot”图标。图的数据可以通过选择工具提示中的“save and edit in the cloud”按钮来查看。

要隐藏某些家系,点击他们的名字在图例。要在隐藏后再次显示它们,请再次点击它们。

散点图

下一个可视化将一个基因的表达数据与自身的不同数据集或另一个基因的数据集进行比较。

对于相同基因的不同数据集,从两个下拉菜单中选择它们,然后按“加载图”。第一个下拉菜单选择X轴,第二个下拉菜单选择Y轴,load Plot来导入散点图

要比较该基因的分布与另一个基因,选择“different Gene”选项卡。要选择第二个基因,请使用搜索栏搜索它,并单击“搜索”。此搜索也不区分大小写,并且还提供了自动完成建议。

气泡图

2.细胞系的信息

CCLE有超过1100个细胞系。要查看cell line的信息,请从首页搜索它。搜索是自动完成的。

突变数据表

这里是必须先注册账号以后才能查看相关信息。

如要导出突变数据,请按“Copy”、“CSV”或“Excel”按钮进行保存。“Excel”按钮在Safari中不可用。

papers

  • Next-generation characterization of the Cancer Cell Line Encyclopedia   Ghandi, M., Huang F. et al.  Nature doi:10.1038/s41586-019-1186-3 / May 8, 2019
  • The landscape of cancer cell line metabolism   Li, H. et al. Nature Medicine doi:10.1038/s41591-019-0404-8 / May 8, 2019
  • Pharmacogenomic agreement between two cancer cell line data sets.   The Cancer Cell Line Encyclopedia Consortium & The Genomics of Drug Sensitivity in Cancer Consortium  Nature doi:10.1038/nature15736  /  Nov 16, 2015
  • The Cancer Cell Line Encyclopedia enables predictive modelling of anticancer drug sensitivityBarretina Caponigro Stransky et al.  Nature doi:10.1038/nature11003  /  Mar 29, 2012

CCLE网站数据量(截止2021.1.10)

  • Cell Lines: 1457
  • Genes: 84,434
  • Unique Data Sets: 136,488
  • Mutation Entries: 1,159,663
  • Distribution Scores: 118,661,636
  • Methylation Scores: 411,948,577

生物医学科研方法

conda技术交流,终于确定了(直播视频课程)

2021-1-16 5:24:58

生物医学科研方法

全网首发!文献阅读神器Snipaste结合文献阅读报告模板“双模态”阅读SCI,秒杀Setuna

2021-1-16 5:44:47