CCLE(Broad Institute Cancer Cell Line Encyclopedia)肿瘤细胞系在线数据库

瘤细胞系在肿瘤发生机制的阐明,药物敏感性的检测,肿瘤标志物的发现等研究内容中发挥重要的作用。肿瘤细胞系的数据显得尤为重要。

之前给大家简单介绍了癌症体细胞突变COSMIC(Catalogue of Somatic Mutations in Cancer)数据库,今日给大家安利另一个肿瘤细胞系数据库CCLE,全称为Broad Institute Cancer Cell Line Encyclopedia,附上官网链接:

https://portals.broadinstitute.org/ccle/about

2012年Broad Institute,Novartis Institutes for Biomedical Research和Genomics Institute of the Novartis Research Foundation共同合作描绘了癌症模细胞系的遗传特征以及药理学特征并构建了CCLE数据库。迄今为止,CCLE团队在更新和维护CCLE数据库方面共发表了4篇文献,从肿瘤细胞系的药物特征到肿瘤细胞系的代谢特征,从芯片数据到如今的二代测序,CCLE数据同COSMIC一样都在不断更新。

CCLE数据库是公开的数据库,通过普通的邮箱注册就能获取数据库中公开的数据。据统计数据库中共包含40种癌型(包含未知的癌型),1457个肿瘤细胞系的数据,可以说CCLE数据库和COSMIC都是研究肿瘤细胞系的利器。据统计CCLE数据包含了细胞系的突变、基因融合、miRNA、蛋白质表达谱、基因表达谱、甲基化谱、拷贝数、代谢谱、药物处理细胞系的IC50值和AUC值等。相比于COSMIC数据来说,CCLE数据涵盖的数据内容更全面。值得一提的是,CCLE数据库并不是所有的细胞系在各个组学层面都进行了检测。各种组学数据中包含的细胞系数量都是不相同的。

简单了解了CCLE数据的内容之后,发现CCLE数据库的数据还是好多。

那么,首先一起学习怎么下载和使用CCLE数据中的基因表达谱数据吧!下面根据感兴趣基因的多和少分别介绍。

第一种:研究对象为一个或两个等较少的基因

假如只针对一个或两个基因感兴趣,可直接在CCLE首页右上角检索感兴趣的基因。CCLE提供便利的可视化工具,可通过检索获得基因在各种癌型的细胞系中表达情况,便捷传达了基因在哪些癌型细胞系高表达,哪些癌型细胞系低表达。此外,能直接下载感兴趣的基因在细胞系中的表达谱数据。这就很方便了,后续可根据自己的需求进行数据的处理和分析。

第二种:研究对象为细胞系所有的基因

若需要细胞系的全部基因,那么上面的方法就不是便捷的方法了。点击CCLE首页左上角的Data,会提醒你进行用户注册,注册登录后,可见到CCLE中公开的各种类型的数据。

CCLE数据库中基因表达谱有两种数据。一种是运用二代测序方法检测到的,另一种是利用传统的芯片检测方法检测的。相比于二代测序来说,芯片技术检测到的基因表达谱数据其检测的基因有限且只能检测已知的基因。而二代测序解决了芯片技术的局限性。下图中通过CCLE提供的可视化工具查阅MYC基因分别在芯片和二代测序方法中各种细胞系的基因表达值的相关性,可以发现两者之间的相关性程度高。因此,推荐使用二代测序的基因表达谱。当然,CCLE提供的二代测序的表达谱文件有6个,选择哪个需要根据后续的分析来决定。下载好细胞系的表达谱数据,就能根据自己的需求进行数据的处理和分析,如差异基因分析,功能富集等。

基于细胞系的数据进行挖掘,有助于推动肿瘤研究的进展。CCLE基因表达谱的下载和使用就介绍到这。

路漫漫其修远兮,吾将上下而求索。

工具介绍

AnnoLnc2:一站式lncRNA查询数据库

2020-8-21 13:08:19

工具介绍

ImageJ快速自动计数细胞数目教程

2020-8-21 13:13:59

加入Q群
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索