4个肿瘤数据库,手把手教你生信数据挖掘,不进实验室就把发文章
作者头像
  • 2021-09-11 10:44:52 7

我们知道生物信息学在科研领域有着重要的应用,尤其是在发表SCI论文方面。生物信息学不仅能够帮助我们发表论文,还可以用于职称评定和基金申请。不同于传统的综述和元分析,生物信息学更多的是基于原始数据进行分析,这些原始数据可以来自自测数据,也可以来自公共数据库。简而言之,就是“借用他人的数据,撰写自己的论文”。

因此,生物信息学的数据挖掘成为继元分析之后的另一热门研究方法。然而,在庞大的生物信息学数据库中,真正有价值的有用数据却相对有限。如何在这海量数据中找到有价值的信息,成为了生物信息学数据挖掘的第一步,同时也是最具挑战性的一步。

目前,许多数据库的操作方法并不统一,代码也不具备可重复使用性,甚至有些网站根本无法访问。更棘手的是,很多数据库的具体用途我们并不清楚。为此,我们特别整理了四个专注于肿瘤研究的数据库,详细指导大家如何进行生物信息学数据挖掘。

CancerSEA

CancerSEA(癌症单细胞状态图谱)是首个专门针对单细胞测序的数据库,旨在全面研究癌细胞在单细胞层面的不同功能状态。

网址:http://biocc.hrbmu.edu.cn/CancerSEA/

CancerSEA数据库的数据来源于SRA、GEO和ArrayExpress网站上的72个数据集,共计收录了25种癌症类型的41900个肿瘤细胞。其功能分析结果则来源于HCMDB、Cyclebase和StemMapper等数据集,共重新定义了14种功能状态。

通过对这些单细胞进行功能状态注释,研究人员可以使用CancerSEA数据库进行“基因搜索”、“状态搜索”、“浏览状态图谱”、“浏览数据集信息”和“下载”等操作。

COSMIC

COSMIC(癌症体细胞突变数据库)是关于癌症相关体细胞突变的最大数据库之一。

网址:https://cancer.sanger.ac.uk/cosmic/

COSMIC数据库包含了数千个涉及癌症发展的体细胞突变。数据主要来自两部分:一是从文献中收集已知癌症基因的突变;二是从癌症基因组计划进行的全基因组重测序研究中收集的数据。

用户可以通过输入特定的基因或蛋白质名称来查找具体记录。

MEXPRESS

MEXPRESS 是一个可视化工具,用于展示TCGA数据库中的患者临床信息、甲基化和基因表达之间的关系。

网址:https://mexpress.be/

使用MEXPRESS非常简便,只需输入基因名称并选择研究的肿瘤类型即可。与其他工具如cBioPortal、Xena和TSVdb相比,MEXPRESS的独特之处在于它可以同时查询DNA甲基化数据、基因组位置以及临床信息,并且提供了相关性和校正p值。

miRWalk3.0

miRWalk 是一个综合性的小分子RNA(miRNA)靶基因数据库,收录了人类、小鼠等多种物种的miRNA靶基因信息。它类似于mirDIP,是一个整合型数据库,整合了来自miRDB、TargetScan、miRTarBase等数据库的信息。

网址:http://mirwalk.umm.uni-heidelberg.de/

miRWalk涵盖了多个知名miRNA数据库的结果,包括预测的和实验验证过的。它使用了流行的TarPmiR算法来预测miRNA的结合位点。用户可以进行单个或多个miRNA或mRNA的搜索,并获得图表及富集分析结果。此外,数据可以全部下载,非常适合研究感兴趣的miRNA的靶基因或mRNA的结合miRNA。

资源领取方式

想要获取更多关于这些数据库的资源和教程,请在后台私信“肿瘤研究”获取。

    本文来源:图灵汇
责任编辑: :
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
数据挖掘手把手肿瘤实验室数据库文章
    下一篇