TCGA、GEO、Oncomine数据发掘(汇总篇附赠源代码)
作者头像
  • 刘颖
  • 2020-01-09 15:04:33 0

在大数据时代,临床医生和基础科研人员是否有可能在不进行实验或查阅病史的情况下,直接利用公共数据撰写并发表SCI论文呢?答案是肯定的,这可以通过一些公共数据库来实现,比如TCGA癌症公共数据库。

TCGA数据库介绍

TCGA(癌症基因组图谱)数据库是一个包含常见癌症的基因组、转录组、蛋白组、表观遗传组数据以及相关临床数据的综合性数据库。它为研究人员提供了大量数据,有助于揭示肿瘤的发生、发展和转移等生物学机制。

GEO数据库的应用

GEO(基因表达综合)数据库是目前最大、最全面的公共基因表达数据资源。适合研究多种疾病,而不仅仅局限于肿瘤研究。GEO数据库的数据下载和整理相对简单,但数据分析需要一定的R编程技能,整体难度适中。利用GEO数据撰写的论文通常得分较低,一般在1到2分之间。

Oncomine数据库的功能

Oncomine数据库整合了来自GEO、TCGA以及已发表文献中的RNA和DNA测序数据,拥有全面的癌症突变谱、基因表达数据及相关临床信息。通过Oncomine,可以进行差异表达分析、共表达分析,从而识别特定癌症中的差异表达基因,为研究提供方向。

综合分析视频材料

接下来,我们将分享一系列关于GEO、TCGA和Oncomine数据库结合分析的视频教程。这些教程涵盖了从基础数据下载到高级分析技术的各个方面,包括但不限于:

TCGA数据分析教程

  • 数据库简介
  • 网页下载数据
  • 命令行下载数据
  • 生成矩阵
  • ID转换成基因名
  • 差异表达分析
  • edgeR差异表达
  • DESeq差异表达
  • miRNA数据下载与整理
  • 共表达数据合并
  • 生存分析介绍
  • 生存分析数据准备
  • R语言进行生存分析
  • 安装包

批量发掘TCGA miRNA

  • 课程介绍
  • 批量获取TCGA miRNA
  • 挑选差异miRNA
  • 单因素Cox回归数据准备
  • 单因素Cox回归
  • lasso回归数据格式准备
  • lasso回归
  • 多因素Cox数据准备
  • 多因素Cox回归分析
  • 绘制列线图
  • 绘制校准图
  • 绘制ROC曲线
  • 风险评分可视化
  • 批量生成生存曲线

单个基因生物信息学分析视频教程

  • 单个基因生物信息学分析概述
  • 基因结构预测和功能注释
  • 蛋白结构域预测
  • 多序列比对
  • 蛋白二级和三级结构预测
  • 蛋白特性分析
  • 跨膜结构分析
  • 信号肽分析
  • 亚细胞定位预测
  • 启动子分析
  • 调控目的基因的miRNA预测
  • 基因表达分析

TCGA、GEO、Oncomine数据发掘

  • 数据发掘概述
  • GEO在线工具的使用
  • GEO数据下载和数据质量分析
  • 原始数据预处理
  • 寻找差异基因及制作热图和火山图
  • 富集分析
  • KEGG分析
  • 蛋白互作网络
  • TCGA数据下载
  • TCGA数据整理和基因注释
  • 寻找差异基因和制作五年生存率
  • Oncomine概述及Meta分析
  • Oncomine差异分析及共表达分析

最新GEO芯片数据发掘视频及源代码

  • GEO数据库简介
  • R语言简介
  • 芯片下载与质控
  • 芯片分析结果展示:热图——GO和KEGG富集分析
  • R对象的命名规则
  • R包的安装与调用
  • 获取R包的帮助与引用信息
  • GEO数据下载与整理
  • 芯片分析流程
  • 读取芯片文件
  • 质量控制:查看灰度图
  • 质量控制:相对对数表达
  • 质量控制:相对标准差
  • RMA法预处理肿瘤样本
  • 合并正常与肿瘤数据
  • Probe ID转换为基因符号
  • 补充缺失值
  • 差异表达分析
  • 结果展示:绘制热图
  • 结果展示:GO分析

希望这些资源能帮助您更好地理解和利用这些强大的公共数据库,提升您的研究水平。

    本文来源:图灵汇
责任编辑: : 刘颖
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
附赠源代码发掘汇总Oncomine数据TCGAGEO
    下一篇