生物信息学分析技术那些事!

-回复 -浏览
楼主 2019-06-11 13:21:16
举报 只看此人 收藏本贴 楼主

生物信息学是一门随着生物学的发展特别是系统生物学的发展而发展的科学, 为后基因组时代的研究提供了更快、更新、更准确的研究手段。生物信息学在系统 生物学研究领域有着举足轻重的地位,正所谓五分靠实验,五分靠分析,准确可靠的统计与生物信息分析结果有助于研究者全面了解各种生物分子的功能及富集信息,为后续的深入研究提供了方向,同时也是取得有说服力的研究成果的关键因素之一。

经典分析流程

1、系统生物学数据分析流程

1、实 验

2、搜 库

常用所用软件(网站或者数据库): ProteinPilot、Proteome Discoverer 、Mascot。

3、质 控

针对有重复的实验:需要质控验证生物学或者实验重复得到的原始数据是否合理可靠;

原始数据质控常见软件(网站或者数据库): PCA、 PLS-DA 、OPLS-DA:Simca-p,SAS、SPSS、R语言…… Cluster:R语言、mega、cluster+等。

4、差异筛选

质控合理的数据仍然是高通量大数据,不能直接后续分析,需要通过一 定算法,从质控合理的数据中,筛选出合适的差异数据,然后基于差异 数据进行后续分析。

差异筛选常见软件(网站或者数据库): 质控合理的数据仍然是高通量大数据,不能直接后续分析,需要通过一 定算法,从质控合理的数据中,筛选出合适的差异数据,然后基于差异 数据进行后续分析。 实验 质控 差异 筛选 ID转换 同源映射 功能 分析 选择 方向 构建 搜库 模型 验证 T-test(火山图):Excel、SAS、SPSS、 s-plus、 R语言…… F-test(one way ANOVA、two way AVOVA):Excel、SAS、SPSS、s-plus、R语言。

5、ID转换  同源映射

ID转换:一些公共数据库(STRING)只识别专门ID号(Uniprot),如果搜库的时候提供的是NCBI获得的库,需要进行ID转换将GI转为Uniprot,进行后续分析,如果搜库提供的是转录测序得到的库,这种编号通常是人为拟定的,需要进行序列调取,然后根据序列获取标准ID号,然后进行后续分析;

同源映射:虽然标记定量蛋白实验可以对蛋白进行定性定量,但是许多非模式物种研究很少或者还没有被研究,无法获取蛋白功能或者功能富集信息,所以要根据序列相似性,要把其映射到最近缘的模式物种进行比较分析,获取其功能或功能富集预测结果;

ID转换:uniprot-ID mapping、perl sequence、DAVID、MBRole-ID等;

同源映射:NCBI-BLAST在线比对、BLSAT本地检索程序、uniprot-blast、MEGA等。

6、功能分析

功能分析常见软件(网站或者数据库):

GO:Gene Ontology、QuickGO、DAVID、KOBAS、EASE、FatiGO、GARBAN、GOALIE、GOArray等;

Pathway:DAVID、KEGG、Reactome、Wikipathway、metacore、IPA、pathwaystudio等;

PPI互作分析:STRING、MINT、BIOGRID等;

功能分析作图:Excel、Origin、GraphPad Prism、Minitab、KEGG mapper、cytoscape等。

7、选择方向

选择方向常见软件(网站或者数据库):

韦恩图:Draw V、Excel等;

归一化(箱线图):SPSS、DPS、Minitab、Matlab、Excel等;

表达模式或者功能热图:R语言、MATLAB、Hem I等;

聚类、进化树构建:MEGA、cluster+ Treeview、R语言等。

8、构建模型

根据功能和功能富集结果以及选择的重点方向,构建相关模型,直观描述所研究的机理机制,后续可以通过经典分子生物学对其进行验证。

构建模型常见软件(网站或者数据库):

Chembiooffice、pathway builder、cytoscape,scienceslides等。

scienceslides

9、验 证

TAT是不是看的头晕眼花?这么多软件,这么多操作,谁来拯救我!没错这就是经典生物信息学分析!

本文来源于鹿明生物


▲长按二维码“识别”关注
我要推荐
转发到