划时代的文章!David baker预测12%未知结构家族蛋白结构

-回复 -浏览
楼主 2021-01-09 16:17:35
举报 只看此人 收藏本贴 楼主


这一期的Science注定将载入史册,久负盛名的David Baker课题组再次给大家呈现了史诗般的工作。

David baker等人通过基于宏基因组大数据分析蛋白质残基接触性的信息,以高精度预测了12%未知结构的蛋白家族的结构,这将为人类了解蛋白质结构,尤其是结构预测方面提供新的策略。

有没有很激动?有没有想了解David Baker等人的设计策略?

让我们一起阅读吧!

目前已知有14849种不同的蛋白家族,其中4752种蛋白家族中,含有至少一种蛋白,另外3984种家族的蛋白可以通过同源重组等进行结构建模,然而仍然有5211种家族的蛋白没有得到解析。

考虑到从头预测蛋白的困难性,因此想通过直接直接从头预测非常困难,那是否可以增添多种信息,帮助结构预测?

科学家们想到了宏基因组数据提供的蛋白家族的信息。

事实上,残基间的共进化的信息,已经被用来预测折叠层面的蛋白质结构分析,那么是否可以用于原子精度水平的结构预测?

基于进化的方法,David Baker课题组已经预测了58个家族的蛋白的结构,随着近期不断的晶体结构的解析,为评价这些结构预测提供了价值标准:

针对于六个被解析的晶体结构可以看到:

其相应蛋白结构的预测精度非常的高,因此,David Baker便立下了更为伟大的雄心壮志。

首先基于27个已知结构的蛋白家族,为了确定需要的比对序列的个数等信息,David baker等人开发了一套全新的算法:这套算法被称为双动态算法,不仅依赖于Rosetta的从头预测,同时也借助于不同蛋白结构接触模式上的一致性帮助结构预测。

由上图也可以看到Nf:反应序列个数与长度的一个数,与预测结果息息相关。

然而目前人们已知的蛋白中,能够满足Nf>64的比例非常的小,但是宏基因组数据的出现,极大的促进的蛋白序列的获得,进而促进了蛋白质结构的解析。从8%提高到了25%。

对相应的预测出来的结构进行生物学的解析,也获得了完美的生物学解释,相应的Fold也满足对应的生物需求。而在工作进展过程中,新通过晶体解析也与预测的结构非常一致。

正如文中雄心壮志的描述:“如今,随着不同学科的交叉,宏基因组与蛋白质结构预测的完美结合,随着时间,越来越多的结构,尤其是真核的蛋白结构也将得到解析!”

致敬 David Baker!



我要推荐
转发到