周耀旗课题组 
蛋白药物设计及分子检测研究

English Version
研究方向

主要科研领域与方向:我们结合人工智能驱动的结构生物信息学与尖端的高通量和定向进化生物技术,来加深对蛋白质/RNA的序列、结构、功能与表型之间错综复杂关系的理解以实现精准的预测和设计。我们是一个多学科交叉的团队,具有AI计算、分子生物学、细胞生物学、合成化学的科研人员以及软件和硬件工程师等多方面的人才。部分研究方向如下:

 

一、蛋白质结构/功能预测

        从序列预测蛋白质结构一直是分子生物学中的核心挑战。随着时间的推移,该领域已经从基于模板的建模、片段的组装、无片段预测发展到端到端的学习。我们通过开发SPARKS(2004年)【1】和SPARKS X(2011年)【2】用于基于模板的建模,以及发展命名为DFIRE的统计力学势能(2002年)【3】用于能量引导的结构优化,对该领域做出了贡献。此外,我们率先预测蛋白质二面角,发展无片段结构预测方法(2009年)【4】,使端到端学习的结构预测成为可能,是AlphaFold 2成功实现高精度蛋白质结构预测的重要一环。目前,我们专注于解决AlphaFold2的预测精确度严重依赖天然同源序列的这个挑战性问题。

【1】H. Zhou and Y. Zhou,``Single-body residue-level knowledge-based energy score combined with sequence-profile and secondary structure information for fold recognition”, Proteins, 55, 1005-1013 (2004).

【2】Y. Yang, E. Faraggi, H. Zhao and Y. Zhou, “Improving protein fold recognition and template-based modeling by employing probabilistic-based matching between predicted one-dimensional structural properties of the query and corresponding native properties of templates” Bioinformatics 27, 2076-2082 (2011).

【3】H. Zhou and Y. Zhou, “Distance-scaled, finite ideal-gas reference state improves structure-derived potentials of mean force for structure selection and stability prediction, Protein Science, 11 , 2714-2726 (2002). 

【4】E. Faraggi, Y. Yang, S. Zhang and Y. Zhou, “Predicting continuous local structure and the effect of its substitution for secondary structure in fragment-free protein structure prediction”, Structure 17,1515-1527 (2009)

 

二、蛋白质设计

        由于可能的蛋白质序列数量庞大(仅100个氨基酸的蛋白质,可能性达到10130个),蛋白质的结构和功能空间仍然是远未开发的资源。在历史上,基于能量的方法主导了全新蛋白质设计,但它们的整体成功率有限,阻碍了广泛应用。我们率先发展无需依赖能量函数的、基于人工智能的蛋白质设计SPIN方法(2014年)【5】,随后采用了深度学习进行改进(SPIN2,2018)【6】。现在,基于人工智能的蛋白质设计成为主流,在不断提高成功率 【7】。我们的目标是通过计算与实验自动进化的结合来提高功能设计的成功率,特别关注蛋白质药物的发现。

【5】Z. Li, Y. Yang, E. Faraggi, J. Zhan, and Y. Zhou, “Direct prediction of profiles of sequences compatible with a protein structure by neural networks with fragment-based local and energy-based nonlocal profiles.”, Proteins, 82, 2565-2573 (2014). 

【6】J. O’Connell, Z. Li, J. Hanson, R. Heffernan, J. Lyons, K. Paliwal, A. Dehzangi, Y. Yang, and Y. Zhou, SPIN2: Predicting sequence profiles from protein structures using deep neural networks PROTEINS, 86: 629-633 (2018).

【7】X Zhang, H Yin, F Ling, J Zhan, Y Zhou. SPIN-CGNN: Improved fixed backbone protein design with contact map-based graph construction and contact graph neural network. bioRxiv; 2023. DOI: 10.1101/2023.07.07.548080.

 

三、RNA结构功能研究

        非编码RNA是目前生物学基础研究的热点。这主要是因为编码蛋白质的信使RNA(mRNA)只占人类基因组的1.5%,而非编码RNA则占据了75%。到目前为止,只有非常少量的非编码RNA的功能被发现,它们几乎出现在所有生物过程里,在许多疾病(包括癌症)中起着关键作用【8】。但是,对绝大多数的非编码RNA而言,我们了解甚少,主要是因为缺乏结构信息。结构决定功能,没有结构,我们就没有线索去解析它的功能。我们在RNA结构预测的贡献包括建立了第一个完全自动化的同源搜索管线RNAcmap(2021年)【9】,世界上第一个端到端深度学习来预测RNA二级结构(2019年)【10】,机器学习预测功能长非编码RNA【11】及利用深度突变来推测RNA二级结构的方法【12】,以及开发了专门针对RNA的统计能量函数BRiQ 能够对RNA近天然态结构的高精度优化修正(2020年)【13】。Alchemy-RNA2通过BRiQ能量函数,在2022年的CASP 15 RNA结构预测竞赛中获得第一名 【14】。目前,这些工作正在进一步发展,为最终实现从序列到结构、结构到功能、到功能设计的远大目标而努力。

【8】B. Zhou, B. Ji, K. Liu, G. Hu, F. Wang, Q. Chen, R. Yu, P. Huang, J. Ren, C. Guo, H. Zhao, H. Zhang, D. Zhao, Z. Li, Q. Zeng, J. Yu, Y. Bian, Z. Cao, S. Xu, Y. Yang, Y. Zhou*, and J. Wang*, EVLncRNAs 2.0: an updated database of manually curated functional long non-coding RNAs validated by low-throughput experiments, Nucleic Acids Research (Database Issue) 49, D86–D91 (2021).

【9】T. Zhang, J. Singh, T. Litfin, J. Zhan, K. Paliwal, and Y. Zhou, “RNAcmap: A fully automatic pipeline for predicting contact maps of RNAs by evolutionary coupling analysis.”, Bioinformatics , 37, 3494–3500 (2021).

【10】J. Singh, J. Hanson, K. Paliwal, and Y. Zhou, RNA secondary structure prediction using an ensemble of two-dimensional deep neural networks and transfer learning, Nature Communications 10, 5407 (2019).

【11】B. Zhou, Y. Yang, J. Zhan, X. Dou, J. Wang*, and Y. Zhou*, Predicting functional long non-coding RNAs validated by low throughput experiments, RNA Biology, 16: 1555-1564 (2019).

【12】Z. Zhang, P. Xiong, T. Zhang, J. Wang, J. Zhan, and Y. Zhou, Accurate inference of the full base-pairing structure of RNA by deep mutational scanning and covariation-induced deviation of activity, Nucleic Acids Research, 48:1451-1465 (2020).

【13】X. Peng, R. Wu, J. Zhan* and Y. Zhou*, Pairing a high-resolution statistical potential with a nucleobase-centric sampling algorithm for improving RNA model refinement,Nature Communications 12, Article number: 2777 (2021)。

【14】K. Chen, Y. Zhou, S. Wang, and P. Xiong, “RNA tertiary structure modeling with BRiQ potential in CASP15.”, Proteins (CASP 15 Special Issue) , in press (2023).

 

四、生物药、纳米抗体设计和开发

        人与人之间在基因组上千分之一的差异导致了每个人在免疫能力、得某种疾病的可能性、及各种药的效果上有相当的不同。这些差异需要精准的疾病诊断方法及个性化、针对性强的新型预防性疫苗或治疗用药物。而利用人工智能、深度学习方法来对生物、医疗大数据的进行挖掘是尽快实现精准医疗的必由之路。新药开发、精准医疗是中国十三·五国家战略性新兴产业发展规划的重点之一,而生物药(小肽、RNA、蛋白质、抗体等)受到越来越多的欢迎是因为副作用小、针对性强。目前无论是小分子还是生物药,在抗病毒、抗细菌、抗真菌、抗癌方面都面临着严重的抗药性问题,主要原因是现在临床上使用的药都是与药物分子所针对的靶标结构的表面相互作用,而天然发生的靶标结构表面的变异会导致抗药性。周耀旗课题组经过多年的探索,能够用计算方法来预测破坏靶标结构的自抑制小肽,并成功地应用于发现新型的、难以产生抗药性的抗菌小肽【15】。此外,蛋白质设计也越来越成为生物药包括纳米抗体设计的一个新工具【16】。课题组通过计算与实验相结合必将加速新药的发现和应用。

【15】J. Zhan, H. Jia, E. A. Semchenko, Y. Bian, A. M. Zhou, Z. Li, Y. Yang, J. Wang, S. Sarkar, M. Totsika, H. Blanchard, F. E.-C. Jen, Q. Ye, T. Haselhorst, M. P. Jennings, K. L. Seib, and Y. Zhou, Self-derived structure-disrupting peptides targeting methionine aminopeptidase in pathogenic bacteria; a new strategy to generate antimicrobial peptides, FASEB J. , 33: 2095–2104 (2019).

【16】Z. Li, Y. Yang, J. Zhan, L. Dai and Y. Zhou, Energy Functions in De Novo Protein Design: Current Challenges and Future Prospects, Ann. Rev. Biophysics 42, 315-335 (2013).

 

五、生物标志物检测、仪器开发

        快速、便宜、高灵敏度、高准确度地检测生物标志物仍旧是当今世界性的难题,而科研、医疗用仪器则被几个国际公司垄断。周耀旗课题组有参与设计高灵敏度传感器的经验【17】,多年负责软件开发、数据分析、以及AI算法的项目,目前正在主持新一代免疫印迹成像系统的研发。<点击查看>

【17】S. Xu, J. Zhan, B. Man, S. Jiang, W. Yue, S. Gao, C. Guo, H. Liu, Z. Li, J. Wang, and Y. Zhou, Real-time reliable determination of binding kinetics of DNA hybridization using a multi-channel graphene biosensor, Nature Communications 8, 14902 (2017).