Brief Bioinform | 吴松/白晨团队联合开发分子生成模型InterDiff

May 6, 2024

简介

结构为基础的药物设计(structured based drug design:SBDD)旨在获得和靶点具有高度亲和力并且具有良好特异性的分子,在当前的生物医药研究中已经成为一种常用且重要的方法。在该设计策略下,蛋白质与配体的结合方式对于理解大分子机器的工作过程至关重要。在蛋白与小分子的结合口袋中,有一小部分残基称为热点残基(hotspots),这些残基贡献了亲和力中的绝大部分。热点残基的突变可能导致结合亲和力显著下降,甚至导致患者产生药物耐药性。在现代药物开发中,热点残基对于合理的药物设计起到核心作用,研究者通常希望药物能够与热点残基发生相互作用,从而实现最大药效。

扩散生成模型是一种较新颖的生成方法,通过模拟自然界的扩散过程来合成新数据。在分子设计中,扩散生成模型也得到了广泛的应用。然而,目前的扩散模型忽略了蛋白质-配体相互作用信息,无法定制生成的分子在蛋白口袋中的结合模式。

受到自然语言处理中提示学习技术相关研究的启发,晨伫科技开发了一个基于提示学习的扩散生成模型,以定制生成分子在蛋白质口袋中的结合模式。InterDiff引入了四种可学习的提示嵌入向量,以指示蛋白质残基的相互作用类型,包括π-π相互作用、阳离子-π相互作用、氢键相互作用和卤素键相互作用。

 

研究测试

为了评估InterDiff在生成具有指定相互作用的分子方面的能力,晨伫科技研究团队用CrossDocked2020测试集中的分子进行了测试,共包括100个测试样本。在测试集中,未检测到任何相互作用的测试样本被排除,共剩下99个样本。如下图一所示,与其他方法相比,InterDiff在给定相互作用提示的条件下能够以很高的准确性设计出具有指定相互作用的分子,3D-SBDD在准确性上仅次于InterDiff。

为了测试相互作用提示的作用,研究团队额外测试了删除所有相互作用提示的生成表现(图一中表示为InterDiff_noprompt),并且结果显示复现相互作用的准确性显著下降。InterDiff在给定9个相互作用情况下实现了最高的准确性,在1个相互作用情况下实现了最低的准确性。在给定9个相互作用的条件下,有5个分子产生了与参考分子完全相同的相互作用,13个分子符合8个相互作用。

图片

图一:InterDiff在不同相互作用数目提示下实现指定相互作用的准确性,对比方法包括3D-SBDD、TargetDiff、DiffSBDD、Pocket2Mol和GraphBP等经典方法。

 

除了评估InterDiff设计相互作用的准确性外,晨伫科技探索了在给定分子结合模式的情况下,InterDiff在真实靶点中设计药物的潜力。作者选择了两个具有不同亚型的蛋白质靶标,并使用InterDiff设计和原生药物具有相同结合模式的分子。第一个靶标是乙酰胆碱受体(mAChR),该蛋白在中枢神经系统疾病中扮演着重要角色,例如阿尔茨海默症和精神分裂症。Xanomeline是临床中常用的mAChR激动剂,研究发现该激动剂几乎对所有mAChR亚型(M1-M5)都具有相同的结合亲和力,但是激活效果却明显不同。

最近的研究发现,Xanomeline与mAChR的非活跃状态结构和活跃状态结构之间的结合模式存在差异。我们使用InterDiff来设计与M2型mAChR相结合的分子,同时针对非活跃状态和活跃状态的结构,并以Xanomeline的相互作用模式为生成条件。第二个靶标是KRAS,KRAS基因在癌症中较为常见,容易产生突变,并且是癌症治疗的重要靶点,例如肺癌、结直肠癌和胰腺癌。目前的KRAS抑制剂只针对KRAS G12C突变体,但非G12C突变体在KRAS驱动的癌症中占据了更大的比例。

最近,Kim等人报道了一种非共价抑制剂BI-2865,可以结合广泛的KRAS突变体。同样地,研究人员使用InterDiff针对KRAS蛋白设计分子,并以KRAS G12C和另一突变体G13D中BI-2865的相互作用模式作为生成条件。我们针对两个靶标的不同状态各采样300个分子,并检测分子在使用QuickVina对接后的相互作用。如下图二所示,在生成的分子中,我们成功获得了与原生药物具有相同或更多相互作用的分子,这里我们选择四个生成分子进行展示。

图片

图二:InterDiff在mAchR和KRAS蛋白中设计分子与原生药物的结合模式对比

 

除了应用于从头的分子生成外,InterDiff也实现了基于碎片的分子设计(fragment based drug design: FBDD)。晨伫科技研究人员发现InterDiff可以在给定分子碎片的基础上,生成与指定残基发生相互作用的分子。这一功能在很多场景下非常有用,例如药物化学家可能希望优化分子的某些片段,同时保持分子的骨架不变。实验中使用了相同的蛋白质靶点,并对两个靶点的不同状态进行了100次分子采样。

我们去除原生药物中与蛋白质残基有相互作用的分子片段(图三,紫色分子中的透明部分),并保留剩余的分子骨架。图三显示了InterDiff基于分子骨架和相互作用提示设计的分子,我们成功地设计出了与M2 mAChRs的原生药物具有相同相互作用的片段。对于KRAS突变体G12C(PDB:8azx)和KRAS野生型(PDB:8azv),三个相互作用中的一个(ASP-69,氢键相互作用)和四个相互作用中的两个(ASP-69,氢键相互作用;TYR-64,cation-π相互作用)相互作用被实现。

我们注意到补全模式下InterDiff实现相互作用的准确性低于基于口袋的条件生成模式。这可能是因为模型必须在去噪步骤中同时估计蛋白质和配体原子的位置。相反,在口袋条件生成模式中只需估计配体原子的位置。在同时估计蛋白质原子类型和位置时,模型产生误差可能会影响估计配体原子的准确性。

图片

图三:InterDiff在mAchR和KRAS蛋白中在给定药物骨架碎片情况下设计新的分子片段

 

感兴趣的读者可以阅读briefings in bioinformatics原文:

https://academic.oup.com/bib/article/25/3/bbae174/7655598