Virtual Screening and Kinetic Validation of Novel DPP-IV Inhibitors
This paper details an innovative drug development strategy targeting dipeptidyl peptidase-4 (DPP4), which integrates three cutting-edge technologies: virtual screening, molecular docking, and molecular dynamics simulations. This strategy enhances both the efficiency and accuracy of drug development. The study begins with a large compound library, employing advanced algorithms and machine learning tools to efficiently screen for candidate molecules with potential high binding affinity to the DPP4 target, significantly narrowing down the pool of experimental candidates. Subsequently, molecular docking techniques are used to deeply analyze the interaction patterns, energy characteristics, and the role of key amino acid residues between the candidate molecules and the target, successfully identifying lead compounds with high affinity and selectivity. To further validate and optimize, the study incorporates molecular dynamics simulations to dynamically observe the conformational stability, solvation effects, and dynamic binding with the target in a biological environment. This provides scientific evidence for drug design, accelerates the development of DPP4 inhibitors, and opens new prospects for the treatment of diabetes and other metabolic diseases.
Type 2 Diabetes
2型糖尿病(T2DM)是一种由胰岛素抵抗和胰岛素分泌不足引起的慢性代谢性疾病,已经成为全球公共卫生领域的重大挑战,且其血糖管理问题亟待解决。二肽基肽酶-4 (DPP-4)是体内广泛分布的一类酶
目前,DPP-4抑制剂作为一种提升内源性GLP-1水平的药物,已在临床上广泛应用,如西格列汀、维格列汀和沙格列汀等
传统DPP-4抑制剂研发依赖经验法筛选靶点,效率低下、成本高昂且成功率低。为此,计算机辅助药物设计(CADD)技术应运而生,成为突破传统药物发现瓶颈的创新手段。CADD技术凭借其精确模拟生物体内复杂分子间相互作用及有效预测化合物生物活性的能力,显著加速了药物研发进程,降低了研发成本和失败风险
为开发新型DPP-4抑制剂,本研究将采用基于结构的虚拟筛选技术对化合物库进行高效筛选,并运用分子动力学模拟对筛选出的化合物进行深入分析。该方案旨在快速筛选并验证具有成药潜质的DPP-4抑制剂,为后续实验研究提供有力参考,推动T2DM治疗药物的研发进程。
蛋白质结构数据从RCSB PDB数据库下载,检索得到DPP4与抑制剂西格列汀结合的共晶结构(PDB ID: 1X70)作为本研究的计算分析基础。该共晶结构的分辨率为2.10 Å,西格列汀的结合亲和力在0.35~18 nM范围内。为了准备蛋白质结构,我们使用了Maestro 13.0软件包中的Protein Preparation Wizard模块进行处理。首先,添加了必要的键序和电荷,并去除了所有水分子。接着,向蛋白质体系中添加了氢原子,并进行了氢原子的取向优化。此外,在pH值为7.2的条件下,我们对氨基酸进行了正确的质子化预测,并使用OPLS4力场对整个结构进行了能量最小化。这些准备步骤确保了蛋白质模型在后续计算和分析中具备正确的化学和物理特性。
本研究中使用的天然产物库由上海桃术生物科技有限公司提供,该库专为高通量虚拟筛选设计。化学结构通过Chemdraw绘制,并导出为mol格式。随后,利用Maestro 13.0中的LigPrep模块对分子进行OLPS4力场优化,模拟生理条件。优化步骤包括能量最小化、固定手性构型,并生成至少5个构象。最终,将优化结果存储为mo12格式,完成小分子配体的准备工作。
对接盒子文件就是一个描述受体结合位点周围的三维空间区域的结构文件,通常由格点坐标和与每个格点相关的能量信息组成。这些信息被用于在对接过程中指导分子在该区域内进行合适的空间搜索,使得小分子配体与受体蛋白有一个合理的结合构象
对接盒子是对接模拟中用于限定小分子搜索空间的关键工具,其作用是精确包裹活性口袋,从而提高对接的准确性。在本研究中,我们使用Maestro 13.0中的受体格点准备模块(Receptor Grid Generation)生成了对接盒子文件。在生成过程中,我们选择了共晶结构中小分子的质心作为活性口袋的中心,以确保对接盒子能够精确覆盖目标区域。基于此设置,我们计算并生成了体积为10 × 10 × 10 Å3的对接盒子文件。这一配置不仅有效限定了小分子的搜索空间,还提高了对接模拟的准确性,确保小分子与受体之间的相互作用能够被精准捕捉。
分子对接是一种广泛应用于虚拟筛选的建模工具,旨在预测配体与靶标蛋白之间的结合模式与结构
分子动力学模拟是一种通过计算机模拟方法研究物质分子在特定条件下的运动和相互作用的技术。该方法基于经典力学,通过数值计算解决原子或分子随时间变化的运动轨迹
在本研究中,我们使用了Maestro软件的Desmond模块进行分子动力学模拟,并在Linux系统上进行计算。首先,通过Desmond的SystemBuilder模块构建周期性溶剂模型,力场为OPLS3e,水溶剂模型为SPC,周期性盒子设置为正交立方体,溶剂与蛋白质之间的边界距离设定为10 Å。为了保证体系的电中性,加入Na+和Cl-离子。
使用Minimization模块对体系进行了优化,优化过程的参数设置为最大迭代次数2000次,能量收敛值为1 kcal/mol。优化后的体系在NPT系综下进行分子动力学模拟。模拟过程中,温度控制使用Nose-Hoover热浴,压力使用Martyna-Tobias-Klein压浴(1 atm)。模拟的总时长为100 ns,每0.1 ns输出一次能量和坐标信息。
模拟结束后,我们得到了100 ns的分子动力学轨迹,并使用Simulation Interaction Diagram模块对轨迹进行了分析。通过计算RMSD (均方根偏差)来评估蛋白质–配体复合物的稳定性,同时计算RMSF (均方根波动)、蛋白–配体接触等数据,以观察蛋白结构的波动性。
此过程的结果为进一步分析和筛选潜在的高活性化合物提供了可靠的模拟依据。
在完成虚拟筛选后,我们计划对筛选出的候选分子进行详细的ADMET (吸收、分布、代谢、排泄和毒性)评估以及Lipinski规则
我们针对内部化合物库(包含303,171个分子)执行了全面的ADMET预测,成功筛选出了286,373个分子。随后,在HTVS (高通量虚拟筛选)阶段,我们进一步缩减了候选分子范围,获得了222,122个分子。为了进一步优化筛选结果,我们选取了HTVS阶段得分前10%的分子,即22,292个分子,进行了更为精确的SP计算。经过这一轮的精细化筛选,我们又从中挑选了前10%的分子,共计2,256个,进行了MM-GBSA计算,以评估其结合能。最终,从这些分子中筛选出209个具有较高潜在活性的化合物。结合所有筛选数据,我们进行了手动筛选,挑选出若干具有高潜力的化合物用于活性测试。筛选结果如
Compound |
Structure |
Weight |
Docking score |
Interacting residues |
1 |
277.2788 |
−8.829 |
TYR666 TYR662 PHE357 GLU206 GLU205 |
|
2 |
369.5010 |
−9.580 |
TYR666 PHE357 GLU206 GLU205 |
|
3 |
305.4400 |
−9.673 |
TYR666 TYR662 GLU206 GLU205 |
|
4 |
352.3980 |
−8.761 |
TYR666 TYR662 PHE357 GLU206 GLU205 ARG125 |
|
5 |
295.4300 |
−10.217 |
TYR666 GLU206 GLU205 |
|
6 |
326.8144 |
−8.556 |
TYR666 TYR662 PHE357 |
对排名前五的化合物与DPP4蛋白的结合模式进行分析,结果表明,这些化合物与DPP4蛋白的主要相互作用包括氢键、π-π堆积相互作用和盐桥作用(
化合物1:与DPP4蛋白的结合主要通过与五个氨基酸残基的相互作用来稳定。具体而言,化合物1通过与残基TYR666和PHE357形成π-π堆积相互作用,并与TYR662、GLU206和GLU205形成氢键。同时,GLU206与化合物1之间形成了盐桥。
化合物2:与DPP4蛋白的结合通过与四个氨基酸残基的相互作用来稳定。化合物2与残基TYR666和PHE357形成π-π堆积相互作用,并与GLU206和GLU205形成氢键。同时,GLU206和GLU205也与化合物2形成盐桥。
化合物3:与DPP4蛋白的结合主要通过与四个氨基酸残基的相互作用来稳定。化合物3通过与TYR666和TYR662形成π-π堆积相互作用,并与GLU206形成氢键。此外,GLU206和GLU205也与化合物3形成盐桥。
化合物4:与DPP4蛋白的结合通过与六个氨基酸残基的相互作用来稳定。化合物4与TYR666、TYR662和PHE357形成了π-π堆积相互作用,并与GLU206形成氢键。同时,GLU205与化合物4形成盐桥,并且ARG125与化合物4之间形成了π-cation相互作用。
化合物5:与DPP4蛋白的结合通过与三个氨基酸残基的相互作用来稳定。化合物5与TYR666形成π-π堆积相互作用,并与GLU206和GLU205形成氢键,同时,GLU206和GLU205也与化合物5形成盐桥。
化合物6:与DPP4蛋白的结合通过与三个氨基酸残基的相互作用来稳定。化合物6与PHE357形成π-π堆积相互作用,并与TYR662形成氢键,并且TYR666与化合物6之间形成了π-cation相互作用。
这些结果表明,化合物与DPP4蛋白的结合主要通过氢键、π-π堆积相互作用和盐桥等非共价作用力来稳定,尤其是GLU206和GLU205残基在多个化合物的结合过程中起到了关键作用。
MD模拟的结果有力地证实了蛋白质与小分子抑制剂之间形成了稳定的结合。在
图2. 化合物1-6 (A-F)蛋白质–配体根均方偏差
进一步的均方根波动(RMSF)分析,如
图3. 化合物1-6 (A-F)蛋白质均方根波动
在分子动力学(MD)模拟的结果中,通过
图4. 化合物1-6 (A-F)蛋白–配体相互作用
图5. 50 ns内化合物1-6 (A-F)蛋白–配体相互作用
通过分析
本研究通过综合运用计算机辅助药物设计(CADD)技术中的基于结构的药物设计(SBDD)策略,成功从庞大的内部化合物数据库中筛选并鉴定出了三个具有显著潜力的DPP4 (二肽基肽酶4)抑制剂分子。为了实现这一目标,我们首先采用了高通量虚拟筛选(HTVS)技术,它能够迅速缩小候选分子的范围,显著提高了筛选效率。在高通量筛选的基础上,我们通过精确的分子对接技术进一步评估了这些候选分子与DPP4蛋白活性位点的结合能力和亲和力。通过对分子对接结果的深入分析,我们确认了这三个分子在与目标蛋白结合时表现出高度的契合性和较强的结合亲和力。进一步地,我们应用分子动力学模拟技术,模拟了这些分子与DPP4蛋白在动态环境中的相互作用。模拟结果为我们提供了关于这些分子与目标蛋白结合稳定性和持久性的关键见解,验证了它们在实际生物环境中可能的稳定性和药理活性。
经过这一系列严谨且系统的筛选流程,我们最终确认了这三个DPP4抑制剂分子。它们在理论计算中展现出优异的结合特性,并且与目标蛋白具有高度契合性,表明它们具有潜在的生物活性和药物开发前景。研究结果为后续的实验验证、结构优化和药物开发研究奠定了坚实的基础,并为糖尿病及相关代谢性疾病的治疗提供了新的解决方案。
*通讯作者。