引言
药物的吸收、分布、代谢、排泄以及毒性(ADMET)性质预测对于药物有效性和安全性至关重要,药物发现早期进行ADMET性质预测,能大大降低药物研发失败的概率。传统ADMET性质预测是基于分子指纹进行矢量化,近年来图卷积方法在处理分子图方面显示巨大优势。来自斯坦福大学和默克公司的团队针对31个ADMET数据集系统比较了基于图卷积的多任务深度学习方法与传统基于分子指纹的随机森林方法。
图1. 预测ADMET的机器学习方法
图片来源JMC
31个ADMET数据集测试结果
作者将当前的最新算法(GCNN-单任务和多任务PotentialNet)与许多大型制药公司所使用的算法(基于atom pair描述符的随机森林)进行了直接比较。在31种ADMET数据集上进行训练,并比较了随机森林和GCNN的结果在两种不同的交叉验证策略的测试集上的结果。结果显示,多任务深度学习方法预测准确性都有明显提升。
图2. Temporal分割方法结果
图片来源JMC
图3. Temporal结合分子量分割方法结果
图片来源JMC
图4. Prospective分割方法结果
图片来源JMC
模型泛化能力验证
为了进一步确定模型的泛化能力,作者从学术文献中获得了外部测试集数据,包括大环化合物的膜渗透性和log D的数据,选择该数据集是因为作者对高分子量的化合物进行了大量的一致性测量。
图5. 外部测试集泛化能力比较
图片来源JMC
默克公司内部数据预测实战
作者将2018年8月的模型用于预测默克公司两个先导化合物优化项目中,结果展示出了较好的拟合效果。
图6. 使用随机森林模型和PotentialNet模型对默克公司内部数据进行的前瞻性预测
图片来源JMC
总结
临床前的药物研究是药物开发过程的关键阶段,并且也是一个限速阶段。药物疗效和ADMET属性之间的多目标优化可能需要进行一些取舍和折中。准确地预测ADMET属性既可以避免进入不良的药物空间,也有利于更加快捷地获得化合物。本文结果表明,利用图卷积进行深度学习的预测模型大大优于基于分子指纹的RF预测模型。
参考文献
Evan Feinberg, Elizabeth M Joshi, Vijay S. Pande, and Alan Cheng. Improvement in ADMET Prediction with Multitask Deep Featurization. J Med Chem, 2020. DOI: 10.1021/acs.jmedchem.9b02187