PharmKG:专用于生物医药数据挖掘的知识图谱

近日,国际生物信息学重要期刊《Briefings in Bioinformatics》在线发表了“PharmKG: a dedicated knowledge graph benchmark for biomedical datamining”。该论文提出了一种新的基于50,000种不同基因,药物以及疾病之间联系的生物医药知识图谱构建方式。该知识图谱比以往的相关图谱拥有更高的质量和多样性,使其能更好地解决现有知识图谱研究及应用中所面对的技术问题,以期为今后的生物医药研究提供更广泛的研究思路。该论文由德睿智药MindRank AI(德国Xetra上市AI医疗公司的spin off,其AI解决方案曾获得 “欧盟创新药物计划” 认可)团队(团队代表为牛张明,核心成员来自于世界顶尖名校及国际头部药企,包括剑桥大学英国两院院士,AI竞赛世界冠军等)与广州中山大学数据科学与计算机学院杨跃东教授团队联合主导。

PharmKG:专用于生物医药数据挖掘的知识图谱

图 | PharmKG构建、模型、应用框架

生物医药知识图谱(Biomedicalknowledge graphs)已开始在医学实践和研究中发挥关键作用。它有助于简化复杂的生物系统以及病理学过程,使研究人员能更好地理解其中的原理。然而,由于其复杂性和构建的特定要求,此类知识图谱的挖掘和落地仍然充满着挑战。现有的研究常常会遇到诸如数据集稀疏和嘈杂、建模方法不足、评价指标不一致等问题。在这篇论文中,作者构建了一种数据更为全面、质量更高、应用更广泛的生物医药知识图谱系统,即PharmKG。此图谱为多关系属性生物医学知识图谱,由基因、药物以及疾病之间的500,000多个关系组成,并包含29种关系种类以及超过8000种歧义实体。PharmKG中的每个实体都附带从多组数据中提取出来的异构、特定领域的信息,即基因表达、化学结构和疾病词嵌入,同时保留了语义和生物医学特征。

PharmKG:专用于生物医药数据挖掘的知识图谱

图 | PharmKG与其他知识图谱比较

图 | PharmKG关系、实体分布

对于基准,我们提供了9种最先进的知识图谱方法以及一种直观的、基于生物学和图神经网络的新型知识图谱方法,该方法结合了全局网络结构和异构域特征。在基准之上,我们进行了广泛的实验,以使用多种评估指标评估这些知识图谱模型。

图 | 案例研究_PharmKG知识图谱最支持的10条路径

论文链接:https://doi.org/10.1093/bib/bbaa344

关于德睿智药:

德睿智药(MindRank AI)为德国Xetra上市AI医疗公司的spin off中国公司, 办公室位于杭州市江干区。

公司致力于使用AI技术提高药物研发效率与成功率,让更多疾病有药可医,让更多生命重获健康。旗下原创AI解决方案已经获得“欧盟创新药物计划”采纳并成功服务多家企业。团队成员来自世界顶级名校,曾服务于国内外头部药企。

图 | 办公室(500平米办公场地)

欢迎洽谈合作以及咨询工作机会

info@mindrank.ai