为了更好地预测和解读 PPI,并深入挖掘相关分子信息,2023 年 3 月,腾讯 AI Lab 联合香港科技大学、中国科学院大学相关团队,将深度学习领域的层次图学习技术引入 PPI 研究,提出了一种双视图层次图学习模型(HIGH-PPI),模型被证明在 PPI 研究中具有更高的预测准确性和更好的可解释性,研究成果在知名国际学术期刊《自然-通讯》(Nature Communications)发表。
人类蛋白质组学数据分析表明,人体的 PPI 网络涉及约 65 万个相关接触位点。处理这样量级的数据,人工智能的效率要明显高于人类,相关技术引入可以更加高效、准确地帮助人们找出重要信息,促进靶向药物的开发和癌症等疾病的治疗。
图:蛋白质结构和网络结构都对 PPI 的准确预测至关重要。(a)蛋白质序列通常能提供关于 PPI 的细节信息,但它也可能导致 PPI 的预测准确性降低,例如不具备序列相似性的两个蛋白质(SERPINA1、3)可能和同一蛋白质(ELANE)在相同作用界面发生 PPI;(b)包含网络结构信息的 PPI,将蛋白质区分为不同的社区,社区内的蛋白质之间存在密集的交互,而社区之间通常只有微弱的连结;(c)HIGH-PPI 具备双视图层次,顶视图包含网络结构信息,底视图包含蛋白质结构信息。
这项研究是腾讯 AI Lab 对 PPI 层次问题建模的首次尝试,得到了审稿人的高度评价,被视为生物信息领域一项富有潜力的创新贡献,文章也得到了学界的认可,被选入《自然-通讯》年度编辑精选文章合集。
HIGH-PPI 模型是腾讯在 AI+生命科学研究领域的最新研究成果,此前,团队在蛋白质相关的药物发现领域已经取得诸多领先成果,发表多项关于蛋白质结构-功能关系研究的文章,如蛋白质高精度结构模型、疾病分类、蛋白动力学建模以及蛋白质组学数据等。