药物优化算法-PriorCD

该R包将药物功能相似网络和全局网络传播算法相结合,实现了对感兴趣的癌症治疗药物优先级的预测方法。此外,用户可以验证优先排序结果,并可视化得到的药物网络结构。

这个算法由哈尔滨医科大学生物信息科学与技术学院的韩俊伟老师团队研发,韩俊伟老师主要从事复杂疾病相关的基因、药物、代谢分析、代谢网络重构、致病代谢通路识别、全基因组生物学通路网络分析及平台开发等方面的研究。

构建算法的主要数据有:

(1)药物活性数据:60个NCI-60的癌细胞系的2000种药物的药效数据,对药效指标最大半数生长抑制浓度(GI50)进行处理,-log10(GI50)越大说明该细胞徐对药物越敏感。选取3645个敏感性高的药物进行分析。

(2)表达数据:NCI-60癌细胞系中19 794个mRNA表达数据,319个microRNA表达数据。

算法流程(流程图如下):

(1)基于KEGG的250个基因集,使用单样本基因集富集分析(ssGSEA)算法,将mRNA表达数据转化为通路活性谱。根据mRNA-microRNA互作数据,将mRNA的通路转化为microRNA的通路,将microRNA的靶mRNA映射到mRNA通路中,通过超几何检验计算microRNA与mRNA通路关联的pvalue,p< 0.05认为是microRNA通路,为microRNA通路活性谱。

(2)将NCI-60癌细胞系的药物活性数据和通路活性数据进行皮尔森相关,为通路-药物相关性矩阵。对这些药物之间基于通路活性数据进行皮尔森相关。对这些药物的相关性结果构建网络,节点为药物,边为功能相似显著性,最终这个网络为药物-药物功能相似性网络。对于每个药物,选取相关系数 ≥ 0.7,FDR ≤ 0.05, 相关系数top 0.05% 的药物,为其显著相似的药物。然后合并基于mRNA和microRNA通路的药物功能相似网络。

(3)对药物相似性网络使用重启动随机游走算法(RWR),根据稳态概率向量pt中的值对药物进行排序,pt作为药物优先级评分

(4)统计学显著性分析和方法评估:与随机网络比较评估药物相似性网络显著性,并且对于针对特定癌症的任意一组已批准的治疗药物,执行留一法交叉验证(LOOCV)测试;绘制ROC曲线,根据区分鉴定结果的药物优先排序得分,计算AUROC来衡量该方法的性能。

R包介绍:

install.packages("PriorCD") #安装包library(PriorCD)

1. 评估药物相似性:Drsim

整合NCI-60癌细胞的通路活性与药物活性相结合,评估药物的相似性,构建药物功能相似网络。Drsim函数用于构造药物相似性的二元邻接矩阵,其中1表示药物之间具有强相似性,0表示药物之间具有弱相似性。

用法

drsim(r.mat, p.mat, top = 0.005, r.thres = 0.7, p.thres = 0.01)

实例

r <- getData("drug.r")fdr <- getData("drug.fdr")

#getData获取该包中的示例数据

#例子数据包括:mRNA_path, microRNA_path, drug.ic50, drug.r, drug.fdr, drug.info, drug.edgelist, breast_cancer以及 brc_candidates.

 

m <- drsim(r, fdr, top = 0.5)

#r(即drug.r)为输入的药物与药物的相关性矩阵

#fdr(即drug.fdr)为药物与药物的相关性显著性值(p值或fdr)的输入矩阵

#top为度量药物相似度的值。这是一个相关性阈值,top=0.005(默认值)表示每行药物的top 0.005被认为具有很强的相似性。

#r.thres度量药物相似度的值。这是一个相关性阈值,r.thres=0.7(默认值)表示当r大于0.7时,药物之间的相似性很强。

#p.thres测量药物相似度显著性水平的值。p.thres=0.01(默认值)表示当p < 0.01时,药物之间的相似性显著。

输出:药物相似度的二元邻接矩阵

2. 生成药物药物相似网络getDDN

获得药物功能相似度矩阵后,可构建药物相似性网络,在网络上进行全局网络传播(RWR)算法,对候选对象进行优先级排序。getDDN函数可浏览网络结构。

用法

getDDN(drug.el, r.set, candidates, file = “network.html”)

实例

e <- getData("drug.edgelist")brc <- getData("breast_cancer")candidates <- getData("brc_candidates")

getDDN(e, brc, candidates,file = "F:/network.html")

#e(即drug.edgelist)药物的边矩阵,每一行定义一个边。列表中的数字表示药物的NSC-ID。

#brc(即breast_cancer)你需要优化的药物 NSC-ID集合(这里是乳腺癌用药)

(NSC-ID是NCI-60数据库中药物ID)

#candidates(即brc_candidates)一组已经获批的药物 NSC-ID集合(这里是乳腺癌用药)

#文件= ” network.html”(默认),文件名和保存HTML网页的路径,目前只支持.html格式

输出:F盘中network.html文件

 

 

 

3. 绘制ROC曲线getROC

获得药物功能相似度矩阵后,可构建药物相似性网络,在网络上进行全局网络传播(RWR)算法,对候选对象进行优先级排序。getROC函数可绘制ROC曲线。

用法

getROC(drug.el, p0, gamma = 0.7, filename = “ROC.pdf”)

实例

e <- getData("drug.edgelist")brc <- getData("breast_cancer")getROC(e, brc,filename = "F:/ROC.pdf")

 

#p0所研究的癌型的获批药物的NSC-ID

#gamma=0.7(默认),表示随机游走时失败的概率。这个值的范围是(0,1)。

#filename = “ROC.pdf”(默认)。文件名和保存PDF的路径。文件类型由路径中的扩展名决定,目前只支持.pdf

输出:F盘中ROC.pdf文件

 

4. 生成药物优化结果prior

用法

prior(drug.el, p0, gamma = 0.7, times = 100)

实例

e <- getData("drug.edgelist")brc <- getData("breast_cancer")result <- prior(e, brc,time=20)

#gamma=0.7(默认)

#time=100(默认值),是获取p值时的循环次数。

输出:

药物优先排序的详细信息,包括药物的NSC-id、名称、优先排序得分、p值、FDR、状态和MOA(作用机制)。

小编总结:

当我们进行某癌型的研究的时候,除了基于该癌型的一些分型、标志物识别等方面的研究,也可以通过这个R包加入一些药物方面的结论,这将给你的工作加分不少,当然这个R包还是主要用于药物重置(老药新用),所以可以基于这个方法可预测一些癌型的新的用药方法,或者对于你研究的或者预测的药物使用方法,用该R包进行验证。

文章引用:

Di J, Zheng B, Kong Q, et al. Prioritization of candidate cancer drugs based on a drug functional similarity network constructed by integrating pathway activities and drug activities. Mol Oncol. 2019;13(10):2259–2277. doi:10.1002/1878-0261.12564

生物信息学

一步确定你的基因集在两个状态中是否显著的一致差异

2020-8-28 4:30:11

生物信息学

pathwayPCA:基于主成分分析的通路分析

2020-8-28 4:57:41

加入Q群
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索