Nat. Commun | 基于網(wǎng)絡(luò)的藥物組合預(yù)測(cè)
本期介紹2019年3月發(fā)表在Nature Communications的研究工作,該工作由哈佛醫(yī)學(xué)院、東北大學(xué)和Dana-Farber癌癥研究所等機(jī)構(gòu)的研究人員完成。藥物組合能夠增加治療功效和降低毒性,在治療多種復(fù)雜疾病中起重要作用。然而,識(shí)別和驗(yàn)證有效組合的能力受到藥物組合爆炸增長(zhǎng)的限制,由大量藥物對(duì)和劑量組合驅(qū)動(dòng)。本文提出了一種基于網(wǎng)絡(luò)的方法來識(shí)別特定疾病的臨床有效藥物組合。

1.?背景簡(jiǎn)介
組合治療使用多種藥物以改善臨床效果相較于單一療法具有多個(gè)優(yōu)點(diǎn):它提供了更高的功效或通過降低個(gè)體劑量,它可以減少不良反應(yīng)的風(fēng)險(xiǎn)。因此,聯(lián)合療法被廣泛應(yīng)用于多種復(fù)雜疾病的治療中,從高血壓到癌癥和傳染病。然而,同時(shí)提供高臨床療效和低毒性的藥物組合的系統(tǒng)鑒定通常由直覺和經(jīng)驗(yàn)而不是既定原則驅(qū)動(dòng)。因此,迫切需要新的方法來促進(jìn)多組分療法的發(fā)現(xiàn)。
一種方法是成對(duì)藥物組合的系統(tǒng)性高通量測(cè)試,然而,它面臨著一個(gè)組合挑戰(zhàn):對(duì)于1000種FDA批準(zhǔn)的藥物,有499,500種可能的成對(duì)組合,應(yīng)該在大約3000次測(cè)試人類疾病和多劑量的組合。因此,我們甚至不能粗略地探索具有潛在積極臨床結(jié)果的大量可能組合。可以肯定,一些基于機(jī)器學(xué)習(xí)的“黑盒子”模式已經(jīng)發(fā)展到預(yù)測(cè)藥物的組合,提供精度略有增長(zhǎng)的隨機(jī)猜測(cè)。然而,我們?nèi)狈︻A(yù)測(cè)的機(jī)制驅(qū)動(dòng)的,基于網(wǎng)絡(luò)醫(yī)學(xué)的方法來預(yù)測(cè)有效的藥物組合。
基于網(wǎng)絡(luò)的方法已經(jīng)提供了一個(gè)有前途的框架,以確定新的見解,以加速藥物發(fā)現(xiàn),幫助量化疾病和藥物間的關(guān)系。這些方法學(xué)的進(jìn)步提出了超越“單藥、單靶標(biāo)”范式的可能性,并探索了旨在同時(shí)調(diào)節(jié)同一疾病模塊中的多種疾病蛋白質(zhì)所提供的“多種藥物、多種靶標(biāo)”的可能性,同時(shí)最小化毒性型材。在這項(xiàng)研究中,我們量化了人類蛋白質(zhì)-蛋白質(zhì)相互作用組中藥物靶標(biāo)和疾病蛋白質(zhì)之間的關(guān)系,從而形成了一種合理的,基于網(wǎng)絡(luò)的藥物組合設(shè)計(jì)策略。
2. 方法
2.1 構(gòu)建人類蛋白質(zhì)-蛋白質(zhì)相互作用組
組建了15個(gè)常用數(shù)據(jù)庫(kù),重點(diǎn)關(guān)注高品質(zhì)蛋白質(zhì)-蛋白質(zhì)相互作用(PPI)和五種證據(jù):(1)通過高通量酵母雙雜交(Y2H)篩選系統(tǒng)測(cè)試的二元,物理PPI,結(jié)合兩種公開測(cè)試的二元PPIs高質(zhì)量的Y2H數(shù)據(jù)集和一個(gè)未發(fā)表的數(shù)據(jù)集; (2)文獻(xiàn)策劃的PPIs通過親和純化,親和純化質(zhì)譜(AP-MS),Y2H和文獻(xiàn)衍生的低通量實(shí)驗(yàn)鑒定; (3)來自蛋白質(zhì)三維結(jié)構(gòu)的二元,物理PPI; (4)通過文獻(xiàn)衍生的低通量和高通量實(shí)驗(yàn)的激酶-底物相互作用;(5)通過文獻(xiàn)衍生的低通量實(shí)驗(yàn)發(fā)送信號(hào)網(wǎng)絡(luò)。基于GeneCards及其Entrez ID將蛋白質(zhì)編碼基因定位到其官方基因符號(hào)。計(jì)算推斷的根植于進(jìn)化分析,基因表達(dá)數(shù)據(jù)和代謝關(guān)聯(lián)的相互作用被排除在外。
2.2 建立藥物-靶標(biāo)網(wǎng)絡(luò)
從6種常用數(shù)據(jù)(DrugBank、PharmGKB、ChEMBL、TTD、BindingDB、IUPHAR/BPS)收集了FDA批準(zhǔn)或臨床研究藥物的高質(zhì)量藥物-靶標(biāo)相互作用,并使用報(bào)告的結(jié)合親和力數(shù)據(jù)定義了物理藥物-靶標(biāo)相互作用:抑制常數(shù)/效力(K i)、解離常數(shù)(K d)、中值有效濃度(EC50)或中值抑制濃度(IC 50)≤10μM。從這些數(shù)據(jù)庫(kù)中提取與藥物相關(guān)的生物活性數(shù)據(jù)后,僅保留符合以下四個(gè)標(biāo)準(zhǔn)的藥物-靶標(biāo)相互作用:(i)結(jié)合親和力,包括K i,K d,IC 50或EC 50,每個(gè)≤10μM;(ii)蛋白質(zhì)可以用獨(dú)特的UniProt登錄號(hào)表示;(iii)在UniProt數(shù)據(jù)庫(kù)中將蛋白質(zhì)標(biāo)記為“已審核”;(iv)蛋白質(zhì)來自智人(Homo sapiens)。
2.3 收集最佳的配對(duì)藥物組合
本研究中通過匯總來自多個(gè)數(shù)據(jù)源的臨床數(shù)據(jù)來關(guān)注成對(duì)藥物組合。在組合每種藥物需要具有實(shí)驗(yàn)證實(shí)靶標(biāo)信息。每種藥物的化合物名稱由MeSH和UMLS詞匯表標(biāo)準(zhǔn)化,并進(jìn)一步從DrugBank數(shù)據(jù)庫(kù)轉(zhuǎn)換為DrugBank ID,刪除重復(fù)的藥物對(duì)。
2.4 收集不良的藥物-藥物相互作用
匯編了來自DrugBank數(shù)據(jù)庫(kù)的臨床報(bào)告的藥物不良反應(yīng)(DDIs)數(shù)據(jù)。這里專注于藥物相互作用,其中每種藥物都有經(jīng)過實(shí)驗(yàn)驗(yàn)證的靶標(biāo)信息。每種藥物的化合物名稱由MeSH和UMLS詞匯表標(biāo)準(zhǔn)化,并進(jìn)一步從DrugBank數(shù)據(jù)庫(kù)轉(zhuǎn)換至DrugBank ID 。
2.4 藥物對(duì)的化學(xué)相似性分析
從DrugBank數(shù)據(jù)庫(kù)下載化學(xué)結(jié)構(gòu)信息(SMILES格式),使用Open Babel計(jì)算了每種藥物的MACCS指紋圖譜,并計(jì)算藥物-藥物對(duì)的Tanimoto系數(shù)(T)。
2.5 蛋白質(zhì)序列相似性分析
從UniProt數(shù)據(jù)庫(kù)下載了Homo sapiens中藥物靶標(biāo)(蛋白質(zhì))的經(jīng)典蛋白質(zhì)序列。使用Smith-Waterman算法計(jì)算了兩個(gè)藥物靶標(biāo)的蛋白質(zhì)序列相似性。Smith-Waterman算法通過比較所有可能長(zhǎng)度的片段并優(yōu)化相似性度量來執(zhí)行局部序列比對(duì),以確定藥物靶標(biāo)的兩串蛋白質(zhì)規(guī)范序列之間的相似區(qū)域。
2.6 基因共表達(dá)分析
從GTEx V6版本下載了32個(gè)組織的RNA-seq數(shù)據(jù)(RPKM值)。對(duì)于每種組織將超過80%樣本中RPKM≥1的基因視為組織表達(dá)基因。為了測(cè)量與藥物治療疾病相關(guān)的藥物靶標(biāo)編碼基因的共表達(dá)程度,研究人員計(jì)算了Pearson相關(guān)系數(shù)(PCC(a ,b)對(duì)于跨越32個(gè)人組織的每對(duì)藥物靶標(biāo)編碼基因a和b,通過F-統(tǒng)計(jì)學(xué)得到相應(yīng)的P值。為了降低共表達(dá)分析的噪音將PCC(a,b)定位到人蛋白質(zhì)-蛋白質(zhì)相互作用組網(wǎng)絡(luò)中以構(gòu)建共表達(dá)的蛋白質(zhì)-蛋白質(zhì)相互作用組網(wǎng)絡(luò)。通過對(duì)所有靶標(biāo)對(duì)a和b上平均PCC(a,b)來計(jì)算與兩種藥物A和B相關(guān)的藥物靶標(biāo)編碼基因的共表達(dá)相似性。
2.7 GO相似性分析
所有藥物靶標(biāo)編碼基因的GO注釋均從http://www.geneontology.org/網(wǎng)站下載。研究人員使用了三種類型的實(shí)驗(yàn)驗(yàn)證或文獻(xiàn)衍生的證據(jù):生物過程(BP)、分子函數(shù)(MF)和細(xì)胞成分(CC),排除了計(jì)算推斷的注釋。GO注釋的語(yǔ)義比較提供了計(jì)算基因和基因產(chǎn)物之間相似性的定量方法。
2.8 臨床相似性分析
來自藥物解剖治療化學(xué)(ATC)分類系統(tǒng)代碼的藥物對(duì)的臨床相似性通常用于預(yù)測(cè)新的藥物靶標(biāo)。本研究中使用的所有FDA批準(zhǔn)藥物的ATC代碼均從DrugBank數(shù)據(jù)庫(kù)下載。藥物A和B的第k級(jí)藥物臨床相似性(Sk)通過如下的ATC代碼定義。
2.9 與靶標(biāo)集重疊方法的比較
將引入的基于網(wǎng)絡(luò)的藥物分離與僅基于共享靶標(biāo)的重疊測(cè)量進(jìn)行了比較,而不使用PPI網(wǎng)絡(luò)。研究人員檢查了兩種量化藥物A和藥物B的靶標(biāo)組之間重疊的方法。
2.10 基于網(wǎng)絡(luò)的藥物分離
基于網(wǎng)絡(luò)的藥物對(duì)A和B的分離通過Eq。研究人員考慮兩個(gè)藥物靶標(biāo)組之間的路徑長(zhǎng)度的四個(gè)其他不同距離測(cè)量:(a)最接近的測(cè)量,表示藥物A的靶標(biāo)與藥物A的最近靶標(biāo)之間的平均最短路徑長(zhǎng)度;(b)最短的措施,代表所有藥物靶標(biāo)的平均最短路徑長(zhǎng)度;(c)核心測(cè)量,通過指數(shù)懲罰降低較長(zhǎng)路徑的權(quán)重;(d)中心指標(biāo),代表藥物靶標(biāo)中具有最大親密度的所有藥物靶標(biāo)中的最短路徑長(zhǎng)度。
2.11 收集疾病關(guān)聯(lián)基因
整合了來自8種不同資源的疾病基因注釋數(shù)據(jù),并排除了重復(fù)的條目。研究人員使用基因Entrez ID、染色體位置和來自NCBI數(shù)據(jù)庫(kù)的官方基因符號(hào)來注釋所有蛋白質(zhì)編碼基因。每個(gè)心血管事件都由MeSH和UMLS詞匯表定義。這項(xiàng)研究中為4種類型的心血管事件構(gòu)建疾病相關(guān)基因:心律失常、心力衰竭、心肌梗塞和高血壓/高血壓。
2.12 效能評(píng)估
使用接受者操作特征曲線(ROC)曲線下的面積(AUC)來評(píng)估網(wǎng)絡(luò)接近度與隨機(jī)藥物對(duì)區(qū)分FDA批準(zhǔn)或?qū)嶒?yàn)驗(yàn)證的成對(duì)組合的程度。研究人員將不同網(wǎng)絡(luò)鄰近度處的真陽(yáng)性率和假陽(yáng)性率計(jì)算為閾值以說明ROC曲線。由于陰性藥物對(duì)通常不會(huì)在文獻(xiàn)或公開數(shù)據(jù)庫(kù)中報(bào)告,研究人員使用所有未知藥物對(duì)作為陰性樣本。此外,選擇相同部分的未知藥物對(duì)作為陽(yáng)性樣本來控制大小不平衡,重復(fù)此過程100次并報(bào)告平均AUC值以比較不同方法的性能。
3. 結(jié)果
3.1 基于網(wǎng)絡(luò)的藥物-藥物關(guān)系的鄰近度量
基于網(wǎng)絡(luò)的藥物組合方法是有效的,研究人員需要確定兩個(gè)藥物-靶標(biāo)模塊之間的拓?fù)潢P(guān)系也反映了生物學(xué)和藥理學(xué)關(guān)系。發(fā)現(xiàn)人體相互作用組中藥物-藥物對(duì)靶點(diǎn)的網(wǎng)絡(luò)接近度與化學(xué)、生物學(xué)功能和臨床相似性相關(guān),優(yōu)于靶標(biāo)-重疊方法。
3.2 藥物-藥物-疾病組合的網(wǎng)絡(luò)配置
為了解這些藥物-藥物-疾病配置中哪一種具有最大的臨床療效,研究人員關(guān)注高血壓和癌癥,這兩種疾病具有大量經(jīng)FDA批準(zhǔn)的成對(duì)藥物組合。研究人員發(fā)現(xiàn)六種藥物-藥物-疾病配置中的四種沒有顯示共同治療癌癥或高血壓的統(tǒng)計(jì)學(xué)顯著趨勢(shì)。換句話說,如果組合中的至少一種藥物不能定位于疾病模塊的附近,則該組合不具有比單一療法更大的治療效果。研究人員第一個(gè)主要發(fā)現(xiàn):對(duì)于具有治療效果的藥物對(duì),兩種藥物靶標(biāo)模塊必須與疾病模塊重疊。這一發(fā)現(xiàn)強(qiáng)調(diào)了在尋找治療上有益的組合時(shí),需要檢查藥物靶標(biāo)和疾病蛋白質(zhì)之間的網(wǎng)絡(luò)關(guān)系。第二個(gè)發(fā)現(xiàn)是重疊暴露,即當(dāng)藥物-靶標(biāo)模塊彼此重疊以及與疾病模塊重疊時(shí),在單一療法中治療疾病沒有統(tǒng)計(jì)學(xué)上顯著的效果。第三個(gè)關(guān)鍵發(fā)現(xiàn)是,只有與疾病模塊具有互補(bǔ)暴露關(guān)系的藥物對(duì)顯示出對(duì)藥物組合療法具有統(tǒng)計(jì)學(xué)顯著效力。
3.3 基于網(wǎng)絡(luò)的高血壓藥物組合揭示
預(yù)測(cè)有效藥物組合促使研究人員使用高血壓數(shù)據(jù)作為驗(yàn)證集用于基于網(wǎng)絡(luò)的新藥物組合預(yù)測(cè)。這種預(yù)測(cè)建立在兩種既定的網(wǎng)絡(luò)方法的基礎(chǔ)上:(a)兩種藥物的靶標(biāo)之間基于網(wǎng)絡(luò)的分離;(b)疾病模塊和兩個(gè)藥物靶標(biāo)模塊之間的網(wǎng)絡(luò)接近度。
4. 討論
聯(lián)合療法在治療復(fù)雜疾病方面提供了廣泛的文獻(xiàn)記載。研究人員證明了基于網(wǎng)絡(luò)的方法識(shí)別藥物-靶標(biāo)模塊相對(duì)于疾病模塊的相對(duì)網(wǎng)絡(luò)配置可以幫助優(yōu)先考慮潛在有效的成對(duì)藥物組合用于高血壓和癌癥。基于組的方法在比較效力和不良相互作用方面提供了治療組合的網(wǎng)絡(luò)級(jí)視圖。研究人員的關(guān)鍵發(fā)現(xiàn)是只有當(dāng)藥物組合遵循與疾病模塊的特定網(wǎng)絡(luò)拓?fù)潢P(guān)系時(shí)才具有治療效果,
研究結(jié)果表明,有效藥物組合的發(fā)現(xiàn)受益于基于網(wǎng)絡(luò)的合理藥物組合篩選,通過人類相互作用組中的網(wǎng)絡(luò)接近來探索藥物-靶標(biāo)模塊和疾病模塊之間的關(guān)系。如果廣泛應(yīng)用開發(fā)的網(wǎng)絡(luò)工具可以幫助開發(fā)針對(duì)多種復(fù)雜疾病的新穎的有效的聯(lián)合療法。
Code availability
https://github.com/emreg00/toolbox
Data availability
https://ccsb.dana-farber.org/interactome-data.html
參考資料
Cheng F, Kovács I A, Barabási A L. Network-based prediction of drug combinations[J]. Nature communications, 2019, 10(1): 1197.
NAT 網(wǎng)絡(luò)
版權(quán)聲明:本文內(nèi)容由網(wǎng)絡(luò)用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔(dān)相應(yīng)法律責(zé)任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實(shí)的內(nèi)容,請(qǐng)聯(lián)系我們jiasou666@gmail.com 處理,核實(shí)后本網(wǎng)站將在24小時(shí)內(nèi)刪除侵權(quán)內(nèi)容。
版權(quán)聲明:本文內(nèi)容由網(wǎng)絡(luò)用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔(dān)相應(yīng)法律責(zé)任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實(shí)的內(nèi)容,請(qǐng)聯(lián)系我們jiasou666@gmail.com 處理,核實(shí)后本網(wǎng)站將在24小時(shí)內(nèi)刪除侵權(quán)內(nèi)容。