Nat. Commun. | 識別藥物靶點(diǎn)的貝葉斯機(jī)器學(xué)習(xí)方法

      網(wǎng)友投稿 997 2025-04-02

      1

      研究背景

      藥物研發(fā)是一個耗費(fèi)大量金錢和時間的過程,從實(shí)驗(yàn)室中的小分子到獲得批準(zhǔn)的藥物平均需要花費(fèi)15年時間和26億美元,其中的瓶頸之一是確證候選分子的靶標(biāo)。通過計(jì)算的方法能夠大大的減少藥物靶點(diǎn)識別所需的工作和資源。傳統(tǒng)的識別靶標(biāo)的方法需要大量的已知信息以及較高的計(jì)算能力等。除了傳統(tǒng)的方法,也有新的計(jì)算方法使用治療后基因表達(dá)變化和副作用等數(shù)據(jù)來預(yù)測藥物的新機(jī)制。然而,大多數(shù)的方法所用到的數(shù)據(jù)類型過于單一,容易受到數(shù)據(jù)特定噪聲的影響,實(shí)用性和準(zhǔn)確性也有待提高。最近,有越來越多的方法試圖在基于相似性或數(shù)據(jù)驅(qū)動的框架內(nèi)集成多種不同的數(shù)據(jù)類型。然而,這些方法存在一些局限性:

      使用給定化合物的已知靶標(biāo)作為輸入,限制了對未知化合物的預(yù)測能力。

      經(jīng)常使用基于基因的相似性特征,這種方法傾向于發(fā)現(xiàn)與已知藥物靶點(diǎn)關(guān)聯(lián)緊密的基因,不利于發(fā)現(xiàn)不同類型的靶標(biāo)(基因)。

      除化合物結(jié)構(gòu)之外,大多數(shù)模型僅集成一個或兩個數(shù)據(jù)類型。

      許多依賴復(fù)雜數(shù)據(jù)類型的集成算法很難適應(yīng)新的信息源。

      大多數(shù)人只在少數(shù)藥物上評估了他們的方法(<500鐘),沒有經(jīng)過廣泛的實(shí)驗(yàn)驗(yàn)證。

      圖1 聯(lián)合多種數(shù)據(jù)類型預(yù)測共享靶標(biāo)藥物對的方法原理圖

      2

      方法

      2.1

      數(shù)據(jù)集

      生長抑制數(shù)據(jù)

      文中使用來自National Cancer Institute's Development Therapeutics Program(NCI-DTP)的生長抑制數(shù)據(jù)。從cellminer.com(1.6.2版本)下載。

      基因表達(dá)數(shù)據(jù)

      所有治療后基因表達(dá)數(shù)據(jù)均來自Broad Connectivity Map (CMap)項(xiàng)目。從Broad CMap Portal下載。

      不良反應(yīng)

      副作用從SIDER數(shù)據(jù)庫下載。使用MedDRA(16.1版)字典對每種副作用進(jìn)行分類。

      生物測定/化學(xué)結(jié)構(gòu)

      所有生物測定結(jié)果和化學(xué)結(jié)構(gòu)均從PubChem下載,并根據(jù)每個小分子的PubChem Compound Identification(CID)進(jìn)行組織。

      已知藥物靶標(biāo)

      從DrugBank數(shù)據(jù)庫中提取所有已知藥物靶標(biāo)(4.1版)。

      2.2

      計(jì)算和實(shí)驗(yàn)

      計(jì)算相似性分?jǐn)?shù)

      生長抑制數(shù)據(jù),對每一對藥物計(jì)算pearson相關(guān)系數(shù);基因表達(dá)和化學(xué)基因組適應(yīng)度評分,使用pearson相關(guān)系數(shù)來衡量兩種藥物的相似程度;生物測定,根據(jù)Pubchem提供的數(shù)據(jù),所有生物測定均分為陽性或陰性。jaccard指數(shù)是根據(jù)兩種藥物共有的陽性化驗(yàn)次數(shù)計(jì)算出來的。要求每個藥物對至少在一個類似的試驗(yàn)中進(jìn)行了測試,以計(jì)算相似度評分;化學(xué)結(jié)構(gòu),為每個藥物提取同分異構(gòu)的SMILES,并使用atom-pair方法計(jì)算了兩種化合物之間基于DICE系數(shù)的結(jié)構(gòu)相似性;不良反應(yīng),使用SIDER2數(shù)據(jù)庫,提取出每種藥物的“preferred term”副作用。然后計(jì)算每個藥物對共有的副作用的jaccard指數(shù)。

      計(jì)算相似類型之間的相關(guān)性

      圖2 密度圖顯示了不同的相似度評分如何相互關(guān)聯(lián),用較暗的區(qū)域表示較高的密度。

      總似然比

      對于每個數(shù)據(jù)類型,BANDIT計(jì)算一個似然比,總似然比(TLR)可以表示為個各個似然比的乘積。總似然比(TLR)與兩種藥物在給定的信息源中共享給定靶標(biāo)的幾率成正比;

      Nat. Commun. | 識別藥物靶點(diǎn)的貝葉斯機(jī)器學(xué)習(xí)方法

      測試已知靶標(biāo)的藥物

      利用五折交叉驗(yàn)證生成ROC曲線并計(jì)算AUROC的值。結(jié)果表明BANDIT是針對藥物開發(fā)的新穎且有效的篩選和靶標(biāo)預(yù)測平臺,有望對當(dāng)前的工作產(chǎn)生積極影響。

      與現(xiàn)有的藥物靶點(diǎn)預(yù)測方法

      對比幾個現(xiàn)有的藥物靶點(diǎn)預(yù)測研究,進(jìn)一步證明了BANDIT的性能更優(yōu)(具體對比結(jié)果可見原文Supplementary Table 4)。

      復(fù)制激酶實(shí)驗(yàn)性篩選

      首先在Peterson等人的數(shù)據(jù)庫中分離出被分為BANDIT孤兒小分子的激酶。對于每種孤兒激酶抑制劑,使用BANDIT來預(yù)測共享的靶標(biāo)藥物;共享靶標(biāo)藥物的每個已知激酶靶標(biāo)被歸類為孤兒抑制劑的一個潛在激酶靶標(biāo)。

      圖3 BANDIT可以復(fù)制實(shí)驗(yàn)激酶實(shí)驗(yàn)性篩選的結(jié)果

      特定靶標(biāo)投票

      測試到的每個孤兒小分子的投票最高的靶點(diǎn)為預(yù)測的一個新的特異性靶點(diǎn);

      圖4 用于預(yù)測特定靶點(diǎn)交互的BANDIT投票原理圖

      新型抗微管小分子的鑒定

      圖5 基于作用機(jī)制的已知的微管抑制劑簇

      藥物機(jī)制聚類

      對于每個藥物對,將它們之間的TLR轉(zhuǎn)換為用于估計(jì)任何兩種藥物之間的親密度的距離度量。接下來,分離了所有已知至少存在于三個BANDIT數(shù)據(jù)集中抑制微管的藥物。以BANDIT距離度量為輸入,使用譜系聚類R方法和基于平均值的聚類方法創(chuàng)建了所有已知MTIs的層次聚類;

      藥物領(lǐng)域集群

      使用與創(chuàng)建MTI網(wǎng)絡(luò)相同的協(xié)議,創(chuàng)建了一個包含所有已知靶點(diǎn)的藥物網(wǎng)絡(luò),每個邊緣代表一個預(yù)測的共享靶點(diǎn)交互作用,以及與交互作用強(qiáng)度相對應(yīng)的邊緣權(quán)重。使用KEGG藥物數(shù)據(jù)庫和DrugBank,根據(jù)ATC代碼對每種藥物進(jìn)行了注釋,并對每種藥物進(jìn)行了相應(yīng)的著色。特別分離出三個集群,分別為:(1)帕金森氏癥藥物的β受體阻滯劑,(2)抗逆轉(zhuǎn)錄病毒藥和他汀類藥物,以及(3)阿片類藥物和微管抑制劑。

      除此之外還利用生物實(shí)驗(yàn)進(jìn)行了微管成像/測試,量化微管的影響,對耐藥細(xì)胞系的處理,ONC201-DRD2相互作用的表征。

      3

      結(jié)果

      綜合多種類型數(shù)據(jù)的方法能夠提高預(yù)測的準(zhǔn)確性

      圖6 不同數(shù)據(jù)類型集的AUROC對比圖

      BANDIT精確地預(yù)測了特定靶標(biāo)的相互作用

      圖7 BANDIT獲得特定靶標(biāo)的兩種建議的操作方案示意圖

      新型微管靶向化合物的發(fā)現(xiàn)

      4

      總結(jié)

      參考資料

      Madhukar N S, Khade P K, Huang L, et al. A Bayesian machine learning approach for drug target identification using diverse data types[J]. Nature communications, 2019, 10(1): 1-14.

      NAT 機(jī)器學(xué)習(xí)

      版權(quán)聲明:本文內(nèi)容由網(wǎng)絡(luò)用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔(dān)相應(yīng)法律責(zé)任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實(shí)的內(nèi)容,請聯(lián)系我們jiasou666@gmail.com 處理,核實(shí)后本網(wǎng)站將在24小時內(nèi)刪除侵權(quán)內(nèi)容。

      版權(quán)聲明:本文內(nèi)容由網(wǎng)絡(luò)用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔(dān)相應(yīng)法律責(zé)任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實(shí)的內(nèi)容,請聯(lián)系我們jiasou666@gmail.com 處理,核實(shí)后本網(wǎng)站將在24小時內(nèi)刪除侵權(quán)內(nèi)容。

      上一篇:wps表格的文本格式怎么調(diào)(wps表格怎么調(diào)整格式)
      下一篇:怎么查找我已經(jīng)打了的字,太多的(怎么查自己打了多少字)
      相關(guān)文章
      中文字幕在亚洲第一在线| 亚洲一区影音先锋色资源| 一本色道久久综合亚洲精品| 亚洲精品成人图区| 亚洲成a人片在线播放| 亚洲av无码专区在线电影天堂 | 亚洲国产精品第一区二区三区| 国产亚洲中文日本不卡二区| 亚洲特级aaaaaa毛片| 久久国产亚洲精品无码| 亚洲网站视频在线观看| 91亚洲一区二区在线观看不卡 | 久久精品亚洲综合一品| 亚洲Av无码精品色午夜| 亚洲av无码专区国产乱码在线观看 | 亚洲高清国产拍精品青青草原 | 亚洲国产人成网站在线电影动漫| 亚洲成人精品久久| 亚洲精品美女视频| 亚洲中文无码av永久| 2020国产精品亚洲综合网 | 亚洲国产精品VA在线看黑人| 亚洲va无码va在线va天堂| 亚洲成AV人片在线观看| 亚洲国产精品乱码一区二区| 亚洲国产精品一区| 亚洲啪啪免费视频| 亚洲女子高潮不断爆白浆| 午夜亚洲国产理论片二级港台二级| 噜噜噜亚洲色成人网站| 亚洲色偷拍区另类无码专区| 亚洲熟妇无码乱子AV电影| 久久精品国产亚洲AV麻豆不卡| 在线免费观看亚洲| 亚洲情A成黄在线观看动漫软件| 亚洲欧美成aⅴ人在线观看| 亚洲国产av无码精品| 亚洲国产日韩在线视频| 久久精品国产亚洲精品2020| 亚洲an日韩专区在线| 亚洲AV无码男人的天堂|