XCMS | LC/MS and GC/MS Data Analysis
XCMS包的安裝及要求
xcms是基于R語言設(shè)計(jì)的程序包(R package),可以通過Bioconductor進(jìn)行安裝。具體信息請參考https://bioconductor.org/packages/release/bioc/html/xcms.html
安裝Bioconductor
安裝XCMS
安裝數(shù)據(jù)及其他R包
原始數(shù)據(jù)轉(zhuǎn)換
xcms支持xml、mzData、mzXML、mzML、netCDF等數(shù)據(jù)格式,因而在利用xcms進(jìn)行數(shù)據(jù)處理之前,需要對于質(zhì)譜采集的原始數(shù)據(jù)進(jìn)行格式轉(zhuǎn)換,一般可使用ProteoWizard等。
利用XCMS進(jìn)行峰檢測及對齊
(Bioconductor上已有xcms數(shù)據(jù)處理的具體指導(dǎo),參見https://bioconductor.org/packages/release/bioc/vignettes/xcms/inst/doc/xcms.html) 由于xcms3對xcms中的方法名稱進(jìn)行了調(diào)整,對于一致使用xcms進(jìn)行數(shù)據(jù)處理的用戶來說可能會(huì)造成一定的困擾,目前xcms3還繼續(xù)兼容大多數(shù)舊的xcms方法,但隨著程序的進(jìn)一步更新,勢必會(huì)逐步取代過去的方法,因而,大家還是需要盡快熟悉新的方法的使用。在此,為方便大家理解,本文對同一處理分別使用新舊方法進(jìn)行演示。
調(diào)用R包
數(shù)據(jù)導(dǎo)入
利用centWave算法進(jìn)行峰檢測
findChromPeaks是xcms中用于進(jìn)行峰檢測的新方法,輸入值為'OnDiskMSnExp'對象和峰檢測參數(shù)對象,CentWaveParam用以創(chuàng)建'CentWaveParam'對象,該對象設(shè)置使用'centWave'算法進(jìn)行峰檢測時(shí)所需要的參數(shù),其中比較常用的參數(shù)如下:
* ppm -- 峰檢測時(shí)MS1的m/z tolerance,以ppm為單位
* peakwidth -- 長度為2的向量,設(shè)置峰檢測時(shí)峰寬范圍,事實(shí)上該參數(shù)對應(yīng)的每個(gè)峰可以跨越多少個(gè)質(zhì)譜檢測的scan,而非多少秒
* snthresh -- 峰檢測時(shí)信噪比要求
* return.type -- 返回?cái)?shù)據(jù)類型,可以根據(jù)要求返回'XCMSnExp'類數(shù)據(jù)(默認(rèn))、傳統(tǒng)的'xcmsSet'類以及'list'
xcmsSet是xcms中可以用于峰檢測的傳統(tǒng)方法,使用method參數(shù)設(shè)置峰檢測算法,另外根據(jù)不同的峰檢測算法可以設(shè)置該算法需要的參數(shù),詳情請參考xcms官方文檔。其中'centWave'算法所對應(yīng)的參數(shù)與'CentWaveParam'設(shè)置基本一致。
峰檢測時(shí)除了可以使用centWave算法外,還可以使用其他算法,如'centWaveWithPredIsoROIs'、'massifquant'、'matchedFilter'、'MSW'等,分別對應(yīng)'CentWavePredIsoParam'、'MassifquantParam'、'MatchedFilterParam'、'MSWParam'參數(shù)設(shè)置,詳情請參考xcms官方文檔或者使用R help
峰對齊及分組(peak alignment & grouping)
同一代謝物在不同樣品的流出時(shí)間會(huì)略有差異,因而對于峰檢測的結(jié)果需要進(jìn)行對齊(alignment)并將不同樣品中的統(tǒng)一代謝物分到各自可以表征該代謝物的峰組(peak group)中(代謝組學(xué)中一般成為feature),從而進(jìn)一步比較不同樣品間統(tǒng)一代謝物的含量。通常我們可以使用'obiwarp'算法進(jìn)行peak alignment,然后利用'density'算法進(jìn)行peak grouping.
峰補(bǔ)齊
對于峰檢測過程中會(huì)有部分feature在某些樣品中未檢出對應(yīng)代謝物峰的清醒,xcms可以根據(jù)已檢出feature的信息,在相應(yīng)樣品中強(qiáng)行提取EIC信息,從而計(jì)算該代謝物在該樣品中的含量信息,我們一般稱之為filling gaps
如此,對于一組代謝物樣品的峰檢測已經(jīng)全部完成。
對比xcms用于峰檢測的新方法和就方法,我們可以發(fā)現(xiàn)新方法在命名方面更加直白,可以根據(jù)方法名稱直接了解該方法所使用的算法,而在以前的峰檢測方法中,這些算法均整合在數(shù)據(jù)處理的過程中。兩種方式格局優(yōu)劣,新方法意義明確,但是在處理時(shí)需要更多的參數(shù)設(shè)置過程,而舊方法數(shù)據(jù)處理過程更加簡潔,但需要對xcms熟練度要求較高。
參考資料
https://www.bioconductor.org/packages/release/bioc/html/xcms.html
基因容器
版權(quán)聲明:本文內(nèi)容由網(wǎng)絡(luò)用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔(dān)相應(yīng)法律責(zé)任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實(shí)的內(nèi)容,請聯(lián)系我們jiasou666@gmail.com 處理,核實(shí)后本網(wǎng)站將在24小時(shí)內(nèi)刪除侵權(quán)內(nèi)容。
版權(quán)聲明:本文內(nèi)容由網(wǎng)絡(luò)用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔(dān)相應(yīng)法律責(zé)任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實(shí)的內(nèi)容,請聯(lián)系我們jiasou666@gmail.com 處理,核實(shí)后本網(wǎng)站將在24小時(shí)內(nèi)刪除侵權(quán)內(nèi)容。