HUAWEI云服務(wù)器 linux系統(tǒng)安裝mysql
965
2025-03-31
S4D官方文檔
S4D倉庫
S4D論文下載鏈接
官網(wǎng)鏈接
S4D:Python中的Speaker Diarization Toolkit
Speaker Diarization(發(fā)言者語音片段切分歸類)是一個將群組發(fā)言中不同人不同時間點的語音樣本劃分和重組為獨特的,同質(zhì)的片段的過程,分離出誰在何時說了什么。
摘要:
在本文中,我們提出了一個新的致力于語音分類開源Python工具包S4D。
S4D提供各種狀態(tài)最先進的組件和可能性使得端到端的分類原型系統(tǒng)更加容易。
S4D提供了大量的聚類,分割,評分和可視化算法。S4D被認為易于理解,安裝,修改和使用以便快速轉(zhuǎn)換到工業(yè)技術(shù)和促進新的技術(shù)方法。本文提供了標準任務(wù)和教程的示例。S4D是基于說話人識別的開源工具包SIDEKIT的擴展。
Kaldi官網(wǎng)
Kaldi 簡介:
Kaldi 是一個語音識別的工具包
htk官網(wǎng)
什么是HTK?
隱馬爾可夫模型工具包(HTK)是一個用于構(gòu)建和操作隱馬爾可夫模型的便攜式工具包。HTK主要用于語音識別研究,盡管它已被用于許多其他應(yīng)用,包括語音合成,字符識別和DNA測序的研究。HTK正在全球數(shù)百個網(wǎng)站上使用。
HTK包含一組C源代碼形式的庫模塊和工具。這些工具為語音分析,HMM培訓(xùn),測試和結(jié)果分析提供了先進的工具。該軟件支持使用連續(xù)密度混合高斯和離散分布的HMM,并可用于構(gòu)建復(fù)雜的HMM系統(tǒng)。HTK版本包含大量文檔和示例。
HTK普通的學(xué)習鏈接
librispeech asr語料庫
語音通話
版權(quán)聲明:本文內(nèi)容由網(wǎng)絡(luò)用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔相應(yīng)法律責任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實的內(nèi)容,請聯(lián)系我們jiasou666@gmail.com 處理,核實后本網(wǎng)站將在24小時內(nèi)刪除侵權(quán)內(nèi)容。
版權(quán)聲明:本文內(nèi)容由網(wǎng)絡(luò)用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔相應(yīng)法律責任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實的內(nèi)容,請聯(lián)系我們jiasou666@gmail.com 處理,核實后本網(wǎng)站將在24小時內(nèi)刪除侵權(quán)內(nèi)容。