uis-rnn語音分離配置流程
簡介
谷歌研究人員的新方法通過遞歸神經網絡(RNN)模擬發言者的嵌入(即,單詞和短語的數學表示),RNN是一種機器學習模型,可以使用其內部狀態來處理輸入序列。每個發言者都以自己的RNN實例開始,該實例在給定新嵌入的情況下不斷更新RNN狀態,使系統能夠學習在發言者和話語之間共享的高級知識。
“由于該系統的所有組件都可以以監督的方式學習,因此在可以獲得具有高質量時間標記的揚聲器標簽訓練數據的情況下,優于無監督系統,”研究人員在論文中寫道。“我們的系統采用全面監督,并且能夠從帶有時間標記的發言者標簽的示例中學習。”
在未來的工作中,團隊計劃優化模型,以便它可以集成上下文信息以執行離線解碼,他們期望這能進一步降低DER錯誤率。谷歌團隊還準備直接對聲學特征進行建模,以便整個發言者diarization系統可以進行端到端的訓練。
語音分離github uis-rnn網址
吹文鏈接
論文鏈接
博客鏈接
博客鏈接,可能是直接打不開的喲
最近做別的工作,后續有時間再跟進這個學習一波
推薦的一個Google UIS-RNN 的安裝與測試
依賴項:
Dependencies This library depends on: python 3.5+ numpy 1.15.1 pytorch 0.4.0 scipy 1.1.0 (for evaluation only)
1
2
3
4
5
6
7
部署安裝流程:
conda create -n uisRnn python=3.5.5 conda activate uisRnn
1
2
3
直接安裝 pytorch 會自動安裝合適版本的 numpy
Installing without CUDA
最新版安裝命令鏈接
0.4.1版本安裝命令鏈接
conda install pytorch=0.4.1 -c pytorch
1
安裝scipy
官網安裝命令介紹
conda install scipy
1
下載之后解壓,進入解壓目錄,按教程運行
python3 demo.py --train_iteration=1000 -l=0.001 -hl=100
1
第一次運行如下測試命令時,報錯如下:
ImportError: cannot import name 'show_config'
1
預計是numpy與scipy版本沖突,于是刪除該環境,按照如上步驟重新安裝,測試運行成功
神經網絡 語音通話
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。