如何快速準備高質量的視頻標注數據?
如何快速準備高質量的視頻標注數據?
隨著AI的快速發(fā)展,如何快速準備大量高質量的數據已經成為AI開發(fā)過程中一個極具挑戰(zhàn)性的問題!隨著視頻監(jiān)控、抖音等短視頻APP的快速發(fā)展,視頻數據越來越多,應用也越來越廣,比如人臉識別門禁、人臉識別考勤、交通違規(guī)識別、智能交通等,這些AI技術的應用離不開視頻及其標注數據的準備。本教程將基于視頻類型的數據集,指導您如何使用華為云ModelArts對視頻類數據進行快速標注,得到高質量的視頻標注數據。標注后的數據集,經過發(fā)布即可用于模型訓練和部署AI應用等。
數據準備
參考此文檔,完成ModelArts準備工作。包括注冊華為云賬號、ModelArts全局配置和OBS相關操作。
ModelArts產品地址??梢赃吙床┛瓦厡嶋H操作:https://console.huaweicloud.com/modelarts/?region=cn-north-4#/dataset
下載數據
此次體驗數據包含9個短視頻。需要從AI Gallery下載數據至OBS。視頻的數據集名字為:交通違規(guī)。
首先進入AI Gallery,選擇數據,然后搜索dataset-video-9
創(chuàng)建數據集
創(chuàng)建視頻數據集,輸入路徑選擇從Gallery下載數據的位置。并添加"person",“car”的標簽
開始標注
數據集詳情頁中,展示了此數據集中 “未標注” 和 “已標注” 的視頻。
標注欄與物體檢測類似,支持畫框、多邊形、圓、實線、虛線、點的標注。
在“未標注”頁簽左側視頻列表中,單擊目標視頻文件,打開標注頁面。
在標注頁面中,播放視頻,當視頻播放至待標注時間時,單擊進度條中的暫停按鈕,將視頻暫停至某一畫面。
在左側區(qū)域選擇標注框,默認為矩形框。使用鼠標在視頻畫面中框出目標,然后在彈出的添加標簽文本框中,直接輸入新的標簽名,在文本框前面選中標簽顏色,單擊“添加”完成1個物體的標注。如果已存在標簽,從下拉列表中選擇已有的標簽,然后單擊“添加”完成標注。逐步此畫面中所有物體所在位置,一張畫面可添加多個標簽。
示例1:對交通違規(guī)情況所在幀進行標注:斑馬線車輛未禮讓行人
示例2:無牌車輛闖紅燈
上一個暫停畫面標注完成后,在進度條處單擊播放按鈕繼續(xù)播放,在需要標注的畫面中暫停,然后繼續(xù)標注目標物體。界面右側將呈現當前視頻帶標注的時間點。
修改標注
在界面右上角點擊標簽類別,可顯示當前文件標簽:
當數據完成標注后,您還可以進入“已標注”頁簽,刪除標注數據。
單擊目標編號操作列的,刪除該段視頻的標注。您也可以單擊標注視頻文件上方的叉號刪除標注,然后單擊“確認標注”。
在“已標注”頁簽下,單擊目標視頻文件,在標注頁面右側的**“當前文件標簽”**下,可單擊時間點右側小三角展開詳情,您可以修改或刪除標簽。
修改標簽:單擊標簽右側的編輯按鈕,標簽名稱可進行修改。
刪除標簽:單擊標簽右側的刪除按鈕,將直接刪除此標簽。如果單擊畫面時間右側的刪除按鈕,將刪除此畫面下的所有標簽。
發(fā)布數據集
標注完成后,可以發(fā)布版本,會將當前數據集數據存檔。
數據集發(fā)布后,相關文件的目錄結構說明:
由于數據集是基于OBS目錄管理的,發(fā)布為新版本后,對應的數據集輸出位置,也將基于新版本生成目錄。
在數據集發(fā)布后,其相關文件的目錄結構如下。
其manifest文件存放在此目錄下:
標注結果文件(XML)為VOC格式,存放在數據集輸出目錄下:
|-- user-specified-output-path |-- DatasetName-datasetId |-- annotation |-- VersionMame1 |-- VersionMame1.manifest |-- annotations |-- images |-- videoName1 |-- videoName1.timestamp.xml |-- videoName2 |-- videoName2.timestamp.xml |-- VersionMame2 ... |-- ...
視頻標注的關鍵幀存在數據集的輸入目錄下:
|-- user-specified-input-path |-- images |-- videoName1 |-- videoName1.timestamp.jpg |-- videoName2 |-- videoName2.timestamp.jpg
參考:
【1】華為云ModelArts文檔中心:https://support.huaweicloud.com/bestpractice-modelarts/modelarts_10_0018.html
【2】如何快速準備高質量的AI數據? https://bbs.huaweicloud.com/blogs/261979
【3】更多功能:https://bbs.huaweicloud.com/blogs/262413
【4】ModelArts產品地址:https://console.huaweicloud.com/modelarts/?region=cn-north-4#/dataset
AI AI開發(fā)平臺ModelArts 智能數據 機器學習 視頻
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發(fā)現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。