我的文檔變成了亂碼?(文檔突然變成亂碼)
1102
2022-05-30
應用場景
用戶評論過濾:對網站用戶的評論信息進行檢測,審核出涉及色情、暴恐、政治敏感、惡意推廣等內容,保證良好的用戶體驗
注冊信息篩查:對用戶的注冊信息進行篩查,避免黑產通過用戶名實現違規信息的推廣
文章內容審核:對UGC文章內容進行多個維度的審核,避免因內容違規導致的APP下架等損失
官網地址: https://ai.baidu.com/ai-doc/ANTIPORN/Vk3h6xaga
能力介紹
您可以在內容審核平臺中對以下項目進行配置,后期調用接口時即可按照您的配置啟用以下一項或多項能力
百度官方違禁詞庫:包含百度海量歷史數據,提供對敏感事件、違規詞語及監管要求封禁詞語的識別審核能力,同時于2020年1月開始包含對新冠疫情謠言的識別審核能力
文本色情:對文本中的色情行為描述、色情資源鏈接、低俗交友、污穢文愛等內容進行識別
暴恐違禁:對暴力行為、恐怖描述、賭博、毒品、槍支彈藥等違禁內容進行識別
政治敏感:對文本中的敏感事件、涉政人物、散布謠言、反動宣傳等內容進行識別
惡意推廣:對文本中帶有售賣意向的軟文廣告,微信、QQ等個人聯系方式等違規內容及變體進行識別
低俗辱罵:對文本中的侮辱謾罵、人身攻擊、消極宣泄等內容進行識別
低質灌水:對網絡社區常見的亂碼、水帖、刷屏等無意義的灌水信息進行識別
廣告法審核:對廣告法中要求的不能出現的違規詞進行檢測
使用流程
確認默認配置是否符合您需求,如果符合請學習新手指南完成應用創建后調用接口
如果默認配置不符合您需求,請先閱讀《配置文本審核策略》章節了解基礎的審核規則配置,如果您有自定義添加政治敏感人物、自定義圖像黑白名單、期望在敏感時期自動收緊線上策略(多策略自動調度切換)的需求,請閱讀完《配置圖像審核策略》章節后閱讀《高級功能》章節,然后按文檔中的引導在內容審核平臺中完成對應規則的配置后調用接口
代碼實現
使用依賴
工具類 只需修改client_id,client_secret 參數內容即可
package com.ying.baiducontentapproval; import cn.hutool.http.HttpRequest; import cn.hutool.http.HttpResponse; import cn.hutool.json.JSON; import cn.hutool.json.JSONUtil; /** * @author 小影 * @contact QQ: 2849799912 * @create 2022-03-31 13:46 * @describe:百度云內容審核 */ public class ContentApprovalUtil { String client_id = "XXXX";// API Key String client_secret = "XXXX";// 應用的Secret Key /** * 獲取token */ private String getToken() { String url = "https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=APP_KEY&client_secret=SECRET_KEY"; url = url.replace("APP_KEY", client_id).replace("SECRET_KEY", client_secret); HttpResponse response = HttpRequest.post(url).execute(); JSON parse = JSONUtil.parseObj(response.body()); return parse.getByPath("access_token").toString(); } /** * 文本-內容審核 * @param bodyText 待審核內容 * @return 審核結果 */ public String TextCensor(String bodyText) { String path = "https://aip.baidubce.com/rest/2.0/solution/v1/text_censor/v2/user_defined?access_token="+getToken(); HttpResponse response = HttpRequest.post(path) .header("Content-Type", "application/x-www-form-urlencoded") .body("text=" + bodyText) .execute(); return response.body(); } }
響應參數
參數名稱
數據類型
是否必須
備注
log_id
Long
Y
請求唯一id
error_code
Long
N
錯誤提示碼,失敗才返回,成功不返回
error_msg
String
N
錯誤提示信息,失敗才返回,成功不返回
conclusion
String
N
審核結果,可取值:合規、不合規、疑似、審核失敗
conclusionType
Integer
N
審核結果類型,可取值1.合規,2.不合規,3.疑似,4.審核失敗
data
Array
N
不合規/疑似/命中白名單項詳細信息。響應成功并且conclusion為疑似或不合規或命中白名單時才返回,響應失敗或conclusion為合規且未命中白名單時不返回。
+error_code
Integer
否
內層錯誤提示碼,底層服務失敗才返回,成功不返回
+error_msg
String
否
內層錯誤提示信息,底層服務失敗才返回,成功不返回
+type
Integer
N
審核主類型,11:百度官方違禁詞庫、12:文本反作弊、13:自定義文本黑名單、14:自定義文本白名單
+subType
Integer
N
審核子類型,此字段需參照type主類型字段決定其含義:
當type=11時subType取值含義:
0:百度官方默認違禁詞庫
當type=12時subType取值含義:
0:低質灌水、1:暴恐違禁、2:文本色情、3:政治敏感、4:惡意推廣、5:低俗辱罵 6:惡意推廣-聯系方式、7:惡意推廣-軟文推廣、8:廣告法審核
當type=13時subType取值含義:
0:自定義文本黑名單
當type=14時subType取值含義:
0:自定義文本白名單
+msg
String
N
不合規項描述信息
+hits
Array
N
送檢文本違規原因的詳細信息
++probability
Float
N
不合規項置信度
++datasetName
String
N
違規項目所屬數據集名稱
++words
Array
N
送檢文本命中詞庫的關鍵詞(備注:建議參考新字段“wordHitPositions”,包含信息更豐富:關鍵詞以及對應的位置及標簽信息)
++modelHitPositions
Array
N
送檢文本命中模型的詳細信息,包含位置信息及置信度信息。位置信息:命中模型的違規內容在送檢原文中的位置(從0開始計算):“開始位置”、“結束位置”;置信度信息:命中模型對應的置信度分數(范圍:0至1,數字越大,可能性越高)。返回示例見下方“成功響應示例——不合規”部分
++wordHitPositions
Array
N
送檢文本命中詞庫的詳細信息,為Object的列表,包含words、positions、label三個字段,詳細描述如下表所示。返回示例見下方“成功響應示例——不合規”部分
+++keyword
String
N
送檢文本命中詞庫的關鍵詞
+++positions
Array
N
關鍵詞在送檢原文中的位置(從0開始計算):分別為“起始位置”,“結束位置”
+++label
String
N
關鍵詞命中的細分標簽,標簽規則見文末“細分標簽對照表”
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。