【TensorFlow】01 TensorFlow簡介與Python基礎
1226
2025-03-31
前言
目前,雙塔結構在推薦領域里已經是個常規方法了,在召回和粗排環節的模型選型中,被廣泛采用。其實,不僅僅是在推薦領域,在其它領域,雙塔結構也已經被越來越多得用起來了。比如,在當代搜索引擎的召回環節,除了常見的經典倒排索引來對Query和Document進行文本字面匹配外,經常也會增加一路基于Bert模型的雙塔結構,將用戶查詢Query和搜索文檔,各自通過一個塔形結構來打Embedding,以此增加Query和Document的深層語義匹配能力;再比如,在自然語言處理的QA領域,一般也會在第一步召回環節,上一個基于Bert模型的雙塔結構,分別將問題Question和可能包含正確答案的Passage,通過雙塔結構映射到同一個語義空間,并分別把Question和Passage打出各自的Embedding。
我的感覺,未來,雙塔結構會在更多應用領域獲得應用,這是個非常有生命力的模型。為啥呢?答案其實很簡單:在面臨海量候選數據進行粗篩的場景下,它的速度太快了,效果說不上極端好,但是畢竟是個有監督學習過程,一般而言也不差,實戰價值很高,這個是根本。若一個應用場景有如下需求:應用面臨大量的候選集合,首先需要從這個集合里面篩選出一部分滿足條件的子集合,縮小篩查范圍。那么,這種應用場景就比較適合用雙塔模型。
上面說的是雙塔模型的優點,所謂“天下沒有免費的晚餐”,它為了速度快,是需要付出代價的,那么,代價是什么呢?就是要在一定程度上犧牲掉模型的部分精準性,而且這個代價是結構內生的,也就是說它這種結構必然會面臨這樣的問題。至于產生問題的具體原因
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。