計算廣告:競價廣告計價算法、搜索廣告系統(tǒng)
1、競價廣告計價算法
第 5 章中介紹了搜索廣告和廣告網(wǎng)絡(luò)這兩種最典型的競價廣告產(chǎn)品。在進入這些具體產(chǎn)品的技術(shù)之前,我們先來了解一下“競價”這一核心邏輯的具體實現(xiàn),順便引出此核心邏輯的幾項主要支持技術(shù)。
5.2 節(jié)中介紹了位置拍賣市場中一些常用的定價策略,包括 GSP、MRP、價格擠壓等,單獨理解這些策略都不困難。在實際的系統(tǒng)中,我們需要將這幾種策略綜合起來執(zhí)行。以
按 CPC 計價的競價廣告產(chǎn)品中一次廣告展示為例,我們將實際的計價算法用下面的代碼描
述,可以對照表 5.2 來進一步直觀地理解這一完整的定價過程。
在實際的廣告產(chǎn)品中,還有可能同時存在若干種計費方式,其 eCPM 估算過程也不同,我們用下面的一小段代碼來說明在各種計費方式并存的情況下完整的 eCPM 計算邏輯。當然,這里的邏輯比較簡單直覺,有關(guān) CPM 和 CPC 混合競價的拍賣過程與定價機制的探討,可以進一步查閱參考文獻 。
從定價過程的輸入可以看出,對于一個 CPC 結(jié)算的競價廣告系統(tǒng),需要先得到廣告候選集合,并計算每個候選的點擊率,這對應(yīng)競價廣告兩個最關(guān)鍵的計算問題,即廣告檢索和廣告排序,這也是本章要討論的重點技術(shù)問題。
競價廣告中根據(jù) eCPM 對廣告進行排序,而根據(jù) 2.3.1 節(jié)的介紹,按照點擊和轉(zhuǎn)化兩個發(fā)生在不同階段的行為,eCPM 可以分解成點擊率和點擊價值的乘積,eCPM 的估計主要就是點擊率預(yù)測和點擊價值估計兩個任務(wù):
r(a, u, c) = μ(a, u, c) · ν(a, u) (13.1)
我們認為點擊率 μ 是廣告 3 個行為主體的函數(shù),而點擊價值則是用戶 u 和廣告商 a 的函數(shù),而在 CPC 計算的競價廣告中,點擊價值是廣告主的出價,不需要估計。在分別介紹搜索廣告和廣告網(wǎng)絡(luò)的架構(gòu)和技術(shù)點之后,我們將把主要篇幅放在廣告檢索和點擊率預(yù)測這兩項核心技術(shù)上。
2、搜索廣告系統(tǒng)
搜索廣告是最早產(chǎn)生的,也是最為重要的競價廣告系統(tǒng)。搜索廣告的優(yōu)化目標在式(2.2)的基礎(chǔ)上加以調(diào)整,可以用下式來表達:
這個目標相對簡單清晰:對每次展示的各個候選,根據(jù)查詢估計其點擊率μ,并乘以廣告主出的點擊單價得到eCPM,再按此排序即可。而在eCPM的估計過程中,根據(jù)上下文即用戶輸入的查詢來決策。
搜索廣告是競價廣告中最典型的系統(tǒng)之一,它與一般廣告網(wǎng)絡(luò)最主要的區(qū)別是上下文信息非常強,用戶標簽的作用受到很大的限制。因此,搜索廣告的檢索過程,一般都不考慮用戶 u 的影響,而上下文信息 c,即查詢,又是實時通過用戶輸入獲得,因而離線受眾定向的過程基本可以被省略。在這樣的應(yīng)用場景下,搜索廣告的系統(tǒng)架構(gòu)如圖 13-1 所示,它與一般的競價廣告系統(tǒng)架構(gòu)上的主要區(qū)別是沒有上下文和用戶標簽的緩存,但是其檢索模塊由于查詢擴展的需求,會比一般的競價廣告系統(tǒng)要復(fù)雜,并且在排序后的收益優(yōu)化階段還需要進行北區(qū)和東區(qū)的廣告放置決策。
搜索廣告算法上最關(guān)鍵的技術(shù)是點擊率預(yù)測,這一點會在后面專門討論。除此之外,搜索廣告還有一個技術(shù)上的重點,那就是查詢詞的擴展,即如何對簡短的上下文信息做有效的拓展,由于搜索廣告的變現(xiàn)水平高,這樣的精細加工是值得而且有效的。
2.1 查詢擴展
搜索廣告中查詢的重要性極高,粒度又非常細,如何根據(jù)廣告主需求對關(guān)鍵詞進行合理的拓展對于需求方和供給方來說都有很大意義:需求方需要通過擴展關(guān)鍵詞獲得更多流量;供給方則需要借此來變現(xiàn)更多流量和提高競價的激烈程度。因此,查詢擴展(query expansion)是搜索廣告的重要技術(shù),它主要用于 5.1.3 節(jié)中介紹的廣泛匹配情形下。搜索廣告的查詢擴展與搜索中的查詢擴展既有相通之處,又有一些顯著的區(qū)別。相關(guān)的方法很多但這里只介紹 3 種主要的思路。
1.基于推薦的方法
如果把用戶一個會話(session)內(nèi)的查詢視為目的相同的一組活動,可以在 {session, query} 矩陣上通過推薦技術(shù)來產(chǎn)生相關(guān)的關(guān)鍵詞。這種方法利用的是搜索的日志數(shù)據(jù),而基本上個性化推薦領(lǐng)域的各種思路和方法都可以適用。下面以查詢擴展的問題為例介紹一下推薦技術(shù)的基本問題。
顯然,這個矩陣中大多數(shù)單元都是空白,但這并不意味著用戶搜索該詞的可能性為零。而推薦的基本任務(wù)就是根據(jù)這個矩陣中已知的元素值,去盡可能預(yù)測性地填充那些歷史上沒有觀測到的單元。類似的場景除了搜索,還廣泛出現(xiàn)在各種互聯(lián)網(wǎng)應(yīng)用當中,如商品的瀏覽或購買記錄以及在線電影的打分記錄,都可以抽象出類似的交互強度矩陣以及相應(yīng)的推薦問題。這樣根據(jù)群體用戶的選擇關(guān)聯(lián)性進行推薦的問題也被稱為協(xié)同過濾(Collaborative Filtering,CF)問題。
基于協(xié)同過濾的推薦問題有非常多的算法,它們可以分為基于內(nèi)存的非參數(shù)化的方法和基于模型的參數(shù)化方法。后者是用維數(shù)較低的空間概要性地刻畫交互矩陣,然后根據(jù)該空間的生成參數(shù)恢復(fù)矩陣里未知的值。這種將空間降維的思路與文檔主題模型乍看起來很相似,不過問題本身還是有明確的區(qū)別:在推薦問題中,應(yīng)該把那些未觀測到的交互單元視為未知,而在文檔主題模型中,合理的方法是認為未在某文檔中出現(xiàn)的詞交互強度為 0。關(guān)于推薦算法的綜述,可以查閱參考文獻 [75, 90] 等,這里不再詳述。
3.基于歷史效果的方法
對搜索廣告而言,還有一類查詢擴展方法很重要,那就是利用廣告本身的歷史 eCPM數(shù)據(jù)來挖掘變現(xiàn)效果較好的相關(guān)查詢。由于在廣告主選擇競價的關(guān)鍵詞時,一般來說都會選擇多組,如果從歷史數(shù)據(jù)中發(fā)現(xiàn),某些關(guān)鍵詞對某些特定廣告主的 eCPM 較高,那么應(yīng)該將這些效果較好的查詢組記錄下來,以后當另一個廣告主也選擇了其中的某個關(guān)鍵詞時,可以根據(jù)這些歷史記錄,自動地擴展出其他 效果較好的查詢。
雖然這種方法得到的擴展結(jié)果經(jīng)常會與前兩種方法得到的結(jié)果相重合,但是由于這種方法直接使用廣告的優(yōu)化目標,即 eCPM 來指導(dǎo)查詢擴展,往往能夠成為前兩種方法非常重要的補充手段,而且對營收產(chǎn)生的效果往往還要好于前面的兩種方法。
2.2 廣告放置
如 5.1.3 節(jié)中討論的,廣告放置指的是搜索引擎廣告中確定北區(qū)和東區(qū)廣告條數(shù)的問題。考慮到用戶體驗,需要對北區(qū)廣告的數(shù)量進行限制,因此,這是一個典型的帶約束優(yōu)化的問題。其中的約束是系統(tǒng)在一段時間內(nèi)整體的北區(qū)廣告條數(shù),而優(yōu)化的目標則是搜索廣告系統(tǒng)的整體營收。在進行廣告放置之前的排序過程中,比較的都是單條廣告的 eCPM,不過此處的優(yōu)化需要處理一組廣告,并且需要考慮位置因素,此問題可以表達如下:
搜索廣告雖然不宜進行深入的個性化,但在廣告放置問題上存在著很大的個性化空間。不同用戶對于廣告接受和容忍的程度有著很大的不同,實際上,即使在北美市場這樣的用戶受教育水平較高的市場上,也至少有三四成的用戶不能完全分辨搜索結(jié)果和廣告。因此,對不同的用戶動態(tài)調(diào)整北區(qū)的條目數(shù),可以使得在北區(qū)平均廣告數(shù)目相同的約束下,整體系統(tǒng)的營收有顯著的提高。在考慮單個用戶的廣告接受程度后,我們可以對式(13.3)中的收入作個性化的調(diào)整。例如,對于北區(qū)的一個廣告展示,改成下面的形式:
以上內(nèi)容摘選自《計算廣告 互聯(lián)網(wǎng)商業(yè)變現(xiàn)的市場與技術(shù)》 第2版
本文轉(zhuǎn)載自異步社區(qū)。
Web應(yīng)用防火墻 WAF
版權(quán)聲明:本文內(nèi)容由網(wǎng)絡(luò)用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔相應(yīng)法律責任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實的內(nèi)容,請聯(lián)系我們jiasou666@gmail.com 處理,核實后本網(wǎng)站將在24小時內(nèi)刪除侵權(quán)內(nèi)容。