序列特征的處理方法之二:基于卷積神經網絡方法

      網友投稿 1132 2025-04-01

      前言


      上一篇文章介紹了基本的基于注意力機制方法對序列特征的處理,這篇主要介紹一下基本的基于卷積神經網絡方法對序列特征的處理,也就是TextCNN方法。序列特征的介紹,背景以及應用可以參考上一篇的詳細介紹,這里簡單回顧一下定義,用戶在使用APP或網站的時候,用戶會產生一些針對物品的行為,比如點擊感興趣的物品,或購買物品等,而這些行為往往代表著用戶對這些物品是感興趣的,而將這些交互過的物品放在時間軸來看,就形成了用戶感興趣的物品序列,我們要處理的數據對象類似如圖 1 所示具有時序關系的序列特征,這里拿用戶感興趣的物品序列為例作為處理對象。

      序列特征的處理方法之二:基于卷積神經網絡方法

      ▲ 圖1. 用戶感興趣的物品序列

      我們都知道用戶的歷史行為中可能存在著一些局部的連續行為,比如最近新型冠狀病毒疫情嚴重,可能用戶在過去幾天內連續買了口罩和酒精這種消毒和防護用品,那么在推薦中可以根據這種局部信息來推薦一些跟防護和消毒相關的商品。而淺層的卷積神經網絡由于其卷積感受野比較小,善于捕獲局部信息,因此可以利用淺層卷積神經網絡來對序列特征中的局部行為模式進行建模。鑒于針對句子序列建模的卷積神經網絡TextCNN也是針對embedding matrix做處理,因此選用TextCNN來對用戶感興趣的物品序列進行處理。

      TextCNN原理

      如圖 2 所示為TextCNN對句子序列建模并進行分類的示意圖:

      ▲ 圖 2. TextCNN示意圖[1]

      1. Embedding:每個單詞包括標點都被處理成5維的embedding vector,句長為7,因此處理之后為7×5的矩陣,為圖 2 的第一列所示。

      2. Convolution:經過 kernel_sizes分別為2,3,4的一維卷積層,每個kernel_size 都有2個卷積核,因此經過卷積之后輸出6個卷積結果,其中卷積核的示意圖為圖 2 第二列所示,卷積后的結果為圖 2 第三列所示。需要說明的一點是,從圖 2 可以看出卷積核的高分別有2,3和4,而卷積核的寬都是都和embedding vector的維度一致,這是因為每一個向量代表一個詞,在抽取特征的過程中,詞做為文本的最小粒度,應該保證其信息的完整性。

      3. MaxPooling:對卷積后得到的6個結果進行MaxPooling,然后進行concact,最終得到一個6維的特征向量,如圖 2 第四列所示。

      4. Fully Connect and Softmax:在6維的特征向量后加上一個神經元為2的全連接層,并進行softmax歸一化得到分類概率值,如圖 2 第五列所示。

      應用在序列特征上

      我們主要借鑒的是上面介紹的TextCNN提取特征的方法,也就是上面介紹的如何把embedding matrix變為最終的6維特征向量的方法。如圖 3 所示:

      ▲ 圖 3. TextCNN的序列特征處理

      一般在把TextCNN應用在序列特征的處理上時一維卷積的kernel_sizes設置為2或3,或者同時都用,每個kernel_sizes的卷積核個數一般都為1。一維卷積核大小分別設置為2和3時可以提取不同范圍大小的局部信息,保證了特征的多樣性。

      除此之外,為了彌補有關全局信息提取的不足之處,還可以結合max/mean/sum pooling提取全局特征的方法,使得提取的特征既有全局信息又有局部信息[2],如圖 4 所示,其中全局pooling和textCNN共享序列特征的embedding matrix。

      ▲ 圖 4. 結合TextCNN和全局pooling的序列特征處理

      總結

      卷積神經網絡因其滑動卷積的計算方式對局部特征的提取有天然的優勢,因此成為提取局部信息的首選建模方法。除此之外,還可以結合全局pooling的方法提取全局特征,彌補對全局特征提取的不足,提高特征的多樣性。與此同時,之前介紹過多值類別特征的處理方法,同樣可以采用textCNN進行局部特征的提取。

      參考文獻

      [1] Convolutional Neural Networks for Sentence Classification

      [2] Convolutional Sequence Embedding Recommendation Model

      深度學習 機器學習

      版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。

      版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。

      上一篇:關于生產管理mes系統的信息
      下一篇:Java低代碼開發平臺哪個好,提供全面評估和比較的綜合指南
      相關文章
      亚洲国产aⅴ综合网| 亚洲色婷婷综合开心网| 亚洲精品国精品久久99热一| 亚洲一区二区三区在线播放| 亚洲AV无码之日韩精品| 亚洲 无码 在线 专区| 国产精品亚洲精品日韩动图| 亚洲av无码一区二区三区人妖| 亚洲日韩av无码中文| 亚洲国产欧洲综合997久久| 国产AV旡码专区亚洲AV苍井空| 亚洲av永久综合在线观看尤物| 亚洲剧场午夜在线观看| 亚洲人成7777影视在线观看| 久久久久亚洲AV片无码下载蜜桃| 久久久亚洲AV波多野结衣| 亚洲成a人片毛片在线| 亚洲AV无码成人专区| 亚洲午夜无码久久久久软件| 亚洲免费网站观看视频| 精品国产亚洲第一区二区三区| 亚洲av无码成人精品区在线播放 | 亚洲黄黄黄网站在线观看| 亚洲国产成人精品女人久久久 | 国产精品亚洲专区无码WEB| 日日摸日日碰夜夜爽亚洲| 亚洲精品WWW久久久久久| 久久亚洲精品无码播放| 亚洲精品成人片在线观看精品字幕 | 亚洲高清国产拍精品熟女| 国产精品亚洲专区无码牛牛| 亚洲欧洲一区二区三区| 国产亚洲精品国产| 久久精品九九亚洲精品| 亚洲av极品无码专区在线观看| 亚洲爆乳少妇无码激情| 亚洲美日韩Av中文字幕无码久久久妻妇| 久久影视综合亚洲| 亚洲av日韩av高潮潮喷无码| 亚洲综合一区二区| 亚洲欧洲无码一区二区三区|