BN與LN的區別

網友投稿 1198 2025-04-02

RNN是可以用BN的，只需要讓每個Batch的長度相等，可以通過對每個序列做補長，截斷來實現。RNN不適合用BN的原因：Normalize的對象(position)來自不同分布。CNN中使用BN，對一個batch內的每個channel做標準化。多個訓練圖像的同一個channel，大概率來自相似的分布。(例如樹的圖，起始的3個channel是3個顏色通道，都會有相似的樹形狀和顏色深度)RNN中使用BN，對一個batch內的每個position做標準化。多個sequence的同一個position，很難說來自相似的分布。(例如都是影評，但可以使用各種句式，同一個位置出現的詞很難服從相似分布)所以RNN中BN很難學到合適的μ和σ，將來自不同分布的特征做正確變換，甚至帶來反作用，所以效果不好。

BN是不適用于RNN這種動態結構的。如果將BN應用在RNN中，由于BN是以batch為單位統計歸一化變量的，所以不同長度的樣本的時間片如何計算將十分困難。在BN中我們需要根據訓練數據保存兩個統計量 μ和σ，如果在測試時一組樣本的長度大于訓練的所有樣本，那么它的后面的時間片需要的μ和σ該怎么辦？

BN與LN的區別

LN是按與x軸平行的方向做歸一化（即[C,T]），這個被證明是在RNN中表現比較好的一種歸一化方法，因為在每個時間片都會獲得相同的數量（通道數）個數值的歸一化統計量。LN中不同時間片的μ和σ是共享的。

batch是“豎”著來的，各個維度做歸一化，所以與batch size有關系。

layer是“橫”著來的，對一個樣本，不同的神經元neuron間做歸一化。

Batch Normalization 的處理對象是對一批樣本， Layer Normalization 的處理對象是單個樣本。

Batch Normalization 是對這批樣本的同一維度特征（每個神經元）做歸一化， Layer Normalization 是對這單個樣本的所有維度特征做歸一化。

機器學習神經網絡

標簽：區別

cpld fpga 區別">cpld fpga 區別

1198 2025-04-02

jtag和swd區別，該用哪個？">jtag和swd區別，該用哪個？

1198 2025-04-02

okr工作法和kpi的區別你知道嗎？（okr與kpi有什么區別）">okr工作法和kpi的區別你知道嗎？（okr與kpi有什么區別）

1198 2025-04-02

BN與LN的區別

cpld fpga 區別">cpld fpga 區別

jtag和swd區別，該用哪個？">jtag和swd區別，該用哪個？

okr工作法和kpi的區別你知道嗎？（okr與kpi有什么區別）">okr工作法和kpi的區別你知道嗎？（okr與kpi有什么區別）

推薦文章

企業生產管理是什么，企業生產管理軟件

進盤點進銷存軟件排行榜前十名

進銷存系統哪個簡單好用？進銷存系統優點

工廠生產管理（工廠生產管理流程及制度）

生產管理軟件，機械制造業生產管理，制造業生產過程管理軟件

進銷存軟件和ERP有什么區別？進銷存與erp軟件理解

進銷存如何進行庫存管理

如何利用excel制作銷售訂單管理系統？

數據庫訂單管理系統有哪些功能？數據庫訂單管理系統怎么設計？

什么是數據庫管理系統？

最近發表

熱評文章

零代碼開發是什么？2022低代碼平臺排行榜">零代碼開發是什么？2022低代碼平臺排行榜

進銷存庫存管理 系統（智慧進銷存）">智能進銷存庫存管理系統（智慧進銷存）

在線文檔哪家強？8款在線文檔編輯軟件推薦">在線文檔哪家強？8款在線文檔編輯軟件推薦

WPS2016怎么繪制簡單的價格表?

系統的功能有哪些？餐飲服務系統的構成及工作程序">連鎖餐飲管理系統的功能有哪些？餐飲服務系統的構成及工

進銷存庫存管理盤點">簡單進銷存庫存管理盤點

友情鏈接