亞寵展、全球寵物產業風向標——亞洲寵物展覽會深度解析
1814
2022-12-07
本篇文章給大家談談excel數據分析模型,以及Excel數據和模型對應的知識點,希望對各位有所幫助,不要忘了收藏本站喔。 今天給各位分享excel數據分析模型的知識,其中也會對Excel數據和模型進行解釋,如果能碰巧解決你現在面臨的問題,別忘了關注本站,現在開始吧!
本文目錄一覽:
1、如何利用Excel做數據分析
2、excel表格如何做數據分析
3、excel管理數據模型的使用
Excel是日常工作中最常用的工具excel數據分析模型,如果不考慮性能和數據量的話,可以應付絕大部分的分析工作。數據分析的最終目的是解決我們生活和工作中遇到的問題,明確的問題為數據分析提供excel數據分析模型了目標和方向。
Excel數據分析步驟分為:明確問題-理解數據-清洗數據-數據分析或構建模型-數據可視化。
一、明確問題
以上篇文章中提到的淘寶和天貓嬰兒用品數據為數據集來進行數據分析。
1、在一級分類商品中,哪個商品銷量最好,在此分類下,哪個子分類最受歡迎?
2、不同季度對用戶購買行為有什么影響?
2、不同年齡對用戶購買行為有什么影響?
3、不同性別對用戶購買行為有什么影響?
二、理解數據
參考 沐沐:描述統計分析 理解數據集部分
三、數據清洗
數據清洗步驟為:選擇子集-列名重命名-刪除重復值-缺失值處理-一致化處理-數據排序-異常值處理。
1、選擇子集
有時候原始數據量過大,有時候并不需要全部字段,我們可以將不需要用到的字段進行隱藏,為了保證數據的完整性,盡量不要刪除數據。從問題中我們可以發現購買商品表中的商品屬性對于我們分析數據沒什么幫助,可以將其隱藏(選中商品屬性列-右擊-選擇隱藏)。
2、列名重命名
我們可以將原始數據集的英文字段改成中文字段,方便閱讀和理解,雙擊列名直接修改即可。
3、刪除重復值
從購買商品表和嬰兒信息表示中可知,如果全部字段重復,我們才認為數據是有重復的,從操作來看,是沒有重復值的。
4、缺失值處理
可以看總共有多少行數據,然后鼠標選中列來看缺少多少數值。如果有缺失值,我們可以用定位找到缺失值(選中列-F5-定位條件-空值)。未找到缺失值。
5、一致化處理
對數據列的數據格式進行統一處理。數據中的購買時間列和出生日期列為常規格式,我們需要轉換為日期類型(選中列-右擊-設置單元格格式-日期),然后再選中列-分列-下一步-下一步-列數據格式:日期:YMD-完成。
6、數據排序
我們通過對購買次數列進行降序排序,發現用戶‘2288344467’在2014年11月13日購買了10000份的‘50018831’二級分類、‘50014815’一級分類商品。
7、異常值處理
通過數據透視表沒有每列數據中的異常值。
至此,我們已經得到分析問題的數據了,下一步,利用Excel中的數據透視、函數和分析工具來進行數據分析來解決我們的業務問題了。
1、在一級分類商品中,哪個商品銷量最好,在此分類下,哪個子分類最受歡迎?
將商品一級分類放在行標簽,值為購買數量的求和項,得出最受歡迎的一級商品為28,購買數量為28545。
在此分類下,即在一級分類28商品下,最受歡迎的是哪類二級商品?
2、季度對用戶購買行為有什么影響?即看每個季度銷量怎么樣?
從數據透視結果來看,我們發現,12-14年的第四季度在該年的銷售量都是最高的。
3、不同年齡對用戶購買行為有什么影響?
在分析這個問題之前,我們需要將一級分類商品和二級分類商品用Vlookup函數V到嬰兒信息表中,然后計算出嬰兒的年齡。
根據計算出的數據透視出來各年齡段的購買量為:從透視表中我們可以看出4歲以前的嬰兒為主要用戶群體。
從嬰兒不同年齡段購買二級商品數量來看,各年齡段最受用戶歡迎的二級商品如下圖所示:
4、不同性別對用戶購買行為有什么影響?
我們可以看出男嬰兒和女嬰兒的人數相差小,但是女嬰兒的購買數量將近是男嬰兒的兩倍。
最受男女嬰兒歡迎的二級分類商品的TOP5
此外,我們還可以看出最受男女嬰兒歡迎的二級分類商品TOP5。
在日常辦公以及數據處理中excel數據分析模型,經常要把一些有規律excel數據分析模型的數據處理成圖文,從而看起來比較直觀。下面讓excel數據分析模型我為你帶來excel表格數據分析的 方法 。
excel表格數據分析步驟如下:
選擇成對的數據列,將它們使用“X、Y散點圖”制成散點圖。
在數據點上單擊右鍵,選擇“添加趨勢線”-“線性”,并在選項標簽中要求給出公式和相關系數等,可以得到擬合的直線。
由圖中可知,擬合的直線是y=15620x+6606.1,R2的值為0.9994。
因為R2 0.99,所以這是一個線性特征非常明顯的實驗模型,即說明擬合直線能夠以大于99.99%地解釋、涵蓋了實測數據,具有很好的一般性,可以作為標準工作曲線用于其他未知濃度溶液的測量。
為了進一步使用更多的指標來描述這一個模型,我們使用數據分析中的“回歸”工具來詳細分析這組數據。
在選項卡中顯然詳細多了,注意選擇X、Y對應的數據列。“常數為零”就是指明該模型是嚴格的正比例模型,本例確實是這樣,因為在濃度為零時相應峰面積肯定為零。先前得出的回歸方程雖然擬合程度相當高,但是在x=0時,仍然有對應的數值,這顯然是一個可笑的結論。所以我們選擇“常數為零”。
“回歸”工具為我們提供了三張圖,分別是殘差圖、線性擬合圖和正態概率圖。重點來看殘差圖和線性擬合圖。
在線性擬合圖中可以看到,不但有根據要求生成的數據點,而且還有經過擬和處理的預測數據點,擬合直線的參數會在數據表格中詳細顯示。本實例旨在提供更多信息以起到拋磚引玉的作用,由于涉及到過多的專業術語,請各位讀者根據實際,在具體使用中另行參考各項參數,此不再對更多細節作進一步解釋。
殘差圖是有關于世紀之與預測值之間差距的圖表,如果殘差圖中的散點在中州上下兩側零亂分布,那么擬合直線就是合理的,否則就需要重新處理。
更多的信息在生成的表格中,詳細的參數項目完全可以滿足回歸分析的各項要求。下圖提供的是擬合直線的得回歸分析中方差、標準差等各項信息。
關于excel表格數據分析的相關 文章 推薦:
1. 如何利用excel進行數據分析的教程
2. 如何用excel進行數據分析的教程
3. excel的數據分析功能在哪里
Power Pivot的主要用途是它能夠管理數據表及其之間的關系,以便于分析多個表中的數據。您可以在創建數據透視表時或直接從PowerPivot功能區將excel表添加到數據模型。
僅當多個表之間存在關系時,才可以分析它們之間的數據。使用Power Pivot,您可以從數據視圖或圖表視圖創建關系。此外,如果您選擇向Power Pivot添加表,則還需要添加一個關系。
使用數據透視表將Excel表添加到數據模型
在Excel中創建數據透視表時,它僅基于單個表/范圍。如果要將更多表添加到數據透視表中,可以使用數據模型。
假設您的工作簿中有兩個工作表-
在表“銷售人員”中包含銷售人員及其代表的地區的數據。
另一個在表格中包含銷售,地區和月份的數據–銷售。
您可以按銷售人員的方式匯總銷售情況,如下所示。
單擊表格–銷售。
單擊功能區上的“插入”選項卡。
在“表”組中選擇“數據透視表”。
將創建一個空的數據透視表,其中包含Sales表中的字段-Region,Month和Order Amount。如您所見,“數據透視表字段”列表下面有一個“ 更多表”命令。
單擊更多表。
出現創建新數據透視表消息框。顯示的消息是-要在分析中使用多個表,需要使用數據模型創建一個新的數據透視表。點擊是
將創建一個新的數據透視表,如下所示-
在數據透視表字段下,您可以觀察到有兩個選項卡-ACTIVE和ALL。
單擊全部選項卡。
在“數據透視表字段”列表中,出現兩個表-Sales和Salesperson,以及相應的字段。
單擊“銷售人員”表中的“銷售人員”字段,并將其拖到“ ROWS”區域。
單擊“銷售”表中的“月”字段并將其拖到“ ROWS”區域。
單擊“銷售”表中的字段“訂單金額”,并將其拖到“ ∑值”區域。
數據透視表已創建。數據透視表字段中將顯示一條消息– 可能需要在表之間建立關系。
單擊消息旁邊的創建按鈕。出現“ 創建關系”對話框。
在表格下,選擇銷售。
在“ 列(外國)”框中,選擇“區域”。
在“ 相關表”下,選擇“銷售員”。
在“ 相關列(主)”框中,選擇“區域”。
單擊確定。
兩個工作表上的兩個表中的數據透視表已準備好。
此外,正如Excel在將第二個表添加到數據透視表時所說的那樣,該數據透視表是使用數據模型創建的。要驗證,請執行以下操作-
單擊功能區上的POWERPIVOT選項卡。
單擊“數據模型”組中的“ 管理 ”。出現Power Pivot的數據視圖。
您可以觀察到在創建數據透視表時使用的兩個Excel表已轉換為數據模型中的數據表。 關于excel數據分析模型和Excel數據和模型的介紹到此就結束了,不知道你從中找到你需要的信息了嗎 ?如果你還想了解更多這方面的信息,記得收藏關注本站。 excel數據分析模型的介紹就聊到這里吧,感謝你花時間閱讀本站內容,更多關于Excel數據和模型、excel數據分析模型的信息別忘了在本站進行查找喔。
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。