自動根據數據生成降雨量實況Word報告

      網友投稿 648 2025-04-01

      最近遇到一個有點燒腦的需求,其實也不算燒腦,主要是判斷條件過多,對于我這種記憶力差,內存小的人來說容易出現內存溢出導致大腦宕機。也可能是因為我還沒有找到能減小大腦內存壓力的寫法。


      若讀者有啥更好解決方案,歡迎評論噢!

      先看看需求吧:

      主要就是要根據左側的表格自動生成右側的word統計報告,實際的各種可能性情況遠比圖中展示的要更加復雜。

      好了,直接開始干代碼吧:

      數據讀取

      import pandas as pd df = pd.read_csv("11月份數據.csv", encoding='gbk') # 當前統計月份 month = 11 df = df.query('月份==@month') df

      1

      2

      3

      4

      5

      6

      7

      數據:

      異常數據過濾

      查看缺失值數量:

      pd.isnull(df).sum()

      1

      結果:

      區域 0 月份 0 降雨量(mm) 0 降雨距平(mm) 1 觀測站 0 dtype: int64

      1

      2

      自動根據數據生成降雨量實況Word報告

      3

      4

      5

      6

      僅一個缺失值數據,可直接刪除:

      df.dropna(inplace=True)

      1

      計算所有觀測站降雨量相對往年的比較

      計算降雨量比往年高,跟往年比無變化,以及比往年低的次數分別是多少:

      rainfall_high = df.eval('`降雨距平(mm)` > 0').value_counts().get(True, 0) rainfall_equal = df.eval('`降雨距平(mm)` == 0').value_counts().get(True, 0) rainfall_low = df.eval('`降雨距平(mm)` < 0').value_counts().get(True, 0) print(rainfall_high, rainfall_equal, rainfall_low)

      1

      2

      3

      4

      13 1 18

      1

      上面的結果中rainfall_high表示降雨量比往年平均水平高的次數,rainfall_equal表示降雨量比往年平均水平持平的次數,rainfall_low表示降雨量比往年平均水平低的次數。

      于是分情況討論生成第一段的報告:

      p1 = f"{month}月份" if rainfall_low == 0 or rainfall_high == 0: if rainfall_equal != 0: p1 += f"除{rainfall_equal}個觀測站降雨量較往年無變化外," if rainfall_high == 0: p1 += f"各氣象觀測站降雨量較往年均偏低。" elif rainfall_low == 0: p1 += f"各氣象觀測站降雨量較往年均偏高。" else: # 10%以內差異認為是持平 if rainfall_high > rainfall_low*1.1: p1 += f"大部分氣象觀測站降雨量較往年偏高。" elif rainfall_low > rainfall_high*1.1: p1 += f"大部分氣象觀測站降雨量較往年偏低。" else: p1 += f"各氣象觀測站降雨量較往年整體持平。" p1

      1

      2

      3

      4

      5

      6

      7

      8

      9

      10

      11

      12

      13

      14

      15

      16

      17

      結果:

      '11月份大部分氣象觀測站降雨量較往年偏低。'

      1

      計算各區域降雨量的極值

      再生成第二段的報告:

      p2 = "" t = df['降雨量(mm)'] p2 += f"各區域降雨量在{t.min()}~{t.max()}mm之間,其中{df.loc[t.argmax(), '區域']}區域的降雨量最大,為{t.max()}mm。" p2

      1

      2

      3

      4

      結果:

      '各區域降雨量在0.0~16.0mm之間,其中51a45區域的降雨量最大,為16.0mm。'

      1

      分觀測站統計

      讓我腦袋疼的地方就是從這里的代碼開始的,后面還有更復雜蛋疼的需求就不公布了。

      對每個觀測站分別統計哪些區域偏高,哪些區域持平,哪些區域偏低:

      p3s = [] for station, tmp in df.groupby('觀測站'): t = tmp['降雨量(mm)'] p3 = f"各區域降雨量在{t.min()}~{t.max()}mm之間," rainfall_high_mask = tmp.eval('`降雨距平(mm)` > 0') rainfall_equal_mask = tmp.eval('`降雨距平(mm)` == 0') rainfall_low_mask = tmp.eval('`降雨距平(mm)` < 0') rainfall_high = rainfall_high_mask.value_counts().get(True, 0) rainfall_equal = rainfall_equal_mask.value_counts().get(True, 0) rainfall_low = rainfall_low_mask.value_counts().get(True, 0) # print(rainfall_high, rainfall_equal, rainfall_low) if rainfall_low == 0 or rainfall_high == 0: if rainfall_equal != 0: p3 += '除' p3 += '、'.join(tmp.loc[rainfall_equal_mask, '區域']+'區域') p3 += "降雨量較往年無變化外," if rainfall_high == 0: p3 += f"各區域降雨量均較往年偏低" elif rainfall_low == 0: p3 += f"各區域降雨量均較往年偏高" t = tmp['降雨距平(mm)'].abs() p3 += f"{t.min()}~{t.max()}mm;" else: if rainfall_equal != 0: p3 += '除' p3 += '、'.join(tmp.loc[rainfall_equal_mask, '區域']+'區域') p3 += "降雨量較往年無變化," # 10%以內差異認為是持平 if rainfall_high > rainfall_low*1.1: if rainfall_equal == 0: p3 += '除' p3 += '、'.join(tmp.loc[rainfall_low_mask, '區域']+'區域') p3 += "降雨量較往年偏低" t = tmp.loc[rainfall_low_mask, '降雨距平(mm)'].abs() if t.shape[0] > 1: p3 += f"{t.min()}~{t.max()}mm" else: p3 += f"{t.min()}mm" p3 += "外," t = tmp.loc[rainfall_high_mask, '降雨距平(mm)'].abs() p3 += f"其余各區域降雨量較往年偏高{t.min()}~{t.max()}mm;" elif rainfall_low > rainfall_high*1.1: if rainfall_equal == 0: p3 += '除' p3 += '、'.join(tmp.loc[rainfall_high_mask, '區域']+'區域') p3 += "降雨量較往年偏高" t = tmp.loc[rainfall_high_mask, '降雨距平(mm)'].abs() if t.shape[0] > 1: p3 += f"{t.min()}~{t.max()}mm" else: p3 += f"{t.min()}mm" p3 += "外," t = tmp.loc[rainfall_low_mask, '降雨距平(mm)'].abs() p3 += f"其余各區域降雨量較往年偏低{t.min()}~{t.max()}mm;" else: if rainfall_equal != 0: p3 = p3[:-1]+'外,' p3 += f"各區域降雨量較往年偏高和偏低的數量持平,其中" p3 += '、'.join(tmp.loc[rainfall_low_mask, '區域']+'區域') p3 += "降雨量較往年偏低" t = tmp.loc[rainfall_low_mask, '降雨距平(mm)'].abs() if t.shape[0] > 1: p3 += f"{t.min()}~{t.max()}mm," else: p3 += f"{t.min()}mm," p3 += '、'.join(tmp.loc[rainfall_high_mask, '區域']+'區域') p3 += "降雨量較往年偏高" t = tmp.loc[rainfall_high_mask, '降雨距平(mm)'].abs() if t.shape[0] > 1: p3 += f"{t.min()}~{t.max()}mm;" else: p3 += f"{t.min()}mm;" p3s.append([station, p3]) p3s[-1][-1] = p3s[-1][-1][:-1]+"。" p3s

      1

      2

      3

      4

      5

      6

      7

      8

      9

      10

      11

      12

      13

      14

      15

      16

      17

      18

      19

      20

      21

      22

      23

      24

      25

      26

      27

      28

      29

      30

      31

      32

      33

      34

      35

      36

      37

      38

      39

      40

      41

      42

      43

      44

      45

      46

      47

      48

      49

      50

      51

      52

      53

      54

      55

      56

      57

      58

      59

      60

      61

      62

      63

      64

      65

      66

      67

      68

      69

      70

      71

      72

      73

      74

      75

      76

      77

      結果:

      [['A站', '各區域降雨量在0.0~16.0mm之間,除548ad區域、1bafe區域、51a45區域、53f42區域降雨量較往年偏高0.1~7.41mm外,其余各區域降雨量較往年偏低0.4~3.4mm;'], ['B站', '各區域降雨量在0.0~5.3mm之間,除54ac3區域降雨量較往年無變化外,各區域降雨量較往年偏高和偏低的數量持平,其中16d40區域、592ac區域降雨量較往年偏低0.2~0.5mm,32046區域、4e6f0區域降雨量較往年偏高0.5~1.1mm;'], ['C站', '各區域降雨量在1.3~3.5mm之間,除3722c區域降雨量較往年偏高1.4mm外,其余各區域降雨量較往年偏低0.6~2.9mm;'], ['D站', '各區域降雨量在0.0~5.5mm之間,各區域降雨量較往年偏高和偏低的數量持平,其中66955區域、7639e區域、1c5ff區域降雨量較往年偏低0.9~3.1mm,2d91d區域、78896區域、25464區域降雨量較往年偏高0.9~1.6mm;'], ['E站', '各區域降雨量在7.3~13.6mm之間,各區域降雨量均較往年偏高4.0~9.1mm。']]

      1

      2

      3

      4

      5

      6

      7

      8

      可能是我還沒有想出較好的封裝方式導致代碼變得這么復雜,如果有巧妙解決這個問題方法的朋友,希望能夠一起探討。

      將組織好的文本寫入到word文檔中

      word模板文件docxtemplate.docx的內容:

      一、{{ month }}月各氣象觀測站降雨量實況 (一)降水 {{ p1 }} {{ p2 }} {%p for station,p3 in p3s %} {{ station }}:{{ p3 }} {%p endfor %}

      1

      2

      3

      4

      5

      6

      7

      即:

      python渲染代碼:

      from docxtpl import DocxTemplate tpl = DocxTemplate("docxtemplate.docx") context = { 'month': month, 'p1': p1, 'p2': p2, 'p3s': p3s, } tpl.render(context) tpl.save("11月降雨量報告.docx")

      1

      2

      3

      4

      5

      6

      7

      8

      9

      10

      11

      執行完畢,得到word報告:

      版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。

      版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。

      上一篇:無須時間焦慮?看看牛人是怎么做時間管理
      下一篇:word頁面裝訂線距正文25磅怎么設置(頁面裝訂線距正文25磅 左邊怎么設置)
      相關文章
      亚洲AV日韩AV高潮无码专区| 亚洲免费日韩无码系列| 亚洲国产精品无码专区影院| 亚洲中文字幕视频国产| 亚洲Aⅴ无码一区二区二三区软件| 亚洲爆乳精品无码一区二区| 亚洲一日韩欧美中文字幕在线| 亚洲日本国产综合高清| 亚洲人成人77777网站不卡| 亚洲天堂一区二区| 无码乱人伦一区二区亚洲一| 久久久亚洲精品国产| 日韩精品一区二区亚洲AV观看 | 亚洲欧美一区二区三区日产| 亚洲最大的成人网| 亚洲av日韩精品久久久久久a| 综合一区自拍亚洲综合图区| 亚洲av无码乱码在线观看野外| 亚洲成年人啊啊aa在线观看| 久久精品国产亚洲一区二区三区| 国产成人精品久久亚洲| 中文字幕亚洲综合久久男男| 日本亚洲视频在线| 内射干少妇亚洲69XXX| 亚洲国色天香视频| 国产成人精品亚洲2020| 亚洲国产成人无码AV在线影院| 蜜桃传媒一区二区亚洲AV| 亚洲国产精品不卡毛片a在线| 亚洲日韩精品国产3区| 亚洲av日韩av永久在线观看| 亚洲精品成人久久久| 爱情岛亚洲论坛在线观看| 国产99久久亚洲综合精品| 五月婷婷亚洲综合| 亚洲人成无码网站| 久久久久亚洲AV片无码下载蜜桃| 亚洲激情在线视频| 亚洲色欲www综合网| 亚洲AV无码欧洲AV无码网站| 2022年亚洲午夜一区二区福利 |