使用python讀取word文件里的表格信息

網友投稿 1748 2025-03-31

在企查查查詢企業信息的時候，得到了一些word文件，里面有些控股企業的數據放在表格里，需要我們將其提取出來。

word文件看起來很復雜，不方便進行結構化。實際上，一個word文檔中大概有這么幾種類型的內容：paragraph（段落），table（表格），character（字符）。我現在要解析的word文檔中，基本都是段落和表格，本文主要來講一下如何從word中解析出表格，并將表格信息進行結構化。

要想使用python解析word文件，我們可以使用包docx，首先我們需要安裝它。

pip install python-docx

安裝完成后，我們需要讀取word文件，代碼大致如下：

import docx

from docx import Document

docFile = '國家電網有限公司.docx'

Document = Document(docFile) #讀入文件

tables = document.tables #獲取文件中的表格集

使用python讀取word文件里的表格信息

上面的代碼中，tables已經是word文件中所有的table構成的list，我要尋找的表格2.6是word文件中的第9個table，可以這樣讀取。

table = tables[8]#獲取文件中的第9個表格

for i in range(1, len(table.rows)):#從表格第二行開始循環讀取表格數據

idNum = table.cell(i,0).text #序號

companyName = table.cell(i,1).text ?#控股企業名稱

investmentRate = table.cell(i,2).text ? #投資比例

stock= table.cell(i,3).text ?#股權鏈

這里已經將表2.6的每一列每一行遍歷啦，之后可以將抽取出來的4個參數寫到CSV或插入數據庫中。

====================================================================

本文發表在李思原博客“機器在學習”

=====================================================================

python

標簽：數據庫 Document

【云圖說】第235期 DDS讀寫兩步走帶您領略只讀節點的風采

1748 2025-03-31

【小資說庫】第13期應用程序開發人員、DBA和DBMS開發人員的分工是怎樣的？

1748 2025-03-31

Spark_算子調優

1748 2025-03-31

使用python讀取word文件里的表格信息

【云圖說】第235期 DDS讀寫兩步走帶您領略只讀節點的風采

【小資說庫】第13期應用程序開發人員、DBA和DBMS開發人員的分工是怎樣的？

Spark_算子調優

推薦文章

企業生產管理是什么，企業生產管理軟件

進盤點進銷存軟件排行榜前十名

進銷存系統哪個簡單好用？進銷存系統優點

工廠生產管理（工廠生產管理流程及制度）

生產管理軟件，機械制造業生產管理，制造業生產過程管理軟件

進銷存軟件和ERP有什么區別？進銷存與erp軟件理解

進銷存如何進行庫存管理

如何利用excel制作銷售訂單管理系統？

數據庫訂單管理系統有哪些功能？數據庫訂單管理系統怎么設計？

什么是數據庫管理系統？

最近發表

熱評文章

零代碼開發是什么？2022低代碼平臺排行榜">零代碼開發是什么？2022低代碼平臺排行榜

進銷存庫存管理 系統（智慧進銷存）">智能進銷存庫存管理系統（智慧進銷存）

在線文檔哪家強？8款在線文檔編輯軟件推薦">在線文檔哪家強？8款在線文檔編輯軟件推薦

WPS2016怎么繪制簡單的價格表?

系統的功能有哪些？餐飲服務系統的構成及工作程序">連鎖餐飲管理系統的功能有哪些？餐飲服務系統的構成及工

進銷存庫存管理盤點">簡單進銷存庫存管理盤點

友情鏈接

使用python讀取word文件里的表格信息

推薦文章

最近發表

熱評文章

零代碼開發是什么？2022低代碼平臺排行榜">零代碼開發是什么？2022低代碼平臺排行榜

進銷存庫存管理系統（智慧進銷存）">智能進銷存庫存管理系統（智慧進銷存）

在線文檔哪家強？8款在線文檔編輯軟件推薦">在線文檔哪家強？8款在線文檔編輯軟件推薦

系統的功能有哪些？餐飲服務系統的構成及工作程序">連鎖餐飲管理系統的功能有哪些？餐飲服務系統的構成及工

進銷存庫存管理盤點">簡單進銷存庫存管理盤點

友情鏈接

零代碼開發是什么？2022低代碼平臺排行榜">零代碼開發是什么？2022低代碼平臺排行榜

在線文檔哪家強？8款在線文檔編輯軟件推薦">在線文檔哪家強？8款在線文檔編輯軟件推薦

系統的功能有哪些？餐飲服務系統的構成及工作程序">連鎖餐飲管理系統的功能有哪些？餐飲服務系統的構成及工