PDF文件如何轉成markdown格式

      網友投稿 977 2025-04-03

      百度上根據pdf轉makrdown為關鍵字進行搜索,結果大多數是反過來的轉換,即markdown文本轉PDF格式。

      但是PDF轉markdown的解決方案很少。

      正好我工作上有這個需求,所以自己實現了一個解決方案。

      下圖是一個用PDF XChange Editor打開的PDF文件,我想將其內容通過markdown格式導出。

      (1) 首先將該PDF導出成word格式,后綴.docx

      (2) 使用typora獲得該word文檔的markdown源代碼:

      此時任務只完成了一半,因為typora這個工具轉換成的markdown格式,如果原始的word文檔里包含圖片,這些圖片以本地圖片的形式存在于markdown里,那我如果直接將包含了這些本地圖片的標簽的markdown發布到簡書,CSDN,開源中國,騰訊云,阿里云這些支持markdown的社區時,這些本地圖片將無法顯示。

      因此我們必須找到一個高效的方法,將word里包含的本地圖片先上傳到網絡上,再用生成的包含了圖片網絡url的markdown標簽替換本地圖片標簽。

      (3) 把word文件的后綴從.docx改成.zip, 解壓后,在文件夾word的子文件夾media里能找到所有的本地文件。

      把這些本地文件全部上傳到網站,生成下面這些url:

      我寫了一個工具,可以把僅包含了本地圖片標簽的markdown源代碼和包含了上述在線圖片url標簽的源代碼做一個合并,后并后,本地圖片標簽會被在線圖片標簽取代:

      這個工具可以從我github上獲得:

      PDF文件如何轉成markdown格式

      https://github.com/i042416/KnowlegeRepository/blob/master/practice/255_markdown_tool.html

      下圖就是我的原始PDF轉換成markdown格式后發布在某社區上的效果,和原始PDF外觀完全一致:

      Markdown

      版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。

      版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。

      上一篇:PCB表面處理工藝六大分類
      下一篇:Excel2010中進行表格篩選數據的操作方法(excel2010表格怎么篩選數據)
      相關文章
      亚洲av一综合av一区| 国产亚洲精久久久久久无码| 亚洲色图古典武侠| 亚洲AV无码一区二区三区系列| 国产中文在线亚洲精品官网| 色噜噜AV亚洲色一区二区| 亚洲午夜激情视频| 77777亚洲午夜久久多人| 亚洲欧洲成人精品香蕉网| 亚洲无人区午夜福利码高清完整版| 国产福利电影一区二区三区,亚洲国模精品一区 | 亚洲国产精品VA在线看黑人| 亚洲精品国产字幕久久不卡| 亚洲色无码一区二区三区| 国产成人综合亚洲亚洲国产第一页| 国产自偷亚洲精品页65页| 中文字幕在线亚洲精品| 亚洲国产精品无码久久久蜜芽| 亚洲av日韩综合一区在线观看| 91情国产l精品国产亚洲区| 亚洲福利电影一区二区?| 亚洲剧场午夜在线观看| 亚洲综合国产成人丁香五月激情 | 亚洲精品二三区伊人久久| 亚洲精品美女网站| 亚洲gay片在线gv网站| 亚洲?V无码成人精品区日韩| 亚洲真人日本在线| 亚洲AV无码乱码在线观看富二代 | 亚洲另类春色国产精品| 亚洲小说图区综合在线| 亚洲AV电影天堂男人的天堂| 亚洲成人高清在线| 国产精品亚洲аv无码播放| 婷婷亚洲久悠悠色悠在线播放 | 亚洲人成网站18禁止一区| 中文字幕亚洲第一| 久久亚洲精品成人777大小说| 亚洲福利秒拍一区二区| 亚洲人成网站免费播放| 亚洲国产午夜福利在线播放|