亚洲国产日韩欧美在线a乱码,国产精品路线1路线2路线,亚洲视频一区,精品国产自,www狠狠,国产情侣激情在线视频免费看,亚洲成年网站在线观看

使用XPDF將PDF轉(zhuǎn)換為HTML的操作步驟

時(shí)間:2023-03-29 19:09:31 HTML DOM 我要投稿
  • 相關(guān)推薦

使用XPDF將PDF轉(zhuǎn)換為HTML的操作步驟

  1、下載xpdf最新版本,我下載的是xpdf-3.02pl2-win32.zip

  2、下載中文支持包,我下載的是xpdf-chinese-simplified.tar.gz

  3、下載pdftohtml支持包,我下載的是:pdftohtml-0.39-win32.tar.gz

  4、解壓調(diào)試

  1) 先將xpdf-3.02pl2-win32.zip解壓,解壓后的內(nèi)容可根據(jù)需要進(jìn)行刪減,如果只需要轉(zhuǎn)換為txt格式,其他的

  exe文件可以刪除,只保留pdftotext.exe,以此類推;

  2) 然后將xpdf-chinese-simplified.tar.gz解壓到剛才xpdf-3.02pl2-win32.zip的解壓目錄;

  3) 將pdftohtml-0.39-win32.tar.gz解壓,pdftohtml.exe解壓到xpdf-3.02pl2-win32.zip的解壓目錄;

  4) 目錄結(jié)構(gòu):

  +---[X:xpdf]

  |-------各種轉(zhuǎn)換用到的exe文件

  |

  |-------xpdfrc

  |

  +------[X:xpdfxpdf-chinese-simplified]

  |

  http://www.javaeye.com/forums 1.6 Word/Excel/PDF文件轉(zhuǎn)換成HTML整理

  |

  +-------很多轉(zhuǎn)換時(shí)需要用到的字符文件

  xpdfrc:此文件是用來(lái)聲明轉(zhuǎn)換字符集對(duì)應(yīng)路徑的文件

  5) 修改xpdfrc文件(文件原名為sample-xpdfrc)

  修改文件內(nèi)容為:

  #----- begin Chinese Simplified support package

  cidToUnicode Adobe-GB1 xpdf-chinese-simplifiedAdobe-GB1.cidToUnicode

  unicodeMap ISO-2022-CN xpdf-chinese-simplifiedISO-2022-CN.unicodeMap

  unicodeMap EUC-CN xpdf-chinese-simplifiedEUC-CN.unicodeMap

  unicodeMap GBK xpdf-chinese-simplifiedGBK.unicodeMap

  cMapDir Adobe-GB1 xpdf-chinese-simplifiedCMap

  toUnicodeDir xpdf-chinese-simplifiedCMap

  fontDir C:WINDOWSFonts

  displayCIDFontTT Adobe-GB1 C:WINDOWSFontssimhei.ttf

  #----- end Chinese Simplified support package

  6) 創(chuàng)建bat文件pdftohtml.bat(放置的路徑不能包含空格)

  內(nèi)容為:

  @echo off

  set folderPath=%1

  set filePath=%2

  cd /d %folderPath%

  pdftohtml -enc GBK %filePath%

  exit

  http://www.javaeye.com/forums 1.6 Word/Excel/PDF文件轉(zhuǎn)換成HTML整理

  7) 創(chuàng)建類

  public class ConvertPdf

  {

  private static String INPUT_PATH;

  private static String PROJECT_PATH;

  public static void convertToHtml(String file, String project)

  {

  INPUT_PATH = file;

  PROJECT_PATH = project;

  if(checkContentType()==0)

  {

  toHtml();

  }

  }

  private static int checkContentType()

  {

  String type = INPUT_PATH.substring(INPUT_PATH.lastIndexOf(".") + 1, INPUT_PATH.length())

  .toLowerCase();

  if (type.equals("pdf"))

  return 0;

  else

  return 9;

  }

  private static void toHtml()

  {

  if(new File(INPUT_PATH).isFile())

  {

  try

  {

  String cmd = "cmd /c start X:pdftohtml.bat "" + PROJECT_PATH + "" http://www.javaeye.com/forums 1.6 Word/Excel/PDF文件轉(zhuǎn)換成HTML整理

  Runtime.getRuntime().exec(cmd);

  }

  catch (IOException e)

  {

  e.printStackTrace();

  }

  }

  }

  }

  String cmd = "....";此處代碼是調(diào)用創(chuàng)建的bat文件進(jìn)行轉(zhuǎn)換

  8) 測(cè)試轉(zhuǎn)換

  public static void main(String[] args)

  {

  ConvertPdf.convertToHtml("C:test.pdf", "X:xpdf");

  }

【使用XPDF將PDF轉(zhuǎn)換為HTML的操作步驟】相關(guān)文章:

迅捷CAD轉(zhuǎn)PDF轉(zhuǎn)換器軟件介紹10-26

軟文推廣營(yíng)銷操作步驟03-03

裝載機(jī)正確的操作步驟08-12

檢修電氣設(shè)備操作步驟12-07

挖掘機(jī)的基本操作步驟10-25

泡茶機(jī)怎么使用步驟06-08

將格式化文本導(dǎo)入Excel的步驟12-07

使用ajax操作JavaScript對(duì)象的方法08-26

化妝水的正確使用步驟08-11

光療甲油膠的操作步驟與維護(hù)技巧04-03