亚洲精品中文字幕无乱码_久久亚洲精品无码AV大片_最新国产免费Av网址_国产精品3级片

HTML DOM

使用XPDF將PDF轉(zhuǎn)換為HTML的操作步驟

時間:2024-08-15 20:12:53 HTML DOM 我要投稿
  • 相關(guān)推薦

使用XPDF將PDF轉(zhuǎn)換為HTML的操作步驟

  1、下載xpdf最新版本,我下載的是xpdf-3.02pl2-win32.zip

  2、下載中文支持包,我下載的是xpdf-chinese-simplified.tar.gz

  3、下載pdftohtml支持包,我下載的是:pdftohtml-0.39-win32.tar.gz

  4、解壓調(diào)試

  1) 先將xpdf-3.02pl2-win32.zip解壓,解壓后的內(nèi)容可根據(jù)需要進(jìn)行刪減,如果只需要轉(zhuǎn)換為txt格式,其他的

  exe文件可以刪除,只保留pdftotext.exe,以此類推;

  2) 然后將xpdf-chinese-simplified.tar.gz解壓到剛才xpdf-3.02pl2-win32.zip的解壓目錄;

  3) 將pdftohtml-0.39-win32.tar.gz解壓,pdftohtml.exe解壓到xpdf-3.02pl2-win32.zip的解壓目錄;

  4) 目錄結(jié)構(gòu):

  +---[X:xpdf]

  |-------各種轉(zhuǎn)換用到的exe文件

  |

  |-------xpdfrc

  |

  +------[X:xpdfxpdf-chinese-simplified]

  |

  http://www.javaeye.com/forums 1.6 Word/Excel/PDF文件轉(zhuǎn)換成HTML整理

  |

  +-------很多轉(zhuǎn)換時需要用到的字符文件

  xpdfrc:此文件是用來聲明轉(zhuǎn)換字符集對應(yīng)路徑的文件

  5) 修改xpdfrc文件(文件原名為sample-xpdfrc)

  修改文件內(nèi)容為:

  #----- begin Chinese Simplified support package

  cidToUnicode Adobe-GB1 xpdf-chinese-simplifiedAdobe-GB1.cidToUnicode

  unicodeMap ISO-2022-CN xpdf-chinese-simplifiedISO-2022-CN.unicodeMap

  unicodeMap EUC-CN xpdf-chinese-simplifiedEUC-CN.unicodeMap

  unicodeMap GBK xpdf-chinese-simplifiedGBK.unicodeMap

  cMapDir Adobe-GB1 xpdf-chinese-simplifiedCMap

  toUnicodeDir xpdf-chinese-simplifiedCMap

  fontDir C:WINDOWSFonts

  displayCIDFontTT Adobe-GB1 C:WINDOWSFontssimhei.ttf

  #----- end Chinese Simplified support package

  6) 創(chuàng)建bat文件pdftohtml.bat(放置的路徑不能包含空格)

  內(nèi)容為:

  @echo off

  set folderPath=%1

  set filePath=%2

  cd /d %folderPath%

  pdftohtml -enc GBK %filePath%

  exit

  http://www.javaeye.com/forums 1.6 Word/Excel/PDF文件轉(zhuǎn)換成HTML整理

  7) 創(chuàng)建類

  public class ConvertPdf

  {

  private static String INPUT_PATH;

  private static String PROJECT_PATH;

  public static void convertToHtml(String file, String project)

  {

  INPUT_PATH = file;

  PROJECT_PATH = project;

  if(checkContentType()==0)

  {

  toHtml();

  }

  }

  private static int checkContentType()

  {

  String type = INPUT_PATH.substring(INPUT_PATH.lastIndexOf(".") + 1, INPUT_PATH.length())

  .toLowerCase();

  if (type.equals("pdf"))

  return 0;

  else

  return 9;

  }

  private static void toHtml()

  {

  if(new File(INPUT_PATH).isFile())

  {

  try

  {

  String cmd = "cmd /c start X:pdftohtml.bat "" + PROJECT_PATH + "" http://www.javaeye.com/forums 1.6 Word/Excel/PDF文件轉(zhuǎn)換成HTML整理

  Runtime.getRuntime().exec(cmd);

  }

  catch (IOException e)

  {

  e.printStackTrace();

  }

  }

  }

  }

  String cmd = "....";此處代碼是調(diào)用創(chuàng)建的bat文件進(jìn)行轉(zhuǎn)換

  8) 測試轉(zhuǎn)換

  public static void main(String[] args)

  {

  ConvertPdf.convertToHtml("C:test.pdf", "X:xpdf");

  }

【使用XPDF將PDF轉(zhuǎn)換為HTML的操作步驟】相關(guān)文章:

科目三轉(zhuǎn)彎詳細(xì)操作步驟10-30

數(shù)控加工中心的操作步驟07-16

用友U8年結(jié)詳細(xì)操作步驟05-31

用友T6結(jié)賬及反結(jié)賬操作詳細(xì)步驟06-01

數(shù)控加工中心新手操作需要學(xué)習(xí)的7個步驟07-16

金蝶財務(wù)軟件操作流程和使用技巧02-23

網(wǎng)頁滾動文字的制作HTML代碼04-10

最新金蝶財務(wù)軟件操作流程和使用技巧04-05

臨摹的方法與步驟03-20

細(xì)致的泡茶步驟04-19