设为首页收藏本站|繁體中文 快速切换版块

 找回密码
 立即加入
搜索
查看: 2045|回复: 2

PDF文件处理

[复制链接]

该用户从未签到

尚未签到

发表于 2007-12-6 15:52:27 | 显示全部楼层 |阅读模式

马上加入,结交更多好友,共享更多资料,让你轻松玩转电力研学社区!

您需要 登录 才可以下载或查看,没有账号?立即加入

×
PDF文件处理2 x4 a7 Y5 K* U2 o* q: f7 C8 M9 ?
问:PDF与WORD之间如何通过软件实现格式转换?
! F0 d! F/ o) ?8 ?
/ T% c& `2 O: ?2 V  |( X答:PDF—>DOC  使用软件Acrobat,pdf2word;DOC—>PDF  使用软件Acrobat。0打开tif文件,识别。这个东东识别准确率极高。 9 ^* D& a6 L3 J; k! C

8 l# [* o1 m+ \8 C, cpdf->Tiff(JPEG,PNG)->OCR输出word,效果极佳,如果是English几乎不用怎么修改就可以用了。
3 \, Y6 b9 N; f) L, R3 F" D' e. H4 J" x, H& K$ `
推荐OCR软件:ABBYY FineReader 7.0;ScanSoft OmniPage Pro 14.0(最强)
0 t( I: f# j+ n: H& t  H9 O" V5 E2 r7 I) z

0 x3 R" a- @/ t问:如何把WORD文档转换成PDF? 3 H4 _  }# c, i6 I: H! a

! [$ E: q% A: O2 j5 p9 o答:安装Acrobat(不只是Reader)完全版,在安装选项里有的,把这一项选上,选pdfmaker。在word的工具条上会有一个转换按钮。装好之后在WORD的工具栏里面会有Adobe PDF,下拉菜单里面会有convert to Adobe PDF,按那个就行了。在控制面板里的打印机里多了两个关于Acrobat的,说明可以了。装了Acrobat的话,默认会装一个distiller,你也可以装acrobat里面的pdfwriter,它们两个都会成为虚拟的打印机的。然后在Word里,File->Print选择刚过装好的虚拟打印机就可以了。/ Z6 ]/ S. {/ R! u/ r
+ H& ]/ k1 m2 d' U* w8 [- g" @4 y
6 I/ K/ w+ W& ^/ M3 K
问:如何将PDF文档直接转为WORD?除了ACROBAT还有其它软件工具吗,用这个图片走样很厉害( K* _- @! q4 s: M! f0 E0 w  r

: h7 T# B' E$ P9 c( t$ b8 d! O答:使用pdf2word、pdffactory这些软件可以实现; q1 }1 x! L3 u* w& C
6 J1 M6 n7 J- {& D5 m" b
5 s1 u7 V  T; i+ O3 |! t5 @
问:DOC转换成PDF时,图很不清楚,怎么办?论文的提交的格式是DOC,但在DOC转PDF时,图很不清楚。) h& G! n/ C; G- Z- q! D
' j* m0 e$ T  \6 u
答:不要用pdfwriter,用distiller可能会好一些。或者用Letex,图的清晰度损失不大) W1 m! {3 J! X7 R7 J8 ]8 D4 J
. j! g1 E, n6 U; l" F

" N( v8 ~6 Q0 P  ^8 ?6 S3 t问:很多用VISIO画的图,插入在WORD文档里面的,怎么专成PDF以后,图里面的字母位置变了?而且变的很夸张,满屏幕乱窜,这个问题怎么办啊?
1 Q) I% k9 ?4 T
% F& Z8 K8 f9 \答:Word中所有图片都变成tif格式的。其他的一律事先转成tif,压缩的,这样文件也不大。或者变成BMP位图也可以,但图片容量比较大。# ]7 o# q9 B4 Q. y

; W0 J- w9 e' R+ t' Y0 }# }* W( F+ G- Z
问:我想把PDF格式文档直接转成DOC(就是WORD文档)或者TXT(纯文本文档),可以吗?
% p$ f& o0 t- G; j0 d% {
7 r7 M. i$ H6 \! |1 q. S: n7 s答:PDF格式的文档是不能直接转换成DOC(WORD文档)的,但是可以先转换成RTF格式,然后再转成DOC格式,前提是该PDF文档必须是纯英文的,中文的PDF转换之后会出现乱码。此时,需要用到一个工具:Aerial,这个工具是Acrobat的一个插件,可以用来把PDF文档转换成RTF文档。原PDF文档可以包含图片,图片能正常转换到RTF文档中。如果只需转换成TXT文档,那么直接转换就可以了(图片就没了)。
( b: P) |+ }  Q1 v4 x" n! r: G  y. t" m- C& ~4 z- x: N6 E

5 h) _. g5 ]2 H) ^9 }" m问:PDF文件中的文字怎么转换成WORD?
& y3 O  T8 M! k+ o+ j2 f8 w
  B4 ^8 ]% e; D# H答:如果是文本的,可以用Acrobat选中文字功能,如果是图片格式的,可以用最新豪华版的维普的OCR功能,但是要自己改错字。
3 r' \# O' x+ O0 U3 M7 z& k$ B( O/ p5 p+ O: ^7 c
; b' R3 E. \3 k& u  b( [( \
问:我的PDF转WORD的时候怎么排版变了?
  |; v' F' z0 Z4 @! ?; v; v% C: ]* o+ F) _/ k
答:有些地方没有用固定的东西固定,比如分页符、软回车,图片不统一也很有可能排版变掉  x/ n+ c: w$ ?" K
- l* v  i) H( E4 _9 f, I4 r
% w2 s! f5 a( o& i, O
问:PDF转换成WORD,提示PDF有密码,怎么办呢?4 n) X8 d/ |4 }: V% m* j2 L
, w& q0 i+ ]8 O2 P' D( n
答:找一个PDF密码石皮解器,石皮解后,再转换就可以了。) Z7 |; H, z: Y* J
( y& U9 O" _/ R  v$ @6 C, m$ z
比如Advanced pdf Password Recovery;pdf Password Remover;HB-pdfpr21-fxj.zip;Advanced Password Recovery5.3。后者是一个各种石皮解的集成,里面的Acrobat是针对PDF的。
* I- a/ _4 r- @9 _8 ^0 g9 V1 q# K5 S# |

7 S# \9 y/ R( H* c5 @问:PDF文件到TXT文件的转换,除了copy和paste得方法外,还有什么办法吗?& C3 t" n' ?- i& U
7 Y. w5 \: P% M, f0 M
答:将WORD转为PDF,然后用方法2另存为rtf文件,WORD可以识别。但是一般的下载文献,因为本身是图形,所以第二种方法不能实现。以上所说的是针对中文文本。+ L7 x. T! f. T: W! @
* Q. z8 ]0 P8 T
PDF-—>WORD方法总结如下:
" A( ?3 s# X3 B. H+ A! L; F
. v2 l1 p' G# ~; i4 b& n●如果PDF本身就是图形的话处理方法如下:
  @, m2 F6 E! B1 e; I! [$ U& c, q; j9 Y. B
(1)英文处理方法:
  ?+ f8 A; G' L. F- Z3 t8 L" F' q# ~/ a' @. Y
A,用photoshop6。0打开PDF将之转化为tif格式文件。
1 C% _' s1 |# \9 p; X6 g- E& `7 O, E, `/ V7 ]+ }& _3 b& f5 X
B,用<, SPAN lang=EN-US style="COLOR: blue">Omnipagepro10
- w( z% R3 N  {: N" o) \: W$ }! z- a2 f: k) ?' E/ Q2 ~
(2)中文处理方法:
) t3 V. b' M8 ^' }/ X: x; f
8 r( x. y; }/ Y3 J( sA,用photoshop打开PDF将之转化为tif格式文件。
  O) g* Q0 D) b% o
2 ^4 _; \. i" {1 YB,用th-ocr2000专业版或者Shocr6。0打开tif文件,识别。. h4 U' |" j. Z' m
( c0 n% V& W  V# h

6 r+ Y: R5 L4 D/ u2 S' z: `●如果PDF本身是文本的话处理方法如下:
  X9 D+ y5 W, g$ J( L- N  _0 _& l) e
(1)使用BCL公司的drake软件(Acrobat的插件)转换。1 w/ f/ U( c2 ?5 s# F. T8 s9 T

2 i) X+ K2 G+ q% c0 y使用第一种方法转换成的rtf文件格式比较乱,不过可以直接拷贝出其中的图形。# _! y9 f: {# n5 \+ Y

, r( h/ u8 l7 N$ W% J# _& y使用的二种方法转换成的rtf文件格式遵循原文,不过不能拷贝原文中的图形。
3 T8 x: _0 m4 Z
, v: ^4 n# q( y9 r% g7 g" b
/ ]. B: T/ k+ H" m; J& [问:为什么我的PDF文档不能选取文字内容或者存为rtf或者txt?2 b+ i8 S1 T- V; p0 n+ H: U$ V: @

+ V5 s  g; m- a5 D) J答:如果不属于这种情况,很可能是因为这个文档中的所谓的文字是从图像文件(比如扫描仪得到的结果)打印出来的。这种情况下是肯定不能直接选取文本的。顺便说一下,在Acrobat 6.0中是另存为WORD文档。, q( u; W5 z  ~  C! B2 G- E

% m9 R2 }4 {& K8 @; C# h; U' H; y. X解决办法:使用OCR软件识别图像中的文本内容。识别英文的软件推荐Abbyy Fine Reader,中文推荐北大汉王,清华紫光。扫描仪一般会附带这种软件的。
5 ]8 B% a. c  w$ u  O) A# j" A$ N0 R

3 E, `' y( c7 d% v. K! I问:怎么把pdf格式中的图表拷贝出来?# @" R$ L! }% l6 B, ]! N, y

: J1 u) c0 M  l2 t. U! a$ E答:如下方式均可:
; ^* O# e8 I6 U9 Z& P* {# ~  _0 A8 A8 A7 D+ N9 `8 p' h
●acrobat6.0以上里面有复制表格这一个选项的
( p# Z& m7 k; @; ]5 O
6 A/ p) P" u5 c7 w  N- o●尚书六号软件8 C1 h1 D8 t7 o% N2 B

7 R& |1 l# e1 }# T( c' [, V●snagit2 k3 ]/ `) F# S( a3 Q2 g
- `. B/ H. C* c9 b) N: E
●print screen一键即可
8 o+ |8 y/ Y0 R/ ]0 D" [
3 O; b7 ~* I, K7 `% T8 d8 A, U
问:visio的图转化为pdf文件时出问题了,框图中的文字位置跑到外面去了,不知道怎么回事,其它几张都是好的,如何处理?
7 [& o. p2 Q: U3 \" V- e
5 `! E; y  d- [( f7 ?答:即使转成wmf格式插在word中有时也会这样。把它转成emf就没问题,应该在pdf中也可以;或者把word中的visio框图换成位图,然后再转成pdf就可以了;图片不要存成默认格式,存成tiff格式,分辨率设得高一点,再插入到word中,再转成pdf文件
2 e8 {. {* B& S& i9 q$ L' W9 V# Q; p( U2 H% [+ M. r! g3 Z
1 a0 _/ T' m9 q( H2 G& I1 ^
问:如何把pdf文件连起来?. p- z) ~- n3 K! J4 Q7 v
/ l$ h* b3 G( l9 N4 U! w
答:用acrobat,全选,右键然后选择合并。。。;有个combine pdf选项可以实现,文件(File)—创建PDF—从多个文件—浏览—添加多个文件—确定/ b; C8 e9 k. {5 J

4 |2 `0 Y/ D, X4 }; l# j2 t, K0 z& {% w
问:怎么将PDF文件的其中几页保存为另一个文件?打印了之后,文件打不开!怎么回事呢?
5 \" [6 Q7 S$ e9 x7 V: k+ J: g3 ?9 u% x- m8 Z& h. R; G
答:可以试试选中要的几页,点击右键,选“选取文件”项,然后另存为另外一个文件即可5 ]* m& [# p, M4 G6 S

6 o& d  H2 P! x9 }$ [0 `* W问:怎么选中几页呢?就算只要一页,我点击右键也没有找到选取文件项,对啦,我在PDF文件上加了一些阅读过的符号,如画线、加亮之类的,这个有影响吗?0 W+ r1 h6 @; b2 F4 `
& c# w7 l4 F3 e: g/ f
答:不知道你用的是哪个版本的acrobat,根据我用7.0版的看来,在PDF上作改动不会影响选页保存。我的是英文版,选页保存操作如下:先打开左侧的pages栏,选择你要取出来的那些页,后右键选extract pages(我这边看来是第二项),之后会自动弹出来由选取的页组成的pdf文件,保存它就可以了。如果你要每一页分开保存,钩选那个extract pages as seperate files即可。! X( S9 ~# g* G! n
$ i% \1 G' u5 s; Q
或者安装软件PDFFACTORY,打开你的PDF文档,点击打印,选择PDFFACTORY,打印机选择打印的起始终止页码,确定打印,出来的就是原文中的你选择的某几页! N# P- J" W! _6 v- b" b  k3 O
- l& p; {) [/ W: E' x7 @

' d# @# o5 t- i问:为什么我的PDF不能用打印机打印?PDF文件设置密码加密后不可复制打印怎么办?
. e6 g& b; Y) m: R
& m6 n+ J7 `7 K2 |/ B答:PDF文档在创建的时候可以设置密码保护和权限,这一点可以在File—>Document Properties(文件-)文件属性)的安全选项里面找到。同时,如果文档设置了权限限制,在Acrobat(Reader)窗口的下方会出现一个金黄色的钥匙图标(6.0版本是左下角的一把锁)。在安全选项里面包括打印、对文章修改的各种权限的设置,如果你使用的是Acrobat,可以在这里自行设置密码保护。
  l7 J3 W. v3 C0 {
# X$ z' d+ _; {0 O) b# ]解决办法:使用PDF文档解密软件可以解决这个问题。推荐:Advanced pdf Password Recovery;pdf Password Remover;Advanced Password Recovery5.3。后者是一个各种石皮解的集成,里面的Acrobat是针对PDF的。# q% P; W7 ]5 s: k) x& ~+ m$ F
1 @8 o4 U$ O2 l8 a  ]  k( Z

2 p( P5 C3 B/ m* C" D5 \问:为什么我的Adobe Acrobat Distiller打印机不能正常打印文档到文件或PDF?. Y6 E- R! x9 w3 f- e
( @" q+ X1 R# `! [$ |
是把控制面板打印机里面的Acrobat或者Distiller打印机的preference中“不发送字体到Acrobat(或者Distiller)”的复选框去掉,然后就可以了。
2 B6 ^3 k  t+ g) [: V8 N- x$ ]
  B6 G8 \& R( `9 F$ w7 Y% H# C2 r1 k5 R' B
问:金山词霸如何在Acrobat(Reader)上取词?
( F" \& @: S! [# O. Q, {$ k
" ?! E9 c2 a9 y' F3 a3 \答:要先装acrobat,后装詞霸。将词霸目录下的xdict32.api插件复制到Acrobat(Reader)的Plug_ins目录下,两个软件都需要重新运行。文件是图形不能取词: x6 ~' j  C5 y4 j( g

% b" ?/ {" h  S
. {7 q0 d9 K) b/ [$ t9 H9 y问:词霸在acrobat 5中的取词解决方法
; g4 s9 L' X; \0 o
* p: Y' ^2 @: ~+ K. A0 q2 I- B1 {答:在acrobat5.0里的“edit”菜单,选择“Preferences”,取消选择“Certified Plug-ins only”选项,再重新启动Acrobar reader就可以取词了。
- W  G! [* M; ~
2 j7 B1 g& \# v2 B/ w中文的是这样的:编辑->首选项->一般->选项->启动->仅认证的增效工具,勾勾去掉。
! B" ^* D4 B3 m( P$ l4 a5 z/ }
5 }+ O- O& C, q* R) a) ^中文5.0默认就是去掉的,词霸可以识别: X7 a; v9 P2 H
3 `. y* H5 F! c4 }6 J

. Z" w" \* r5 e  F4 r问:英文的pdf文件中如有中文字符该怎么办?投个国际会议,结果反馈的信息是说我的pdf文件有postscript error,有人说是中文字符的问题,用一个英文版的acrobat打开,果然到有些页面要提示下载中文包,否则无法显示那些页面。原来是用word写的,能想到的就是查找中文的逗号句号什么的,可是搜来搜去改完了还是有这样的毛病,起先想找个英文版的office来,发现这年头这种东东还真是稀有,ft,有没有哪位处理过类似的问题,指点一把,先谢过了。。。
% A8 b% _9 _2 l- R4 D) Z
# y  d+ J: m) {9 G答:你可以用工具-》字数统计统计一下,里面是否有中文字符和朝鲜字。如果有的话,再慢慢的找。一般的来说,如果整篇是英文文本的话,里面混有中文字符的可能有:标点,特殊字符(如α等希腊字符),单位符号如度数(英文里没有这个特殊符号的,一般我是用上标0和大写的C组合的)。这样再找找看。
; W% d, A/ Q- r0 u; j& i4 A% ?# l2 q7 q" m& w

0 j  p4 I% W6 e问:怎么编辑PDF文件?就是在PDF文档中加入一些文字,怎么操作?2 u' F& E. I/ Z) }! S5 a

5 I/ \* j; ]1 J+ S: j3 U1 d答:要装pdf adobe acrobat standard软件,而不是reader软件,其中中有个高级编辑,有个图标像T+ 的,这个是编辑的工具
3 c; Y, Q* }* W  I) l) t
1 y2 Q5 I/ A8 ^2 l% U/ |) h: t$ \5 J! a1 v# \$ k' b4 J& c
问:Google搜索pdf文档最佳方法如何?
5 H, R9 d( r- H, s  E" X4 G- A3 Y# M8 A
答:可以采用如下方法:6 B4 h+ H6 Y- z2 H2 ]
) Y4 F/ n5 ]% g+ x
●直接用pdf作关键词5 c: z  B- n, j, E5 T

4 n- |! _9 r( F5 p! @●在要搜索的关键词最后空一格,写上filetype:pdf
, t& o: ^3 f" I% O. p; @
' ]0 s0 m9 s& q( {: }* }+ k●inurl:pdf  关键词。这是因为很多pdf格式的文件会把其后缀显示在URL地址里,有些却不会,所以应该是不全的。0 x+ T8 x. ]. I! E3 A
转贴:http://hi.baidu.com/jinhao0591/b ... 093910738b6564.html

评分

参与人数 1威望 +5 +20 收起 理由
electronic + 5 + 20 感谢转载

查看全部评分

"真诚赞赏,手留余香"
还没有人打赏,支持一下
楼主热帖
帖文化:【文明发帖 和谐互动】 社区精神:【创新、交流、互助、共享】
  • TA的每日心情
    开心
    2018-7-18 12:52
  • 签到天数: 6 天

    连续签到: 1 天

    [LV.2]偶尔看看I

    累计签到:6 天
    连续签到:1 天
    发表于 2007-12-6 18:06:58 | 显示全部楼层
    好东西。顶!
    "真诚赞赏,手留余香"
    还没有人打赏,支持一下
    帖文化:【文明发帖 和谐互动】 社区精神:【创新、交流、互助、共享】
  • TA的每日心情
    郁闷
    2021-4-15 00:05
  • 签到天数: 31 天

    连续签到: 2 天

    [LV.5]常住居民I

    累计签到:35 天
    连续签到:1 天
    发表于 2008-3-6 18:08:19 | 显示全部楼层
    好东西。顶!好东西。顶!
    "真诚赞赏,手留余香"
    还没有人打赏,支持一下
    帖文化:【文明发帖 和谐互动】 社区精神:【创新、交流、互助、共享】
    您需要登录后才可以回帖 登录 | 立即加入

    本版积分规则

    招聘斑竹

    小黑屋|手机版|APP下载(beta)|Archiver|电力研学网 ( 赣ICP备12000811号-1|赣公网安备36040302000210号 )|网站地图

    GMT+8, 2026-3-18 03:45

    Powered by Discuz! X3.5 Licensed

    © 2001-2025 Discuz! Team.

    快速回复 返回顶部 返回列表