设为首页收藏本站|繁體中文 快速切换版块

 找回密码
 立即加入
搜索
查看: 1794|回复: 2

PDF文件处理

[复制链接]

该用户从未签到

尚未签到

发表于 2007-12-6 15:52:27 | 显示全部楼层 |阅读模式

马上加入,结交更多好友,共享更多资料,让你轻松玩转电力研学社区!

您需要 登录 才可以下载或查看,没有账号?立即加入

×
PDF文件处理
6 u7 ]4 _3 o- y) j问:PDF与WORD之间如何通过软件实现格式转换?
. b: ]: y% e% j5 ^4 C' @. d
9 `' Q1 n. @" }9 W7 r8 l答:PDF—>DOC  使用软件Acrobat,pdf2word;DOC—>PDF  使用软件Acrobat。0打开tif文件,识别。这个东东识别准确率极高。 ( [- s; f; o) I3 m% B( K" |$ J+ K2 D

4 T4 x$ b( ~$ k( Vpdf->Tiff(JPEG,PNG)->OCR输出word,效果极佳,如果是English几乎不用怎么修改就可以用了。( I6 F" G: F( C5 B! L# x5 J( Q6 Q
; {, s! X8 i, F! |/ t, h$ n
推荐OCR软件:ABBYY FineReader 7.0;ScanSoft OmniPage Pro 14.0(最强)
4 K4 d$ m! e( x4 I& h( K; i( s" c: }' u
+ J, c) {; K; o* [/ U; ?/ K( p9 P
问:如何把WORD文档转换成PDF?
/ b: g8 X* C) t2 ~0 j- S0 N$ `! l4 r+ `" h3 ]* r# [/ d9 W
答:安装Acrobat(不只是Reader)完全版,在安装选项里有的,把这一项选上,选pdfmaker。在word的工具条上会有一个转换按钮。装好之后在WORD的工具栏里面会有Adobe PDF,下拉菜单里面会有convert to Adobe PDF,按那个就行了。在控制面板里的打印机里多了两个关于Acrobat的,说明可以了。装了Acrobat的话,默认会装一个distiller,你也可以装acrobat里面的pdfwriter,它们两个都会成为虚拟的打印机的。然后在Word里,File->Print选择刚过装好的虚拟打印机就可以了。: u% g. v! p, p6 J$ \6 m+ m

4 a+ U4 N$ l; m* k
# z+ a8 A3 Z7 W问:如何将PDF文档直接转为WORD?除了ACROBAT还有其它软件工具吗,用这个图片走样很厉害% X  t6 u( V/ @) q6 V

; ]; E8 o6 w6 m5 f7 I答:使用pdf2word、pdffactory这些软件可以实现4 @' L6 F0 i8 {7 r4 v  R, {
) l/ _! z& V5 ], O
& N8 K4 t0 C! D+ V3 D' g
问:DOC转换成PDF时,图很不清楚,怎么办?论文的提交的格式是DOC,但在DOC转PDF时,图很不清楚。
- O. |* ^/ G  k9 x9 C$ B( c% K& b8 y6 q$ g) F/ O
答:不要用pdfwriter,用distiller可能会好一些。或者用Letex,图的清晰度损失不大
. ^) [! \3 V2 f0 j5 U
8 y. g6 R" K0 |! H5 d+ L! G& u0 c
6 `( K) v" a4 e问:很多用VISIO画的图,插入在WORD文档里面的,怎么专成PDF以后,图里面的字母位置变了?而且变的很夸张,满屏幕乱窜,这个问题怎么办啊?5 {/ v  A* W( i/ j% l4 J

$ K$ u& k2 B+ k5 {" ]8 j, y' D答:Word中所有图片都变成tif格式的。其他的一律事先转成tif,压缩的,这样文件也不大。或者变成BMP位图也可以,但图片容量比较大。. h" H( L+ ]& X6 |: S( d- [( j3 @7 R
* M5 g. ~) G! d( E

! m2 p7 y% Y# V, A4 C! x问:我想把PDF格式文档直接转成DOC(就是WORD文档)或者TXT(纯文本文档),可以吗?4 t; b- F0 r# g5 N+ O" g! Q
0 a& m! g5 E0 h% B
答:PDF格式的文档是不能直接转换成DOC(WORD文档)的,但是可以先转换成RTF格式,然后再转成DOC格式,前提是该PDF文档必须是纯英文的,中文的PDF转换之后会出现乱码。此时,需要用到一个工具:Aerial,这个工具是Acrobat的一个插件,可以用来把PDF文档转换成RTF文档。原PDF文档可以包含图片,图片能正常转换到RTF文档中。如果只需转换成TXT文档,那么直接转换就可以了(图片就没了)。
3 `* E' ]4 w) ]% R6 g5 d8 q
8 _# h, G& O1 S  _
7 c- g2 M8 z) e问:PDF文件中的文字怎么转换成WORD?
4 u5 l. q4 x, u) z7 ^6 n/ E  }' Y7 i: j
答:如果是文本的,可以用Acrobat选中文字功能,如果是图片格式的,可以用最新豪华版的维普的OCR功能,但是要自己改错字。
8 {+ K! N- c- n! }
3 I& Q, ~* O$ R- N4 A, l8 U1 U
问:我的PDF转WORD的时候怎么排版变了?' D: U+ x; ~' a* D/ ^3 e" G$ s

) {( C3 O, X7 v  I. f7 b答:有些地方没有用固定的东西固定,比如分页符、软回车,图片不统一也很有可能排版变掉. E' T/ e$ O, R! r; p' o7 V+ @" ^
/ C" s/ v( J" K+ A* ^( q- X

# t+ q6 ]- ]4 u问:PDF转换成WORD,提示PDF有密码,怎么办呢?
' W6 f% E; ?5 L
! I7 ^2 c4 @$ z. l7 f" A答:找一个PDF密码石皮解器,石皮解后,再转换就可以了。' t- x2 }" ?3 O1 V

. |, K8 }+ s$ v3 j比如Advanced pdf Password Recovery;pdf Password Remover;HB-pdfpr21-fxj.zip;Advanced Password Recovery5.3。后者是一个各种石皮解的集成,里面的Acrobat是针对PDF的。
) e( V( s; U, C' X  @" Y( g; B9 x  @/ K! z( V
, R6 s+ c4 g( f1 C) W
问:PDF文件到TXT文件的转换,除了copy和paste得方法外,还有什么办法吗?- w0 ^  i, [& J. R$ a! }

1 G5 ]! w7 L; @$ z答:将WORD转为PDF,然后用方法2另存为rtf文件,WORD可以识别。但是一般的下载文献,因为本身是图形,所以第二种方法不能实现。以上所说的是针对中文文本。4 }* n# ?  F! z% \1 w- k
. }1 z: B! L( Q# n1 e, J" A" ]9 F
PDF-—>WORD方法总结如下:, x2 c: N- D5 x
. x" e# a: l- p& c" Q# G: w( G  J* e
●如果PDF本身就是图形的话处理方法如下:8 D# Z' L7 f- P5 `% I7 P' c
. t4 a' l* Q6 M
(1)英文处理方法:
$ B( i; E: r+ H- T1 O" ^4 p4 e, U! n% P  x  Z9 A
A,用photoshop6。0打开PDF将之转化为tif格式文件。
8 z( {- V" R. ^. @. y$ V3 j5 w' n9 q2 Y* G2 @" B& }& |4 o2 x
B,用<, SPAN lang=EN-US style="COLOR: blue">Omnipagepro10
6 A/ z  A( }" H) c# x4 t: F; g4 K1 V& a# D! [
(2)中文处理方法:
; w* w: ^6 q( W$ m6 @1 s! z& {$ P' L- W1 M+ l% A4 c
A,用photoshop打开PDF将之转化为tif格式文件。: j6 b  A% z% i( T3 j  h  v& J

3 b" r7 e: L0 u9 w' qB,用th-ocr2000专业版或者Shocr6。0打开tif文件,识别。
2 y% S1 [2 T7 W; g) ^$ b) n$ a- f- s% `' u8 Y; h0 _9 s
1 v( E) ?- z2 c1 t6 n$ i0 C
●如果PDF本身是文本的话处理方法如下:2 F* Z0 P4 W9 e1 d3 G

& a4 [0 w4 p! g5 m$ X1 E(1)使用BCL公司的drake软件(Acrobat的插件)转换。8 s- z/ X" X+ c! y8 a: P* e
" }" {. H9 {2 o) j0 x' N4 q. k
使用第一种方法转换成的rtf文件格式比较乱,不过可以直接拷贝出其中的图形。( I  ?6 B9 h4 y

1 c2 t& T! f; j5 a使用的二种方法转换成的rtf文件格式遵循原文,不过不能拷贝原文中的图形。
) \1 Y  M; r" y0 O7 J
: E( y1 v" L) ]& l8 N8 ]" A. [( B+ [% y6 n5 N" m, K! h
问:为什么我的PDF文档不能选取文字内容或者存为rtf或者txt?  H9 L5 F; V0 V6 e

9 m+ Z% O1 ^2 J" t/ |. q答:如果不属于这种情况,很可能是因为这个文档中的所谓的文字是从图像文件(比如扫描仪得到的结果)打印出来的。这种情况下是肯定不能直接选取文本的。顺便说一下,在Acrobat 6.0中是另存为WORD文档。  ^: y! B# K7 m0 ^6 ?

9 E/ Z# L5 b$ K6 }/ I解决办法:使用OCR软件识别图像中的文本内容。识别英文的软件推荐Abbyy Fine Reader,中文推荐北大汉王,清华紫光。扫描仪一般会附带这种软件的。
3 u5 R1 S8 q8 h1 k( ?
9 b7 R* ?- t" n$ m; Z* X3 ?/ i1 E* @* S9 |& ^
问:怎么把pdf格式中的图表拷贝出来?6 c, S8 [5 X5 ^2 b" b" O0 S. K- }8 t

& M$ A' k% h) k% M答:如下方式均可:
9 a& w; w5 D3 }8 }. }$ ?. j* N! X8 X* }* H
●acrobat6.0以上里面有复制表格这一个选项的
1 A8 F# G1 Q6 M: ]5 Y- ?7 Z: z/ @' v6 f4 r0 S- M- L
●尚书六号软件
" i" K/ \8 H% o' ~. Q. K9 s" M* Z9 D0 a, \& v3 U
●snagit1 `9 K) ?; L  y% x8 m

3 h5 b+ q3 }; J0 x0 e●print screen一键即可
% b' e# {6 r* n0 c2 t5 @% \( B7 C/ k0 m+ x5 r" D1 ~$ i
2 _# c; C; ?4 z6 Y' d( R- j; d) y; I
问:visio的图转化为pdf文件时出问题了,框图中的文字位置跑到外面去了,不知道怎么回事,其它几张都是好的,如何处理?) ?' X- Y- t+ m  G* a  k0 X( x

$ B0 Q' P# q4 u# G* Y8 H答:即使转成wmf格式插在word中有时也会这样。把它转成emf就没问题,应该在pdf中也可以;或者把word中的visio框图换成位图,然后再转成pdf就可以了;图片不要存成默认格式,存成tiff格式,分辨率设得高一点,再插入到word中,再转成pdf文件
6 T/ p( t, p/ Y( V* F  L; ~4 _0 D6 n0 }
# f# \% S$ ]- L" S' F3 R9 g) y8 B
问:如何把pdf文件连起来?
$ p3 E7 X3 e/ f' G
6 Z" v1 N5 j- O# P) c答:用acrobat,全选,右键然后选择合并。。。;有个combine pdf选项可以实现,文件(File)—创建PDF—从多个文件—浏览—添加多个文件—确定
# i, u7 R0 s, Q# I8 e5 g( _
8 i3 U. |. {% t; m* @/ n6 `  Z1 P& r' l
问:怎么将PDF文件的其中几页保存为另一个文件?打印了之后,文件打不开!怎么回事呢?4 o  |. B( y( |1 `( d1 R  d

6 S2 L* H1 Q& Z( }5 Q; u答:可以试试选中要的几页,点击右键,选“选取文件”项,然后另存为另外一个文件即可
4 @- H* }* I7 Z3 a2 a9 O+ P5 R  ]+ ^( R$ h4 a! d" {  Q
问:怎么选中几页呢?就算只要一页,我点击右键也没有找到选取文件项,对啦,我在PDF文件上加了一些阅读过的符号,如画线、加亮之类的,这个有影响吗?
0 R9 [* e$ b1 s+ b0 O
4 n1 c, c6 E6 l$ ~) F- u( Z; F/ {答:不知道你用的是哪个版本的acrobat,根据我用7.0版的看来,在PDF上作改动不会影响选页保存。我的是英文版,选页保存操作如下:先打开左侧的pages栏,选择你要取出来的那些页,后右键选extract pages(我这边看来是第二项),之后会自动弹出来由选取的页组成的pdf文件,保存它就可以了。如果你要每一页分开保存,钩选那个extract pages as seperate files即可。0 _  L8 i6 q' `4 D7 f
2 ]/ b  K+ V) L& k
或者安装软件PDFFACTORY,打开你的PDF文档,点击打印,选择PDFFACTORY,打印机选择打印的起始终止页码,确定打印,出来的就是原文中的你选择的某几页
# F1 M  J" k! Y6 B/ k* z( g5 x& O7 Z) H$ y3 S9 [

  D6 P8 i" r4 @* U: ]问:为什么我的PDF不能用打印机打印?PDF文件设置密码加密后不可复制打印怎么办?: H) |" g3 S; ?' q
" T& r3 \; m# L( M* _; U0 ?+ m! H
答:PDF文档在创建的时候可以设置密码保护和权限,这一点可以在File—>Document Properties(文件-)文件属性)的安全选项里面找到。同时,如果文档设置了权限限制,在Acrobat(Reader)窗口的下方会出现一个金黄色的钥匙图标(6.0版本是左下角的一把锁)。在安全选项里面包括打印、对文章修改的各种权限的设置,如果你使用的是Acrobat,可以在这里自行设置密码保护。9 z& Q: L  ]2 _" |4 ~9 H- [6 b1 A' ~
) [+ n; a8 G; [+ A7 n) F
解决办法:使用PDF文档解密软件可以解决这个问题。推荐:Advanced pdf Password Recovery;pdf Password Remover;Advanced Password Recovery5.3。后者是一个各种石皮解的集成,里面的Acrobat是针对PDF的。) v: T7 [6 c6 ?! E; x
: a) K3 S2 Z9 @

2 v! p3 E# r5 L问:为什么我的Adobe Acrobat Distiller打印机不能正常打印文档到文件或PDF?
$ d! N2 R  \( Y, H
/ p* r: l' s0 P2 e" h$ d) Z( L是把控制面板打印机里面的Acrobat或者Distiller打印机的preference中“不发送字体到Acrobat(或者Distiller)”的复选框去掉,然后就可以了。
1 o) S, {; ?( U# c
8 s& O5 T5 B8 Q: E4 z# N4 q0 o. n' ]) Z4 ^- l- R
问:金山词霸如何在Acrobat(Reader)上取词?
3 w, t2 U( E' c3 A" I( y3 D# d* [9 _% R8 a5 L0 @, g1 A! F
答:要先装acrobat,后装詞霸。将词霸目录下的xdict32.api插件复制到Acrobat(Reader)的Plug_ins目录下,两个软件都需要重新运行。文件是图形不能取词
9 u2 T7 N- `6 }' U4 x5 Y
1 Z0 y4 p1 i* I# T8 y
0 ~( S+ q/ y- m0 p1 x问:词霸在acrobat 5中的取词解决方法8 b& [$ Z& ]8 v! B3 T7 i

5 j. w  R" H, D- P6 O答:在acrobat5.0里的“edit”菜单,选择“Preferences”,取消选择“Certified Plug-ins only”选项,再重新启动Acrobar reader就可以取词了。' G3 }! X+ c% w4 R5 q% n& d/ [) O7 l9 p

: ?0 A" J7 V; N0 X中文的是这样的:编辑->首选项->一般->选项->启动->仅认证的增效工具,勾勾去掉。6 J5 `- ?" U- \6 D! L. q4 s
- b: v1 s0 b2 ]
中文5.0默认就是去掉的,词霸可以识别
8 j; y. T' A- v2 H  N  V$ t' m& c; t% [4 E9 A
6 V& M, L. g3 g5 v2 @0 y  q
问:英文的pdf文件中如有中文字符该怎么办?投个国际会议,结果反馈的信息是说我的pdf文件有postscript error,有人说是中文字符的问题,用一个英文版的acrobat打开,果然到有些页面要提示下载中文包,否则无法显示那些页面。原来是用word写的,能想到的就是查找中文的逗号句号什么的,可是搜来搜去改完了还是有这样的毛病,起先想找个英文版的office来,发现这年头这种东东还真是稀有,ft,有没有哪位处理过类似的问题,指点一把,先谢过了。。。
  w0 k7 r+ X+ Q4 u, `! A/ _8 ?' n5 w0 j; w9 u
答:你可以用工具-》字数统计统计一下,里面是否有中文字符和朝鲜字。如果有的话,再慢慢的找。一般的来说,如果整篇是英文文本的话,里面混有中文字符的可能有:标点,特殊字符(如α等希腊字符),单位符号如度数(英文里没有这个特殊符号的,一般我是用上标0和大写的C组合的)。这样再找找看。
% @2 h( N3 G+ W9 b1 G" [/ j3 P) }+ o" S5 w! n% @" c; c+ L" Y
3 U7 y2 \' }3 p) G' x7 s9 x3 l
问:怎么编辑PDF文件?就是在PDF文档中加入一些文字,怎么操作?
3 l6 f6 B, w; O5 I: G$ I, |6 J9 F, [' c2 A) f) X9 P! M. Y3 H5 Q
答:要装pdf adobe acrobat standard软件,而不是reader软件,其中中有个高级编辑,有个图标像T+ 的,这个是编辑的工具9 {6 s  x, ?9 v3 V% |7 G/ s" ?

) B9 [! s5 u4 P; Q# q% h" a; e: E+ w- A) R) I
问:Google搜索pdf文档最佳方法如何?
9 _0 s9 h! s/ x5 O
! K6 }8 Z2 V8 s- I答:可以采用如下方法:! H! W! G; Z  @8 t
& ^( `4 J2 e: s- d% D
●直接用pdf作关键词( _0 Y! N/ B/ Y2 a$ k2 Z) g

6 R% @! A9 ~5 b  X●在要搜索的关键词最后空一格,写上filetype:pdf8 R! Z' y" _$ Y0 y+ R, Q
1 D4 T) t4 Z$ J# X
●inurl:pdf  关键词。这是因为很多pdf格式的文件会把其后缀显示在URL地址里,有些却不会,所以应该是不全的。
/ I& P. t* w/ ^5 v1 t转贴:http://hi.baidu.com/jinhao0591/b ... 093910738b6564.html

评分

参与人数 1威望 +5 +20 收起 理由
electronic + 5 + 20 感谢转载

查看全部评分

"真诚赞赏,手留余香"
还没有人打赏,支持一下
楼主热帖
帖文化:【文明发帖 和谐互动】 社区精神:【创新、交流、互助、共享】
  • TA的每日心情
    开心
    2018-7-18 12:52
  • 签到天数: 6 天

    连续签到: 1 天

    [LV.2]偶尔看看I

    累计签到:6 天
    连续签到:1 天
    发表于 2007-12-6 18:06:58 | 显示全部楼层
    好东西。顶!
    "真诚赞赏,手留余香"
    还没有人打赏,支持一下
    帖文化:【文明发帖 和谐互动】 社区精神:【创新、交流、互助、共享】
  • TA的每日心情
    郁闷
    2021-4-15 00:05
  • 签到天数: 31 天

    连续签到: 2 天

    [LV.5]常住居民I

    累计签到:35 天
    连续签到:1 天
    发表于 2008-3-6 18:08:19 | 显示全部楼层
    好东西。顶!好东西。顶!
    "真诚赞赏,手留余香"
    还没有人打赏,支持一下
    帖文化:【文明发帖 和谐互动】 社区精神:【创新、交流、互助、共享】
    您需要登录后才可以回帖 登录 | 立即加入

    本版积分规则

    招聘斑竹

    小黑屋|手机版|APP下载(beta)|Archiver|电力研学网 ( 赣ICP备12000811号-1|赣公网安备36040302000210号 )|网站地图

    GMT+8, 2024-5-7 18:21

    Powered by Discuz! X3.5 Licensed

    © 2001-2024 Discuz! Team.

    快速回复 返回顶部 返回列表