设为首页收藏本站|繁體中文 快速切换版块

 找回密码
 立即加入
搜索
查看: 1957|回复: 2

PDF文件处理

[复制链接]

该用户从未签到

尚未签到

发表于 2007-12-6 15:52:27 | 显示全部楼层 |阅读模式

马上加入,结交更多好友,共享更多资料,让你轻松玩转电力研学社区!

您需要 登录 才可以下载或查看,没有账号?立即加入

×
PDF文件处理3 A1 k1 ?! N4 [8 U/ o9 W
问:PDF与WORD之间如何通过软件实现格式转换?
$ [- N, w, a5 B4 T2 ?% s: G
7 X! @' @; y: ]; T; t; e答:PDF—>DOC  使用软件Acrobat,pdf2word;DOC—>PDF  使用软件Acrobat。0打开tif文件,识别。这个东东识别准确率极高。 * z8 a. l# z2 v* Z% Y0 L

; N4 l( V, V4 updf->Tiff(JPEG,PNG)->OCR输出word,效果极佳,如果是English几乎不用怎么修改就可以用了。
8 S2 s% y& R- e2 \9 v6 m
. B4 D+ _: d* h  X, b推荐OCR软件:ABBYY FineReader 7.0;ScanSoft OmniPage Pro 14.0(最强)* C' P, O& R% Y# R: _5 E- c

6 F( b% H) }0 \. D! l8 i8 I% R% L- O4 }
问:如何把WORD文档转换成PDF?
( p! W* x  b4 Z
* i/ j" ^- d3 o' N6 }) F答:安装Acrobat(不只是Reader)完全版,在安装选项里有的,把这一项选上,选pdfmaker。在word的工具条上会有一个转换按钮。装好之后在WORD的工具栏里面会有Adobe PDF,下拉菜单里面会有convert to Adobe PDF,按那个就行了。在控制面板里的打印机里多了两个关于Acrobat的,说明可以了。装了Acrobat的话,默认会装一个distiller,你也可以装acrobat里面的pdfwriter,它们两个都会成为虚拟的打印机的。然后在Word里,File->Print选择刚过装好的虚拟打印机就可以了。
- ~8 h7 q8 u1 G* M- X& N$ F7 f+ w+ S; v1 ~! U

2 I+ t0 H/ V4 T- C' X问:如何将PDF文档直接转为WORD?除了ACROBAT还有其它软件工具吗,用这个图片走样很厉害
+ B0 Q2 U/ L! }2 ~( r
3 e4 V8 Z+ g) z& k) w7 E& W3 A答:使用pdf2word、pdffactory这些软件可以实现- p5 s4 J; M+ X, d8 {
* `+ f7 l' A- h5 ]
" x5 K. ~& E% o) N. b$ E# A0 }
问:DOC转换成PDF时,图很不清楚,怎么办?论文的提交的格式是DOC,但在DOC转PDF时,图很不清楚。
6 f; t! v9 H+ ?( e# i" ^3 s7 H& Y
$ Q1 O/ Q6 E$ M9 w8 }, F' I8 \3 v答:不要用pdfwriter,用distiller可能会好一些。或者用Letex,图的清晰度损失不大' F& d+ O; r; O) U

( i9 C$ B5 K4 Q( p4 \8 K9 ~6 I/ n8 e8 D
问:很多用VISIO画的图,插入在WORD文档里面的,怎么专成PDF以后,图里面的字母位置变了?而且变的很夸张,满屏幕乱窜,这个问题怎么办啊?
5 K4 d: R' D* S6 c) r) T1 H: B. \% W9 C3 N9 `% E
答:Word中所有图片都变成tif格式的。其他的一律事先转成tif,压缩的,这样文件也不大。或者变成BMP位图也可以,但图片容量比较大。, x4 e& X  @9 Q
* L  T4 E! u+ L3 u

3 R, O, k; _5 V7 g9 C" G% A6 K问:我想把PDF格式文档直接转成DOC(就是WORD文档)或者TXT(纯文本文档),可以吗?4 b6 v, h  B" f( ~# u4 ?8 W7 ~

8 V: Q, N: f" j+ D; U9 J答:PDF格式的文档是不能直接转换成DOC(WORD文档)的,但是可以先转换成RTF格式,然后再转成DOC格式,前提是该PDF文档必须是纯英文的,中文的PDF转换之后会出现乱码。此时,需要用到一个工具:Aerial,这个工具是Acrobat的一个插件,可以用来把PDF文档转换成RTF文档。原PDF文档可以包含图片,图片能正常转换到RTF文档中。如果只需转换成TXT文档,那么直接转换就可以了(图片就没了)。% m& m2 j$ v, v& u* J

1 N& _2 P" a. a: @3 l/ L1 J$ }& O) k
, q, D  H- l$ F9 }& Y( C问:PDF文件中的文字怎么转换成WORD?
% e0 V0 E4 c1 H6 Q
! F# o' `# @9 k+ c) W答:如果是文本的,可以用Acrobat选中文字功能,如果是图片格式的,可以用最新豪华版的维普的OCR功能,但是要自己改错字。9 N6 r2 ]; |4 h4 C' i5 R
6 E0 W. ?% `* \# E, Y5 G2 D

' [: Z+ x7 A$ h3 q4 c! j问:我的PDF转WORD的时候怎么排版变了?
# |3 |" Q! u. x* X  G/ y9 W' M; }! L0 [8 U) D; y5 v( n6 s
答:有些地方没有用固定的东西固定,比如分页符、软回车,图片不统一也很有可能排版变掉
0 h8 B) V" F2 H/ Q8 f8 Z. m3 ^
0 m& m3 \+ G) B
: R- t3 y; f. ?4 U& Z7 ]问:PDF转换成WORD,提示PDF有密码,怎么办呢?3 P  J9 R' o( D* h2 F; P

* c* Y4 g% U- e$ {8 L答:找一个PDF密码石皮解器,石皮解后,再转换就可以了。
  G% ]0 L# n, c
  G& y0 w+ M$ s; Q$ z# k! A& r! R1 U4 e- S比如Advanced pdf Password Recovery;pdf Password Remover;HB-pdfpr21-fxj.zip;Advanced Password Recovery5.3。后者是一个各种石皮解的集成,里面的Acrobat是针对PDF的。, o* X1 q. T. `% b

: K1 g5 `( k( W* X, R
/ O% t) s+ y' q4 u$ m问:PDF文件到TXT文件的转换,除了copy和paste得方法外,还有什么办法吗?
3 `5 Z0 a# X" G0 l; ~* i  f" v1 W0 _7 B% @
答:将WORD转为PDF,然后用方法2另存为rtf文件,WORD可以识别。但是一般的下载文献,因为本身是图形,所以第二种方法不能实现。以上所说的是针对中文文本。
' _  ^9 A% y9 R, I2 }1 D  O2 {+ D, y' D- a. d
PDF-—>WORD方法总结如下:
  B1 ~9 H5 B* F0 C  P/ }
5 ]$ ~- v, w, _●如果PDF本身就是图形的话处理方法如下:. b% V* P# b4 m, g% A! W0 L7 X
+ |1 p  v; V+ Z. v- \2 \. o
(1)英文处理方法:5 W8 Q5 {7 i( J4 N  P2 H6 x
3 `' d9 u9 l; t$ r. [
A,用photoshop6。0打开PDF将之转化为tif格式文件。! S* q) U# y& p4 ?& B/ O

1 z0 c$ h; r" L9 i, PB,用<, SPAN lang=EN-US style="COLOR: blue">Omnipagepro10
, G$ r1 {7 ^% W
3 m6 U5 t) t6 y7 k7 K) [# B(2)中文处理方法:
' A# j2 ]( p* s
# R: X3 D; z8 _$ g/ E4 m7 XA,用photoshop打开PDF将之转化为tif格式文件。* x" x2 Z1 s1 M8 F6 y- P. w

4 {5 i- F4 I" Q( X% p* MB,用th-ocr2000专业版或者Shocr6。0打开tif文件,识别。
0 H- [8 r+ o8 Z; K* ?  n$ t4 B9 u' k7 ?- p$ f2 c& i) P  j
6 x& f2 f1 @1 H6 Y5 G! i4 Q
●如果PDF本身是文本的话处理方法如下:
9 L1 f0 h1 |2 R/ _: [
) N# u: Y9 r% X% `( @7 d" L' {(1)使用BCL公司的drake软件(Acrobat的插件)转换。9 ?$ I3 l$ M. c$ ]2 T

6 _8 H# H" ]; d6 T% m- D# @. z使用第一种方法转换成的rtf文件格式比较乱,不过可以直接拷贝出其中的图形。9 ?8 [' Y0 X2 Y: q- K3 F  m' T: B

8 b; I5 _8 K8 F使用的二种方法转换成的rtf文件格式遵循原文,不过不能拷贝原文中的图形。0 w# O5 p* ~! O6 i# N" _; Z
: R6 I) j% O. X( @) K& ?. @) T
* D7 t1 b' g5 Y
问:为什么我的PDF文档不能选取文字内容或者存为rtf或者txt?: z- Z' C" k% [" M7 j) x, S1 \4 ~* O7 b

' R" f$ c6 V9 r2 {4 |答:如果不属于这种情况,很可能是因为这个文档中的所谓的文字是从图像文件(比如扫描仪得到的结果)打印出来的。这种情况下是肯定不能直接选取文本的。顺便说一下,在Acrobat 6.0中是另存为WORD文档。
6 p  \$ G6 g) H/ I
! `/ x, r* u0 {( f* W解决办法:使用OCR软件识别图像中的文本内容。识别英文的软件推荐Abbyy Fine Reader,中文推荐北大汉王,清华紫光。扫描仪一般会附带这种软件的。+ Z: {! g9 m( T$ H
( F4 x; s$ \- R/ u; j

8 v3 y  ]. B5 m/ C* z4 V* j问:怎么把pdf格式中的图表拷贝出来?0 x. S( B4 q, b9 {

. [, V+ }* [$ H4 s答:如下方式均可:0 O9 J2 h8 J* [4 U1 p2 ]+ N2 p

) K% Q- ?0 {( Q1 }  Q- E●acrobat6.0以上里面有复制表格这一个选项的- `) P5 C# l/ y& w

2 \# O7 J# w8 o& b, @. A●尚书六号软件: n" R8 I5 F6 ]5 ]0 _' _4 Y* ^

" ~1 a. l! g5 ^2 @; l●snagit2 J* {. x5 }2 i3 \

+ D$ G) ~2 p2 o& \# w6 M, A8 C●print screen一键即可$ A5 E+ h2 s2 q/ o; t

7 |# o, Z0 @+ K5 ^6 A) ]. T1 p$ g# j( m* ~; G8 M4 L. {% e
问:visio的图转化为pdf文件时出问题了,框图中的文字位置跑到外面去了,不知道怎么回事,其它几张都是好的,如何处理?! F8 @) q6 u  n6 C- N

5 J" @' Y' x) x5 w1 O' f答:即使转成wmf格式插在word中有时也会这样。把它转成emf就没问题,应该在pdf中也可以;或者把word中的visio框图换成位图,然后再转成pdf就可以了;图片不要存成默认格式,存成tiff格式,分辨率设得高一点,再插入到word中,再转成pdf文件. `8 X, |9 B3 R5 J! n: P
) M+ h; U  l+ D

" U0 @# P; o9 A5 E0 x0 j问:如何把pdf文件连起来?
, E" X) w; i! W* g  \4 H* _" Q+ l. f' I
答:用acrobat,全选,右键然后选择合并。。。;有个combine pdf选项可以实现,文件(File)—创建PDF—从多个文件—浏览—添加多个文件—确定# [/ J+ J) {- x  U# a8 T

* W+ A5 e" p( Q# p3 R: z& X: s, I0 }2 V1 r
问:怎么将PDF文件的其中几页保存为另一个文件?打印了之后,文件打不开!怎么回事呢?
; I% n& m" ?" d$ |# p* o! J; X- a' Q; s8 t; @. ^
答:可以试试选中要的几页,点击右键,选“选取文件”项,然后另存为另外一个文件即可
/ F5 ?$ L* b$ t7 n/ [2 W& O0 E0 ~& G
问:怎么选中几页呢?就算只要一页,我点击右键也没有找到选取文件项,对啦,我在PDF文件上加了一些阅读过的符号,如画线、加亮之类的,这个有影响吗?
  x: M  s. R; q$ c* }) c/ c* w" P4 U4 Q. s& m, ~1 b- `
答:不知道你用的是哪个版本的acrobat,根据我用7.0版的看来,在PDF上作改动不会影响选页保存。我的是英文版,选页保存操作如下:先打开左侧的pages栏,选择你要取出来的那些页,后右键选extract pages(我这边看来是第二项),之后会自动弹出来由选取的页组成的pdf文件,保存它就可以了。如果你要每一页分开保存,钩选那个extract pages as seperate files即可。
) M# y7 l8 D' Z# M
( R3 B7 T7 B- z6 B0 d" h. c或者安装软件PDFFACTORY,打开你的PDF文档,点击打印,选择PDFFACTORY,打印机选择打印的起始终止页码,确定打印,出来的就是原文中的你选择的某几页  S9 P0 n4 A$ ~6 P8 j

  Y, Z% S- c9 l. `5 h& E8 J$ w" ?! l
问:为什么我的PDF不能用打印机打印?PDF文件设置密码加密后不可复制打印怎么办?
3 K. W$ e; {3 `, F1 p; B$ u1 B: }% V4 N
答:PDF文档在创建的时候可以设置密码保护和权限,这一点可以在File—>Document Properties(文件-)文件属性)的安全选项里面找到。同时,如果文档设置了权限限制,在Acrobat(Reader)窗口的下方会出现一个金黄色的钥匙图标(6.0版本是左下角的一把锁)。在安全选项里面包括打印、对文章修改的各种权限的设置,如果你使用的是Acrobat,可以在这里自行设置密码保护。
+ W0 `) c$ S+ F4 D$ ?6 [
% e. f) h( U2 G解决办法:使用PDF文档解密软件可以解决这个问题。推荐:Advanced pdf Password Recovery;pdf Password Remover;Advanced Password Recovery5.3。后者是一个各种石皮解的集成,里面的Acrobat是针对PDF的。
. `! H( l$ j- r1 `: A5 j/ ~
. ?& U) {& c1 K( ~3 O0 B3 M1 z! W4 W/ {: O2 Z; U; l
问:为什么我的Adobe Acrobat Distiller打印机不能正常打印文档到文件或PDF?5 W. _" g- o: B) Q
0 e, W- _! v8 V% Y2 u( \& M
是把控制面板打印机里面的Acrobat或者Distiller打印机的preference中“不发送字体到Acrobat(或者Distiller)”的复选框去掉,然后就可以了。
2 u. ^9 w+ N; r/ o- r- k+ {# F+ b* F7 K  l& l2 ~8 W

' y( e% O5 H; C+ c+ g( p问:金山词霸如何在Acrobat(Reader)上取词?
% e1 `0 \8 `. F1 l" b9 b% q
( F0 t. \1 d7 _) V$ k& q  T4 W答:要先装acrobat,后装詞霸。将词霸目录下的xdict32.api插件复制到Acrobat(Reader)的Plug_ins目录下,两个软件都需要重新运行。文件是图形不能取词2 D. Q! G! E3 w1 M% p

. h' m! H: R. z* `; G) \+ N+ m! O) Z) K6 |
问:词霸在acrobat 5中的取词解决方法
( F: D6 g2 k6 V8 v% W7 X/ E5 [9 R+ ^6 {0 X4 _( h: B
答:在acrobat5.0里的“edit”菜单,选择“Preferences”,取消选择“Certified Plug-ins only”选项,再重新启动Acrobar reader就可以取词了。! L7 i/ L  S0 X$ X9 u5 J
5 V: ^# ]  \( ^+ u5 U- D2 s
中文的是这样的:编辑->首选项->一般->选项->启动->仅认证的增效工具,勾勾去掉。+ {: z+ Y  @( N$ Q8 P! o

0 f1 A' E" z, n5 {+ j中文5.0默认就是去掉的,词霸可以识别2 I3 w- F3 e0 V0 f

" r" ^3 w$ O4 g! W/ N6 g* b
# u, v- K( J. k- G  U/ z问:英文的pdf文件中如有中文字符该怎么办?投个国际会议,结果反馈的信息是说我的pdf文件有postscript error,有人说是中文字符的问题,用一个英文版的acrobat打开,果然到有些页面要提示下载中文包,否则无法显示那些页面。原来是用word写的,能想到的就是查找中文的逗号句号什么的,可是搜来搜去改完了还是有这样的毛病,起先想找个英文版的office来,发现这年头这种东东还真是稀有,ft,有没有哪位处理过类似的问题,指点一把,先谢过了。。。
) H8 W8 \/ ]4 w" p- i/ E$ o2 g4 y# f1 E) Z/ s% {
答:你可以用工具-》字数统计统计一下,里面是否有中文字符和朝鲜字。如果有的话,再慢慢的找。一般的来说,如果整篇是英文文本的话,里面混有中文字符的可能有:标点,特殊字符(如α等希腊字符),单位符号如度数(英文里没有这个特殊符号的,一般我是用上标0和大写的C组合的)。这样再找找看。+ ^4 w# [4 \. K4 ]( M, t

8 C) [4 C0 Q2 F2 C- Z" u$ y6 p% W! R% b
问:怎么编辑PDF文件?就是在PDF文档中加入一些文字,怎么操作?7 m! ^; h0 H1 i4 T
- |: _( \) H" Z  v: w1 Z+ J+ t
答:要装pdf adobe acrobat standard软件,而不是reader软件,其中中有个高级编辑,有个图标像T+ 的,这个是编辑的工具
+ H' v" D- u% o  f
# P  J3 f; O: K* j2 [) T8 {* O, _! m" A  E" |
问:Google搜索pdf文档最佳方法如何?
2 k  o6 D2 ]+ P7 \* T4 e# ~6 }; o( ~4 p" k- \
答:可以采用如下方法:
& W& A6 }& P1 W3 e4 o6 C, E* b* B, J, \0 A
●直接用pdf作关键词
5 p  c+ b* L5 a9 }# }- x9 |1 e+ p5 H7 ]3 i! B9 l
●在要搜索的关键词最后空一格,写上filetype:pdf- m% q! _" l* `  L4 j- M2 \

  b: A3 B7 S/ \5 Q; w●inurl:pdf  关键词。这是因为很多pdf格式的文件会把其后缀显示在URL地址里,有些却不会,所以应该是不全的。: i9 a% y( i0 G( {0 ?
转贴:http://hi.baidu.com/jinhao0591/b ... 093910738b6564.html

评分

参与人数 1威望 +5 +20 收起 理由
electronic + 5 + 20 感谢转载

查看全部评分

"真诚赞赏,手留余香"
还没有人打赏,支持一下
楼主热帖
帖文化:【文明发帖 和谐互动】 社区精神:【创新、交流、互助、共享】
  • TA的每日心情
    开心
    2018-7-18 12:52
  • 签到天数: 6 天

    连续签到: 1 天

    [LV.2]偶尔看看I

    累计签到:6 天
    连续签到:1 天
    发表于 2007-12-6 18:06:58 | 显示全部楼层
    好东西。顶!
    "真诚赞赏,手留余香"
    还没有人打赏,支持一下
    帖文化:【文明发帖 和谐互动】 社区精神:【创新、交流、互助、共享】
  • TA的每日心情
    郁闷
    2021-4-15 00:05
  • 签到天数: 31 天

    连续签到: 2 天

    [LV.5]常住居民I

    累计签到:35 天
    连续签到:1 天
    发表于 2008-3-6 18:08:19 | 显示全部楼层
    好东西。顶!好东西。顶!
    "真诚赞赏,手留余香"
    还没有人打赏,支持一下
    帖文化:【文明发帖 和谐互动】 社区精神:【创新、交流、互助、共享】
    您需要登录后才可以回帖 登录 | 立即加入

    本版积分规则

    招聘斑竹

    小黑屋|手机版|APP下载(beta)|Archiver|电力研学网 ( 赣ICP备12000811号-1|赣公网安备36040302000210号 )|网站地图

    GMT+8, 2025-5-14 06:56

    Powered by Discuz! X3.5 Licensed

    © 2001-2025 Discuz! Team.

    快速回复 返回顶部 返回列表