设为首页收藏本站|繁體中文 快速切换版块

 找回密码
 立即加入
搜索
查看: 1920|回复: 2

PDF文件处理

[复制链接]

该用户从未签到

尚未签到

发表于 2007-12-6 15:52:27 | 显示全部楼层 |阅读模式

马上加入,结交更多好友,共享更多资料,让你轻松玩转电力研学社区!

您需要 登录 才可以下载或查看,没有账号?立即加入

×
PDF文件处理
2 n2 A" ]* m' T问:PDF与WORD之间如何通过软件实现格式转换?
4 C+ w1 U' J, b8 w1 ^! w$ H0 {7 t$ f# X
答:PDF—>DOC  使用软件Acrobat,pdf2word;DOC—>PDF  使用软件Acrobat。0打开tif文件,识别。这个东东识别准确率极高。
6 L, h# s6 }* p7 X+ a/ n
$ U# L! a6 m! ]4 j) ppdf->Tiff(JPEG,PNG)->OCR输出word,效果极佳,如果是English几乎不用怎么修改就可以用了。; a3 I- l! K7 t4 W9 n

9 s" D  N0 @) A4 v& s% u- @推荐OCR软件:ABBYY FineReader 7.0;ScanSoft OmniPage Pro 14.0(最强)9 O7 q( p: H/ F0 B9 c3 d

- }3 q: g" _* `2 h" _( ?7 j3 y, g- w/ V
问:如何把WORD文档转换成PDF? * g% l1 X1 i2 r& k

  x5 R3 v) Z$ ?) O/ B, D- G# n$ V答:安装Acrobat(不只是Reader)完全版,在安装选项里有的,把这一项选上,选pdfmaker。在word的工具条上会有一个转换按钮。装好之后在WORD的工具栏里面会有Adobe PDF,下拉菜单里面会有convert to Adobe PDF,按那个就行了。在控制面板里的打印机里多了两个关于Acrobat的,说明可以了。装了Acrobat的话,默认会装一个distiller,你也可以装acrobat里面的pdfwriter,它们两个都会成为虚拟的打印机的。然后在Word里,File->Print选择刚过装好的虚拟打印机就可以了。
6 _8 m  H' u) X6 @! }) _' C( U0 L' L  T; m. s, ?

/ N3 C7 y. O9 c2 ?0 t* f! {. e问:如何将PDF文档直接转为WORD?除了ACROBAT还有其它软件工具吗,用这个图片走样很厉害& h8 j: b3 @1 |. k) p

9 K8 \+ {3 C) ~/ Y! z答:使用pdf2word、pdffactory这些软件可以实现9 Q4 H% S  k# f! H5 \

( M3 \. Z+ K9 r6 N6 }# c+ u+ `& d9 Z4 T4 q1 P2 Y- Y
问:DOC转换成PDF时,图很不清楚,怎么办?论文的提交的格式是DOC,但在DOC转PDF时,图很不清楚。
! ~. m; p6 {$ J$ d. A5 S( r/ Y. s% k% }
答:不要用pdfwriter,用distiller可能会好一些。或者用Letex,图的清晰度损失不大
* `. K2 w) s4 R/ X& m  x
* _% O. Z, ?) G. m2 X7 u
7 H# t' M' G7 k3 s$ t7 u3 C3 R问:很多用VISIO画的图,插入在WORD文档里面的,怎么专成PDF以后,图里面的字母位置变了?而且变的很夸张,满屏幕乱窜,这个问题怎么办啊?7 m6 z$ `  s( F

% M0 N7 M' `2 W答:Word中所有图片都变成tif格式的。其他的一律事先转成tif,压缩的,这样文件也不大。或者变成BMP位图也可以,但图片容量比较大。# q) I" j, w. G" ^( V  d' e

+ Q+ P: g( Z) ~+ s/ ~
3 q3 _7 }5 l( z问:我想把PDF格式文档直接转成DOC(就是WORD文档)或者TXT(纯文本文档),可以吗?3 `4 j: a" t+ Y* `
- I& L2 t, A5 Z3 v4 u
答:PDF格式的文档是不能直接转换成DOC(WORD文档)的,但是可以先转换成RTF格式,然后再转成DOC格式,前提是该PDF文档必须是纯英文的,中文的PDF转换之后会出现乱码。此时,需要用到一个工具:Aerial,这个工具是Acrobat的一个插件,可以用来把PDF文档转换成RTF文档。原PDF文档可以包含图片,图片能正常转换到RTF文档中。如果只需转换成TXT文档,那么直接转换就可以了(图片就没了)。
  c: O5 Q6 g& H. x( A' g9 U0 }2 x3 M4 v% D2 r2 _
  x1 b) u* m6 h- g( ^
问:PDF文件中的文字怎么转换成WORD?- z. A. r* k/ }' ?- u6 j

4 p& W/ p6 s& W) @; i- o- I2 t答:如果是文本的,可以用Acrobat选中文字功能,如果是图片格式的,可以用最新豪华版的维普的OCR功能,但是要自己改错字。3 U9 M) U5 |4 z+ g

/ G* L" X% C( O% G2 E  ?  |3 L+ `5 h
问:我的PDF转WORD的时候怎么排版变了?
) x! Q3 z. e, p5 r# v7 o, `
. I) S. B; |) Y1 c% M答:有些地方没有用固定的东西固定,比如分页符、软回车,图片不统一也很有可能排版变掉* u8 d4 {/ p' {4 n/ ?9 A; O
( t2 K& n2 V5 t
; K) }: `% s, J: {3 Q3 b7 w
问:PDF转换成WORD,提示PDF有密码,怎么办呢?: Y/ T' \( U& \8 J' z; U

- @/ f- ]$ d( N6 U* J( ?答:找一个PDF密码石皮解器,石皮解后,再转换就可以了。
* ^6 }+ ^* i9 F% c- a. b7 y# ?/ m
) J4 z# P8 b% L9 @9 ~比如Advanced pdf Password Recovery;pdf Password Remover;HB-pdfpr21-fxj.zip;Advanced Password Recovery5.3。后者是一个各种石皮解的集成,里面的Acrobat是针对PDF的。
- L, _( j- p; H5 y$ l6 o4 Z
4 q6 B0 G$ U3 |) y' S" K- E
& _; f8 d6 J+ t. ?6 u问:PDF文件到TXT文件的转换,除了copy和paste得方法外,还有什么办法吗?
; m- l! m! D$ h% B
" A2 ^- u; j6 x) }; S答:将WORD转为PDF,然后用方法2另存为rtf文件,WORD可以识别。但是一般的下载文献,因为本身是图形,所以第二种方法不能实现。以上所说的是针对中文文本。
3 i/ J- o% h6 w
& I  \& q4 M# O- @4 gPDF-—>WORD方法总结如下:) K+ X" `! M- O% r7 s

: i' ^6 A5 g8 ^●如果PDF本身就是图形的话处理方法如下:
  n8 C; O& v2 t( ~- G# }+ g/ F0 _: r9 h" `0 F* f
(1)英文处理方法:
) P0 w0 [. u- F
( G' X! B: }7 G/ a# Q9 Z( h% bA,用photoshop6。0打开PDF将之转化为tif格式文件。6 R) z# p5 w1 ?6 [: R' O$ x. w& x
0 D: r0 c7 _0 x- Z
B,用<, SPAN lang=EN-US style="COLOR: blue">Omnipagepro10
1 H1 h; [* p/ |! c/ \0 [2 r
4 {8 b) W! a; E% v(2)中文处理方法:
! L! l7 t" s8 A0 a2 W: q+ E' J* o
0 j/ Z4 z+ @3 ?+ h8 [  r% B+ TA,用photoshop打开PDF将之转化为tif格式文件。& I+ Y  R  a9 [- z) Q) B

$ s1 w" o0 E" {% GB,用th-ocr2000专业版或者Shocr6。0打开tif文件,识别。
5 M! A* Z* @4 m- @/ J$ M1 o% Q4 E6 ?, y- A: ]* J, g0 T  y

+ v  t2 F/ z; L) A●如果PDF本身是文本的话处理方法如下:
' A. t) G6 _! {1 \. v0 k/ [$ f% Q# U5 e/ z' i
(1)使用BCL公司的drake软件(Acrobat的插件)转换。8 s6 J& Y6 b+ s. m4 F6 \
6 z7 C0 z( }" P( Y- P5 `
使用第一种方法转换成的rtf文件格式比较乱,不过可以直接拷贝出其中的图形。
0 L$ u3 I' E5 m4 y, i
$ e3 b. y8 E* ^使用的二种方法转换成的rtf文件格式遵循原文,不过不能拷贝原文中的图形。
* J" y2 h- r2 ~4 f: D2 |9 L# d
2 \. z) s6 e3 Y, Z. W, f4 k2 S% u. F$ X
问:为什么我的PDF文档不能选取文字内容或者存为rtf或者txt?4 U/ k0 P6 O$ {1 t

( `* a6 t5 S1 n# \) O答:如果不属于这种情况,很可能是因为这个文档中的所谓的文字是从图像文件(比如扫描仪得到的结果)打印出来的。这种情况下是肯定不能直接选取文本的。顺便说一下,在Acrobat 6.0中是另存为WORD文档。, X  N! M! Z2 K/ G

6 x2 Q0 H7 [! \! m+ {( w解决办法:使用OCR软件识别图像中的文本内容。识别英文的软件推荐Abbyy Fine Reader,中文推荐北大汉王,清华紫光。扫描仪一般会附带这种软件的。
8 a/ m3 I5 i- \8 V6 a+ E' u% s& T4 v7 l- P+ I2 y: f
; r2 f6 G3 {5 A* x  z) O3 Z0 H
问:怎么把pdf格式中的图表拷贝出来?1 P' u, H: Z! I2 r+ _3 ~

! a6 e# I5 I0 e! y  S答:如下方式均可:" r. H6 w/ r$ f/ ?# ]  \  {5 P
% w4 G1 g  c4 t
●acrobat6.0以上里面有复制表格这一个选项的' C! b+ k5 ^( m
8 x, h0 P8 ^: P& H: }
●尚书六号软件
; F- d  |' U: ~* T5 G; b9 t' Z% U; w/ ^7 Y1 [
●snagit
; l/ L! U& Y1 U* J% d3 r: [& s1 s. \1 _8 U
●print screen一键即可
0 g  _- v# _/ |( E7 q6 ?
+ J3 }# y. E) c
5 L8 d/ ^  k5 H, a问:visio的图转化为pdf文件时出问题了,框图中的文字位置跑到外面去了,不知道怎么回事,其它几张都是好的,如何处理?
# q* h' o: h, ?2 n/ U( w5 C& Z: H( c
答:即使转成wmf格式插在word中有时也会这样。把它转成emf就没问题,应该在pdf中也可以;或者把word中的visio框图换成位图,然后再转成pdf就可以了;图片不要存成默认格式,存成tiff格式,分辨率设得高一点,再插入到word中,再转成pdf文件
: F" Z2 P( y5 W& d9 X! R
5 K# D* C3 U% v! s0 U" D# x1 n
) X' M* F" B  V6 w3 c问:如何把pdf文件连起来?
- g3 A" k; y, c
' Z  B6 D' K! [, I* B# S答:用acrobat,全选,右键然后选择合并。。。;有个combine pdf选项可以实现,文件(File)—创建PDF—从多个文件—浏览—添加多个文件—确定; l) w0 ~- ]" z9 }

* x7 w! \2 l3 o9 m; P' B$ |/ r5 y% K! o+ K' t7 y1 @
问:怎么将PDF文件的其中几页保存为另一个文件?打印了之后,文件打不开!怎么回事呢?, I* ]2 m7 v! s5 X* W
+ f6 m7 u, N+ m* j9 [$ v
答:可以试试选中要的几页,点击右键,选“选取文件”项,然后另存为另外一个文件即可$ R6 ^- E! a* h! Z
" e6 f+ {0 F* R! v3 j
问:怎么选中几页呢?就算只要一页,我点击右键也没有找到选取文件项,对啦,我在PDF文件上加了一些阅读过的符号,如画线、加亮之类的,这个有影响吗?
: l" s) m0 s5 o) Q  M8 K+ [  r/ m8 @
答:不知道你用的是哪个版本的acrobat,根据我用7.0版的看来,在PDF上作改动不会影响选页保存。我的是英文版,选页保存操作如下:先打开左侧的pages栏,选择你要取出来的那些页,后右键选extract pages(我这边看来是第二项),之后会自动弹出来由选取的页组成的pdf文件,保存它就可以了。如果你要每一页分开保存,钩选那个extract pages as seperate files即可。
* g- ?4 l' h/ x, j; T2 G" ]* w7 E" h: F2 R0 A! o4 i+ }; F
或者安装软件PDFFACTORY,打开你的PDF文档,点击打印,选择PDFFACTORY,打印机选择打印的起始终止页码,确定打印,出来的就是原文中的你选择的某几页9 [' a0 R8 O. ^4 f4 ?7 Z8 g
" T8 a9 z! [3 u
+ F7 @' O, j6 e3 N! ^
问:为什么我的PDF不能用打印机打印?PDF文件设置密码加密后不可复制打印怎么办?
& Y7 l; A8 l. S( p: L* U- X0 X0 i5 f/ @2 f, v+ `
答:PDF文档在创建的时候可以设置密码保护和权限,这一点可以在File—>Document Properties(文件-)文件属性)的安全选项里面找到。同时,如果文档设置了权限限制,在Acrobat(Reader)窗口的下方会出现一个金黄色的钥匙图标(6.0版本是左下角的一把锁)。在安全选项里面包括打印、对文章修改的各种权限的设置,如果你使用的是Acrobat,可以在这里自行设置密码保护。
( k6 N0 `, {0 U4 e3 I
/ e! _/ V2 ^5 u解决办法:使用PDF文档解密软件可以解决这个问题。推荐:Advanced pdf Password Recovery;pdf Password Remover;Advanced Password Recovery5.3。后者是一个各种石皮解的集成,里面的Acrobat是针对PDF的。
  D2 k7 a* U0 L: ]% U! |5 {1 S" W- n1 c7 k+ N5 q, T( y- X$ w: y) [

7 h0 i5 {) h+ E' r问:为什么我的Adobe Acrobat Distiller打印机不能正常打印文档到文件或PDF?% Z# _! w+ F. y# s9 h
1 \( @2 ^0 e/ F$ {# R2 [# Y
是把控制面板打印机里面的Acrobat或者Distiller打印机的preference中“不发送字体到Acrobat(或者Distiller)”的复选框去掉,然后就可以了。3 w% F$ j% G% i* |1 @

9 M( G$ r' B, x
0 M( t. I$ K/ S# b0 Q/ }" |问:金山词霸如何在Acrobat(Reader)上取词?
4 [) f- G1 l5 {0 S0 M" M. F
  E6 A5 {: k1 a答:要先装acrobat,后装詞霸。将词霸目录下的xdict32.api插件复制到Acrobat(Reader)的Plug_ins目录下,两个软件都需要重新运行。文件是图形不能取词
* p6 W9 t9 E- Q7 Z" J% d/ n  P; G% y2 J9 q! k) Y3 c) L8 l

* y" s& \& t' {; O2 q2 q3 {% j问:词霸在acrobat 5中的取词解决方法
: {3 a7 n  R2 x+ `- f& T* N3 {) i
- ]( ]- V* d- E8 U答:在acrobat5.0里的“edit”菜单,选择“Preferences”,取消选择“Certified Plug-ins only”选项,再重新启动Acrobar reader就可以取词了。; g3 Z5 p  ~5 |! U3 K0 m

2 W* a5 i( u8 o2 s中文的是这样的:编辑->首选项->一般->选项->启动->仅认证的增效工具,勾勾去掉。
9 B5 ~, X5 I: S
; C3 c1 w! h( A4 @! p中文5.0默认就是去掉的,词霸可以识别
& k) S4 K. Y: @: e, P' S( r& c; W1 B& V$ X3 k( i& L1 W6 L

  B2 Q0 j* i5 Y  m问:英文的pdf文件中如有中文字符该怎么办?投个国际会议,结果反馈的信息是说我的pdf文件有postscript error,有人说是中文字符的问题,用一个英文版的acrobat打开,果然到有些页面要提示下载中文包,否则无法显示那些页面。原来是用word写的,能想到的就是查找中文的逗号句号什么的,可是搜来搜去改完了还是有这样的毛病,起先想找个英文版的office来,发现这年头这种东东还真是稀有,ft,有没有哪位处理过类似的问题,指点一把,先谢过了。。。& ~' T: q! d) }

2 M: m0 S* P6 {: L答:你可以用工具-》字数统计统计一下,里面是否有中文字符和朝鲜字。如果有的话,再慢慢的找。一般的来说,如果整篇是英文文本的话,里面混有中文字符的可能有:标点,特殊字符(如α等希腊字符),单位符号如度数(英文里没有这个特殊符号的,一般我是用上标0和大写的C组合的)。这样再找找看。
; L; w. j  r4 }& p; U3 t3 K  O
# D; }$ P# G8 l( k  ~8 I2 B
问:怎么编辑PDF文件?就是在PDF文档中加入一些文字,怎么操作?) a+ h3 y3 G/ s% R8 m
2 B0 o# T0 B  K* B2 L: k. W9 U
答:要装pdf adobe acrobat standard软件,而不是reader软件,其中中有个高级编辑,有个图标像T+ 的,这个是编辑的工具
% U$ F' i* E, @8 w$ h# S& S( U
. o4 O) m# q& }: D, N4 r2 c. a9 }/ T- A
问:Google搜索pdf文档最佳方法如何?
! B3 }, V$ z1 m# d$ ]
: U8 u5 ]% j1 U- ~5 r9 X" f" d! ]答:可以采用如下方法:$ @) }) b8 W. w) ~( L* X

6 Z! j2 q6 ?& {! D●直接用pdf作关键词
4 A+ r( z9 }7 `( {# D1 g; f8 P& A& S+ w
●在要搜索的关键词最后空一格,写上filetype:pdf/ F3 E+ ?( N# q- o$ Y# V
1 u- n! C- D, n4 w* j
●inurl:pdf  关键词。这是因为很多pdf格式的文件会把其后缀显示在URL地址里,有些却不会,所以应该是不全的。
2 Q; R& q: B6 c8 R转贴:http://hi.baidu.com/jinhao0591/b ... 093910738b6564.html

评分

参与人数 1威望 +5 +20 收起 理由
electronic + 5 + 20 感谢转载

查看全部评分

"真诚赞赏,手留余香"
还没有人打赏,支持一下
楼主热帖
帖文化:【文明发帖 和谐互动】 社区精神:【创新、交流、互助、共享】
  • TA的每日心情
    开心
    2018-7-18 12:52
  • 签到天数: 6 天

    连续签到: 1 天

    [LV.2]偶尔看看I

    累计签到:6 天
    连续签到:1 天
    发表于 2007-12-6 18:06:58 | 显示全部楼层
    好东西。顶!
    "真诚赞赏,手留余香"
    还没有人打赏,支持一下
    帖文化:【文明发帖 和谐互动】 社区精神:【创新、交流、互助、共享】
  • TA的每日心情
    郁闷
    2021-4-15 00:05
  • 签到天数: 31 天

    连续签到: 2 天

    [LV.5]常住居民I

    累计签到:35 天
    连续签到:1 天
    发表于 2008-3-6 18:08:19 | 显示全部楼层
    好东西。顶!好东西。顶!
    "真诚赞赏,手留余香"
    还没有人打赏,支持一下
    帖文化:【文明发帖 和谐互动】 社区精神:【创新、交流、互助、共享】
    您需要登录后才可以回帖 登录 | 立即加入

    本版积分规则

    招聘斑竹

    小黑屋|手机版|APP下载(beta)|Archiver|电力研学网 ( 赣ICP备12000811号-1|赣公网安备36040302000210号 )|网站地图

    GMT+8, 2025-4-4 18:11

    Powered by Discuz! X3.5 Licensed

    © 2001-2025 Discuz! Team.

    快速回复 返回顶部 返回列表