设为首页收藏本站|繁體中文 快速切换版块

 找回密码
 立即加入
搜索
查看: 2075|回复: 2

PDF文件处理

[复制链接]

该用户从未签到

尚未签到

发表于 2007-12-6 15:52:27 | 显示全部楼层 |阅读模式

马上加入,结交更多好友,共享更多资料,让你轻松玩转电力研学社区!

您需要 登录 才可以下载或查看,没有账号?立即加入

×
PDF文件处理
4 x' e( A- [3 M  k$ _8 N7 y问:PDF与WORD之间如何通过软件实现格式转换?
: R# p/ Z; e0 l' _' x# {$ |1 `2 w! S! T: L9 G( {, S
答:PDF—>DOC  使用软件Acrobat,pdf2word;DOC—>PDF  使用软件Acrobat。0打开tif文件,识别。这个东东识别准确率极高。 2 z4 H) H& z+ V6 \' L: U+ b- _
  E2 U+ l1 |% r
pdf->Tiff(JPEG,PNG)->OCR输出word,效果极佳,如果是English几乎不用怎么修改就可以用了。
8 Y, ]' b( T3 ?* k, p% a) j4 Q% m$ a- G0 o$ ^8 b4 e0 Z& z
推荐OCR软件:ABBYY FineReader 7.0;ScanSoft OmniPage Pro 14.0(最强)
! j" A$ Q1 ^# a# y6 v2 |0 q/ a# T, Z* o5 c: U
) r2 P6 k( R1 v) v* Z: `. U/ p. J
问:如何把WORD文档转换成PDF?
& r$ V" G2 z. f/ y1 ?6 A$ O- n3 D: _5 K7 g+ F
答:安装Acrobat(不只是Reader)完全版,在安装选项里有的,把这一项选上,选pdfmaker。在word的工具条上会有一个转换按钮。装好之后在WORD的工具栏里面会有Adobe PDF,下拉菜单里面会有convert to Adobe PDF,按那个就行了。在控制面板里的打印机里多了两个关于Acrobat的,说明可以了。装了Acrobat的话,默认会装一个distiller,你也可以装acrobat里面的pdfwriter,它们两个都会成为虚拟的打印机的。然后在Word里,File->Print选择刚过装好的虚拟打印机就可以了。
$ @% M* h0 z4 J+ j0 _' a
7 g$ B8 ~8 m+ i+ ^4 P, M6 T1 L
问:如何将PDF文档直接转为WORD?除了ACROBAT还有其它软件工具吗,用这个图片走样很厉害9 N* `# }8 V7 J
8 G* a" Y2 ~! {* u8 ?7 o) k- N
答:使用pdf2word、pdffactory这些软件可以实现) H5 g. s" ^* I8 c4 M# g$ e0 a4 L7 n
$ c: [/ t) R( F# z4 C% i( Z) Q
9 A6 B. T* a+ i6 C7 @
问:DOC转换成PDF时,图很不清楚,怎么办?论文的提交的格式是DOC,但在DOC转PDF时,图很不清楚。
; _% E$ Z: b% h! J2 N4 K9 t/ K* u+ B/ Q2 _8 {( h% B. t
答:不要用pdfwriter,用distiller可能会好一些。或者用Letex,图的清晰度损失不大" o  \# P* P5 G* z$ J3 ^
1 q& F/ S, M1 _4 Q4 E* W* m( n

: `, Q$ y$ H/ U问:很多用VISIO画的图,插入在WORD文档里面的,怎么专成PDF以后,图里面的字母位置变了?而且变的很夸张,满屏幕乱窜,这个问题怎么办啊?
3 D" |9 M" J" s; l
) i) {. @3 G# P2 }答:Word中所有图片都变成tif格式的。其他的一律事先转成tif,压缩的,这样文件也不大。或者变成BMP位图也可以,但图片容量比较大。6 k/ W& |% G0 g  K

. P7 K6 {0 l( C- v* z- ?, u# F) ?: I4 h$ T, W. v& r$ F
问:我想把PDF格式文档直接转成DOC(就是WORD文档)或者TXT(纯文本文档),可以吗?0 b( |: o# v3 j* P
, U8 B- ?! p9 @; q# g' v5 b1 e
答:PDF格式的文档是不能直接转换成DOC(WORD文档)的,但是可以先转换成RTF格式,然后再转成DOC格式,前提是该PDF文档必须是纯英文的,中文的PDF转换之后会出现乱码。此时,需要用到一个工具:Aerial,这个工具是Acrobat的一个插件,可以用来把PDF文档转换成RTF文档。原PDF文档可以包含图片,图片能正常转换到RTF文档中。如果只需转换成TXT文档,那么直接转换就可以了(图片就没了)。6 ~9 f5 G5 w( n1 P

8 N: q- ~5 @7 ?, n1 B2 \; J7 m8 ]) J& o4 B# c6 g7 _
问:PDF文件中的文字怎么转换成WORD?
9 ~2 p8 T" V7 F7 P  M* g
1 u* Z6 d! U0 R) T' _# v% v答:如果是文本的,可以用Acrobat选中文字功能,如果是图片格式的,可以用最新豪华版的维普的OCR功能,但是要自己改错字。
+ |) k' n/ B8 P
/ r4 x2 H! G1 ^2 T' j; V, P6 W% P& f% {* S* J! [
问:我的PDF转WORD的时候怎么排版变了?
  g) q0 a" L3 B9 H9 `! r  x8 }/ [$ ]
答:有些地方没有用固定的东西固定,比如分页符、软回车,图片不统一也很有可能排版变掉
/ P2 t4 t- s( X6 g5 m% T. `+ w8 r: U/ o1 `  P( y7 D/ D" d1 ^

0 g9 m& \# b/ k; C" g; |问:PDF转换成WORD,提示PDF有密码,怎么办呢?
; {5 z1 F6 U+ B( I; B' a& y: Q0 q- M$ u! q* ~  G
答:找一个PDF密码石皮解器,石皮解后,再转换就可以了。- l& p4 P( ]0 o; s( V' ?
6 p2 d. E( g) N$ U  f: l' j5 [
比如Advanced pdf Password Recovery;pdf Password Remover;HB-pdfpr21-fxj.zip;Advanced Password Recovery5.3。后者是一个各种石皮解的集成,里面的Acrobat是针对PDF的。& ~8 H* h! U2 D" X$ ?7 Y

( x2 q. k, y. C$ c4 y
/ }( Z. g3 L5 u  t- E  P% c. {: w问:PDF文件到TXT文件的转换,除了copy和paste得方法外,还有什么办法吗?
" d8 c! t' B% u+ J! m8 \; v+ E5 L4 n5 ]! L: o5 Q, u, I  n- n
答:将WORD转为PDF,然后用方法2另存为rtf文件,WORD可以识别。但是一般的下载文献,因为本身是图形,所以第二种方法不能实现。以上所说的是针对中文文本。
' z& D" ]2 K) e$ a" ^/ w
# Y9 K- D: {" R! ?+ c) f7 [3 hPDF-—>WORD方法总结如下:
, q6 P, D9 [5 [8 Y7 E
$ _: N( S5 f2 ]* Y$ [* a' D( a2 d●如果PDF本身就是图形的话处理方法如下:4 S9 f3 G5 W) ?% o. \

0 X( q9 q9 @' @3 Q/ C(1)英文处理方法:
, j/ Q' ~# S" S, ]: {$ v" ]. [
0 e6 `2 h1 T; l) t3 p: T  tA,用photoshop6。0打开PDF将之转化为tif格式文件。
" q/ X/ j4 u. F, G7 |1 m
! K2 S; [; t. D/ ~( gB,用<, SPAN lang=EN-US style="COLOR: blue">Omnipagepro103 W$ n- ]* E1 K  m1 a

) t1 M) u" a9 C: _. n' L1 O(2)中文处理方法:  g8 H7 @- |  Z# J: @0 T
/ E% b  |3 H  K" k5 Y: F3 K4 G
A,用photoshop打开PDF将之转化为tif格式文件。2 u  g" T, u7 u' P! A8 o

# Z# j0 `9 r/ t6 d9 @% PB,用th-ocr2000专业版或者Shocr6。0打开tif文件,识别。
4 h' v! b2 @, C# R! P! A+ s# Y  t* ^: A2 [/ u5 D

8 V3 k" ^. P/ G4 d. H●如果PDF本身是文本的话处理方法如下:7 @  u) R) ]. s. T. O& W

2 ^+ I8 U: K6 W# r(1)使用BCL公司的drake软件(Acrobat的插件)转换。- K  G# {+ P+ B+ g+ B  T- R

+ y5 z2 q- \" H. P) z; e使用第一种方法转换成的rtf文件格式比较乱,不过可以直接拷贝出其中的图形。7 q8 d) [9 U) z6 K7 J! p) o

4 q  p; ^: n9 Q6 r5 A使用的二种方法转换成的rtf文件格式遵循原文,不过不能拷贝原文中的图形。( l" I# r, v8 L& K
" v+ l/ D0 _) k9 L* t* ]
( b. \! @9 R. f( B7 c* r
问:为什么我的PDF文档不能选取文字内容或者存为rtf或者txt?
' s9 r9 Z' ?0 {7 {+ N; x
2 J' Y  y0 r# V( s答:如果不属于这种情况,很可能是因为这个文档中的所谓的文字是从图像文件(比如扫描仪得到的结果)打印出来的。这种情况下是肯定不能直接选取文本的。顺便说一下,在Acrobat 6.0中是另存为WORD文档。
' `" f& F( L3 k9 l5 w  i+ [3 O* q4 s
解决办法:使用OCR软件识别图像中的文本内容。识别英文的软件推荐Abbyy Fine Reader,中文推荐北大汉王,清华紫光。扫描仪一般会附带这种软件的。8 k5 y; J# P; w; h/ j; y% j
" ]2 `2 T6 W$ ^' L

8 f8 H5 v# S8 h; E; Y- `) u问:怎么把pdf格式中的图表拷贝出来?
5 M" P4 {, T% [+ S& V- e- f5 s( }2 S% n- H; h7 v4 P# Y& l& u
答:如下方式均可:- ~7 U/ p. V" V' b' ?6 |3 `" f: v
2 s# c$ u( `! u1 a5 h7 u
●acrobat6.0以上里面有复制表格这一个选项的
/ |' D& D, G. M, Q! r. s: a" y( F# O- J, ]" e. e8 i
●尚书六号软件, c& ?4 i" y; q4 B  \

+ o& J$ v; [& `3 Q+ P- w●snagit: A' _- s6 ^( Z* D( x# K) V
+ I* X$ a- o7 O6 u( p+ }& Z( n
●print screen一键即可# v7 p% s1 Y: u$ x) Y
6 c1 [$ ^1 ]% i0 L# L) p

4 [, A8 `3 l' ^9 Q问:visio的图转化为pdf文件时出问题了,框图中的文字位置跑到外面去了,不知道怎么回事,其它几张都是好的,如何处理?
( R; I" W$ B1 `3 a6 {
$ ]$ H, b! J  N答:即使转成wmf格式插在word中有时也会这样。把它转成emf就没问题,应该在pdf中也可以;或者把word中的visio框图换成位图,然后再转成pdf就可以了;图片不要存成默认格式,存成tiff格式,分辨率设得高一点,再插入到word中,再转成pdf文件
* u+ U1 w  k: ]9 `/ H* W1 [+ O/ A4 w* F  x' z2 h$ {/ s) u( A5 [  R

. L$ ^& x% P  S+ `9 ~问:如何把pdf文件连起来?8 H& E! _" w3 T$ ]' m. d

5 z: _( {) W- X2 Z: M# F答:用acrobat,全选,右键然后选择合并。。。;有个combine pdf选项可以实现,文件(File)—创建PDF—从多个文件—浏览—添加多个文件—确定( k+ _( D3 E) H& S

% c( S! S4 A" ]0 t% P- N- f8 x* U9 a- z/ i! f9 H
问:怎么将PDF文件的其中几页保存为另一个文件?打印了之后,文件打不开!怎么回事呢?
5 _2 R& G4 s) V5 [7 W" @: Y7 I, w  A, j) j+ M" Y% N
答:可以试试选中要的几页,点击右键,选“选取文件”项,然后另存为另外一个文件即可
' Y9 E3 Q. j. f' y1 }, a) n8 H
3 C* n* {* A, H& p; T问:怎么选中几页呢?就算只要一页,我点击右键也没有找到选取文件项,对啦,我在PDF文件上加了一些阅读过的符号,如画线、加亮之类的,这个有影响吗?
; n! H9 C+ K) x# ?8 `4 v9 z2 R, O3 p8 _$ d7 X; r) N
答:不知道你用的是哪个版本的acrobat,根据我用7.0版的看来,在PDF上作改动不会影响选页保存。我的是英文版,选页保存操作如下:先打开左侧的pages栏,选择你要取出来的那些页,后右键选extract pages(我这边看来是第二项),之后会自动弹出来由选取的页组成的pdf文件,保存它就可以了。如果你要每一页分开保存,钩选那个extract pages as seperate files即可。3 r1 b2 W* @( W( {" u$ E

& e/ i9 a, Y5 C3 K& m9 |或者安装软件PDFFACTORY,打开你的PDF文档,点击打印,选择PDFFACTORY,打印机选择打印的起始终止页码,确定打印,出来的就是原文中的你选择的某几页
, ]5 c# h6 u/ s0 e0 `8 Y
9 i4 o8 \) Q( W& g
  G0 T& `4 v  w8 G- j7 t问:为什么我的PDF不能用打印机打印?PDF文件设置密码加密后不可复制打印怎么办?
0 d6 U8 |9 \% I1 H/ s; \6 h- E6 r; q/ ^1 S
答:PDF文档在创建的时候可以设置密码保护和权限,这一点可以在File—>Document Properties(文件-)文件属性)的安全选项里面找到。同时,如果文档设置了权限限制,在Acrobat(Reader)窗口的下方会出现一个金黄色的钥匙图标(6.0版本是左下角的一把锁)。在安全选项里面包括打印、对文章修改的各种权限的设置,如果你使用的是Acrobat,可以在这里自行设置密码保护。" }% {% `8 q  o( R3 J

9 D, b# ^' Y1 \) Z( ~, t解决办法:使用PDF文档解密软件可以解决这个问题。推荐:Advanced pdf Password Recovery;pdf Password Remover;Advanced Password Recovery5.3。后者是一个各种石皮解的集成,里面的Acrobat是针对PDF的。# V1 z/ o" Q+ V

! x7 _/ W- Y) q1 {, ]5 D. ^+ I+ }3 W: w* x9 C
问:为什么我的Adobe Acrobat Distiller打印机不能正常打印文档到文件或PDF?. H7 X; m7 s2 H/ H' ^8 \

  k5 S- f! j  l0 z  H是把控制面板打印机里面的Acrobat或者Distiller打印机的preference中“不发送字体到Acrobat(或者Distiller)”的复选框去掉,然后就可以了。& T! r" g1 q% I/ d
  {8 u% E" [' y) E8 U
$ {. r6 x9 G/ Q6 V+ f
问:金山词霸如何在Acrobat(Reader)上取词?
, L  N" Z2 t7 M; I( D0 G# U9 S- j" @) ~% z
答:要先装acrobat,后装詞霸。将词霸目录下的xdict32.api插件复制到Acrobat(Reader)的Plug_ins目录下,两个软件都需要重新运行。文件是图形不能取词( U" Z' E1 T8 F) f+ a7 r
; L, [/ `" t( ~& v, h4 ?
+ }5 C9 e3 J. F! k0 R
问:词霸在acrobat 5中的取词解决方法) u( V( _( G$ ^" u3 X3 e- x0 Y
6 V6 `- `8 H+ p% l
答:在acrobat5.0里的“edit”菜单,选择“Preferences”,取消选择“Certified Plug-ins only”选项,再重新启动Acrobar reader就可以取词了。
% f$ r0 T/ B7 g2 ~1 ?, n1 u" N6 I6 [  w' E0 ?0 Y
中文的是这样的:编辑->首选项->一般->选项->启动->仅认证的增效工具,勾勾去掉。" ]- }4 x  i" l+ J" e3 e

& T6 U% F+ p' e1 z) A7 U  k中文5.0默认就是去掉的,词霸可以识别# X+ J( f5 Z) y; b) z3 j- ^1 @
( r$ Z" {$ ^2 T4 L, l4 t: P6 A, w
, P7 E/ l% M3 c! a6 C  V
问:英文的pdf文件中如有中文字符该怎么办?投个国际会议,结果反馈的信息是说我的pdf文件有postscript error,有人说是中文字符的问题,用一个英文版的acrobat打开,果然到有些页面要提示下载中文包,否则无法显示那些页面。原来是用word写的,能想到的就是查找中文的逗号句号什么的,可是搜来搜去改完了还是有这样的毛病,起先想找个英文版的office来,发现这年头这种东东还真是稀有,ft,有没有哪位处理过类似的问题,指点一把,先谢过了。。。
6 a) n+ h$ F* T( A# x
' [7 ~: I, E) S6 L( u3 ~答:你可以用工具-》字数统计统计一下,里面是否有中文字符和朝鲜字。如果有的话,再慢慢的找。一般的来说,如果整篇是英文文本的话,里面混有中文字符的可能有:标点,特殊字符(如α等希腊字符),单位符号如度数(英文里没有这个特殊符号的,一般我是用上标0和大写的C组合的)。这样再找找看。( j0 h7 \. ?4 X2 o2 {+ T

& Q  y7 K! `3 d( c% Q
# a6 p2 [) G$ ?0 ^6 t/ {6 s问:怎么编辑PDF文件?就是在PDF文档中加入一些文字,怎么操作?
1 V1 a$ Z9 ]' z  \9 B9 d3 N4 w2 s8 [$ O5 s/ a' k2 W
答:要装pdf adobe acrobat standard软件,而不是reader软件,其中中有个高级编辑,有个图标像T+ 的,这个是编辑的工具9 w3 O/ W, H1 G. q; ~. ?; q3 l) {
* c" `) l/ l# A* b# O# B2 Z
6 C$ M* P) _! z. u% z" L9 `4 d
问:Google搜索pdf文档最佳方法如何?
, L. I/ n3 w! R7 K# u& I0 E$ W, S) [7 ^$ d! T0 Y' m
答:可以采用如下方法:; a( J$ @) [; ]
: k( Y- W3 w- b, R; N# O  d& t! A
●直接用pdf作关键词! U. K3 _% D1 c  h# C2 u

5 }: L+ [  K3 S7 p3 J●在要搜索的关键词最后空一格,写上filetype:pdf5 w( K1 p/ b/ T

$ r6 S* y" Q4 ?4 U# F●inurl:pdf  关键词。这是因为很多pdf格式的文件会把其后缀显示在URL地址里,有些却不会,所以应该是不全的。2 a7 c4 \1 L6 j! t- _
转贴:http://hi.baidu.com/jinhao0591/b ... 093910738b6564.html

评分

参与人数 1威望 +5 +20 收起 理由
electronic + 5 + 20 感谢转载

查看全部评分

"真诚赞赏,手留余香"
还没有人打赏,支持一下
楼主热帖
帖文化:【文明发帖 和谐互动】 社区精神:【创新、交流、互助、共享】
  • TA的每日心情
    开心
    2018-7-18 12:52
  • 签到天数: 6 天

    连续签到: 1 天

    [LV.2]偶尔看看I

    累计签到:6 天
    连续签到:1 天
    发表于 2007-12-6 18:06:58 | 显示全部楼层
    好东西。顶!
    "真诚赞赏,手留余香"
    还没有人打赏,支持一下
    帖文化:【文明发帖 和谐互动】 社区精神:【创新、交流、互助、共享】
  • TA的每日心情
    郁闷
    2021-4-15 00:05
  • 签到天数: 31 天

    连续签到: 2 天

    [LV.5]常住居民I

    累计签到:35 天
    连续签到:1 天
    发表于 2008-3-6 18:08:19 | 显示全部楼层
    好东西。顶!好东西。顶!
    "真诚赞赏,手留余香"
    还没有人打赏,支持一下
    帖文化:【文明发帖 和谐互动】 社区精神:【创新、交流、互助、共享】
    您需要登录后才可以回帖 登录 | 立即加入

    本版积分规则

    招聘斑竹

    小黑屋|手机版|APP下载(beta)|Archiver|电力研学网 ( 赣ICP备12000811号-1|赣公网安备36040302000210号 )|网站地图

    GMT+8, 2026-4-30 07:06

    Powered by Discuz! X3.5 Licensed

    © 2001-2026 Discuz! Team.

    快速回复 返回顶部 返回列表