PDF文本内容提取到TXT文件
时 间:2011-10-08 09:40:10
作 者:叶海峰 ID:31 城市:广州
摘 要:提取PDF文件的文本内容,并可以设定需要提取的页码翻页,生成为TXT文件
正 文:
提取PDF文件的文本内容,需要引用Acrobat库,Acrobat7.0,9.0测试通过,大部分代码在网上收集回来,并非原创,如运行过程中出现ActiveX部件不能创建对象的提示,则有可能是Acrobat库引用失败,请重新安装完整版的Acrobat
Sub PdfToTxT()
Dim MyPdf As AcroPDDoc
Dim MyPageHilite As AcroHiliteList
Dim PageSelect As AcroPDTextSelect
Dim i As Integer
Dim pdfdata As String
Dim OpenResult, HiliteResult
Dim pagenumber As Integer
Dim myPDFPage As AcroPDPage
Open "c:\1.txt" For Output As #1
Set MyPdf = CreateObject("acroexch.pddoc")
OpenResult = MyPdf.Open("c:\2007年半年报摘要.pdf")
For pagenumber = 0 To MyPdf.GetNumPages - 1
Set myPDFPage = MyPdf.AcquirePage(pagenumber)
Set MyPageHilite = CreateObject("acroexch.hilitelist")
HiliteResult = MyPageHilite.Add(0, 9000)
Set PageSelect = myPDFPage.CreatePageHilite(MyPageHilite)
For i = 0 To PageSelect.GetNumText - 1
pdfdata = pdfdata & PageSelect.GetText(i)
Next
Print #1, pdfdata
pdfdata = ""
Set myPDFPage = Nothing
Set MyPageHilite = Nothing
Set PageSelect = Nothing
Next
Set MyPdf = Nothing
Close #1
End Sub
Access软件网QQ交流群 (群号:54525238) Access源码网店
常见问答:
技术分类:
源码示例
- 【源码QQ群号19834647...(12.17)
- 统计当月之前(不含当月)的记录...(03.11)
- 【Access Inputbo...(03.03)
- 按回车键后光标移动到下一条记录...(02.12)
- 【Access Dsum示例】...(02.07)
- Access对子窗体的数据进行...(02.05)
- 【Access高效办公】上月累...(01.09)
- 【Access高效办公】上月累...(01.06)
- 【Access Inputbo...(12.23)
- 【Access Dsum示例】...(12.16)

学习心得
最新文章
- 仓库管理实战课程(9)-开发往来单...(04.02)
- 仓库管理实战课程(8)-商品信息功...(04.01)
- 仓库管理实战课程(7)-链接表(03.31)
- 仓库管理实战课程(6)-创建查询(03.29)
- 仓库管理实战课程(5)-字段属性(03.27)
- 设备装配出入库管理系统;基于Acc...(03.24)
- 仓库管理实战课程(4)-建表操作(03.22)
- 仓库管理实战课程(3)-需求设计说...(03.19)
- 仓库管理实战课程(2)-软件背景和...(03.18)
- 仓库管理实战课程(1)-讲师介绍(03.16)