欢迎您访问我爱IT技术网,今天小编为你分享的编程技术是:【使用pdfbox实现pdf文本提取和合并功能示例】,下面是详细的讲解!
使用pdfbox实现pdf文本提取和合并功能示例
有时我们需要对PDF文件进行一些处理,提取文本、合并等。以前我们使用A-PDF Text Extractor免费工具,为什么不自己写一个呢?
现在我们可以使用PDFBox-0.7.3这个开源类库. 下载解包后引用:
新建一个项目,代码很简单:
获得这个textString,再把它们写成磁盘文件就可以了, 像这样的方法:
其它的功能您可以自行发挥了. 这个类库目前支持:
PDF to text extraction
Merge PDF Documents
PDF Document Encryption/Decryption
Lucene Search Engine Integration
Fill in form data FDF and XFDF
Create a PDF from a text file
Create images from PDF pages
Print a PDF
关于使用pdfbox实现pdf文本提取和合并功能示例的用户互动如下:
相关问题:Java PDFBox 能在PDF上添加标签吗?
答:应该是能加东西的,PDFBox 提供了下面的功能: (1)文本的提取 即在PDF文件里面把文本内容提取出来。 (2) 合并和拆分PDF文档 可以把几个PDF合并成一个PDF文件,也可以把一个PDF文件拆分成多个PDF文件。 (3) 表单填充 从PDF文件的表单中提取... >>详细
相关问题:如何用pdfbox实现对以创建的pdf文件进行些操作,急需
答:最简单和直接的代码就是看pdfbox的demo和tools的源代码,如果具体想要实现什么功能,也可以google,或者这里留言 >>详细
相关问题:求个将图片转成pdf文档的java程序,最好有注解,我用...
答:给你一个用IText写的吧 // 写PDF文件. BufferedImage img = ImageIO.read(new File(imgPath)); FileOutputStream fos = new FileOutputStream(pdfFile); // 创建PDF文档 Document doc = new Document(null, 0, 0, 0, 0); // 设置尺寸为图片尺寸 ... >>详细
- 【创建】ASP.NET Web API教程 创建域模型的方法详
- 【服务器】asp.net页面状态管理cookie和服务器状
- 【Repeater控件】.NET实现Repeater控件+AspNetPag
- 【客户端】获取客户端IP地址c#/vb.net各自实现代
- 【asp】asp.net上传execl文件后 在页面上加载显示
- 【Excel】页面导出为Excel的时间格式的问题-时间
- 【ref】asp.net(c#)ref out params的区别-out-pa
- 【数据控件】asp.net获得数据控件事件索引并获取
- 【NET】10个.NET中删除空白字符串的方法-删除空白
- 【web】web.config配置连接字符串的方法-config配
- 评论列表(网友评论仅供网友表达个人看法,并不表明本站同意其观点或证实其描述)
-
