Java 根据URL,将网页转存为PDF文件
发表时间: 2019-05-09 14:52:10 | 浏览次数:
小编好久没更新文章了,最近实在太忙了。今天来更一篇“如何将网页转存为PED文件”,废话不多说,下面直接贴上代码:
小编用的maven,需要添加以下依赖:
<!-- url转pdf --> <dependency> <groupId>org.xhtmlrenderer</groupId> <artifactId>flying-saucer-pdf-itext5</artifactId> <version>9.0.3</version> </dependency>
UrlToPdfUtil.java:
package com.lrfun.util; import java.io.FileOutputStream; import java.io.OutputStream; import org.xhtmlrenderer.pdf.ITextFontResolver; import org.xhtmlrenderer.pdf.ITextRenderer; import com.itextpdf.text.pdf.BaseFont; public class UrlToPdfUtil { //private static final String OUT_PUT_PDF_PATH = "/home/data/pdf/"; //pdf文件的存放路径(Linux) private static final String OUT_PUT_PDF_PATH = "C:/Users/Administrator/Desktop/pdf/"; //pdf文件的存放路径(windows) /** * @Title 网页转存为PDF文件 * @param url 链接地址 * @param outputFileName 转存的PDF文件名 */ public static void urlToPdf(String url, String outputFileName) { try { String folder = outputFileName.substring(0, 6); String outputFile = OUT_PUT_PDF_PATH + folder +"/"+ outputFileName; java.io.File targetFile = new java.io.File(outputFile); if (!targetFile.getParentFile().exists()) { targetFile.getParentFile().mkdirs(); // 创建父级文件路径 } OutputStream os = new FileOutputStream(outputFile); ITextRenderer renderer = new ITextRenderer(); renderer.setDocument(url); ITextFontResolver fontResolver = renderer.getFontResolver(); //fontResolver.addFont("/usr/share/fonts/chinese/simsun.ttc", BaseFont.IDENTITY_H, BaseFont.EMBEDDED); //Linux fontResolver.addFont("c:/Windows/Fonts/simsun.ttc", BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED); //windows renderer.layout(); renderer.createPDF(os); os.close(); } catch (Exception e) { e.printStackTrace(); } } public static void main(String[] args) { urlToPdf("http://www.lrfun.com/toPdf.html", "201905098888888.pdf"); } }
代码比较简单,但是有两个必须注意的点:
1.字体限制,要使用simsun字体(可点击下载),下载自行安装吧;
2.需要转为PDF的网页,必须遵守W3C标准,也就是说每个标签都必须闭合(如:img等标签的结尾必须要添加“/”),否则就会报错,详细请参考文件:http://www.lrfun.com/toPdf.html
上一篇:Java 扫描微信公众号二维码,关注并自动登录网站
下一篇:Java 企业微信会话内容(聊天记录)存档及获取媒体文件