

综合类管理系统不管是自研还是外包项目都会被客户或者产品经理要求,实现word导出,excel导出,pdf导出等功能,其实pdf导出呢,有很多种方式,我实现过的就有两种,接下来呢,就说说其中的一种,就是当你已经实现了word导出,或有明确的要求说要用word文件转化为pdf文件的时候,可以看看下来,实现的这种 word文件doc、docx转pdf。








package com.ttos.utils;

import com.itextpdf.text.BaseColor;
import com.itextpdf.text.FontProvider;
import com.itextpdf.text.PageSize;
import com.itextpdf.text.pdf.PdfWriter;
import com.itextpdf.tool.xml.XMLWorkerHelper;
import com.lowagie.text.DocumentException;
import com.lowagie.text.Font;
import com.lowagie.text.pdf.BaseFont;
import fr.opensagres.poi.xwpf.converter.pdf.PdfConverter;
import fr.opensagres.poi.xwpf.converter.pdf.PdfOptions;
import lombok.extern.slf4j.Slf4j;
import org.apache.commons.lang3.StringUtils;
import org.apache.poi.hwpf.HWPFDocument;
import org.apache.poi.hwpf.converter.WordToHtmlConverter;
import org.apache.poi.xwpf.usermodel.XWPFDocument;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Element;
import org.jsoup.nodes.Entities;
import org.jsoup.select.Elements;
import org.w3c.dom.Document;

import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.transform.OutputKeys;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;
import java.io.*;
import java.nio.charset.StandardCharsets;
import java.util.Objects;

public class Word2PdfUtils {

     * docx2pdf
     * @param wordFilePath wordFilePath
     * @param pdfFilePath  pdfFilePath
     * @throws Exception Exception
    public static void docx2pdf(String wordFilePath, String pdfFilePath) throws Exception {
        if (Objects.isNull(wordFilePath)) {
        docx2Pdf(new File(wordFilePath), pdfFilePath);

     * docx2Pdf
     * @param wordFile    wordFile
     * @param pdfFilePath pdfFilePath
     * @throws Exception Exception
    public static void docx2Pdf(File wordFile, String pdfFilePath) throws Exception {
        if (Objects.isNull(pdfFilePath)) {
        docx2Pdf(wordFile, new File(pdfFilePath));

     * doc2Pdf
     * @param docFilePath docFilePath
     * @param pdfFIlePath pdfFIlePath
     * @param imgTmpPath  imgTmpPath
    public static void doc2Pdf(String docFilePath, String pdfFIlePath,String imgTmpPath) throws Exception {
        final String html = word2Html(docFilePath, imgTmpPath);
        final String formatHtml = formatHtml(html);
        html2Pdf(formatHtml, pdfFIlePath);

     * doc2Pdf
     * @param docFIle    docFIle
     * @param pdfFIlePath    pdfFIlePath
     * @param imgTmpPath imgTmpPath
     * @throws Exception Exception
    public static void doc2Pdf(File docFIle,String pdfFIlePath, String imgTmpPath) throws Exception {
        final String html = word2Html(docFIle, imgTmpPath);
        final String formatHtml = formatHtml(html);
        html2Pdf(formatHtml, pdfFIlePath);

     * docx2Pdf
     * @param wordFile wordFile
     * @param pdfFile  pdfFile
     * @throws Exception Exception
    public static void docx2Pdf(File wordFile, File pdfFile) throws Exception {
        if (Objects.isNull(wordFile) || !wordFile.exists()) {

        if (Objects.isNull(pdfFile)) {
        if (!pdfFile.exists()) {
            if (!pdfFile.createNewFile()) {

        try (final FileInputStream inputStream = new FileInputStream(wordFile);
             final FileOutputStream outputStream = new FileOutputStream(pdfFile)) {
            XWPFDocument xwpfDocument = new XWPFDocument(inputStream);
            PdfOptions pdfOptions = PdfOptions.create();
            pdfOptions.fontProvider((familyName, encoding, size, style, color) -> {
                try {
                    final String path = Objects.requireNonNull(ClassLoader.getSystemClassLoader().getResource("0.ttf")).getFile();
                    final BaseFont bfChn = BaseFont.createFont(path, BaseFont.IDENTITY_H, BaseFont.EMBEDDED);
                    final Font fontChn = new Font(bfChn, size, style, color);
                    if (!Objects.isNull(familyName)) {
                    return fontChn;
                } catch (DocumentException | IOException e) {
                    return null;
            PdfConverter.getInstance().convert(xwpfDocument, outputStream, pdfOptions);

     * word2Html
     * @param wordPath      wordPath
     * @param imageTempPath imageTempPath
     * @return html
     * @throws Exception Exception
    public static String word2Html(String wordPath, String imageTempPath) throws Exception {
        if (Objects.isNull(wordPath)) {
            log.error("doc文件路径: {} ,不能为空", wordPath);
            return null;
        return word2Html(new File(wordPath), imageTempPath);

     * word2Html
     * @param wordFile   wordFile
     * @param imgTmpPath imgTmpPath
     * @return html
     * @throws Exception Exception
    public static String word2Html(File wordFile, String imgTmpPath) throws Exception {
        if (Objects.isNull(imgTmpPath)) {
            log.error("doc文件内容图片缓存文件路径: {} ,不能为空", imgTmpPath);
            return null;
        return word2Html(wordFile, new File(imgTmpPath));

     * word2Html
     * @param wordFile   wordFile
     * @param imgTmpPath imgTmpPath
     * @return html
     * @throws Exception Exception
    public static String word2Html(File wordFile, File imgTmpPath) throws Exception {
        if (Objects.isNull(wordFile) || !wordFile.exists()) {
            return null;

        if (Objects.isNull(imgTmpPath)) {
            return null;
        if (!imgTmpPath.exists()) {
            if (!imgTmpPath.createNewFile()) {
                return null;
        try (final FileInputStream docInputStream = new FileInputStream(wordFile);
             final ByteArrayOutputStream byteArrayStream = new ByteArrayOutputStream()) {
            final HWPFDocument hwpfDocument = new HWPFDocument(docInputStream);
            final Document document = DocumentBuilderFactory.newInstance().newDocumentBuilder().newDocument();
            final WordToHtmlConverter wordToHtmlConverter = new WordToHtmlConverter(document);
            wordToHtmlConverter.setPicturesManager((bts, pictureType, picName, width, height) -> {
                String tmpPicFilePath = imgTmpPath.getAbsolutePath() + File.separator + picName;
                final File tmpPicFile = new File(tmpPicFilePath);
                try (final FileOutputStream picOutputStream = new FileOutputStream(tmpPicFile)) {
                } catch (IOException e) {
                return tmpPicFilePath;
            final Document htmlDocument = wordToHtmlConverter.getDocument();
            final DOMSource domSource = new DOMSource(htmlDocument);
            final StreamResult streamResult = new StreamResult(byteArrayStream);
            final Transformer transformer = TransformerFactory.newInstance().newTransformer();
            transformer.setOutputProperty(OutputKeys.ENCODING, "utf-8");
            transformer.setOutputProperty(OutputKeys.INDENT, "yes");
            transformer.setOutputProperty(OutputKeys.METHOD, "html");
            transformer.transform(domSource, streamResult);
            return byteArrayStream.toString(StandardCharsets.UTF_8.name());

     * formatHtml 格式化html,补全内容html标签
     * @param html html
     * @return formatHtml
    private static String formatHtml(String html) {
        final org.jsoup.nodes.Document document = Jsoup.parse(html);
        final String style = document.attr("style");
        if (StringUtils.isNotEmpty(style) && style.indexOf("width") > 0) {
            document.attr("style", "");
        final Elements divs = document.select("div");
        for (Element div : divs) {
            final String divStyle = div.attr("style");
            if (StringUtils.isNotEmpty(divStyle) && divStyle.indexOf("width") > 0) {
                div.attr("style", "");

        return document.html();

     * html2Pdf
     * @param html        html
     * @param pdfFilePath pdfFilePath
    public static void html2Pdf(String html, String pdfFilePath) throws Exception {
        if (Objects.isNull(pdfFilePath)) {

        html2Pdf(html, new File(pdfFilePath));

    public static void html2Pdf(String html, File pdfFile) throws Exception {
        if (Objects.isNull(html)) {
        if (Objects.isNull(pdfFile)) {
        if (!pdfFile.exists()) {
            log.error("需转化的pdf文件 不存在,创建文件");
            if (!pdfFile.createNewFile()) {

        try (final FileOutputStream fileOutputStream = new FileOutputStream(pdfFile);
             final ByteArrayInputStream byteArrayInputStream = new ByteArrayInputStream(html.getBytes())) {
            final com.itextpdf.text.Document document = new com.itextpdf.text.Document(PageSize.A4);
            final PdfWriter pdfWriter = PdfWriter.getInstance(document, fileOutputStream);
            XMLWorkerHelper.getInstance().parseXHtml(pdfWriter, document, byteArrayInputStream, StandardCharsets.UTF_8,
                    new FontProvider() {
                        public boolean isRegistered(String s) {
                            return false;

                        public com.itextpdf.text.Font getFont(String s, String s1, boolean b, float v, int i, BaseColor baseColor) {
                            try {
                                final com.itextpdf.text.pdf.BaseFont baseFont = com.itextpdf.text.pdf.BaseFont.createFont("STSong-Light", "UniGB-UCS2-H", com.itextpdf.text.pdf.BaseFont.EMBEDDED);
                                final com.itextpdf.text.Font font = new com.itextpdf.text.Font(baseFont, v, i, baseColor);
                                return font;
                            } catch (IOException | com.itextpdf.text.DocumentException e) {
                            return null;

    public static void main(String[] args) throws Exception {
        docx2pdf("G:\\00_com\\123.docx", "G:\\00_com\\1234.pdf");
        doc2Pdf("G:\\123.doc", "G:\\1234.pdf","G:\\pic\\");



  • [Leetcode] 76. 最小覆盖子串

    给你一个字符串 s 一个字符串 t 返回 s 中涵盖 t 所有字符的最小子串 如果 s 中不存在涵盖 t 所有字符的子串 则返回空字符串 注意 对于 t 中重复字符 我们寻找的子字符串中该字符数量必须不少于 t 中该字符数量 如果 s 中存
  • 算法(公式法):判断是否完全平方数

    给定一个正整数 num 编写一个函数 如果 num 是一个完全平方数 则返回 True 否则返回 False 说明 不要使用任何内置的库函数 如 sqrt 示例 1 输入 16 输出 True 示例 2 输入 14 输出 False 利用公
  • Qt常用的快捷键

    alt enter 自动创建类定义的实现 F1 查看帮助 文档 F2 快速到变量声明 Shift F2 函数的声明和定义之间快速切换 F4 在 cpp 和 h 文件切换 Ctrl M 创建书签 Ctrl 切换书签 Alt M打开书签栏 Ct
  • SVN学习2020.8.9

    SVN账号密码一般是有一个配置管理员给配置的 文件夹绿色标志 代表和服务器文档是一致的 同步更新的 同步更新服务器信息 update 执行操作都先update 再做其他 先保证本地和服务器一致 先更新 上锁 再修改 再提交 解锁 如何把本地
  • 供应链金融与区块链01——论文阅读

    本文章仅用于记录本人学习过程 当作笔记来用 如有侵权请及时告知 谢谢 1 基于区块链技术的供应链金融体系优化研究 龙云安 但是由于 互联网 供应链 无法 及时跟进资金流和信息流 导致核心企业 供应链金 融平台和提供融资的商业银行无法及时掌控
  • 解决前端跨域的问题.Access to XMLHttpRequest at http://xxx.xxx from origin 'http://localhost:8000' has been bl

    1 前端浏览器报错如下 Access to XMLHttpRequest at http xxx xxx from origin http localhost 8000 has been blocked by CORS policy Res
  • Scratch 3.0源码 之 多语言实现

    文章目录 实现方式 初始版本 多语言版本 1 页面文件 2 配置文件 3 建立关联 语法说明 案例1 带HTML标签写法 建议写法 案例2 带超链接写法 建议写法 Scratch 3 0中各类显示文本默认是英文 如果不支持自己的语言 或者自
  • 红队隧道应用篇之Neo-reGeorg实现内网穿透(四)

    简介 reGeorg是一个能够实现内网穿透的工具 基于socks5协议 且能支持众多脚本 由于此工具使用率过高 导致容易被杀毒软件拦截 现有一个项目是由reGeorg修改而来 而且做了加密和免杀处理 这款工具的名字就叫Neo reGeorg
  • sqlServer 自定义函数-传入参数并返回动态表

    自定义函数 传入参数并返回动态表 create FUNCTION dbo v usrlist usr varchar 20 传入当前用户代码 返回动态表 表里面包含编码及名称两个字段 RETURNS tolist TABLE usrcode
  • 一般面试时会遇到的九大难题的对策解析

    终于接到面试通知书了 欣喜之余开始考虑即将面对的种种问题 所谓有备无患 您是否尝试过面试彩排 建议您现在就不妨试上一试 我想这会帮助你对其他问题的回答做准备 好啦面试开始 想象着考官已经坐在您的面前 问题1 为什么不谈谈你自己 分析 这是个
  • 渲染函数render

    文章目录 节点 树以及虚拟 DOM 树 节点 虚拟 DOM vue中render函数的作用 render函数去创建子组件内容 createElement官方文档 参考 节点 树以及虚拟 DOM 在深入渲染函数之前 了解一些浏览器的工作原理是
  • 2016去哪儿编程题:5-血型遗传检测

    题目描述 血型遗传对照表如下 父母血型 子女会出现的血型 子女不会出现的血型 O与O O A B AB A与O A O B AB A与A A O B AB A与B A B AB O A与AB A B AB O B与O B O A AB B与
  • shell 数组(字符串下标)

    现在游戏开的服务器越来越多了 每次用ssh操作都要写ip地址 很烦 也容易出错 所以要自己搞个服务器名到ip的映射 map anahost count 0 temp cat home linwencai sh HOST while read
  • ubuntu18.04合并pdf文件

    以前使用pdftk比较常见 但是pdftk的更新似乎没有跟上 改用pdfunite轻松解决 pdftk原来使用apt安装 现在改成用snap安装pdftk sudo snap install pdftk pdftk合并命令为 pdftk p
  • 洛谷 P1200 [USACO1.1]你的飞碟在这儿Your Ride Is Here

    题目链接 https www luogu com cn problem P1200 include
  • C++函数基础

    一 函数的定义和使用 1 函数的定义 类型说明符 函数名 含类型说明的形参表 语句序列 如 int GetSum int a int b return a b 2 形式参数 形式参数的作用是实现主函数与被调函数之间的联系 3 函数的返回值和
  • 【ubuntu】ubuntu实体机与windows互传文件(两台电脑)

    先记录一些命令 dpkg list 查看软件列表 sudo apt get purge remove 包名 purge是可选项 写上这个属性是将软件及其配置文件一并删除 如不需要删除配置文件 可执行sudo apt get remove 包
  • Python列表操作中extend和append的区别

    1 用法 append 用于在列表末尾添加新的对象 输入参数为对象 extend 用于在列表末尾追加另一个序列中的多个值 输入对象为元素队列 2 相同点 两个都是对列表即list进行的操作 具体句法可以写为 list1 append obj
  • 解决EXPLORER应用程序错误,桌面出不来

    打开运行 输入CMD 输入for 1 in windir system32 dll do regsvr32 exe s 1 意思是注册所有DLL组件 一般都能解决问题 转载于 https blog 51cto com feifei888 4
