HTML 转 PDF 命令行工具 wkhtmltopdf

 软件  2018-09-08  admin  8479  11446

HTML可以很容易的通过浏览器打印功能或者通过PDF编辑器创建,但是通过浏览器打印自定义的参数和功能很少。wkhtmltopdf可以完美支持CSS样式,自动生成标签,保留HTML的链接和锚点,功能非常强大。支持 Windows、Linux、OS X Others 等,并且开源免费。


文档:文档内置 与程序中,命令行运行  wkhtmltopdf -H.
官网:https://wkhtmltopdf.org/downloads.html常用命令及示例:

Snipaste_2018-09-08_14-31-03.png
由于编辑器解析[]的内容,以下代码在运行时需要把中文状态下的中括号【】替换为英文状态下中括号[];

本地文件:file:///E:/demo/yii2doc.html --footer-center 【page】
--header-left 【section】--【subsection】
--minimum-font-size <int>   Minimum font size
--print-media-type
--no-print-media-type

wkhtmltopdf --header-left 【title】 --footer-center 【page】 --header-spacing 2 https://www.taobao.com/  taobao.pdf
wkhtmltopdf --header-left 【section】"        --"【subsection】 --header-font-size 6 --header-line --footer-center 【page】 --header-spacing 2 file:///E:/demo/yii2doc.html yiidoc.pdf

1.全局参数
--collate             当输出多个副本时进行校验(这是默认设置)
    --no-collate          当输出多个副本时不进行校验
    --cookie-jar <path>   从提供的JAR文件中读写cookie数据
    --copies <number>     设置输出副本的数量(默认主1),其实为1就够了
-d, --dpi <dpi>           指定一个要分辨率(这在 X11 系统中并没有什么卵用)
-H, --extended-help       相对 -h 参数,显示更详细的说明文档
-g, --grayscale           指定以灰度图生成PDF文档。占用的空间更小
-h, --help                显示帮助信息  
    --htmldoc             输出程序的html帮助文档
    --image-dpi <integer> 当页面中有内嵌的图片时,
                          会下载此命令行参数指定尺寸的图片(默认值是 600)
    --image-quality <interger> 当使用 jpeg 算法压缩图片时使用这个参数指定的质量(默认为 94)
    --license             输出授权信息并退出
-l, --lowquality          生成低质量的 PDF/PS ,能够很好的节约最终生成文档所占存储空间
    --manpage             输出程序的手册页
-B, --margin-bottom <unitreal> 设置页面的 底边距
-L, --margin-left <unitreal>   设置页面的 左边距 (默认是 10mm)
-R, --margin-right <unitreal>  设置页面的 右边距 (默认是 10mm)
-T, --margin-top <unitreal>    设置页面的 上边距
-O, --orientation <orientation> 设置为“风景(Landscape)”或“肖像(Portrait)”模式,
                                默认是肖像模块(Portrait)
    --page-height <unitreal>   页面高度
-s, --page-size <Size>         设置页面的尺寸,如:A4,Letter等,默认是:A4
    --page-width <unitreal>    页面宽度
    --no-pdf-compression       不对PDF对象使用丢失少量信息的压缩算法,不建议使用些参数,
                               因为生成的PDF文件会非常大。
-q, --quiet                    静态模式,不在标准输出中打印任何信息
    --read-args-from-stdin     从标准输入中读取命令行参数,后续会有针对此指令的详细介绍,
                               请参见 **从标准输入获取参数**
    --readme                   输出程序的 readme 文档
    --title <text>             生成的PDF文档的标题,如果不指定则使用第一个文档的标题
-V, --version                  输出版本信息后退出


2.大纲参数选项
    --dump-default-toc-xsl     输出默认的 TOC xsl 样式表到标准输出
    --dump-outline <file>      输出“大纲”到指定的文件(文件内容为xml)
    --outline                  在生成的PDF文档中输出“大纲”(这是默认设置)
    --no-outline               不在pdf文档中输出大纲
    --outline-depth <level>    设置生成大纲的深度(默认为 4)

3.页面对象参数
    --allow <path>                指定加载HTML中相对路径文件的目录(可重复使用此参数指定多个
                                  目录),这个参数会在后面进行更详细的讲解
    --background                  输出页面背景到PDF文档(这是默认设置)
    --no-background               不输出页面背景到PDF文档
    --cache-dir <path>            网页的缓存目录
    --checkbox-checked-svg <path> 使用指定的SVG文件渲染选中的复选框
    --checkbox-svg <path>         使用指定的SVG文件渲染未选中的筛选框
    --cookie <name> <value>       设置访问网页时的cookie,value 需要进行url编码
                                  (可重复使用此参数指定多个cookie)
    --custom-header <name> <value> 设置访问网页时的HTTP头(可重复使用此参数指定多个HTTP头)
    --custom-header-propagation   为每个要加载的资源添加由 --custom-header 指定的HTTP头
    --no-custom-header-propagation 不为每个要加载的资源添加由 --custom-header 指定的HTTP头
    --debug-javascript            显示javascript调试输出的信息
    --no-debug-javascript         不显示javascript调试输出的信息(这是默认设置)
    --default-header              添加一个默认的“头”,在页面的左头显示页面的名字,
                                  在页面的右头显示页码,这相对于进行了如下设置:
                                  --header-left='【webpage】'
                                  --header-right='【page】/【toPage】'
                                  --top 2cm
                                  --header-line
    --encoding <encoding>         为输入的文本设置默认的编码方式
    --disable-external-links      禁止页面中的外链生成超链接
    --enable-external-links       允许页面中的外链生成超链接(这是默认设置)
    --disable-forms               不转换HTML表单为PDF表单(这是默认设置)
    --enable-forms                转换HTML表单为PDF表单
    --images                      加载图片并输出到PDF文档(这是默认设置)
    --no-images                   在生成的PDF文档中过滤掉图片
    --disable-internal-links      禁止页面中的内链生成超链接
    --enable-internal-links       允许页面中的内链生成超连接(这是默认设置)
-n, --disable-javascript          禁止WEB页面执行 javascript
    --enable-javascript           允许WEB页面执行 javascript(这是默认设置)
    --javascript-delay <msec>     延迟一定的毫秒等待javascript 执行完成(默认值是200)
    --load-error-handling <handler> 指定当页面加载失败后的动作,可以指定为:abort(中止)、
                                    ignore(忽略)、skip(跳过);(默认值是:abort)
    --load-media-error-handling <handler> 指定当媒体文件加载失败后的动作,可以指定为:
                                          abort(中止)、ignore(忽略)、skip(跳过);
                                          (默认值是:ignore)
    --disable-local-file-access   不允许一个本地文件加载其他的本地文件,使用命令行参数
                                   `--allow` 指定的目录除外。
    --enable-local-file-access    允许本地文件加载其他的本地文件(这是默认设置)
    --minimum-font-size <int>     设置最小的字号,除非必要不推荐使用该参数
    --exclude-from-outline        拒绝加载当前页面到PDF文档的目录和大纲中
    --include-in-outline          加载当前页面到PDF文档的目录和大纲中(这是默认设置)
    --page-offset <offset>        设置页码的起始值(默认值为0)
    --password <password>         HTTP身份认证的密码
    --disable-plugins             禁止使用插件(这是默认设置)
    --enable-plugins              允许使用插件,但插件可能并不工作
    --post <name> <value>         添加一个POST字段,可以重复使用该参数添加多个POST字段。
    --post-file <name> <value>    添加一个POST文件,可以重复使用该参数添加多个文件。
    --print-media-type            用显示媒体类型代替屏幕
    --no-print-media-type         不用显示媒体类型代替屏幕
-p, --proxy <proxy>               使用代理
--radiobutton-checked-svg <path>  使用指定的SVG文件渲染选中的单选框
--radiobutton-svg <path>          使用指定的SVG文件渲染未选中的单选框
--run-sript <js>                  页面加载完成后执行一个附加的JS文件,可以重复使用此参数指定
                                  多个要在页面加载完成后要执行的JS文件。
--disable-smart-shrinking         不使用智能收缩策略
--enable-smart-shrinking          使用智能收缩策略(这是默认设置)
--stop-slow-scripts               停止运行缓慢的javascript代码(这是默认设置)
--no-stop-slow-scripts            不停止运行缓慢的javascript代码
--disable-toc-back-links          禁止从标题链接到目录(这是默认设置)
--enable-toc-back-links           允许从标题链接到目录
--user-style-sheet <url>          设置一个在每个页面都加载的用户自定义样式表
--username <username>             HTTP身谁的用户名
--viewport-size <>                设置窗口大小,需要你自定义滚动条或css属性来自适应窗口大小。
--window-status <windowStatus>    Wait until window.status is equal to
                                  this string before rendering page
--zoom <float>                    设置转换成PDF时页面的缩放比例(默认为1)

4.页眉和页脚参数选项
    --footer-center <text>        在页脚的居中部分显示页脚文本 <text>
    --footer-font-name <name>     设置页脚的字体 (默认为 Arial)
    --footer-font-size <size>     设置页脚的字体大小 (默认为 12)
    --footer-html <url>           添加一个html作为页脚
    --footer-left <text>          在页脚的居左部分显示页脚文本 <text>
    --footer-line                 在页脚上方显示一条直线分隔正文
    --no-footer-line              不使用直线分隔页脚与正文(这是默认设置)
    --footer-right <text>         在页脚的居右部分显示页脚文本 <text>
    --footer-spacing <real>       页脚与正文之间的距离(默认为零)


    --header-center <text>        在页眉的居中部分显示页眉文本 <text>
    --header-font-name <name>     设置页眉的字体 (默认为 Arial)
    --header-font-size <size>     设置页眉的字体大小 (默认为 12)
    --header-html <url>           添加一个html作为页眉
    --header-left <text>          在页眉的居左部分显示页眉文本 <text>
    --header-line                 在页眉下方显示一条直线分隔正文
    --no-header-line              不使用直线分隔页眉与正文(这是默认设置)
    --header-right <text>         在页眉的居右部分显示页眉文本 <text>
    --header-spacing <real>       页眉与正文之间的距离(默认为零)
          
5.页眉和页脚
【page】       当前正在被输出页面的页码
【frompage】   第一页在文档中的页码
【topage】     最后一面在文档中的页码
【webpage】    当前正在被输出页面的URL
【section】    当前正在被输出的章节的名字
【subsection】 当前正在被输出的小节的名字
【date】       本地系统格式的当前日期
【isodate】    ISO 8601 格式的当前日期
【time】       本地系统格式的当前时间
【title】      当前对象的标题
【doctitle】   输出文档的标题
【sitepage】   当前正在处理的对象中当前页面的页码
【sitepages】  当前正在处理的对象中的总页数


6.目录对象参数
    --disable-dotted-lines        在目录中不使用虚线
    --toc-header-text <text>      设置目录的页眉文本
    --toc-level-indentation <width> 第级标题在目录中的缩进宽度(默认为1em)
    --disable-toc-links           在目录中不生成指向内容锚点的超链接
    --toc-text-size-shrink <real> 在目录中每级标题的缩放比例(默认为0.8)
    --xsl-style-sheet <file>      使用自定义的 XSL 样式表显示目录内容


参考资料:
1.http://blog.163.com/songchao01230@126/blog/static/1161848722014222231114/
2.http://www.jianshu.com/p/4d65857ffe5e


如果文章对您有帮助,点击下方的广告,支持一下作者吧!

相关推荐


Systemd Web 管理系统:简化服务管理

# Systemd Web Systemd Web 是一个 Systemd 的 Web UI 管理系统,通过直观的界面和易用的操作,让用户能够轻松地管理 Linux 系统和服务。该项目旨在简化 Systemd 的使用,使得无论是专业的系统管理员还是普通的用户,都能够方便地对系统进行操作。 ## [github地址] (https://github.com/topascend/systemd

systemctl 使用

Systemd是Linux系统工具,用来启动守护进程,已成为大多数发行版的标准配置。而systemctl是Systemd的主命令,用于管理系统。其实我们大部分服务都有使用systemctl管理,比如MySQL、Nginx等等。常见配置如下:[Unit] #单元描述 Description=GFAPP #在什么服务启动之后再执行本程序 After=mysql.service [Serv

php 正则获取字符串中所有图片链接地址并下载图片

php 正则获取字符串中所有图片链接地址并下载图片/** *获取图片的绝对地址 *@paramstring$content *@returnmixed *@Author:code.cent123.com */ functiongetImageUrl(string$content=&quot;&quot;) { //$pattern=&quot;/src=[\&quot;\&#39;

PHP常用正则表达式汇总

PHP常用正则表达式汇总&quot;^\d+$&quot;  //非负整数(正整数+0) &quot;^[0-9]*[1-9][0-9]*$&quot;  //正整数 &quot;^((-\d+)|(0+))$&quot;  //非正整数(负整数+0) &quot;^-[0-9]*[1-9][0-9]*$&quot;  //负整数 &quot;^-?\d+$&quot;    //整数