markdownjava html文件转换pdf怎么转换成html或者pdfjava html文件转换pdf

利用Pandoc将markdown文件转化为pdf
Windows下安装pandoc很容易,直接从上下载安装即可。
Linux下的安装可以参考阳志平的博文。
pandoc被称为格式转换的瑞士军刀。执行程序文件只有20M左右大小,但是能够在几十种文件格式之间自如的转换,那当然是得依赖各种格式文件所需要库。转换为pdf就要用到MiKTeX,Windows下推荐使用CTeX完整版,对中文的支持很好,可以从下载。
如果markdown文件中不包含中文字符,那么直接使用下面的命令就可以将markdown文件无缝转换为Latex支持的pdf文件。
pandoc infile.md -o outfile.pdf
如果markdown文件中包含中文字字符,那么上段命令就无法直接转换,可能会报以下错误:
! Package inputenc Error: Unicode char \u8:鍒?not set up for use with LaTex.
pandoc: Error producing PDF from Tex source.
See the inputsnc package documentation for explanation.
为了解决中文编译的问题,需要做以下的工作:
将markdown文档的编码方式改为utf-8。比较简单的办法就是用记事本打开该文档,然后另存为时选择编码方式为utf-8。有可能当你改变编码方式后,文档中的中文全变成乱码了。为避免这种情况,可以在改变编码方式之前先复制文档的全部内容,然后在改变编码方式之后粘贴替换文档中的全木内容,这样就不会出现乱码了。
编译pandoc默认的latex引擎是pdflatex,是不支持中文的,因此需要手动设置编译时所用的引擎为xelatex,编译命令改为:
pandoc infile.md -o outfile.pdf
--latex-engine=xelatex
这时编译可能没有错误了,但是得到的pdf文档中可能所有的中文都没有了。这是字体的问题,因为编译时默认的字体时不支持中文的,所以我们得手动设置中文字体。显然,所设的字体应该为系统中已装的字体,且字体的名字不能写错。有一个办法可以的到系统中所安装的所有字体名(见),即在控制台中输入命令:fc-list
C:\fonts.txt。这样,扫到的字体信息就全部被导入到C盘根目录下的fonts.txt文件中了。这里我们选择宋体,字体名称为“SimSun”,于是编译命令改为:
pandoc infile.md -o outfile.pdf --latex-engine=xelatex -V
mainfont="SimSun"
注意:命令中的``V’’是大写
这里字体名也可以不加双引号,但是如果字体名比较复杂(如包含空格)时,不加双引号就可能出错。
好了,中文字符应该能够显示了,但是你可能会发现很多文字已经超出了文档的边界无法显示了,这是因为pandoc对中文的支持不太好,不能自动换行。但是这并不表示pandoc就真的无法完美处理中文文档了,因为技术界那些追求完美的极客们为我们提供了无限的可能。这篇博文介绍了pandoc中文pdf转换攻略,解决方案是使用网友编辑好的latex模板来生成pdf,这里用到的是提供的pm-template.latex。
下载模板后将其中的LiHei Pro字体替换成系统中安装有的中文字体即可,然后编译命令改为:
pandoc infile.md -o outfile.pdf --latex-engine=xelatex
--template=pm-template.latex
注意:如果安装的MiKTeX(我用的是CTex)宏包不全,编译可能会出问题,如找不到exp13.sty等,因此推荐安装完整版的MiKTex。
当然,你也可以使用自己定义的模板来生成tex和pdf文件。首先使用命令 pandoc -D latex
& my.latex
生成一个默认的模板,在对这个模板进行修改,如字体、自动换行等。
Markdown写作进阶:Pandoc入门浅谈:
黑魔法利器pandoc:
pandoc中文pdf转换攻略:
pm-template GitHub:
已投稿到:
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。上面就是截图了,很多功能还没有实现,目前只是个demo,比如左右同步滚动(同步比较复杂,因为左右是不等高的,也没有明显的比例关系)、左边的文本编辑器功能很弱(只是Qt内置的plaintext控件)、不漂亮(超出能力范围了,不过搞个背景和透明已经觉得很不错了。。)&&
主要有几点比较重要,值得记录一下:
1. python文件的打包,使用cxfreeze进行打包,安装和打包都十分简单,pycharm里面可以自动生成打包需要的setup.py,只要在cxfreeze对应目录下命令行运行一下就可以生成exe和dll等。
2. 之前的python程序是接受人工输入,我们要和Qt整合在一起的时候,需要转换为命令行参数的形式,当然这个很简单,
3. Qt 中QProcess可以调用外部程序并且可以给它命令行参数,用这个来调用之前编译好的转换引擎。
4. Qt 中的逻辑是:1. 获取左边文本框的输入文本;2. 按下make键后将左边的文本写到所在目录下的temp.md 文件中,同时调用转换引擎生成temp.html文件;3. 按下preview键后读取temp.html文件信息,显示到右侧的QWebView空间中去;
5. qrc 文件的使用,将图片啊什么的放进去,可以在程序中调用。
这个程序十分短小,.cpp和.h 一共也就150行吧,还没有转换引擎中的python代码行数多呢~~~
因为程序逻辑上十分简单,主要的解析工作已经用python完成,所以Qt就是包装一下喽,大概就是先用QtDesigner 把控件都托好,然后layout,clear的槽可以之间顺便搞定,
之后只需要在程序中编写类的构造函数来初始化以及编写两个槽函数make 和 preview即可,之后就是美化之类的了。。。。
在Qt Designer的使用中,深深发现了自己对于美的感受和控制的低下。。。调个字体颜色和背景都要好半天,选背景更是。。。最后想起来ubuntu下面的终端透明配上它自带的某个space风格的桌面还不错的样子,才终于如释重负。。。
&效果也就一般般,不过自己都觉得一般般的时候,一般就是。。。丑爆了!
阅读(...) 评论()

我要回帖

更多关于 php html转换markdown 的文章

 

随机推荐