对于使用Kindle来阅读中文的用户而言,如果手中的电子书是PDF格式的,阅读起来是没有什么问题的(比如乱码),因为PDF就像图片一样。但是对于MOBI或者TXT而言,情况就不太一样了。
1. 分行号和分段号
一般大家从网上下载的电子书都是TXT格式的,仔细观察就会发现许多TXT的分段都不是很清晰。一方面是因为这些TXT大部分都是网友手动输入的,难免会有一些错误。另外一方面是大家使用的编辑软件不一样,造成的分段号(paragraph break)和分行号(line break)混淆。这样一来就会出现很多TXT的右边一大片空白,文字不会自动延伸(很多电子邮件系统也具有这个特性)。
一开始我打算编一个简单的文字处理小程序自己将所有的分行号(line break)删除。后来发现网上有现成的工具,效果还非常不错:
http://www.textfixer.com/tools/remove-line-breaks.php
用这个工具处理过之后,再拷贝到Kindle里面,就不会出现大范围空白了,所有的空间都被文字填满了。
注意,这些分行号不会随着TXT转化成其他格式(PDF或MOBI)而消失,只有进入原始的TXT强行删除他们才不会影响阅读。
2. TXT转化成PDF后的空白页面
有一些TXT文件用专门软件转化成PDF格式之后,导入Kindle后会发现很多页面都成空白了。但是同样的PDF在电脑中阅读却不存在一样的问题。
Mac下的解决办法是用“预览”打印该PDF,然后再保存为PDF。不过因为我已经基本放弃了在Kindle阅读转化而来的PDF,这个方法现在用得不多了。
3. MOBI中的乱码
如果你是从亚马逊上直接购买的MOBI,应该不存在乱码。我这里指的乱码是用特殊工具(比如calibre)将TXT转化成MOBI过程中出现的。
不知道是不是MOBI在亚马逊中支持的字体有限,还是转换工具中的bug,在TXT中完美显示的中文到了MOBI格式下总会出现不少乱码,具体的形式就是方框,或者方框里面一些乱七八糟的内容。
我的解决办法是直接使用TXT,但是不是拷贝到Kindle里面,而是通过发邮件到用户的亚马逊网上账户(推送功能)。网上账户接到了发送的TXT以后,会进行一步转化,将文件转成更容易被Kindle接受的模式。一个有趣的现象是转化后的文件作者信息会更改,你的账户名将用作新的TXT的作者。如果你非常不喜欢这点,可以考虑直接拷贝,不过这样一来,就得承担更多乱码的风险。
注意,如果文件是通过推送功能发送到Kindle设备上的话,亚马逊的服务器会改变文件的格式,不论初始文件是TXT或者PDF,最终通过wifi下载的文件都是AZW或者AZW3的。这个不是很普适的格式似乎只有在Kindle中才能完美打开。所以,建议大家推送到Kindle以后继续保持源文件。
没有评论:
发表评论