FileKitFileKit
返回博客
·6 分钟阅读

如何将文字转换为 PDF——从纯文本到格式化文档

将 .txt 文件转换为排版整齐的 PDF 的方法——涵盖浏览器工具、文字处理软件、命令行和排版最佳实践。

为什么需要把纯文本转成 PDF

纯文本文件具有通用性——每个操作系统都能打开,每个文本编辑器都能读取。 但它缺乏排版控制:没有页边距、没有分页符、没有一致的字体样式。同一个 .txt 文件在两台电脑上打开,换行方式、字体和间距可能完全不同。

转换为 PDF 可以锁定排版。文本在每台设备、每块屏幕、每台打印机上呈现 完全一致。这对简历、代码清单、会议记录、法律文书和日志文件至关重要。

转换方法

1. 浏览器端转换

FileKit 的文本转 PDF 工具 让你输入或粘贴文本、选择页面大小(A4 或 Letter)、设置字号和页边距, 即时生成整洁的 PDF。完全在浏览器中运行,无需上传。

2. 文字处理软件

用 Google Docs、Microsoft Word 或 LibreOffice Writer 打开 .txt 文件, 添加标题、调整字体、设置段落间距,然后导出为 PDF。适合需要丰富格式的场景。

3. 命令行

# enscript + ps2pdf(经典 Unix 方法)
enscript -p output.ps --font=Courier10 input.txt && ps2pdf output.ps output.pdf

# pandoc(Markdown/文本转 PDF)
pandoc input.txt -o output.pdf

关键格式选项

字体选择

  • 等宽字体(Courier、Consolas、JetBrains Mono)—— 每个字符占据相同宽度。代码清单、日志文件和任何需要列对齐的内容必备。
  • 比例字体(Helvetica、Times New Roman、Georgia)—— 变宽字符使文本看起来更自然。适合会议记录、信件和叙述性内容。

页面大小

  • A4(210 × 297mm)——国际标准。在北美以外打印使用此尺寸。
  • Letter(8.5 × 11 英寸)——美国和加拿大标准。

页边距和字号

A4 标准页边距为 2cm,Letter 为 1 英寸。正文字号 10-12pt 为标准。 代码清单若需要容纳较宽的行,可用 8-9pt,但会牺牲可读性。

常见使用场景

代码清单和文档

将源代码转为 PDF 用于代码审查、文档附录或学术提交。使用等宽字体, 选择足够小的字号以避免长行换行。

服务器日志和调试输出

系统管理员和开发者经常需要在 Bug 报告或事故复盘中分享日志文件。 PDF 保留精确格式,防止意外编辑,且无需收件人配置大文件文本编辑器。

会议记录和文字记录

转为 PDF 增加专业性,确保团队每个人看到的排版一致。较长的文字记录 可以在转换后添加 页码

法律和合规文档

数据库、邮件存档或聊天记录的纯文本导出经常需要作为证据或合规记录提交。 PDF 是法律提交的标准格式。

处理特殊字符和编码

文本文件可以使用不同编码:UTF-8、ASCII、ISO-8859-1 等。如果文本包含 中文、日文、韩文、阿拉伯文或 emoji 等非拉丁字符,确保转换工具支持UTF-8 编码。缺失字形会显示为方框(□)或问号(?)。

转换后检查

  • 检查换行。长行可能在 PDF 中不同位置换行,验证代码或表格数据仍然对齐。
  • 验证分页。自动分页可能在不恰当的位置断开内容。
  • 文件过大时,可以 压缩 PDF
  • 从文本生成的 PDF 已经是可搜索的,无需 OCR。

文本转 PDF vs 其他转换

  • Markdown 转 PDF — 使用 pandoc,可获得标题、列表、代码块等格式
  • HTML 转 PDF — 使用浏览器的打印到 PDF 功能
  • 图片转 PDF — 使用 FileKit 的图片转 PDF 工具