文字提取 (OCR) 测试版
文件始终留在你的设备上
FileKit — 免费的浏览器端文件工具。无需上传,无需注册。
识别语言
将文件拖到这里
或点击选择文件
单个文件最大 50.0 MB·支持格式:JPG · PNG · WebP · BMP · TIFF · PDF
你可能还需要
OCR 工作原理
FileKit 使用 Tesseract.js(Tesseract OCR 引擎的 WebAssembly 移植版)在浏览器本地完成文字识别。语言模型会在首次使用时下载(英语约 4 MB),之后会缓存在本地——不会上传任何文件。为了获得最佳效果,请使用高对比度、文字清晰的图片,分辨率建议不低于 150 DPI。
如何 OCR 识别文档
- 1
上传图片或扫描 PDF
拖放扫描文档、页面照片或截图。支持 JPG、PNG、WebP 和 PDF 格式。
- 2
选择识别语言
选择文档的主要语言:英文、简体中文、日文或中英混合。正确的语言选择能显著提高识别精度。
- 3
提取并复制文字
FileKit 在浏览器中运行 Tesseract.js(WebAssembly OCR 引擎)。识别出的文字显示在可编辑区域——复制或下载为 .txt 文件。
常见问题
隐私保障承诺
FileKit 使用 JavaScript 和 WebAssembly 在你的浏览器中直接处理每个文件。你的文档、图片和数据绝不会离开你的设备——没有服务器上传,没有云存储,也不需要注册账户。在浏览器中发生的一切,都留在浏览器中。
- 100% 本地浏览器处理
- 绝不上传到服务器
- 无需注册或登录
- 首次加载后支持离线使用