PDF转文字工具

把任意PDF转成干净的纯文本,可复制、可搜索、可二次使用。内置OCR,连扫描件也能识别。

把PDF转成文字无需信用卡

这个PDF转文字工具能做什么

这个工具会读取PDF里的文字,把它们以纯文本的形式还给你,保存成一个干净的.txt文件。没有复杂的排版要对付,没有分栏要理顺,也不用安装任何软件。你上传PDF,工具逐页读取,你拿到的就是可以直接粘贴到任何地方的原始文字。文件用UTF-8编码保存,意思就是é、ñ、ü、ç这类带重音的字符,以及中文、日文、阿拉伯文等非拉丁文字,都会原样保留,不会变成乱码。

如果你的PDF来自扫描仪,或者本身就是某一页的照片,那里面的文字其实是图片,普通的复制粘贴什么都拿不到。这个工具也能处理这种情况:它会自动运行OCR(光学字符识别,也就是识别图片里文字的技术),把扫描件里的文字变成真正可以选中的文本。最终你得到的是一个.txt文件,在任何设备、任何文本编辑器里都能打开,特别适合搜索、引用、翻译,或者喂给别的工具继续处理。

PDF怎么转成文字

  1. 1

    上传PDF

    把PDF拖到页面上,或者从设备里选一个。Windows、Mac、手机上用法都一样,什么都不用装。

  2. 2

    我们读取文字

    工具逐页抓取里面的文字。如果是扫描件,OCR会自动接手,识别图片里的文字。

  3. 3

    下载.txt文件

    拿到UTF-8编码的干净纯文本,马上就能复制、搜索,或者丢进任何别的应用里。

输入什么,输出什么

  • 输入:一个PDF文件,无论是软件导出的,还是扫描纸张得到的。
  • 输出:一个纯文本.txt文件,里面是文档中可读的文字。
  • 编码:UTF-8,带重音的字符和中文等非英文文字都会正确保留。
  • 扫描件:自动用OCR处理,把图片型的页面变成真正的文字。
  • 大小限制:单个文件最大10MB,足够应付日常的文档和报告。

纯文本输出长这样

你的PDFquarterly-report.pdf(12页,封面是扫描页)
quarterly-report.txt
季度报告
运营团队编制

概述
本期各地区营收稳步增长。
客户留存率创下历史新高。

下一步
1. 加强新手引导支持
2. 复审供应商合同

什么时候用得上

引用和调研

从PDF报告、论文或电子书里抠出原句直接引用,不用一个字一个字重新打。

搜索扫描件

对扫描的合同或票据跑一遍OCR,终于可以在里面搜一个名字、日期或数字了。

重新利用内容

把PDF里的文字搬进你的笔记、文档、邮件或别的工具,原来的排版不会跟着跑过来。

无障碍使用

拿到干净的纯文本,屏幕阅读器和辅助工具念起来会比读一个锁死的PDF顺畅得多。

想要更好的结果,记住这几点

  • 扫描件尽量用清晰、端正、光线充足的扫描图,OCR识别字母会比模糊或歪斜的图准确得多。
  • 如果只需要一份长PDF里的一部分,纯文本让你能快速找到并复制想要的那一段。
  • 文件控制在10MB以内;如果PDF太大,把它拆成几个小文件通常就能压到限制以下。
  • 拿到.txt后,用编辑器的查找功能直接跳到文档里的某个名字、日期或关键词。
  • 纯文本是故意去掉所有排版的,所以当内容比版面长相更重要时,就用这个工具。

常见问题

准备好把PDF里的文字抠出来了吗?

免费、无水印、无每日限制,文件绝不存储。靠OCR,连扫描版PDF也能用。

把PDF转成文字

更多工具