引用和调研
从PDF报告、论文或电子书里抠出原句直接引用,不用一个字一个字重新打。
把任意PDF转成干净的纯文本,可复制、可搜索、可二次使用。内置OCR,连扫描件也能识别。
这个工具会读取PDF里的文字,把它们以纯文本的形式还给你,保存成一个干净的.txt文件。没有复杂的排版要对付,没有分栏要理顺,也不用安装任何软件。你上传PDF,工具逐页读取,你拿到的就是可以直接粘贴到任何地方的原始文字。文件用UTF-8编码保存,意思就是é、ñ、ü、ç这类带重音的字符,以及中文、日文、阿拉伯文等非拉丁文字,都会原样保留,不会变成乱码。
如果你的PDF来自扫描仪,或者本身就是某一页的照片,那里面的文字其实是图片,普通的复制粘贴什么都拿不到。这个工具也能处理这种情况:它会自动运行OCR(光学字符识别,也就是识别图片里文字的技术),把扫描件里的文字变成真正可以选中的文本。最终你得到的是一个.txt文件,在任何设备、任何文本编辑器里都能打开,特别适合搜索、引用、翻译,或者喂给别的工具继续处理。
把PDF拖到页面上,或者从设备里选一个。Windows、Mac、手机上用法都一样,什么都不用装。
工具逐页抓取里面的文字。如果是扫描件,OCR会自动接手,识别图片里的文字。
拿到UTF-8编码的干净纯文本,马上就能复制、搜索,或者丢进任何别的应用里。
quarterly-report.pdf(12页,封面是扫描页)季度报告 运营团队编制 概述 本期各地区营收稳步增长。 客户留存率创下历史新高。 下一步 1. 加强新手引导支持 2. 复审供应商合同
从PDF报告、论文或电子书里抠出原句直接引用,不用一个字一个字重新打。
对扫描的合同或票据跑一遍OCR,终于可以在里面搜一个名字、日期或数字了。
把PDF里的文字搬进你的笔记、文档、邮件或别的工具,原来的排版不会跟着跑过来。
拿到干净的纯文本,屏幕阅读器和辅助工具念起来会比读一个锁死的PDF顺畅得多。
免费、无水印、无每日限制,文件绝不存储。靠OCR,连扫描版PDF也能用。
把PDF转成文字