PDF转Markdown转换工具

把PDF里的文字提取出来,变成干净易读的Markdown,随处粘贴都好用。免费,在浏览器里直接完成。

把PDF转成Markdown无需信用卡

这个工具能做什么

这个工具把PDF里的文字抽取出来,还给你一份干净的Markdown(.md)。Markdown是写作者、开发者,以及Obsidian、Notion、GitHub这类工具常用的简单文本格式,纯文本、跨平台、随处可用。你把PDF丢进来,得到的是一段段排版整齐的纯文字,可以直接阅读、编辑,再粘贴到任何地方,不会再有从PDF里直接复制时那种断行错乱、间距奇怪的毛病。

也说点实在的:PDF存的是固定的页面排版,并不像Word那样带着结构化的文字。所以你拿到的是干净易读的Markdown,而不是和原文一模一样的精确复刻。标题尤其如此,工具没法稳定识别,因为PDF里没有可靠的办法标明哪几行是标题。你得到的是真实的文字内容,被切分成干净的段落,剩下的结构由你自己来加。如果你的PDF是扫描件(页面其实是一张图片),工具会先用OCR把图片上的文字识别出来。

使用方法

  1. 1

    上传PDF

    把PDF拖拽进来,或从设备里选一个。支持最大10MB的文件,而且你的文件绝不会被保存。

  2. 2

    我们读取文字

    工具会从PDF里提取文字。如果是扫描件,OCR会自动识别页面图片上的文字。

  3. 3

    下载干净的Markdown

    得到一份可以直接用的.md文件,段落整齐,随处粘贴或编辑都行。没有水印,也没有注册墙。

输入什么,输出什么

  • 输入:一个PDF文件,文本型或扫描型都行,最大10MB
  • 输出:一份干净的Markdown文件(.md),段落整齐易读
  • 扫描件或纯图片PDF会先经过OCR识别再转换
  • 纯文字内容,可直接粘贴进Notion、Obsidian或GitHub
  • 什么都不用装,全程在浏览器里完成

结果长这样

你的PDF(页面上的文字)项目笔记 这次会议讨论了三个议题。 我们就时间表和预算达成了一致。
干净的Markdown(.md)
项目笔记

这次会议讨论了三个议题。
我们就时间表和预算达成了一致。

什么时候用得上

导入Obsidian或Notion

把PDF报告或文章里的文字抽出来,作为干净的Markdown直接放进你的笔记工具。

复用旧文档

从一份没法再编辑的PDF里把文字取出来,方便重写、引用或二次利用,不用手动重打一遍。

读取扫描件

手上有扫描版PDF?OCR会识别页面上的文字,让你最终拿到可以复制、可以搜索的文字。

喂给其他工具

Markdown是写作软件、静态网站和AI工具最友好的格式。转一次,文字随处可用。

想要最佳效果,记住这几点

  • 能用文本型PDF就尽量用,因为扫描件的OCR效果取决于图片质量。
  • 扫描文件时,清晰、端正、高分辨率的扫描,出来的文字比模糊或歪斜的扫描干净得多。
  • 预期拿到的是干净的段落,再在你想要标题的地方自己加上Markdown标题(#),因为工具不会识别标题。
  • 如果PDF超过10MB,先拆成几个小文件,再分别转换。
  • 用Markdown编辑器打开.md文件,先预览并整理一下文字,再拿去复用。

常见问题

从你的PDF里拿到干净的Markdown

免费,无水印,没有每日限制,文件绝不保存。登录即可开始转换。

把PDF转成Markdown

更多工具