Chuyển PDF sang Markdown

Biến mọi file PDF thành Markdown sạch sẽ, dễ đọc, dán được vào bất cứ đâu. Miễn phí, chạy ngay trên trình duyệt.

Chuyển PDF sang MarkdownKhông cần thẻ tín dụng

Công cụ này làm gì?

Công cụ này rút phần chữ ra khỏi file PDF và trả lại cho bạn dưới dạng Markdown (.md) sạch sẽ. Đây là định dạng văn bản đơn giản, gọn nhẹ mà người viết, lập trình viên và các app ghi chú như Obsidian, Notion hay GitHub đều dùng. Bạn chỉ cần thả file PDF vào và nhận lại những đoạn văn gọn gàng bằng chữ thuần, có thể đọc, chỉnh sửa hoặc dán đi bất cứ đâu, không còn cảnh ngắt dòng lung tung và khoảng cách lệch lạc như khi sao chép trực tiếp từ PDF.

Đây không phải bản sao y nguyên bố cục trang. PDF lưu một bố cục cố định chứ không lưu cấu trúc chữ thật, nên thứ bạn nhận về là văn bản sạch theo từng đoạn, chứ không phải hình ảnh giống hệt từng điểm ảnh. Tiêu đề cũng không được nhận diện một cách chắc chắn, nên chúng sẽ về dưới dạng chữ thường để bạn tự đánh dấu thành tiêu đề Markdown sau. Không AI, không viết lại, không bịa thêm: chữ bạn nhận đúng là chữ vốn có trong file.

Cách hoạt động

  1. 1

    Tải file PDF lên

    Kéo và thả file PDF, hoặc chọn từ thiết bị của bạn. Hỗ trợ file tối đa 10MB, và file của bạn không bao giờ bị lưu lại.

  2. 2

    Chúng tôi đọc phần chữ

    Công cụ trích xuất chữ từ file PDF. Nếu là bản scan, OCR sẽ tự động đọc chữ ngay trên hình ảnh của trang.

  3. 3

    Tải về Markdown sạch

    Nhận ngay file .md với các đoạn văn gọn gàng, dán hay chỉnh sửa ở đâu cũng được. Không có chữ mờ chèn lên, không bắt đăng ký thêm mới cho dùng.

Đầu vào là gì, đầu ra là gì

  • Đầu vào: một file PDF, dạng văn bản hoặc bản scan, tối đa 10MB
  • Đầu ra: một file Markdown (.md) sạch với các đoạn văn dễ đọc
  • PDF scan hoặc PDF chỉ có ảnh được đọc bằng OCR trước khi chuyển đổi
  • Chữ thuần, dán thẳng vào Notion, Obsidian hay GitHub là dùng được ngay
  • Không cần cài đặt gì cả, mọi thứ chạy ngay trên trình duyệt

Kết quả trông như thế nào

File PDF của bạn (chữ trên trang)Ghi chú dự án Cuộc họp đã bàn ba chủ đề. Chúng tôi đã thống nhất về tiến độ và ngân sách.
Markdown sạch (.md)
Ghi chú dự án

Cuộc họp đã bàn ba chủ đề.
Chúng tôi đã thống nhất về tiến độ và ngân sách.

Khi nào thì tiện

Ghi chú trong Obsidian hoặc Notion

Lấy phần chữ ra khỏi một báo cáo hay bài viết PDF rồi thả thẳng vào app ghi chú dưới dạng Markdown sạch.

Tái sử dụng tài liệu cũ

Rút chữ ra khỏi một file PDF không còn chỉnh sửa được, để bạn viết lại, trích dẫn hay dùng lại mà khỏi gõ lại từ đầu.

Đọc file đã scan

Có file PDF dạng scan? OCR đọc chữ ngay trên trang, nên cuối cùng bạn có chữ thật sự, sao chép và tìm kiếm được.

Đưa chữ sang công cụ khác

Markdown là định dạng thân thiện nhất với app viết lách, trang web tĩnh và công cụ AI. Chuyển một lần, dùng chữ ở mọi nơi.

Mẹo để có kết quả tốt nhất

  • Dùng PDF dạng văn bản khi có thể, vì OCR trên bản scan chỉ tốt ngang chất lượng của hình ảnh.
  • Với file scan, một bản scan rõ nét, thẳng và độ phân giải cao cho chữ sạch hơn nhiều so với bản mờ hoặc bị nghiêng.
  • Hãy chờ nhận về các đoạn văn sạch, rồi tự thêm tiêu đề Markdown (#) ở những chỗ bạn muốn, vì công cụ không nhận diện tiêu đề giúp bạn.
  • Nếu file PDF lớn hơn 10MB, hãy chia thành các file nhỏ hơn trước, rồi chuyển từng phần.
  • Mở file .md trong một trình soạn thảo Markdown để xem trước và chỉnh lại chữ cho gọn trước khi dùng lại.

Câu hỏi thường gặp

Lấy Markdown sạch từ file PDF của bạn

Miễn phí, không có chữ mờ chèn lên, không giới hạn mỗi ngày, và file của bạn không bao giờ bị lưu lại. Đăng nhập và bắt đầu chuyển đổi.

Chuyển PDF sang Markdown

Công cụ khác