Chuyển PDF thành văn bản (.txt)

Tải file PDF lên và nhận về phần chữ dưới dạng file .txt thuần, mã hóa UTF-8, nên tiếng Việt có dấu và mọi bảng chữ cái khác đều giữ nguyên. Với PDF scan (mỗi trang là một bức ảnh), OCR sẽ tự đọc chữ trong ảnh giúp bạn. Hoàn toàn miễn phí, không dùng AI, file không bao giờ bị lưu lại.

Tải PDF lênKhông cần thẻ tín dụng

Lấy chữ ra khỏi PDF, không cần cài phần mềm

PDF tiện để xem và in, nhưng lại khó dùng khi bạn chỉ cần phần chữ: sao chép một đoạn, tìm một từ, dán sang chỗ khác hay đưa cho trình đọc màn hình. Công cụ này lấy toàn bộ nội dung chữ trong file PDF của bạn và trả về một file .txt thuần. Không định dạng rườm rà, không cột vô hình, chỉ còn chữ sạch để bạn dùng thoải mái.

Kết quả được mã hóa UTF-8, nên dấu tiếng Việt cùng các ký tự không phải chữ Latinh (Ả Rập, Nhật, Hàn, Hy Lạp, v.v.) không bị vỡ thành dấu hỏi hay ký tự lạ. Nếu file của bạn là PDF scan, tức mỗi trang thực ra chỉ là một bức ảnh, OCR sẽ vào cuộc và nhận diện chữ trong ảnh. Tất cả chạy ngay trên trình duyệt: không cần cài chương trình, không cần đăng ký bản quyền, không tốn một đồng nào.

Cách hoạt động

  1. 1

    Tải PDF lên

    Kéo và thả file PDF của bạn, hoặc nhấp để chọn từ máy. File tối đa 10 MB.

  2. 2

    Phần chữ được trích xuất

    Với PDF dạng văn bản, chữ được lấy trực tiếp. Với PDF scan, OCR đọc chữ trong từng trang ảnh.

  3. 3

    Tải về dạng .txt

    Nhận file .txt thuần mã hóa UTF-8, sao chép hoặc tải về chỉ với một cú nhấp.

Loại file được hỗ trợ

  • PDF dạng văn bản (chữ chọn và sao chép được)
  • PDF scan / dạng ảnh (OCR đọc chữ trong ảnh)
  • PDF nhiều trang
  • File tối đa 10 MB
  • Kết quả: file .txt thuần, mã hóa UTF-8

Ví dụ kết quả

Đầu vàobao-cao-thuong-nien-2026.pdf (12 trang)
Kết quả (.txt, UTF-8)
BÁO CÁO THƯỜNG NIÊN 2026

1. Tổng quan
Năm 2026, doanh thu tăng 34% so với năm trước, chủ yếu nhờ thị trường di động.

2. Kết quả chính
- Số người dùng hoạt động hằng tháng đạt 1,2 triệu
- Tỷ lệ giữ chân khách hàng tăng từ 41% lên 58%
- Chi phí vận hành giảm 12%

3. Kết luận
Trọng tâm năm tới là mở rộng sang thị trường Đông Nam Á...

Dành cho ai?

Sinh viên & nhà nghiên cứu

Lấy chữ từ bài báo và giáo trình PDF để trích dẫn, ghi chú hoặc dán vào bài viết của mình.

Dân văn phòng

Trích nội dung từ báo cáo, hợp đồng hay biểu mẫu PDF để chỉnh sửa lại trong Word hoặc Google Docs.

Người làm nội dung

Tái sử dụng phần chữ trong ebook hoặc tài liệu PDF cũ thành bài blog, bài đăng hay bản tin.

Hỗ trợ tiếp cận

Chuyển PDF khó đọc, nhất là PDF scan, thành văn bản thuần để trình đọc màn hình đọc lên rõ ràng.

Mẹo dùng hiệu quả

  • Với PDF dạng văn bản (chữ chọn và bôi đen được), kết quả gần như chính xác tuyệt đối. Nếu bạn không bôi đen được chữ trong file, nhiều khả năng đó là PDF scan và OCR sẽ lo phần này.
  • Với bản scan, hãy dùng file nét, thẳng và đủ sáng. Trang bị nghiêng, mờ hoặc tối sẽ khiến OCR đọc sai một số chữ.
  • Cần giữ font, màu hay bố cục? File .txt không giữ những thứ này. Hãy chuyển sang Word hoặc Markdown nếu bạn cần định dạng.
  • File nặng hơn 10 MB? Hãy nén PDF lại hoặc tách thành nhiều phần nhỏ rồi tải lên lần lượt.
  • Sau khi tải về, hãy lướt nhanh phần đầu và cuối file .txt để chắc chắn mọi trang đều được lấy đầy đủ, nhất là với bản scan nhiều trang.

Câu hỏi thường gặp

Biến PDF của bạn thành văn bản, miễn phí

Tải file PDF lên và nhận về file .txt thuần trong vài giây. Không cần thẻ tín dụng, file không bao giờ bị lưu lại.

Tải PDF lên

Công cụ khác