Hướng dẫn cho người mới bắt đầu để trích xuất văn bản và hình ảnh từ PDF

Tìm hiểu nhiều cách để trích xuất hình ảnh và văn bản ra khỏi tệp PDF

Các tệp PDF thật tuyệt vời để trao đổi các tệp được định dạng giữa các nền tảng và giữa những người không sử dụng cùng một phần mềm, nhưng đôi khi chúng ta cần lấy văn bản hoặc hình ảnh ra khỏi tệp PDF và sử dụng chúng trong các trang web, tài liệu xử lý văn bản , bản trình bày PowerPoint hoặc trong phần mềm xuất bản trên máy tính để bàn .

Tùy thuộc vào nhu cầu của bạn và các tùy chọn bảo mật được đặt trong từng tệp PDF riêng lẻ, bạn có một số tùy chọn để trích xuất văn bản, hình ảnh hoặc cả hai từ tệp PDF. Chọn tùy chọn phù hợp nhất với bạn.

Sử dụng Adobe Acrobat để trích xuất hình ảnh và văn bản từ tệp PDF

Nếu bạn có phiên bản Adobe Acrobat đầy đủ, không chỉ Acrobat Reader miễn phí, bạn có thể trích xuất từng ảnh hoặc tất cả hình ảnh cũng như văn bản từ PDF và xuất ở nhiều định dạng khác nhau như EPS, JPG và TIFF. Để trích xuất thông tin từ PDF trong Acrobat DC, chọn Công cụ > Xuất PDF và chọn một tùy chọn. Để trích xuất văn bản, xuất PDF sang định dạng Word hoặc định dạng văn bản đa dạng thức và chọn từ một số tùy chọn bao gồm:

Sao chép và dán từ PDF bằng Acrobat Reader

Nếu bạn có Acrobat Reader, bạn có thể sao chép một phần của tệp PDF vào khay nhớ tạm và dán nó vào một chương trình khác. Đối với văn bản, chỉ cần đánh dấu phần văn bản trong PDF và nhấn Control + C để sao chép văn bản.

Sau đó, mở một chương trình xử lý văn bản, chẳng hạn như Microsoft Word và nhấn Control + V để dán văn bản. Với một hình ảnh, bấm vào hình ảnh để chọn nó và sau đó sao chép và dán nó vào một chương trình hỗ trợ hình ảnh, sử dụng cùng một lệnh bàn phím.

Mở tệp PDF trong chương trình đồ họa

Khi trích xuất hình ảnh là mục tiêu của bạn, bạn có thể mở một tệp PDF trong một số chương trình minh họa như các phiên bản mới hơn của Photoshop , CorelDRAW hoặc Adobe Illustrator và lưu hình ảnh để chỉnh sửa và sử dụng trong các ứng dụng xuất bản trên máy tính để bàn.

Sử dụng công cụ phần mềm trích xuất PDF của bên thứ ba

Một số tiện ích độc lập và plug-in có sẵn để chuyển đổi các tệp PDF thành HTML trong khi vẫn giữ nguyên bố cục trang, trích xuất và chuyển đổi nội dung PDF sang định dạng đồ hoạ vector và trích xuất nội dung PDF để sử dụng trong xử lý văn bản, trình bày và phần mềm xuất bản trên máy tính. Những công cụ này cung cấp các tùy chọn khác nhau bao gồm trích xuất hàng loạt / chuyển đổi, toàn bộ tệp hoặc trích xuất nội dung một phần và hỗ trợ nhiều định dạng tệp. Đây là các tiện ích dựa trên Windows thương mại và phần mềm chia sẻ chủ yếu.

Sử dụng công cụ trích xuất PDF trực tuyến

Với công cụ trích xuất trực tuyến, bạn không phải tải xuống hoặc cài đặt phần mềm. Bao nhiêu mỗi người có thể trích xuất khác nhau. Ví dụ, với ExtractPDF.com, bạn tải lên một tệp có kích thước tối đa 14MB hoặc cung cấp một URL tới tệp PDF để trích xuất hình ảnh, văn bản hoặc phông chữ.

Chụp màn hình

Trước khi bạn chụp ảnh màn hình của một hình ảnh trong một PDF, phóng to nó trong cửa sổ của nó càng nhiều càng tốt trên màn hình của bạn. Trên PC, nhấp vào thanh tiêu đề của cửa sổ PDF và nhấn Alt + PrtScn . Trên máy Mac, nhấp vào Command + Shift + 4 và sử dụng con trỏ xuất hiện để kéo và chọn khu vực bạn muốn chụp.