FineReaderOnline: Trích xuất nội dung văn bản từ tập tin ảnh scan

FineReaderOnline là một dịch vụ web mới, cho phép người dùng trích xuất nội dung văn bản từ một hình ảnh đã được scan (hỗ trợ BMP, PCX, DCX, JPEG, PNG, GIF...) sang các định dạng tập tin tài liệu có thể biên tập chỉnh sửa thông dụng như: Microsoft Word, Exel, RTF, TXT hay PDF.


Ứng dụng web này hoàn toàn miễn phí và dễ dàng sử dụng. Để bắt đầu tương tác với FineReaderOnline, đơn giản chúng ta cần đăng ký cho mình một tài khoản. Khi hoàn tất thủ tục đăng ký bằng đường dẫn kích hoạt tài khoản, được gửi tới địa chỉ hòm thư dùng để đăng ký thì FineReaderOnline sẽ chuyển tiếp các bạn tới bảng thao tác "Recognize".



Để thu được kết quả mình muốn chúng ta cần thực thi bốn bước gồm:



  • Lựa chọn tập tin cần xử lý.
  • Lựa chọn ngôn ngữ chính trong tài liệu (không được chọn nhiều hơn ba ngôn ngữ).
  • Lựa chọn định dạng tập tin sau khi trích xuất nội dung.
  • Nhấp button "Recognize!".

Thời gian cần cho FineReaderOnline xử lý một tiến trình là nhỏ hơn một phút, sau khoảng thời gian định trên các bạn cần kiểm tra hòm thư dùng đăng ký tải khoản để tải xuống kết quả thu được qua đường dẫn download mà FineReader cung cấp (xác thực trong vòng 24 giờ).



Chú ý: FineReaderOnline cho phép xử lý 50 trang tập tin ảnh mỗi ngày và kích thước tối đa cho tập tin ảnh là 10 MB.



Dưới đây là danh sách tóm tắt đặc điểm của FineReaderOnline:



  • Công cụ trực tuyến với tính năng trích xuất nội dung văn bản từ tập tin ảnh scan.
  • Cho phép xử lý 50 trang mỗi ngày với kích thước tập tin tối đa 10 MB hoàn toàn miễn phí.
  • Hỗ trợ định dạng tập tin ảnh: BMP, PCX, DCX, JPEG/JPEG, PNG và TIFF/TIF.
  • Hỗ trợ trích xuất định dạng: Microsoft Word, Excel, RTF, TXT và PDF.
  • Nhận dạng các ngôn ngữ: Nga, Anh, Đức và Pháp.
  • Tương tự các ứng dụng web khác: Free-ORCOCRTerminal.
Mạnh Tùng (Theo MakeUseOf)