Chuẩn bị tài liệu để quét
Quét tài liệu cho phép bạn chuyển đổi các tài liệu tích lũy của mình thành cơ sở dữ liệu tìm kiếm trên máy tính. Bạn có thể thấy rằng việc quét các bản ghi của những thứ như hợp đồng cho phép bạn cắt giảm chi phí lưu trữ tài liệu hoặc bạn có thể cung cấp các tài liệu được quét trên Web hoặc cho khách hàng của bạn mua. Chuẩn bị một tài liệu để quét đòi hỏi một chút lập kế hoạch và suy nghĩ trước.
Quét cái gì
Yêu cầu chuẩn bị đầu tiên là chọn những gì để quét, và cho mục đích gì. Có thể có các yêu cầu pháp lý; ví dụ, bác sĩ tâm thần đối phó với các khu học chánh hoặc hệ thống tòa án hình sự có thể được yêu cầu quét các đánh giá bệnh nhân với một số thông tin nhận dạng nhất định được loại bỏ. Các tài liệu pháp lý có thể yêu cầu các trang chữ ký hoặc bản khai có tuyên thệ được quét dưới dạng các trang bìa đi kèm với tài liệu.
Yêu cầu cơ khí
Có hai loại máy quét: máy quét hình phẳng (thích hợp để quét sách ràng buộc, tác phẩm nghệ thuật lớn hoặc bản thiết kế) và máy quét cho ăn. Máy quét cho ăn tờ chỉ có thể quét một mặt của trang tại một thời điểm; đây thường là tất cả những gì cần thiết Để quét các trang của một cuốn sách không liên kết, máy quét được cấp nguồn cần phải in hai mặt - quét một mặt của trang tính, lật nó và quét mặt kia. Khi tải một máy quét được cung cấp trang tính, hãy dành một chút thời gian để xem qua tất cả các trang, tìm kiếm các trang lộn ngược và những thứ như ghim, băng dính hoặc ghi chú dán có thể tắt khi các trang được đưa qua cơ chế.
Chuẩn bị thể chất
Một khi các lý do pháp lý và kinh doanh để quét được biết đến, yêu cầu tiếp theo là chuẩn bị vật lý. Kiểu chuẩn bị vật lý sẽ phụ thuộc vào máy quét đang được sử dụng và có thể rất đơn giản - loại bỏ ghim trên các trang lỏng lẻo trước khi đưa chúng vào máy quét được cấp giấy - đến phức tạp - dán nhiều tài liệu nhỏ hơn vào nhau bảng để giảm chảy máu và chạy chúng trên máy quét giường phẳng. Tài liệu nên được ép phẳng, không có lọn tóc hoặc nếp gấp. Nếu bạn đang cố gắng tăng độ tương phản của văn bản trên máy quét hình phẳng, đặt mặt sau màu xám trung tính, như mặt sau bằng bìa cứng của một tờ giấy, đằng sau trang được quét đôi khi có thể giúp ích.
Yêu cầu xử lý OCR
Nhận dạng ký tự quang học sử dụng nhận dạng hình dạng để thử và ghép các từ trong từ điển. Chuẩn bị tài liệu cho OCR bắt đầu bằng cách tập trung vào độ tương phản trên tài liệu gốc. Một mẹo có thể làm việc cho các tài liệu cũ trên giấy bị ố vàng từ hàm lượng axit là tạo một bản sao có độ tương phản cao trên giấy in nặng. Về mặt vật lý và cơ học, hầu hết các lần quét OCR đều dành cho các trang lỏng lẻo và đảm bảo rằng chúng được đặt vuông góc trên bộ nạp tài liệu cũng rất quan trọng, vì các trang được quét ở một góc nhỏ có thể làm tăng tỷ lệ lỗi. Cho dù OCR của bạn tốt đến đâu, bạn sẽ muốn dành thời gian đọc lại kết quả quét và điều đó nên được dự trù vào thời gian cần thiết.