Skanning av dokumenter med løpende nummerering til én- eller flersides bilde-PDF-filer
Skanning til PDF-filer av store volumer dokumenter fra A8 (53*74 mm) opp til A3-format med en automatisk dokumentskanner, og deretter opp til A1+ med en overhead-skanner! Det ferdige produktet består av sidebilder lagret i PDF-format. De nummereres med løpende numre i skanningsrekkefølge, 0001.pdf, 0002.pdf og så videre, og nummereringen påføres enten per sidebilde eller per flersides PDF-dokument. Vi skanner normalt i gråtoner ved 300 dpi, men vi kan også skanne i svart-hvitt, gråtoner eller farger opptil 600 dpi.
Dokumentseparering utføres ved hjelp av et dedikert skilleark med en strekkode beregnet for dette formålet.
PDF-filer skannes normalt i det strenge PDF-arkiveringsformatet PDF/A-1b (ISO 19005-1:2005) (gjelder bilde-PDF).
Skanning til flersides PDF-filer med dokumentseparering egner seg godt for eksempel til due diligence, revisjonsdokumentasjon og lignende, utleggsrapporter og ulike typer saksmapper. Hvis materialet er vanskelig å skanne på grunn av påstiftede kvitteringer og lignende, kan vi bruke overhead-skanneren vår i stedet for en vanlig dokumentskanner.
Skanning av dokumenter til PDF med et OCR-tolket tekstlag for søk
Etter at vi har skannet dokumentene til bilde-PDF-filer, OCR-tolker vi dem med den beste programvaren for masseprosessering!
Skanning av en bok, et hefte eller en katalog til PDF med et OCR-tolket tekstlag for søk
Vi "ofrer" boken/heftet (eller bruker en overhead-skanner), vi måler sidestørrelsen og skanner med nøyaktig riktig størrelse, vi OCR-tolker med den beste programvaren; enten (1) batch-OCR uten å korrigere usikre tegn, eller (2) med korrigering av usikre tegn og ord. Til slutt beskjærer vi sidene elektronisk med et par mm for et pent utseende (ikke permanent, det kan fjernes). Vi kan også gå gjennom side for side og manuelt rette opp visse sider og tekstlinjer, og rydde opp i margene, i dedikert programvare for jobber som krever ekstra høy visuell kvalitet!
For kataloger med liten skrift kan vi først skanne med høy oppløsning og OCR-tolke, og deretter redusere oppløsningen og komprimere for en mindre størrelse egnet for internett.
Dokumentskanning med automatisk indeksering
En utvidet variant av dokumentskanningen ovenfor er å OCR-tolke bare noe, eller noen få enkeltfelter på bildene, kanskje fra et forsideark. Dette kan for eksempel være et personnummer, organisasjonsnummer eller en annen unik identifikator. Vi kan bruke denne tolkede informasjonen til å navngi PDF-ene automatisk. De kan navngis etter et personnummer, organisasjonsnummer, rapportnummer eller kontraktnummer, for eksempel 'personnummer'.PDF, og så videre. Når bildene er navngitt på denne måten, blir det enkelt å finne dem i mappen din på datamaskinen. Det blir også enkelt å lenke til dokumentene fra en database.
Denne automatiske indekseringen gjøres normalt med fleksibel datafangstteknologi. Les gjerne mer om denne teknologien i avsnittet "Skanning av skjemaer".
Dokumentskanning med manuell indeksering
I tilfeller der det ikke er mulig å fange et felt automatisk for indeksering, kan vi registrere ett eller noen få dataelementer fra en side manuelt.
Omdøping av dokumenter
Etter at vi har fanget eller registrert data, kan vi bruke disse dataene til å gi PDF-filene nye navn.