Skanning | Kontakt

Skriptoriet OCR scanning
Knutstorpsvägen 2
268 77 Kågeröd

VD & operatör Niclas Wallin
Mob: 070-722 81 48
E-post: niclas@skriptoriet.se

Textextraktion ur PDF-filer t.ex. tingsrätternas domar

Textextraktion ur PDF-filer

Vi kan extrahera / kopiera textområden ur PDF-filer med hjälp av skräddarsydda script och bygga upp innehåll till en databas på det viset. Detta är ett mer kraftfullt och mer flexibelt alternativ än att använda ett OCR program med avancerade funktioner. Det är dessutom snabbare!

Extraktionsområden kan sättas med hjälp av exakta koordinater, eller med hjälp av koordinater relativt keywords, eller relativt ”regular expressions” (sökmönster). Det finns även möjlighet att söka keywords med fuzzy-matchning (dvs något tecken får vara fel)!

Vanliga uppgifter kan vara flexibel inhämtning av orgnummer och/eller personnummer, datum, ordernummer eller liknande.

Det kan t. ex. gälla myndighetshandlingar som domslut, kontoutdrag osv, handlingar från Bolagsverket, Skatteverket etc.

Domar från tingsrätter - extraktion av tilltalade och målsägande ur tingsrätternas domar

Vi har omfattande erfarenhet av att jobba med särskilt domar från alla tingsrätter! Vi kan extrahera tilltalad och målsägande, deras personnummer där det förekommer, målnummer och domstolsnamn osv ur alla domar som publiceras som pdf-filer från landets domstolar. Snabbt och till rimligt pris!

Med 100% specialanpassat script så går det oftast att få ut exakt det ni vill ha!

Skanning

Databehandling

Skanning | Nyheter

Skanning | Kontakt

Textextraktion ur PDF-filer t.ex. tingsrätternas domar

Textextraktion ur PDF-filer

Domar från tingsrätter - extraktion av tilltalade och målsägande ur tingsrätternas domar