Text aus PDF-Dateien extrahieren

Wir können mithilfe maßgeschneiderter Skripte Text aus PDF-Dateien extrahieren und auf diese Weise Inhalte in einer Datenbank aufbauen. Dies ist eine leistungsfähigere und flexiblere Alternative als die Verwendung eines OCR-Programms mit fortgeschrittenen Funktionen. Es ist auch schneller!

Extraktionsbereiche können mit exakten Koordinaten festgelegt werden, oder mit Koordinaten relativ zu Schlüsselwörtern, oder relativ zu "regulären Ausdrücken" (Suchmustern). Es besteht auch die Möglichkeit, mit unscharfer Übereinstimmung (Fuzzy Matching) nach Schlüsselwörtern zu suchen (d. h. ein Zeichen darf falsch sein)!

Häufige Aufgaben können die flexible Erfassung von Organisationsnummern und/oder Personennummern, Daten, Bestellnummern oder dergleichen sein.

Dies kann zum Beispiel amtliche Dokumente wie Gerichtsentscheidungen, Kontoauszüge und so weiter betreffen, Dokumente von Bolagsverket, Skatteverket und so weiter.

Bezirksgerichtsurteile – Extraktion von Angeklagten und Geschädigten aus den Urteilen der Bezirksgerichte

Wir verfügen über umfangreiche Erfahrung insbesondere mit Urteilen aller Bezirksgerichte! Wir können den Angeklagten und den Geschädigten, ihre Personennummern, sofern vorhanden, das Aktenzeichen und den Gerichtsnamen und so weiter aus allen Urteilen extrahieren, die als PDF-Dateien von den Gerichten des Landes veröffentlicht werden. Schnell und zu einem angemessenen Preis!

Mit einem zu 100 % maßgeschneiderten Skript ist es in der Regel möglich, genau das herauszubekommen, was Sie möchten!