Extraire du texte à partir de fichiers PDF

Nous pouvons extraire du texte à partir de fichiers PDF à l'aide de scripts sur mesure et construire ainsi un contenu dans une base de données. C'est une alternative plus puissante et plus flexible que l'utilisation d'un programme OCR aux fonctionnalités avancées. C'est aussi plus rapide !

Les zones d'extraction peuvent être définies à l'aide de coordonnées exactes, ou à l'aide de coordonnées relatives à des mots-clés, ou relatives à des « expressions régulières » (motifs de recherche). Il y a aussi la possibilité de rechercher des mots-clés avec une correspondance approximative (c'est-à-dire qu'un caractère peut être erroné) !

Les tâches courantes peuvent être la capture flexible de numéros d'immatriculation d'entreprise et/ou de numéros d'identité personnelle, de dates, de numéros de commande ou similaires.

Cela peut, par exemple, concerner des documents officiels tels que des décisions de justice, des relevés de compte et ainsi de suite, des documents de Bolagsverket, Skatteverket et ainsi de suite.

Jugements de tribunal de district - extraction des accusés et des parties lésées à partir des jugements des tribunaux de district

Nous avons une vaste expérience du travail avec les jugements en particulier de tous les tribunaux de district ! Nous pouvons extraire l'accusé et la partie lésée, leurs numéros d'identité personnelle lorsqu'ils sont présents, le numéro d'affaire et le nom du tribunal et ainsi de suite à partir de tous les jugements publiés sous forme de fichiers PDF par les tribunaux du pays. Rapidement et à un prix raisonnable !

Avec un script adapté sur mesure à 100 %, il est généralement possible d'obtenir exactement ce que vous voulez !