Bokskanning
Zeutschel OS 12002 A2+ calibré FADGI, non destructif
Bookeye5V1A
Image Access Bookeye 5 V1A, scanner calibré FADGI avec surface plane et vitre ou berceau en V, et jusqu'au format A1+ (635 x 914 mm)
Bokskanning
Inotec 6x1, scanner calibré FADGI pour la numérisation de documents !

La société de numérisation qui vous aide à numériser rapidement et avec une haute qualité des livres, des publications, des revues et des documents de toutes sortes grâce à notre service de numérisation complet ! Voici quelques exemples : numérisation et conversion OCR d'adresses d'étudiants imprimées depuis le système LADOK, UHR / UHÄ (le Conseil suédois de l'enseignement supérieur), CSN, adresses d'actionnaires provenant d'Euroclear, données cadastrales imprimées sur papier, données de Skatteverket imprimées sur papier, adresses de propriétaires forestiers provenant de la Swedish Forest Agency, médecins, infirmiers et sages-femmes issus des registres de Socialstyrelsen, hommes politiques provenant de la Swedish Election Authority, le registre des chiens et le registre des moutons du Swedish Board of Agriculture, etc. Numérisation d'enquêtes, numérisation de formulaires, numérisation de documents en PDF (avec interprétation OCR qui les rend consultables), extraction de texte à partir de PDF et plus encore. Nous mettons au point une méthode pour capturer exactement les informations que vous souhaitez extraire des documents ! Et nous utilisons toutes les méthodes d'assurance qualité possibles !!

Numérisation OCR de listes d'adresses

Nous numérisons et interprétons par OCR les listes d'adresses. Notre service de numérisation pour les registres d'adresses comprend, entre autres :

Livraison sous forme de feuille Excel, de base de données Access ou de fichier texte séparé par des tabulations.

Numérisation OCR de grands volumes de données

Nous numérisons des listes et des tableaux comportant de grands volumes de données numériques ! Nous numérisons à haute qualité et lisons les données avec deux, voire trois programmes différents en parallèle. Nous comparons les données issues des deux ou trois lectures pour identifier les erreurs de lecture, et nous effectuons également un contrôle avec des « expressions régulières » afin de vérifier le contenu des champs, et nous corrigeons manuellement les éventuelles erreurs par rapport à l'image de la ligne de données numérisée !

Numérisation OCR de listes structurées et semi-structurées

Nous convertissons les enregistrements multilignes en enregistrements sur une seule ligne, répartis en champs. Cela peut, par exemple, concerner un registre des membres provenant d'un annuaire imprimé. Il peut également s'agir d'un registre du logement, d'un registre des poursuites ou de toute autre impression de données à l'apparence raisonnablement régulière.

Numérisation OCR d'adresses e-mail

Ce service comprend un traitement postérieur approfondi et des contrôles qualité afin d'obtenir des adresses e-mail aussi exactes que possible !

Après la conversion OCR, toutes les adresses e-mail sont vérifiées à l'aide d'un service qui simule l'envoi aux adresses. Nous vérifions ensuite avec un soin particulier les adresses qui s'avèrent ne pas fonctionner, à la recherche d'erreurs d'OCR.

Numérisation et interprétation d'enquêtes

Nous et notre partenaire d'impression prenons en charge tout le travail lié aux enquêtes. Nous vous aidons à numériser votre enquête ! Le service de numérisation complet de Skriptoriet pour, entre autres, la capture de données à partir d'enquêtes comprend les éléments suivants :

Voir plus d'informations sous le lien « Numérisation d'enquêtes » ci-dessus à droite !

Interprétation avec technologie de capture de données flexible

L'interprétation OCR de certaines données est réalisée à l'aide de règles flexibles plutôt qu'avec une technologie de formulaire fixe ! Entre autres, nous utilisons le logiciel ABBYY FlexiCapture. Une base de données comportant les champs de données correspondants est remplie avec un enregistrement de données par formulaire ou document ! L'interprétation peut également être effectuée sur un PDF ordinaire (ne contenant pas d'image), qui est alors traité comme une image par le logiciel au moment où l'interprétation est réalisée !

Extraction programmatique de texte à partir de PDF

Nous pouvons extraire des zones de texte de PDF de manière programmatique à l'aide d'un script sur mesure en VBA, et constituer ainsi une base de données. Cela peut, par exemple, s'appliquer à des documents d'autorités publiques tels que des jugements de tribunaux. Les zones d'extraction peuvent être définies à l'aide de coordonnées exactes, ou de coordonnées relatives à des mots-clés, ou relatives à des « expressions régulières » (motifs de recherche).

Renommage de PDF à l'aide de données textuelles interprétées par OCR ou extraites

À titre d'exemple typique, ce service signifie que quelques données différentes sont interprétées par OCR et capturées à l'aide d'une technologie de capture de données flexible (ou, alternativement, qu'une petite zone de texte est extraite de manière programmatique d'un PDF texte) généralement à partir de la première page d'un PDF multipage, et que ces données capturées, après contrôles et traitement, sont ensuite utilisées pour renommer le fichier PDF d'origine.

Numérisation en PDF avec numérotation séquentielle

Ce service consiste en une numérisation sans OCR. Le produit final se compose d'images stockées au format PDF ou TIFF. Elles sont numérotées par des numéros séquentiels dans l'ordre de numérisation : 0001.PDF, 0002.PDF, etc. Une variante courante consiste à numériser en un PDF multipage par document multipage à l'aide de feuilles séparatrices. La numérisation en PDF multipages avec séparation automatique des documents convient bien, par exemple, aux due diligence, à la documentation d'audit et plus encore.

Numérisation avec indexation manuelle

Ce service consiste en la numérisation et l'indexation manuelle d'un certain nombre de champs prédéfinis. Il convient souvent le mieux aux documents plus anciens comportant un texte dactylographié difficile à lire ou certaines informations manuscrites à capturer.

Numérisation de procès-verbaux — procès-verbaux historiques et archives

Nous proposons un service complet pour la numérisation de procès-verbaux de réunion, de procès-verbaux de conseil d'administration, de procès-verbaux d'assemblée annuelle et de collections historiques de procès-verbaux pour les associations, les congrégations, les archives municipales, les musées et les entreprises. Nous pouvons réaliser à la fois la numérisation par scanner à plat non destructive de volumes reliés de procès-verbaux (avec nos Zeutschel OS 12002 et Bookeye 5 V1A Archive calibrés FADGI) et la numérisation rapide de matériel pouvant être découpé (Inotec 6x1). Le service comprend la division des doubles pages de livre, la répartition du flux d'images numérisées en documents PDF distincts par jeu de procès-verbaux, le nommage des fichiers selon vos exigences, et un OCR par lots non corrigé pour la recherche. En savoir plus sur la numérisation de procès-verbaux →

OCR vers PDF

Numérisation et/ou interprétation OCR en PDF avec texte interprété invisible sous l'image. Convient bien, par exemple, à l'interprétation OCR d'images TIFF ou d'images PDF afin de créer une archive consultable en texte intégral.

OCR vers Word

OCR de livres et de textes de documents en un fichier Word modifiable. La vérification des caractères est incluse.

Numérisation de lettres, coupures de presse, cartes postales, photographies et plus encore

Nous vous aidons à numériser par scanner à plat des lettres, des coupures de presse, des cartes postales, des photographies et d'autres documents historiques similaires !