La société de numérisation qui vous aide à numériser rapidement et avec une haute qualité des livres, des publications, des revues et des documents de toutes sortes grâce à notre service de numérisation complet ! Voici quelques exemples : numérisation et conversion OCR d'adresses d'étudiants imprimées depuis le système LADOK, UHR / UHÄ (le Conseil suédois de l'enseignement supérieur), CSN, adresses d'actionnaires provenant d'Euroclear, données cadastrales imprimées sur papier, données de Skatteverket imprimées sur papier, adresses de propriétaires forestiers provenant de la Swedish Forest Agency, médecins, infirmiers et sages-femmes issus des registres de Socialstyrelsen, hommes politiques provenant de la Swedish Election Authority, le registre des chiens et le registre des moutons du Swedish Board of Agriculture, etc. Numérisation d'enquêtes, numérisation de formulaires, numérisation de documents en PDF (avec interprétation OCR qui les rend consultables), extraction de texte à partir de PDF et plus encore. Nous mettons au point une méthode pour capturer exactement les informations que vous souhaitez extraire des documents ! Et nous utilisons toutes les méthodes d'assurance qualité possibles !!
Numérisation OCR de listes d'adresses
Nous numérisons et interprétons par OCR les listes d'adresses. Notre service de numérisation pour les registres d'adresses comprend, entre autres :
- Contrôle des noms par rapport à une base de données de noms de personnes fondée sur le registre suédois de la population, avec plus de 900 000 mots-noms uniques !
- Contrôle des noms de rues par rapport à une base de données de noms de rues fournie par la poste suédoise
- Contrôle de la longueur du champ et des caractères dans le champ du code postal
- Contrôle de la ville par rapport à une base de données de villes fournie par la poste suédoise
- Validation et correction des numéros d'identité personnels et des numéros d'organisation
- Suppression des doublons et/ou comparaison avec votre propre registre en option !
Livraison sous forme de feuille Excel, de base de données Access ou de fichier texte séparé par des tabulations.
Numérisation OCR de grands volumes de données
Nous numérisons des listes et des tableaux comportant de grands volumes de données numériques ! Nous numérisons à haute qualité et lisons les données avec deux, voire trois programmes différents en parallèle. Nous comparons les données issues des deux ou trois lectures pour identifier les erreurs de lecture, et nous effectuons également un contrôle avec des « expressions régulières » afin de vérifier le contenu des champs, et nous corrigeons manuellement les éventuelles erreurs par rapport à l'image de la ligne de données numérisée !
Numérisation OCR de listes structurées et semi-structurées
Nous convertissons les enregistrements multilignes en enregistrements sur une seule ligne, répartis en champs. Cela peut, par exemple, concerner un registre des membres provenant d'un annuaire imprimé. Il peut également s'agir d'un registre du logement, d'un registre des poursuites ou de toute autre impression de données à l'apparence raisonnablement régulière.
Numérisation OCR d'adresses e-mail
Ce service comprend un traitement postérieur approfondi et des contrôles qualité afin d'obtenir des adresses e-mail aussi exactes que possible !
Après la conversion OCR, toutes les adresses e-mail sont vérifiées à l'aide d'un service qui simule l'envoi aux adresses. Nous vérifions ensuite avec un soin particulier les adresses qui s'avèrent ne pas fonctionner, à la recherche d'erreurs d'OCR.
Numérisation et interprétation d'enquêtes
Nous et notre partenaire d'impression prenons en charge tout le travail lié aux enquêtes. Nous vous aidons à numériser votre enquête ! Le service de numérisation complet de Skriptoriet pour, entre autres, la capture de données à partir d'enquêtes comprend les éléments suivants :- Un service de prépresse chez notre partenaire d'impression qui adapte l'apparence de l'enquête à nos règles
- Impression, mise sous pli, expédition, gestion du courrier de retour, découpe des dos agrafés et plus encore, grâce à notre partenaire d'impression
- Mise à jour gratuite du registre d'adresses avant les envois de rappel
- Numérisation avec assurance qualité : seuillage dynamique, contrôles de séquence et d'orientation
- Pertes extrêmement faibles dues à des erreurs de numérisation !
- La numérisation A3 est également possible. Par exemple, 4 pages A4 imprimées sur 1 feuille A3 pliée
- Vérification minutieuse des données remplies à la main (champs ICR) telles que la date, l'âge, la taille, etc.
- La possibilité d'un contrôle qualité étendu, vérifiant toutes les cases à cocher par rapport à l'image.
- Les fichiers de données aux formats Excel et SPSS sont toujours inclus. Un fichier TXT est disponible en option gratuite.
- Le fichier de données au format Excel comporte, dans chaque ligne, un lien direct cliquable vers le PDF numérisé correspondant
- Rapports : codes d'erreur par variable, enquêtes non remplies, valeurs par variable
- Les réponses ouvertes peuvent également être fournies fusionnées en un long fichier PDF par numéro de page, consultable par identifiant d'enquête
- L'un de nos principaux avantages client est que des jeux d'images complets aux formats TIFF et PDF sont toujours inclus, sans coût supplémentaire !
- Livraison chiffrée via Dropbox, ou sur une clé USB chiffrée
- Les prix les plus bas de Suède
- Des devis très clairs et aucune surprise sur la facture !
- Des livraisons très rapides
- Assistance dédiée par téléphone ou sur votre ordinateur avec TeamViewer
Voir plus d'informations sous le lien « Numérisation d'enquêtes » ci-dessus à droite !
Interprétation avec technologie de capture de données flexible
L'interprétation OCR de certaines données est réalisée à l'aide de règles flexibles plutôt qu'avec une technologie de formulaire fixe ! Entre autres, nous utilisons le logiciel ABBYY FlexiCapture. Une base de données comportant les champs de données correspondants est remplie avec un enregistrement de données par formulaire ou document ! L'interprétation peut également être effectuée sur un PDF ordinaire (ne contenant pas d'image), qui est alors traité comme une image par le logiciel au moment où l'interprétation est réalisée !Extraction programmatique de texte à partir de PDF
Nous pouvons extraire des zones de texte de PDF de manière programmatique à l'aide d'un script sur mesure en VBA, et constituer ainsi une base de données. Cela peut, par exemple, s'appliquer à des documents d'autorités publiques tels que des jugements de tribunaux. Les zones d'extraction peuvent être définies à l'aide de coordonnées exactes, ou de coordonnées relatives à des mots-clés, ou relatives à des « expressions régulières » (motifs de recherche).
Renommage de PDF à l'aide de données textuelles interprétées par OCR ou extraites
À titre d'exemple typique, ce service signifie que quelques données différentes sont interprétées par OCR et capturées à l'aide d'une technologie de capture de données flexible (ou, alternativement, qu'une petite zone de texte est extraite de manière programmatique d'un PDF texte) généralement à partir de la première page d'un PDF multipage, et que ces données capturées, après contrôles et traitement, sont ensuite utilisées pour renommer le fichier PDF d'origine.
Numérisation en PDF avec numérotation séquentielle
Ce service consiste en une numérisation sans OCR. Le produit final se compose d'images stockées au format PDF ou TIFF. Elles sont numérotées par des numéros séquentiels dans l'ordre de numérisation : 0001.PDF, 0002.PDF, etc. Une variante courante consiste à numériser en un PDF multipage par document multipage à l'aide de feuilles séparatrices. La numérisation en PDF multipages avec séparation automatique des documents convient bien, par exemple, aux due diligence, à la documentation d'audit et plus encore.
Numérisation avec indexation manuelle
Ce service consiste en la numérisation et l'indexation manuelle d'un certain nombre de champs prédéfinis. Il convient souvent le mieux aux documents plus anciens comportant un texte dactylographié difficile à lire ou certaines informations manuscrites à capturer.
Numérisation de procès-verbaux — procès-verbaux historiques et archives
Nous proposons un service complet pour la numérisation de procès-verbaux de réunion, de procès-verbaux de conseil d'administration, de procès-verbaux d'assemblée annuelle et de collections historiques de procès-verbaux pour les associations, les congrégations, les archives municipales, les musées et les entreprises. Nous pouvons réaliser à la fois la numérisation par scanner à plat non destructive de volumes reliés de procès-verbaux (avec nos Zeutschel OS 12002 et Bookeye 5 V1A Archive calibrés FADGI) et la numérisation rapide de matériel pouvant être découpé (Inotec 6x1). Le service comprend la division des doubles pages de livre, la répartition du flux d'images numérisées en documents PDF distincts par jeu de procès-verbaux, le nommage des fichiers selon vos exigences, et un OCR par lots non corrigé pour la recherche. En savoir plus sur la numérisation de procès-verbaux →
OCR vers PDF
Numérisation et/ou interprétation OCR en PDF avec texte interprété invisible sous l'image. Convient bien, par exemple, à l'interprétation OCR d'images TIFF ou d'images PDF afin de créer une archive consultable en texte intégral.
OCR vers Word
OCR de livres et de textes de documents en un fichier Word modifiable. La vérification des caractères est incluse.
Numérisation de lettres, coupures de presse, cartes postales, photographies et plus encore
Nous vous aidons à numériser par scanner à plat des lettres, des coupures de presse, des cartes postales, des photographies et d'autres documents historiques similaires !