Nous avons lu 6468 pages de données immobilières comportant environ 232812 lignes et 13 colonnes de données pour Värderingsdata ! Nous avons lu les données avec deux programmes différents et comparé les résultats pour identifier et corriger les erreurs d'OCR, ce qui donne extrêmement peu d'erreurs de caractères ! De plus, nous avons effectué des contrôles qualité à l'aide d'expressions régulières, ainsi qu'un comptage des lignes par page à l'aide de scripts.