Ein Buch in eine durchsuchbare PDF oder Word.docx mit verifizierten Zeichen und verifizierter Rechtschreibung scannen
Scannen eines Buches, einer Broschüre oder Zeitung in eine Bild-PDF mit einer OCR-interpretierten Textebene
Wir bieten zwei Hauptmethoden für das Scannen von Büchern oder Broschüren an:
- Automatisches Einzelblattscanning: Wird verwendet, wenn das Buch/die Broschüre zerschnitten werden darf, was höhere Qualität, größere Effizienz und Kosteneinsparungen ermöglicht. In diesem Fall werden die Einbände und der Schutzumschlag stets zuerst (bevor das Buch zerschnitten wird) mit einem Aufsichtscanner gescannt.
- Aufsichtscanning: Geeignet für ganze Bücher bis zum Format A1(+), die nicht zerschnitten werden können.
Der Scanvorgang:
- Auflösung: Wir scannen in 600 dpi, um eine hochwertige OCR zu ermöglichen, und reduzieren die Auflösung anschließend auf 300 dpi, um die Dateigröße zu verringern, ohne das OCR-Ergebnis zu beeinträchtigen.
- OCR: Durchgeführt mit der besten verfügbaren Software:
- Option 1: Batch-OCR ohne Korrektur unsicherer Zeichen. (Die Titelseite korrigieren wir jedoch immer.)
- Option 2: OCR mit Korrektur unsicherer Zeichen und Wörter für höhere Genauigkeit.
- Bildoptimierung: Wir verwenden unsere hauseigene dynamische Kantenfüllung für ordentlichere Seitenränder. Wir können außerdem entweder das gesamte Seitenrechteck oder den Textblock auf der Seite begradigen sowie die Ränder für besonders hohe Qualität bereinigen. Beim Schwarzweiß-Scannen wird der Textblock zentriert und kleine schwarze Flecken werden herausgefiltert. Größere Flecken werden manuell retuschiert. Beim Farbscannen können wir Flecken und Punkte sowohl automatisch in den Rändern als auch manuell retuschieren! Die Textzentrierung lässt sich in Farbe etwas schwieriger sauber ausführen.
Lieferung:
- Sie erhalten eine oder mehrere durchsuchbare Bild-PDFs: in 300 dpi mit minimalem Qualitätsverlust, auf Wunsch zusätzlich in 600 dpi.
- Optionen:
- Schwarzweiß: Minimale Dateigrößen, am besten für Textdokumente ohne Illustrationen.
- Graustufen: Kleinere Dateigrößen als in Farbe, ein guter Kompromiss zwischen Qualität und Größe. Ich empfehle jedoch Farbe oder Schwarzweiß!
- Farbe: Unerlässlich für Seiten mit Illustrationen für die beste Wiedergabe.
- Die Möglichkeit, Schwarzweiß- und Farbseiten je nach Inhalt zu mischen.
Preise:
Kontaktieren Sie uns für weitere Informationen oder um Ihren konkreten Bedarf zu besprechen! Es ist wichtig anzugeben, welche Art von Preis und Qualität Sie wünschen: 1) Günstig und einfach, oder 2) Wirklich hohe Qualität mit begradigtem Text und einer sorgfältigen Durchsicht der Seiten mit Retusche von Flecken und Punkten. 3) Wenn Sie bereit sind, lange zu warten, zum Beispiel sechs Monate oder bis zu einem Jahr, gewähre ich bei großen Aufträgen einen erheblichen Rabatt.
Musterdateien:
Nur Bilder, im PDF-, TIFF- oder PNG-Format für den Reproduktionsdruck
Wenn Sie stattdessen einfach nur eine Bild-PDF des Buches oder TIFF-Bilder ohne Bearbeitungsmöglichkeit möchten, können wir das selbstverständlich auch machen! Wir können in Farbe, Graustufen oder Schwarzweiß bis zu 600 dpi optischer Auflösung scannen. 600 dpi reichen in der Regel für den Reproduktionsdruck aus!
In den meisten Fällen können wir auch den Textblock zentrieren, wenn Sie diesen zusätzlichen Service wünschen!
OCR-Scanning eines Buches in Word.docx
Wir zerschneiden das Buch in der Regel - oder wir verwenden für das Buchscanning bis zum Format A1(+) einen Aufsichtscanner - und scannen die Seiten des Buches und konvertieren sie per OCR in einen Rohtext, das heißt einen bearbeitbaren, seitenweise umbrochenen Text mit manuell verifizierten Zeichen und verifizierter Rechtschreibung, jedoch ohne typografische Bearbeitung.
Alternative: KI-verifizierte Rechtschreibung, die etwas günstiger und fast genauso gut ist!
Wir sind stark bei anspruchsvollen Texten mit fremden Sprachen und Zeichen. Das ist einer der Gründe, warum Verlage unsere Dienste gerne in Anspruch nehmen!
Mit unserem Buchdigitalisierungsservice haben wir beispielsweise Brombergs Bokförlag, Bokförlaget Bakhåll, Bokförlaget Daidalos, Bookmark förlag, Fri Tanke Förlag, Bookhouse Publishing, Lindelöws bokförlag, Mondial Förlag, Åbergs stilus et forma und andere unterstützt.
Neuer Satz des Textblocks für den Druck oder ein E-Book
Sie können dann weiter mit dem Text arbeiten, wenn Sie eine Word-Datei bestellt haben! Entweder Sie setzen den Textblock selbst, oder Sie beauftragen einen externen Buchgestalter! Wir können Ihnen auf Wunsch einen Buchgestalter empfehlen, mit dem wir üblicherweise zusammenarbeiten! Er kann einen Textblock setzen, ein neues Cover erstellen oder ein E-Book im EPUB-Format anfertigen.
OCR-Rohtext mit verifizierten Zeichen und verifizierter Rechtschreibung aus einer PDF-Datei
Aus bestimmten PDF-Dateien können wir den Inhalt direkt extrahieren und in eine Word-Datei umwandeln. Wo dies nicht möglich ist, werden die Seiten der PDF-Datei wie oben beschrieben als Bilder mit OCR-Technologie interpretiert.
Einige gängige Dinge, die vor dem Buchscanning zu beachten sind
Beispiel 1: Traditionelle Kalibrierung oder FADGI-Kalibrierung (beste Farbwiedergabe)
Beispiel 2: Unbearbeitetes Bild oder mit dynamischer Kantenfüllung
Beispiel 3: Kantenfüllung mit dynamischer Durchschnittsfarbe oder Kantenfüllung mit einer dynamischen Pixelpalette
Beispiel 4: Original und retuschiertes Bild mit einer dynamischen Pixelpalette
Beispiel 5: Beschneiden oder nicht beschneiden?
Beispiel 6: Eine Buchseite und ein Textblock, wie sie tatsächlich aussehen, oder mit begradigtem Text?
Beispiele für per Aufsichtscanner gescannte Bilder
Video des Arbeitsablaufs - ein Beispiel
Dies ist ein 13-seitiger Auszug aus einem Museumskatalog. Eine Musterdigitalisierung. Ich habe die Titelseiten in Farbe in 600dpi mit einem Zeutschel-Aufsichtscanner gescannt. Anschließend habe ich den Textblock in 600 dpi Farbe auf einem Inotec 6x1-Scanner gescannt. Die Ränder der Seitenbilder habe ich in einem separaten Nachbearbeitungsprogramm nachbearbeitet. Zuletzt habe ich sie per OCR interpretiert und im PDF-Format gespeichert.
Beschneiden von Buchseiten