Scansiona un libro in un PDF ricercabile o in Word.docx con caratteri verificati e ortografia verificata
Scansione di un libro, opuscolo o giornale in un PDF immagine con uno strato di testo interpretato tramite OCR
Offriamo due metodi principali per la scansione di libri o opuscoli:
- Scansione automatica a foglio singolo: Utilizzata quando il libro/opuscolo può essere tagliato, il che consente maggiore qualità, maggiore efficienza e risparmio sui costi. In questo caso le copertine e la sovraccoperta vengono sempre scansionate per prime (prima che il libro venga tagliato) con uno scanner dall'alto.
- Scansione dall'alto: Adatta per libri interi fino al formato A1(+) che non possono essere tagliati.
Il processo di scansione:
- Risoluzione: Scansioniamo a 600 dpi per consentire un OCR di alta qualità e poi riduciamo il campionamento a 300 dpi per ridurre la dimensione del file senza compromettere il risultato OCR.
- OCR: Effettuato con il miglior software disponibile:
- Opzione 1: OCR in batch senza correzione dei caratteri incerti. (Correggiamo tuttavia sempre il frontespizio.)
- Opzione 2: OCR con correzione dei caratteri e delle parole incerte per una maggiore precisione.
- Miglioramento dell'immagine: Utilizziamo il nostro riempimento dinamico dei bordi sviluppato internamente per bordi delle pagine più ordinati. Possiamo inoltre raddrizzare sia l'intero rettangolo della pagina sia il blocco di testo sulla pagina, oltre a sistemare i margini per una qualità particolarmente elevata. Per la scansione in bianco e nero, il blocco di testo viene centrato e i piccoli puntini neri vengono filtrati. I puntini più grandi vengono ritoccati manualmente. Per la scansione a colori, possiamo ritoccare puntini e macchie sia automaticamente nei margini sia manualmente! La centratura del testo può essere un po' più difficile da eseguire in modo pulito a colori.
Consegna:
- Riceverai uno o più PDF immagine ricercabili: a 300 dpi con perdita di qualità minima, più 600 dpi se desiderato.
- Opzioni:
- Bianco e nero: Dimensioni dei file minime, ideale per documenti di testo senza illustrazioni.
- Scala di grigi: Dimensioni dei file inferiori rispetto al colore, un buon compromesso tra qualità e dimensione. Ma consiglio il colore o il bianco e nero!
- Colore: Essenziale per le pagine con illustrazioni per la migliore riproduzione.
- La possibilità di combinare pagine in bianco e nero e a colori a seconda del contenuto.
Prezzi:
Contattaci per maggiori informazioni o per discutere le tue esigenze specifiche! È importante indicare il tipo di prezzo e di qualità che desideri: 1) Economico e di base, oppure 2) Qualità davvero elevata con testo raddrizzato e un'attenta revisione delle pagine con ritocco di puntini e macchie. 3) Se sei disposto ad attendere a lungo, ad esempio sei mesi o fino a un anno, applico uno sconto sostanziale sui grandi incarichi.
File di esempio:
Solo immagini, in formato PDF, TIFF o PNG per la stampa in riproduzione
Se invece desideri semplicemente un PDF immagine del libro, o immagini TIFF, senza possibilità di modifica, naturalmente possiamo farlo anche noi! Possiamo scansionare a colori, in scala di grigi o in bianco e nero fino a 600 dpi di risoluzione ottica. 600 dpi sono solitamente sufficienti per la stampa in riproduzione!
Nella maggior parte dei casi possiamo anche centrare il blocco di testo, se desideri questo servizio aggiuntivo!
Scansione OCR di un libro in Word.docx
Di norma tagliamo il libro - oppure utilizziamo uno scanner dall'alto per la scansione di libri fino al formato A1(+) - e scansioniamo le pagine del libro e le convertiamo tramite OCR in un testo grezzo, ovvero un testo modificabile, suddiviso in pagine, con caratteri verificati manualmente e ortografia verificata, ma senza editing tipografico.
Alternativa: Ortografia verificata tramite IA, che è leggermente più economica e quasi altrettanto valida!
Siamo forti nei testi impegnativi che presentano lingue e caratteri stranieri. Questo è uno dei motivi per cui gli editori sono desiderosi di avvalersi dei nostri servizi!
Con il nostro servizio di digitalizzazione di libri abbiamo assistito, ad esempio, Brombergs Bokförlag, Bokförlaget Bakhåll, Bokförlaget Daidalos, Bookmark förlag, Fri Tanke Förlag, Bookhouse Publishing, Lindelöws bokförlag, Mondial Förlag, Åbergs stilus et forma e altri.
Nuova composizione tipografica del blocco di testo per la stampa o un e-book
Potrai poi lavorare ulteriormente sul testo se hai ordinato un file Word! O componi tu stesso il blocco di testo, oppure ingaggi un book designer esterno! Possiamo raccomandare un book designer con cui collaboriamo abitualmente, se lo desideri! Può comporre un blocco di testo, creare una nuova copertina o realizzare un e-book in formato EPUB.
Testo grezzo OCR con caratteri verificati e ortografia verificata da un file PDF
Da alcuni file PDF possiamo estrarre il contenuto direttamente e convertirlo in un file Word. Dove ciò non è possibile, le pagine del file PDF vengono interpretate come immagini con tecnologia OCR, come sopra.
Alcuni aspetti comuni da considerare prima della scansione di un libro
Esempio 1: Calibrazione tradizionale o calibrazione FADGI (migliore resa cromatica)
Esempio 2: Immagine non elaborata o con riempimento dinamico dei bordi
Esempio 3: Riempimento dei bordi con colore medio dinamico o riempimento dei bordi con una tavolozza di pixel dinamica
Esempio 4: Immagine originale e ritoccata con una tavolozza di pixel dinamica
Esempio 5: Ritagliare o non ritagliare?
Esempio 6: Una pagina di libro e un blocco di testo come appaiono realmente, o con il testo raddrizzato?
Esempi di immagini scansionate dall'alto
Video del flusso di lavoro - un esempio
Questo è un estratto di 13 pagine da un catalogo di museo. Una digitalizzazione di esempio. Ho scansionato le copertine anteriori a colori a 600dpi con uno scanner dall'alto Zeutschel. Poi ho scansionato il blocco di testo a colori a 600 dpi su uno scanner Inotec 6x1. Ho post-elaborato i bordi delle immagini delle pagine in un programma di post-elaborazione separato. Infine, le ho interpretate tramite OCR e le ho salvate in formato PDF.
Rifilatura delle pagine di un libro