Escanee un libro a un PDF con búsqueda o a Word.docx con caracteres verificados y ortografía verificada
Escaneado de un libro, folleto o periódico a un PDF de imagen con una capa de texto interpretada por OCR
Ofrecemos dos métodos principales para escanear libros o folletos:
- Escaneado automático con alimentación de hojas: Se utiliza cuando el libro/folleto puede cortarse, lo que permite mayor calidad, mayor eficiencia y ahorro de costes. En este caso, las cubiertas y la sobrecubierta se escanean siempre primero (antes de cortar el libro) con un escáner cenital.
- Escaneado cenital: Adecuado para libros enteros de hasta formato A1(+) que no pueden cortarse.
El proceso de escaneado:
- Resolución: Escaneamos a 600 dpi para permitir un OCR de alta calidad y luego reducimos la resolución a 300 dpi para reducir el tamaño del archivo sin comprometer el resultado del OCR.
- OCR: Realizado con el mejor software disponible:
- Opción 1: OCR por lotes sin corrección de caracteres inciertos. (No obstante, corregimos siempre la portada.)
- Opción 2: OCR con corrección de caracteres y palabras inciertas para una mayor precisión.
- Mejora de imagen: Utilizamos nuestro propio relleno de borde dinámico para unos bordes de página más limpios. También podemos enderezar bien todo el rectángulo de la página, bien el bloque de texto de la página, así como limpiar los márgenes para una calidad extra alta. Para el escaneado en blanco y negro, el bloque de texto se centra y se filtran las pequeñas motas negras. Las motas más grandes se retocan manualmente. Para el escaneado en color, ¡podemos retocar motas y manchas tanto automáticamente en los márgenes como también manualmente! El centrado del texto puede ser algo más difícil de hacer con precisión en color.
Entrega:
- Recibe uno o varios PDF de imagen con búsqueda: a 300 dpi con una pérdida mínima de calidad, más 600 dpi si lo desea.
- Opciones:
- Blanco y negro: Tamaños de archivo mínimos, lo mejor para documentos de texto sin ilustraciones.
- Escala de grises: Tamaños de archivo menores que en color, un buen compromiso entre calidad y tamaño. ¡Pero recomiendo color o blanco y negro!
- Color: Imprescindible para páginas con ilustraciones para obtener la mejor reproducción.
- La opción de mezclar páginas en blanco y negro y en color según el contenido.
Precios:
¡Póngase en contacto con nosotros para obtener más información o para hablar de sus necesidades concretas! Es importante indicar el tipo de precio y calidad que busca: 1) Económico y básico, o 2) Calidad realmente alta con texto enderezado y una revisión cuidadosa de las páginas con retoque de motas y manchas. 3) Si está dispuesto a esperar mucho tiempo, por ejemplo seis meses o hasta un año, concedo un descuento considerable en trabajos grandes.
Archivos de muestra:
Solo imágenes, en formato PDF, TIFF o PNG para impresión de reproducción
Si en cambio solo desea un PDF de imagen del libro, o imágenes TIFF, sin capacidad de edición, ¡por supuesto también podemos hacerlo! Podemos escanear en color, escala de grises o blanco y negro hasta 600 dpi de resolución óptica. ¡600 dpi suele ser suficiente para la impresión de reproducción!
¡En la mayoría de los casos también podemos centrar el bloque de texto si desea ese servicio adicional!
Escaneado OCR de un libro a Word.docx
Normalmente cortamos el libro -o utilizamos un escáner cenital para el escaneado de libros de hasta formato A1(+)- y escaneamos las páginas del libro y las convertimos con OCR en un texto sin procesar, es decir, un texto editable, con saltos de página y con caracteres verificados manualmente y ortografía verificada, pero sin edición tipográfica.
Alternativa: ¡Ortografía verificada por IA, que es algo más económica y casi igual de buena!
Somos fuertes en textos exigentes con lenguas y caracteres extranjeros. ¡Esa es una de las razones por las que las editoriales están deseosas de utilizar nuestros servicios!
Con nuestro servicio de digitalización de libros hemos prestado ayuda, por ejemplo, a Brombergs Bokförlag, Bokförlaget Bakhåll, Bokförlaget Daidalos, Bookmark förlag, Fri Tanke Förlag, Bookhouse Publishing, Lindelöws bokförlag, Mondial Förlag, Åbergs stilus et forma y otros.
Nueva composición tipográfica del bloque de texto para impresión o un libro electrónico
¡Luego puede seguir trabajando con el texto si es un archivo Word lo que ha encargado! O bien compone usted mismo el bloque de texto, o bien contrata a un diseñador de libros externo. ¡Podemos recomendarle un diseñador de libros con el que solemos trabajar si lo desea! Él puede componer un bloque de texto, crear una nueva cubierta o hacer un libro electrónico en formato EPUB.
Texto sin procesar OCR con caracteres verificados y ortografía verificada a partir de un archivo PDF
A partir de ciertos archivos PDF podemos extraer el contenido directamente y convertirlo en un archivo Word. Cuando esto no es posible, las páginas del archivo PDF se interpretan como imágenes con tecnología OCR, como se ha indicado anteriormente.
Algunas cuestiones habituales a tener en cuenta antes del escaneado de libros
Ejemplo 1: Calibración tradicional o calibración FADGI (mejor reproducción del color)
Ejemplo 2: Imagen sin procesar o con relleno de borde dinámico
Ejemplo 3: Relleno de borde con color medio dinámico o relleno de borde con una paleta de píxeles dinámica
Ejemplo 4: Imagen original y retocada con una paleta de píxeles dinámica
Ejemplo 5: ¿Recortar o no recortar?
Ejemplo 6: ¿Una página de libro y bloque de texto tal como se ve realmente, o con el texto enderezado?
Ejemplos de imágenes escaneadas con escáner cenital
Vídeo del flujo de trabajo - un ejemplo
Este es un extracto de 13 páginas de un catálogo de museo. Una digitalización de muestra. Escaneé las cubiertas delanteras en color a 600dpi con un escáner cenital Zeutschel. Después escaneé el bloque de texto en color a 600 dpi en un escáner Inotec 6x1. Posprocesé los bordes de las imágenes de página en un programa de posprocesamiento aparte. Por último, las interpreté con OCR y las guardé en formato PDF.
Recorte de páginas de libros