Scan en bog til en søgbar PDF eller Word.docx med verificerede tegn og verificeret stavning
Scanning af en bog, et hæfte eller en avis til en billed-PDF med et OCR-tolket tekstlag
Vi tilbyder to hovedmetoder til scanning af bøger eller hæfter:
- Automatisk arkfødt scanning: Bruges, når bogen/hæftet må skæres fra hinanden, hvilket muliggør højere kvalitet, større effektivitet og omkostningsbesparelser. I dette tilfælde scannes omslag og smudsomslag altid først (før bogen skæres fra hinanden) med en overhead-scanner.
- Overhead-scanning: Egnet til hele bøger op til A1(+)-format, der ikke kan skæres fra hinanden.
Scanningsprocessen:
- Opløsning: Vi scanner i 600 dpi for at muliggøre OCR af høj kvalitet og nedskalerer derefter til 300 dpi for at reducere filstørrelsen uden at gå på kompromis med OCR-resultatet.
- OCR: Udført med den bedste tilgængelige software:
- Mulighed 1: Batch-OCR uden korrektur af usikre tegn. (Vi retter dog altid titelbladet.)
- Mulighed 2: OCR med korrektur af usikre tegn og ord for højere nøjagtighed.
- Billedforbedring: Vi bruger vores egenudviklede dynamiske kantudfyldning til pænere sidekanter. Vi kan også rette enten hele siderektanglen eller tekstblokken på siden op samt rydde op i margener for ekstra høj kvalitet. Ved sort-hvid-scanning centreres tekstblokken, og små sorte pletter filtreres væk. Større pletter retoucheres manuelt. Ved scanning i farve kan vi retouchere pletter og skjolder både automatisk i margenerne og også manuelt! Tekstcentrering kan være lidt sværere at udføre pænt i farve.
Levering:
- Du modtager en eller flere søgbare billed-PDF'er: i 300 dpi med minimalt kvalitetstab, plus 600 dpi hvis ønsket.
- Muligheder:
- Sort-hvid: Minimale filstørrelser, bedst til tekstdokumenter uden illustrationer.
- Gråtoner: Mindre filstørrelser end farve, et godt kompromis mellem kvalitet og størrelse. Men jeg anbefaler farve eller sort-hvid!
- Farve: Uundværlig til sider med illustrationer for den bedste gengivelse.
- Muligheden for at blande sort-hvide og farvesider afhængigt af indholdet.
Priser:
Kontakt os for mere information eller for at drøfte dine specifikke behov! Det er vigtigt at angive, hvilken slags pris og kvalitet du er ude efter: 1) Billigt og enkelt, eller 2) Rigtig høj kvalitet med rettet tekst og en omhyggelig gennemgang af siderne med retouchering af pletter og skjolder. 3) Hvis du er villig til at vente længe, for eksempel et halvt år eller op til et år, giver jeg en betydelig rabat på store opgaver.
Eksempelfiler:
Kun billeder, i PDF-, TIFF- eller PNG-format til reproduktionstryk
Hvis du i stedet bare vil have en billed-PDF af bogen eller TIFF-billeder uden redigeringsmulighed, kan vi selvfølgelig også gøre det! Vi kan scanne i farve, gråtoner eller sort-hvid op til 600 dpi optisk opløsning. 600 dpi er som regel nok til reproduktionstryk!
I de fleste tilfælde kan vi også centrere tekstblokken, hvis du ønsker den ekstra service!
OCR-scanning af en bog til Word.docx
Vi skærer normalt bogen fra hinanden - eller vi bruger en overhead-scanner til bogscanning op til A1(+)-format - og scanner bogens sider og OCR-konverterer dem til en råtekst, det vil sige en redigerbar, sideopdelt tekst med manuelt verificerede tegn og verificeret stavning, men uden typografisk redigering.
Alternativ: AI-verificeret stavning, som er noget billigere og næsten lige så god!
Vi er stærke på krævende tekster med fremmede sprog og tegn. Det er en af grundene til, at forlag gerne bruger vores tjenester!
Med vores bogdigitaliseringstjeneste har vi for eksempel bistået Brombergs Bokförlag, Bokförlaget Bakhåll, Bokförlaget Daidalos, Bookmark förlag, Fri Tanke Förlag, Bookhouse Publishing, Lindelöws bokförlag, Mondial Förlag, Åbergs stilus et forma og andre.
Nyt sats af tekstblokken til tryk eller en e-bog
Du kan derefter arbejde videre med teksten, hvis det er en Word-fil, du har bestilt! Enten sætter du selv tekstblokken, eller også hyrer du en ekstern bogdesigner! Vi kan anbefale en bogdesigner, vi normalt samarbejder med, hvis du ønsker det! Han kan sætte en tekstblok, skabe et nyt omslag eller lave en e-bog i EPUB-format.
OCR-råtekst med verificerede tegn og verificeret stavning fra en PDF-fil
Fra visse PDF-filer kan vi udtrække indholdet direkte og konvertere det til en Word-fil. Hvor det ikke er muligt, tolkes PDF-filens sider som billeder med OCR-teknologi, som ovenfor.
Nogle få almindelige ting at overveje inden bogscanning
Eksempel 1: Traditionel kalibrering eller FADGI-kalibrering (bedste farvegengivelse)
Eksempel 2: Ubehandlet billede eller med dynamisk kantudfyldning
Eksempel 3: Kantudfyldning med dynamisk gennemsnitsfarve eller kantudfyldning med en dynamisk pixelpalet
Eksempel 4: Original og retoucheret billede med en dynamisk pixelpalet
Eksempel 5: Beskære eller ikke beskære?
Eksempel 6: En bogside og tekstblok, som den faktisk ser ud, eller med rettet tekst?
Eksempler på overhead-scannede billeder
Video af arbejdsgangen - et eksempel
Dette er et 13-siders uddrag fra et museumskatalog. En prøvedigitalisering. Jeg scannede forsiderne i farve i 600dpi med en Zeutschel overhead-scanner. Derefter scannede jeg tekstblokken i 600 dpi farve på en Inotec 6x1-scanner. Jeg efterbehandlede kanterne af sidebillederne i et separat efterbehandlingsprogram. Til sidst OCR-tolkede jeg dem og gemte dem i PDF-format.
Beskæring af bogsider