Skann en bok til en søkbar PDF eller Word.docx med verifiserte tegn og verifisert staving
Skanning av en bok, et hefte eller en avis til en bilde-PDF med et OCR-tolket tekstlag
Vi tilbyr to hovedmetoder for skanning av bøker eller hefter:
- Automatisk arkmatet skanning: Brukes når boken/heftet kan skjæres fra hverandre, noe som gir høyere kvalitet, større effektivitet og kostnadsbesparelser. I dette tilfellet skannes omslaget og smussomslaget alltid først (før boken skjæres fra hverandre) med en overhead-skanner.
- Overhead-skanning: Egnet for hele bøker opp til A1(+)-format som ikke kan skjæres fra hverandre.
Skanneprosessen:
- Oppløsning: Vi skanner i 600 dpi for å muliggjøre OCR av høy kvalitet og nedskalerer deretter til 300 dpi for å redusere filstørrelsen uten å gå på akkord med OCR-resultatet.
- OCR: Utføres med den beste tilgjengelige programvaren:
- Alternativ 1: Batch-OCR uten korrigering av usikre tegn. (Vi korrigerer imidlertid alltid tittelsiden.)
- Alternativ 2: OCR med korrigering av usikre tegn og ord for høyere nøyaktighet.
- Bildeforbedring: Vi bruker vår egen egenutviklede dynamiske kantutfylling for ryddigere sidekanter. Vi kan også rette opp enten hele siderektangelet eller tekstblokken på siden, samt rydde opp i marger for ekstra høy kvalitet. Ved svart-hvitt-skanning sentreres tekstblokken og små svarte flekker filtreres bort. Større flekker retusjeres manuelt. Ved skanning i farge kan vi retusjere flekker og prikker både automatisk i margene og også manuelt! Tekstsentrering kan være litt vanskeligere å gjøre pent i farge.
Levering:
- Du mottar en eller flere søkbare bilde-PDF-er: i 300 dpi med minimalt kvalitetstap, samt 600 dpi om ønskelig.
- Alternativer:
- Svart-hvitt: Minimale filstørrelser, best for tekstdokumenter uten illustrasjoner.
- Gråtoner: Mindre filstørrelser enn farge, et godt kompromiss mellom kvalitet og størrelse. Men jeg anbefaler farge eller svart-hvitt!
- Farge: Nødvendig for sider med illustrasjoner for best gjengivelse.
- Muligheten til å blande svart-hvitt- og fargesider avhengig av innholdet.
Priser:
Kontakt oss for mer informasjon eller for å diskutere dine spesifikke behov! Det er viktig å oppgi hvilken pris og kvalitet du er ute etter: 1) Billig og enkelt, eller 2) Virkelig høy kvalitet med rettet tekst og en grundig gjennomgang av sidene med retusjering av flekker og prikker. 3) Hvis du er villig til å vente lenge, for eksempel et halvt år eller opptil et år, gir jeg en betydelig rabatt på store jobber.
Eksempelfiler:
Kun bilder, i PDF-, TIFF- eller PNG-format for reproduksjonstrykk
Hvis du i stedet bare ønsker en bilde-PDF av boken, eller TIFF-bilder, uten redigeringsmulighet, kan vi selvfølgelig også gjøre det! Vi kan skanne i farge, gråtoner eller svart-hvitt opptil 600 dpi optisk oppløsning. 600 dpi er vanligvis nok for reproduksjonstrykk!
I de fleste tilfeller kan vi også sentrere tekstblokken hvis du ønsker den ekstra tjenesten!
OCR-skanning av en bok til Word.docx
Vi skjærer normalt boken fra hverandre - eller vi bruker en overhead-skanner for bokskanning opptil A1(+)-format - og skanner bokens sider og OCR-konverterer dem til en råtekst, det vil si en redigerbar, sideinndelt tekst med manuelt verifiserte tegn og verifisert staving, men uten typografisk redigering.
Alternativ: AI-verifisert staving, som er noe billigere og nesten like bra!
Vi er sterke på krevende tekster med fremmedspråk og fremmede tegn. Det er én grunn til at forlag gjerne bruker tjenestene våre!
Med vår bokdigitaliseringstjeneste har vi for eksempel bistått Brombergs Bokförlag, Bokförlaget Bakhåll, Bokförlaget Daidalos, Bookmark förlag, Fri Tanke Förlag, Bookhouse Publishing, Lindelöws bokförlag, Mondial Förlag, Åbergs stilus et forma med flere.
Ny ombrekking av tekstblokken for trykk eller en e-bok
Du kan deretter arbeide videre med teksten hvis det er en Word-fil du har bestilt! Enten setter du tekstblokken selv, eller så leier du inn en ekstern bokdesigner! Vi kan anbefale en bokdesigner vi vanligvis samarbeider med hvis du ønsker det! Han kan sette en tekstblokk, lage et nytt omslag, eller lage en e-bok i EPUB-format.
OCR-råtekst med verifiserte tegn og verifisert staving fra en PDF-fil
Fra visse PDF-filer kan vi hente ut innholdet direkte og konvertere det til en Word-fil. Der det ikke er mulig, tolkes PDF-filens sider som bilder med OCR-teknologi, som ovenfor.
Noen vanlige ting å vurdere før bokskanning
Eksempel 1: Tradisjonell kalibrering eller FADGI-kalibrering (best fargegjengivelse)
Eksempel 2: Ubearbeidet bilde eller med dynamisk kantutfylling
Eksempel 3: Kantutfylling med dynamisk gjennomsnittsfarge eller kantutfylling med en dynamisk pikselpalett
Eksempel 4: Original og retusjert bilde med en dynamisk pikselpalett
Eksempel 5: Beskjære eller ikke beskjære?
Eksempel 6: En bokside og tekstblokk slik den faktisk ser ut, eller med rettet tekst?
Eksempler på overhead-skannede bilder
Video av arbeidsflyten - et eksempel
Dette er et utdrag på 13 sider fra en museumskatalog. En prøvedigitalisering. Jeg skannet forsidene i farge i 600dpi med en Zeutschel overhead-skanner. Deretter skannet jeg tekstblokken i 600 dpi farge på en Inotec 6x1-skanner. Jeg etterbehandlet kantene på sidebildene i et separat etterbehandlingsprogram. Til slutt OCR-tolket jeg dem og lagret dem i PDF-format.
Trimming av boksider