Extraer texto de archivos PDF
Podemos extraer texto de archivos PDF utilizando scripts hechos a medida y construir así el contenido en una base de datos. Esta es una alternativa más potente y flexible que utilizar un programa de OCR con funciones avanzadas. ¡También es más rápida!
Las áreas de extracción pueden definirse mediante coordenadas exactas, o mediante coordenadas relativas a palabras clave, o relativas a "expresiones regulares" (patrones de búsqueda). ¡También existe la opción de buscar palabras clave con coincidencia difusa (es decir, un carácter puede estar equivocado)!
Las tareas comunes pueden ser la captura flexible de números de registro de empresa y/o números de identidad personal, fechas, números de pedido o similares.
Esto puede referirse, por ejemplo, a documentos oficiales como resoluciones judiciales, extractos de cuenta, etc., documentos de Bolagsverket, Skatteverket, etc.
Sentencias de tribunales de distrito - extracción de los acusados y las partes perjudicadas de las sentencias de los tribunales de distrito
¡Tenemos una amplia experiencia trabajando con sentencias, en particular, de todos los tribunales de distrito! Podemos extraer el acusado y la parte perjudicada, sus números de identidad personal cuando estén presentes, el número de caso, el nombre del tribunal, etc. de todas las sentencias publicadas como archivos PDF por los tribunales del país. ¡Rápido y a un precio razonable!
¡Con un script adaptado al 100 % a medida, normalmente es posible obtener exactamente lo que usted desea!