Etiqueta: paperless

  • Cómo hacer que Hazel reconozca fechas en varios idiomas

    Un lector y oyente llamado Iñaki Agüero (@Stratosdj) me consultaba el otro día por Twitter un problema singular. Resulta que él realiza compras en Amazon España, pero también en Amazon UK. Ha programado flujos de Hazel para procesar sus facturas de Amazon, pero dado que Hazel toma el formato de fecha del sistema, las facturas en otro idioma no eran procesadas, toda vez que, por ejemplo, las abreviaturas de los meses son evidentemente distintas (ene-jan).

    Yo le dije que no tenía ni idea de cómo solucionar su problema. La necesidad le agudizó el ingenio y dio con la forma de hacerlo, y ha sido tan amable de mandármelo para compartirlo con vosotros.

    (más…)

  • Renombrar documentos en Paperless

    A petición del respetable voy a poner por escrito lo comentado en el Emilcar Daily del 6 de marzo de 2014 sobre renombrar documentos bajo la filosofía Paperless. Lo primero que hay que indicar es que el libro origen de todo esto, Paperless de David Sparks, trata profundamente el asunto y da diversos ejemplos, que quizá resulten más inspiradores que los míos, y seguro más detallados.

    Qué nombre poner

    Después de mucho experimentar tanto en el trabajo como en casa, he llegado a la conclusión de que la nomenclatura ideal para mí respecto al nombre de un archivo debe incluir de alguna manera la fecha. Los sistemas operativos que manejo (Windows en el trabajo y OS X en casa) ordenan los archivos alfabéticamente por defecto, de manera que si nombro mis archivos comenzando por la fecha en un formato adecuado, obtendré automáticamente un listado de archivos ordenados de más antiguo a más moderno.

    Para ello es imprescindible empezar a nombrar el artículo por el año, luego el mes y luego, si es necesario, el día. Veamos varios ejemplos:

    20140205 Recibo comunidad propietarios.pdf
    2014-02 Factura Movistar.pdf
    201403 Pepephone iPad.pdf
    Cliente1 1402 Cambio de firmas.pdf

    Si separamos los dígitos con guiones tendremos una fecha más fácil de leer pero también un nombre de archivo más largo. En el trabajo siempre anticipo el nombre del cliente a la fecha, porque si no, cuando empiezo a buscar, me sacaría archivos de determinada fecha de varios clientes, y eso no me interesa.

    Renombrado automático

    Cuando estamos creando archivos de texto u hojas de cálculo, nada más fácil queintroducir a mano el nombre del archivo creado, usando la nomenclatura elegida, pero cuando estamos hablando de documentos escaneados para un sistema Paperless, sin duda Hazel en OS X es nuestro principal aliado. Vamos a ver cómo podemos aprovechar su capacidad de leer en las entrañas del pdf para renombrar correctamente los archivos.

    Debemos hacer una regla para cada tipo de documento de los que recibimos habitualmente. Vamos a poner un ejemplo con ticket del supermercado SUPERCOR, perteneciente a El Corte Inglés. Lo primero es escanear con OCR uno de esos tickets y abrirlo en Vista Previa; usando el buscador decidimos que texto es característico de este documento y de ningún otro. En mi caso decido que las cadenas de texto a buscar son SUPERCOR (el producto que tengo contratado) y la fecha del ticket en el formato adecuado, así que determino una regla Content – contains para la palabra SUPERCOR y otra regla Content – contains match para que busque en el documento la fecha con el formato 24/ene/2014.

    Reglas para Supercor

    Es imprescindible que estemos seguros de que ningún documento que no sea un ticket de SUPERCOR va a contener estas normas, porque una vez puesto en marcha, el proceso es automático y es muy difícil advertir un error de identificación si no vas abriendo uno por uno cada archivo renombrado.

    A continuación, le indico a Hazel que proceda con toda su magia. Una vez que Hazel ha detectado una cadena de datos coincidente con un formato (en este caso la fecha) ya podemos usar esos datos como queramos. Por ejemplo, si ha detectado el mes como feb en el documento, podemos decirle que use el número del mes (02) para renombrarlo, y cosas así. En este caso he optado por la función Rename usando el patrón de la fecha reconocida, pero cambiando el orden y alterando la nomenclatura, de manera que si Hazel ha detectado la fecha 24/ene/2014, mi documento se llamará 20140124 Compra SuperCor.pdf. Podría haber hecho igual que se llamara 14-01 supercor.pdf o cualquier variante de la fecha detectada, a mi antojo.

    Todo este proceso tiene lugar en la carpeta donde opera la regla, en mi caso en la carpeta a donde van a parar todos los pdf que escaneo. Ahora toca moverlo, y le indico a Hazel que mueva ese pdf a la carpeta Compras, y que lo ordene en una subcarpeta que se llamará de nuevo en función de la fecha detectada, en mi caso es carpeta se llama 2014-01 usando el año y mes detectado en el ticket. También van a parar ahí tickets de otras tiendas. Para rematar, le pongo una etiqueta violeta, porque me gusta.

    procesar supercor

    La única pega de este sistema es que hay que crear una regla específica para cada tipo de documento habitual que vayamos a escanear. Sin duda un trabajo menos tortuoso que tener que renombrar a mano uno por uno todos los documentos entrantes.

  • Recopilación sobre Paperless

    En algunos de los últimos capítulos de Emilcar Daily he tratado la filosofía Paperless, centrada en reducir la presencia de papel en nuestras vidas y digitalizar y archivar toda la información necesaria para su consulta posterior en nuestro Mac, iPhone o iPad.

    En mi caso, he decidido escanear todos los documentos y mantener un archivo de los mismos bajo una jerarquía de carpetas en Dropbox, aunque conozco a algunos usuarios que hacen lo mismo pero en Evernote u otros sistemas de manejo de documentos e información. Respecto al tratamiento de esos documentos, voy a hacer una recopilación de todo lo comentado estos días:

    • Emilcar Daily: he hablado del tema en los capítulos sobre Facturas en PDF, Hazel y Paperless y OCR para PDF.
    • Escaner: yo uso un escaner de documentos Fujitsu Scansnap S1100 que incluye en su software el OCR de ABBYY FineReader con excelentes resultados. Hay otros modelos de Fujitsu más rápidos y que incluso escanean a doble cara, pero la versatilidad de este modelo no la cambio por nada en el mundo.
    • Software OCR para Mac: aunque ABBY y otras marcas venden software de OCR para Mac, el más popular es PDFpen, que cuesta 54,99€. A este respecto, Jeroen Sangers del blog de productividad El Canasto, me comenta que usa este truco de Hazel para coger un PDF, detectar si necesita OCR y si es así, hacérselo automáticamente con PDFpen. Dado que, como veis, el uso de scripts es muy recurrente en este tipo de programas, yo evitaría comprarlos en la Mac App Store, ya que seguro que las versiones que se venden ahí no permiten usar estas automatizaciones.
    • Software OCR para iOS: «Este es el Mesías, y yo sé de eso porque he seguido a varios». La cita de La Vida de Brian viene aquí al pelo porque yo he usado varias apps de OCR para el iPhone, que actúan sobre fotos de documentos tomadas con el mismo dispositivo o sobre imágenes o PDF que se le suministra. Es una opción válida para tickets y cosas así, pero para documentos en A4 con mucho texto, como una factura, se quedan cortas. De todas las probadas yo me he quedado con Scanner Pro by Readdle My Scans Pro.
    • Evernote: la cuenta gratuita te hace OCR sobre jpg y la cuenta premium te lo hace también sobre PDF, así que puede ser otra solución viable y muy práctica si además le confiamos el archivo definitivo de los documentos (OJO: me comenta Jeroen Sangers que es un OCR dentro de la app, si sacas el PDF pierdes ese reconocimiento de caracteres).
    • Paperless: la madre del cordero este libro de David Sparks, cuya versión recomendada es la de la iBooks Store, al integrar con el texto los vídeos explicativos de todo el sistema. Una gozada. Todo lo que necesitáis saber de esta filosofía está en este libro.
    • Hazel: es la app para el Mac que uso para coger los PDF, inspeccionarlos, renombrarlos y moverlos, en función de una serie de reglas. El libro Paperless te enseña todo lo que necesitas saber al respecto, y por Internet encontrarás también varios tutoriales. Mi función favorita es contain match que me permite indicarle a Hazel el formato de fecha que debe esperar encontrar en una factura (por ejemplo) y posteriormente usar las partes de esa fecha para renombrar el PDF.

    Básicamente esto es todo lo que hemos estado tratando durante estos días en el podcast y en los comentarios que me habéis hecho por twitter, correo electrónico etc. Si os habíais perdido algo, aquí está todo.