Deze antwoorden kun je ook terugvinden in mijn antwoorden op be.comp.os.linux.
Hoe kun je geschreven teksten digitaliseren en bewerkbaar maken? Uiteraard met een scanner en OCR-software. Voor linux bestaan er drie belangrijke OCR-engines: cuneiform, gocr, ocrad, tesseract. (vrij)
Een vergelijking van deze engines vind je op : http://www.splitbrain.org/blog/2010-06/15-linux_ocr_software_comparison
Deze engines zitten meestal reeds in je softwarebronnen van je distributie. Wil je de laatste versies daarentegen dan zul je moeten handmatig installeren.
Naast de engines direct aanspreken via terminal, verkiezen de meeste mensen een grafisch programma. Zo 'zie' je tenminste wat je doet.
Voor cuneiform: http://symmetrica.net/cuneiform-linux/yagf-en.html#requires Deze is wel zelf te compileren. Werkt behoorlijk: je kan ook aparte stukken in de scan selecteren om te laten OCR'en.
Tesseract heeft er verschillende : vietocr :http://sourceforge.net/projects/vietocr/files/vietocr/1.9/VietOCR-1.9.zip/download , (java vereist)
ocrgui: http://ocrgui.sourceforge.net/.
gscan2pdf: zit in je softwarebronnen kan zowel tesseract als cuneiform aan: selecteer de gewenste engine.
Heb je tesseract versie 3 aan de praat gekregen, dan moet je deze nog eerst trainen. Een 'voorgekauwd' nld-trainingsbestand kun je downloaden van http://code.google.com/p/tesseract-ocr/downloads/list en die zwier je dan als /usr/local/share/tessdata/nld.traineddata op je harde schijf.
Naast deze linux-oplossingen kun je ook nog je toevlucht zoeken tot windows-toepassingen die via wine-emulatie werken. Zo is er het gratis simple-ocr: http://www.simpleocr.com/ is er eentje die werkt. De scanner kan hij niet aansturen: dus eerst alles met xsane inscannen en opslaan als bmp-afbeelding. Daarna openen in simple-ocr en verwerken.
Tot anderhalf jaar terug had ik een oude readiris (versie 7.0) die perfect werkte onder wine. Het was een actie van een pc-blad waar je een cd-rom meekreeg en nog sleutel moest aanvragen. Nieuwe pc aangeschaft en vergeten over te zetten: ondertussen is de cd en de key weg... Nieuwere versies kan ik niet meer aan de praat krijgen met wine.
Wil je het commercieel (en dus betalend)dan kun je ook Abbyyocr voor linux aankopen maar dat is enkel terminal, geen grafische interface.
Een totaaloplossing die ik zelf niet heb uitgeprobeerd: http://www.archivista.ch/de/ Dat blijkt een geautomaseerd geheel te zijn maar zelf heb ik er geen ervaring mee.