ドイツ語のOCRを探しました。
何がしたいかと言うと、例のヴェーバーの「経済と社会 旧稿」を折原浩先生の仮説に基づいた順番に並べ直し、更に「理解社会学のカテゴリー」を頭につけて、Web上で提供したいのです。元になるドイツ語テキストとして、Weber im KontextというCD-ROMのテキストが使えますが、一部誤植があるとのことです。また現在刊行中の「全集」で校閲の結果テキストが変わっている可能性があります。このため、
(1)「全集」の紙をスキャナーで画像化し、OCRでドイツ語テキストに変換する。
(2)(1)で変換したテキストとCD-ROMのテキストをdiffなどを使って差分を取る。
ということを行いたいのです。
取り敢えずググって出てきた
https://convertio.co/ja/ocr/german/
のは、試してみたら、箸にも棒にもかからない変換結果でNGでした。
それで製品版ということでABBYY Fine Readerのお試し版を使ってみましたが、これもかなり変換ミスはあるものの、スペルチェッカーを併用することで、まあまあいけるんじゃないかと思い、これを買いました。2万円。
http://finereader.add-soft.jp/