MOJIZO(木簡・くずし字解読システム)…そして

古文書の崩し字、あなたも読めます 画像から似た字検索
ようやく、こういうシステムが登場したかという感じ。ずいぶん前から早くできないかなあと思っていましたし、いろんな人に早く作ってよと言ってきたんです。
まあ、私が望む、文脈も加味して一瞬で1ページ分活字体に直しちゃう!というのには程遠いけれども、最初の一歩ということで。
実際、これだけでもずいぶん便利になりましたよ。
私もずいぶん古文書を読む練習をしてきましたが、どうも長続きしないというか、どんどん忘れちゃう。くずし字字典で探すのも一苦労。
幸いに、私が対面しているアヤシイ地方文書群は、とりあえず近代の産物のようなので、ほとんど崩されていません。だから直接読める。ちょっとだけ変体仮名を覚えればいい程度。
しかし、一般に古文書、特に近世地方文書となると、たいがいがくずし字のオンパレードで、一部の好事家…なんて言うと失礼ですね、真面目な研究者、奇特な郷土史研究家のおじいちゃまくらいしか、スラスラとは読めない。
しかし、昔の人は読んで書いていたわけですから、つまりは記号としてかなりの一般性というか、規則性を持っていたわけで、それは現代の人よりも、現代の機械(コンピュータ)の方が得意分野なはずです。
そう思っていたので、上記の要望をその道の専門家の方に陳情していたわけです。
さてさて、上の画像は、さっそく「酒」というくずし字を読み込ませてみた結果です。
お〜!ちゃんと「酒」が第一位に表示されている。それも平城宮の木簡ですか(笑)。そこまで行かなくてもいいのに。
要は、くずし字字典に載っているサンプルをデータ化して…と思ったら、スミマセン、実はもうちゃんと開発されていましたね。今知りました(笑)。さすが凸版印刷さん。
「凸版印刷、江戸期以前のくずし字を高精度でテキストデータ化する新方式OCR技術を開発
~江戸期以前のくずし字が80%以上の精度でOCR処理可能に~」
これですよ。私が望んでいたのは。8割の判別成功率か。まあまあでしょうね。文脈までは加味されていないようですから、まだまだこれから進化する余地はあると思います。
どんな分野もそうですが、こうしてAIが進歩しますと、それこそ好事家さんや奇特なおじいちゃまたちは絶滅してしまうのでしょうかね。
| 固定リンク
「パソコン・インターネット」カテゴリの記事
- AIで創る「新しいバロック音楽」(2025.05.14)
- 『Baby, I Love You』by Suno AI v4.5(2025.05.07)
- 『Tokyo Jazz』by Suno AI v4.5(2025.05.04)
- 格安Bluetoothイヤホン(2025.04.26)
- iPhone 16e(2025.04.21)
「ニュース」カテゴリの記事
- 追悼 大宮エリーさん(2025.04.28)
- 福知山線脱線事故から20年(2025.04.24)
- YMOと仲小路彰(2025.03.13)
- 日向灘M7.1発生〜南海トラフ地震臨時情報(巨大地震注意)(2024.08.08)
- オリンピックは◯◯の◯◯である!?(2024.08.07)
「書籍・雑誌」カテゴリの記事
- 『宗良親王信州大河原の三十年〜東海信越南北朝編年史』 松尾書店(2025.05.19)
- 『皆神山オカルト学序説 -ピラミッド説・皇居移転計画・カゴメ紋解析-』 長尾 晃(2025.05.02)
- 『だっこがしたい足くん』 そうた (Clover出版)(2025.04.29)
- 追悼 大宮エリーさん(2025.04.28)
- 国語便覧(第一学習社)(2025.04.25)
「文化・芸術」カテゴリの記事
- 光明寺さん(小山市)で思う(2025.05.23)
- 榮山寺のカオスとコスモス(2025.05.22)
- 吉野〜南朝の幻影(2025.05.21)
- 『超国宝』展 (奈良国立博物館)(2025.05.20)
- 私的「大鹿村騒動記」(2025.05.18)
「文学・言語」カテゴリの記事
- 岡崎市円山の神明宮と古墳群(2025.05.24)
- 古文訳J-POP(有隣堂しか知らない世界)(2025.05.12)
- 「ドアを閉めます」(名鉄)(2025.05.10)
- 能『杜若』(2025.05.01)
- 追悼 大宮エリーさん(2025.04.28)
「歴史・宗教」カテゴリの記事
- 乙姫さま降臨(2025.05.26)
- 岡崎市円山の神明宮と古墳群(2025.05.24)
- 光明寺さん(小山市)で思う(2025.05.23)
- 榮山寺のカオスとコスモス(2025.05.22)
- 吉野〜南朝の幻影(2025.05.21)

コメント