Archive for 2008年1月10日

漢字の誤字を生成する誤字ェネレータ

Posted on 1月 10, 2008. Filed under: API |

誤字ェネレータを作った (polog)
漢字を与えるとその誤字になりそうな漢字を出力してくれるAPI。

サンプルレスポンス:
http://goji.polog.org/api/get.json?sentence=六本木&rate=1

アルゴリズムはこちらに書かれている。Rubyのコードが載っている。事前に常用漢字1945文字の全ペアに対して、類似度を求めているようだ。あくまで機械的に画像のピクセル単位の一致度を計算しているので、「機械」と「機会」のような誤字は出力されない。
漢字を類似度検索可能にする (polog)

広告
全文フィードを読む | Make a Comment ( None so far )

Liked it here?
Why not try sites on the blogroll...