漢字の誤字を生成する誤字ェネレータ

Posted on 1月 10, 2008. Filed under: API |

誤字ェネレータを作った (polog)
漢字を与えるとその誤字になりそうな漢字を出力してくれるAPI。

サンプルレスポンス:
http://goji.polog.org/api/get.json?sentence=六本木&rate=1

アルゴリズムはこちらに書かれている。Rubyのコードが載っている。事前に常用漢字1945文字の全ペアに対して、類似度を求めているようだ。あくまで機械的に画像のピクセル単位の一致度を計算しているので、「機械」と「機会」のような誤字は出力されない。
漢字を類似度検索可能にする (polog)

広告

Make a Comment

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中

Liked it here?
Why not try sites on the blogroll...

%d人のブロガーが「いいね」をつけました。