漢字の誤字を生成する誤字ェネレータ
誤字ェネレータを作った (polog)
漢字を与えるとその誤字になりそうな漢字を出力してくれるAPI。
サンプルレスポンス:
http://goji.polog.org/api/get.json?sentence=六本木&rate=1
アルゴリズムはこちらに書かれている。Rubyのコードが載っている。事前に常用漢字1945文字の全ペアに対して、類似度を求めているようだ。あくまで機械的に画像のピクセル単位の一致度を計算しているので、「機械」と「機会」のような誤字は出力されない。
漢字を類似度検索可能にする (polog)
コメントを残す