(moved to http://tmasada.cocolog-nifty.com/blog/)
自作中国語分かち書きプログラム,公開中
結局,Chinese word segmentationは,自分で考えていたアイディアがうまくいかなかったので,その部分を削除して,単なる中国語分かち書き器として自分の仕事用Webサイトで公開中です.

ただ・・・SIGHANの四種類のデータセットのうち,なぜか,Academia Sinicaについてだけ,良い性能が出なくなってしまいました.他のデータセットについては,まあ良い性能が出てるので,公開してます.しかも,ソースファイルをそのまま公開.というのも,訓練用と,テスト用で,それぞれファイル一個しかないですから.
[PR]
by tmasada2 | 2009-01-26 16:25 | らららルルル
<< 靜茹&情歌 / 梁靜茹 いい歌い手は本能的に共有する >>