ICCE2008が始まるということで,ポスター発表する予定の自分の研究を,ここ2週間で,一から再検討しました.条件付き確率場の自作プログラムの作り直しから,実験のやり直しから・・・.そしたら,ベースラインの性能が良くなってしまいました.まぁ,カナ文字列のセグメンテーションが性能良くできればいいので,良いは良いのですが,自分の手案手法が・・・・・・戻ってきてから,さらに再検討です.下図は,mecabが出力した読み仮名を正解だと思ってCRFで学習させて,テスト用のカナ文字列をセグメンテーションさせてみた結果です.縦棒が単語の切れ目のつもり.