|
カテゴリ:ことばの処理
名古屋大学の 佐藤研究室 が 日本語テキストの難易度を測る なるツールを公開しているのね。入力された文から難易度を判定して、1から13までのいずれかの値(小学(1年 - 6年)~大学)を出力してくれるというもの。
帯:日本語テキストの難易度推定 解説を読む。 新書の難易度推定 とか見てみると、
ふーむ。意外におもしろいかもしれない。
なので、あれこれ試してみるかなぁ。モデルのデータが入っているから、なんたらコーパスがないと動かないとかいう類のものじゃないのがよかったりするかも(新たにモデルを作るためのプログラムは同梱されてないから、独自の難易度モデルは作れないが)。 でも、ことば不思議箱 の 基本慣用句五種対照表 や 日本語基本語彙表JC2 みたいのが、実は地味で手間がかかってすごいなぁとか思う。 自然言語処理といえば 「国際電気通信基礎技術研究所(ATR)と内田洋行が語学教育の新会社を設立 ~ATR20年来の言語習得研究の成果を事業展開~ か。英語は「聞き取り」と「発音」から ATRと内田洋行、語学教育の新会社を設立 (@IT)。ATR はさんざん この手のこと やってきているからか。 Robovie-X みたいなこともやっていたのね。 そういえばそういえば、KH Coder に ”専門用語(キーワード)自動抽出システム” の TermExtract が組み込まれたらしい。 お気に入りの記事を「いいね!」で応援しよう
Last updated
2008.05.02 05:32:09
コメント(0) | コメントを書く
[ことばの処理] カテゴリの最新記事
|