3285712 ランダム
 HOME | DIARY | PROFILE 【フォローする】 【ログイン】

傀儡師の館.Python

傀儡師の館.Python

【毎日開催】
15記事にいいね!で1ポイント
10秒滞在
いいね! --/--
おめでとうございます!
ミッションを達成しました。
※「ポイントを獲得する」ボタンを押すと広告が表示されます。
x

PR

Recent Posts

Calendar

Keyword Search

▼キーワード検索

Category

Archives

2024.06
2024.05
2024.04
2024.03
2024.02
2024.01
2023.12
2023.11
2023.10
2023.09

Freepage List

Profile

kugutsushi

kugutsushi

Free Space

設定されていません。
2008.05.01
XML
カテゴリ:ことばの処理
名古屋大学の 佐藤研究室日本語テキストの難易度を測る なるツールを公開しているのね。入力された文から難易度を判定して、1から13までのいずれかの値(小学(1年 - 6年)~大学)を出力してくれるというもの。

帯:日本語テキストの難易度推定 解説を読む。

新書の難易度推定 とか見てみると、

これらのグラフの形から推定される難易度の順番は、やさしい順に、 次のようになります。(上のグラフは、この順番に並んでいます。)

S2005sao - さおだけ屋はなぜ潰れないのか?
S2004com - コミュニケーション力
S1995net - インターネット
S1999ren - 日本語練習帳
S2006goo - Google 既存のビジネスを破壊する
S2005kok - 国家の品格
S2003bak - バカの壁
S1993sei - 「超」整理法
S2005kar - 下流社会
S2006web - ウェブ進化論
S2006tan - 他人を見下す若者たち
S1981sak - 理科系の作文技術

ふーむ。意外におもしろいかもしれない。

本プログラムは、rubyで書かれており、標準的なunix環境で動作します。

なので、あれこれ試してみるかなぁ。モデルのデータが入っているから、なんたらコーパスがないと動かないとかいう類のものじゃないのがよかったりするかも(新たにモデルを作るためのプログラムは同梱されてないから、独自の難易度モデルは作れないが)。

でも、ことば不思議箱基本慣用句五種対照表日本語基本語彙表JC2 みたいのが、実は地味で手間がかかってすごいなぁとか思う。

自然言語処理といえば 「国際電気通信基礎技術研究所(ATR)と内田洋行が語学教育の新会社を設立 ~ATR20年来の言語習得研究の成果を事業展開~ か。英語は「聞き取り」と「発音」から ATRと内田洋行、語学教育の新会社を設立 (@IT)。ATR はさんざん この手のこと やってきているからか。

Robovie-X みたいなこともやっていたのね。

そういえばそういえば、KH Coder”専門用語(キーワード)自動抽出システム”TermExtract が組み込まれたらしい。


なかのひと






お気に入りの記事を「いいね!」で応援しよう

Last updated  2008.05.02 05:32:09
コメント(0) | コメントを書く
[ことばの処理] カテゴリの最新記事



© Rakuten Group, Inc.