3290360 ランダム
 HOME | DIARY | PROFILE 【フォローする】 【ログイン】

傀儡師の館.Python

傀儡師の館.Python

【毎日開催】
15記事にいいね!で1ポイント
10秒滞在
いいね! --/--
おめでとうございます!
ミッションを達成しました。
※「ポイントを獲得する」ボタンを押すと広告が表示されます。
x

PR

Recent Posts

Calendar

Keyword Search

▼キーワード検索

Category

Archives

2024.06
2024.05
2024.04
2024.03
2024.02
2024.01
2023.12
2023.11
2023.10
2023.09

Freepage List

Profile

kugutsushi

kugutsushi

Free Space

設定されていません。
2006.10.29
XML
カテゴリ:ことばの処理
KH Coder を少し使い込んでみようかと、まず、チュートリアルをやってみることにした。一通りやってみる。Excel の等高線グラフって、今まで使ったことがなかった。等高線グラフに表すと分かりやすくなることもあるんだなぁと本筋でないところで関心する。KH Coder の結果をペースとしてメニュー一発で表示できるようになっているお手軽さはいい。

チュートリアル自体は親切に書かれているので順に試していけば、特に苦労することもなく操作の基本が理解できるようになっている。地道にテキストを分析していくのであれば十分な機能だと思うが、コーディングルールは作るのが面倒。作業的には力技だけれども、そこに恣意性が入り込む。主体的な操作であれば問題ないが、この手順でやるとあまりたくさんのテキストを分析するのは辛いかな。1つのテキストを読み込むタイプのマイニングにはよいが、複数のテキスト間の差異に着目する場合は、この恣意性が問題になると思う。もっとも、KH Coder が使うデータはデータベースに入っているのだから、自分であれこれ考えて作ればよいということでもあるが。

ざっと使った感じ、けっこう使えるなという印象。よくできている。次はマニュアルを見ながらもう少し詳しい使い方を覚えることにする。

参考

モーニング娘のアルバムに含まれる歌詞の頻出単語は、KH Coder を使ったおもしろい例。コーディングルールを使っての集計もやっている。「恋愛」と「接触を伴う愛情表現」等、ルールを作って集計した結果などもおもしろい。なるほど、こういう遊び方ができるのね、という感じ。

RankWordなる文書中の頻出語を抽出するソフトがあるのも知る。これは簡単に単語をカウントできるツール。トップテンの単語をカウントして、その単語が含まれる行を取り出すことができる。使い方は簡単だが簡単なことしかできない。軽いノリでどんな単語が多く使われているかチェックしたい程度の用途にしか使ない。KH Coder があれば不要。形態素解析をやっていないようなので文字列の単純マッチのカウントという点では正確な数は出せるだろうが。

東京経済大学 情報システム課の PC教室のソフトの追加,バージョンアップのお知らせ に KH Coder や KWIC Finder が登場している。パソコン教室 ソフトウェアの紹介。こういうものを使った授業でもあるんだろうか。SPSSや SAS、AMOS その他、統計・解析・シミュレーションの分類に入っている。ぱっとマイニング なるものもあるのだな。これ特許情報を対象としたものか。特許調査業務を効率化するためのもの のようで、ぱっとマイニングのマニュアルを見ると、形態素解析は茶筅、辞書は IPA辞書を使っているようだ。ちなみにフリーソフト版はもう公開されていない。横浜市立大学でも情報ネットワーク ニュース No.6を見ると KH Coder 等インストールしているな。どういう授業で使っているんだろうか。








お気に入りの記事を「いいね!」で応援しよう

Last updated  2006.10.29 11:33:11
コメント(0) | コメントを書く
[ことばの処理] カテゴリの最新記事



© Rakuten Group, Inc.