3345905 ランダム
 HOME | DIARY | PROFILE 【フォローする】 【ログイン】

傀儡師の館.Python

傀儡師の館.Python

【毎日開催】
15記事にいいね!で1ポイント
10秒滞在
いいね! --/--
おめでとうございます!
ミッションを達成しました。
※「ポイントを獲得する」ボタンを押すと広告が表示されます。
x

PR

Recent Posts

Calendar

Keyword Search

▼キーワード検索

Category

Archives

2024.11
2024.10
2024.09
2024.08
2024.07
2024.06
2024.05
2024.04
2024.03
2024.02

Freepage List

Profile

kugutsushi

kugutsushi

Free Space

設定されていません。
2008.06.08
XML
カテゴリ:ことばの処理
協和発酵工業の「教えない教育」が眠れる能力を目覚めさせた を読む。この記事はおもしろい。

協和発酵工業では、シードウィン が開発した文章解析システム「文道」を使っているらしい。この文道を取り入れたシステム SAI日経産業新聞 2/7 社員の文章力 10秒で採点 の記事にもなっている。

体言率と用言率に注目し、統計データの分析から書き手のプロフィールを割り出す。「体言率」は「考える材料の多さ」を表し、用言率が高いと他人への命令が多いとか、「助詞・助動詞の使い方からは他人に対する配慮の度合いが分かる」などの特徴を利用しながら、文章を通して、研修のパフォーマンスをチェックするのだな。これはおもしろい。

研修は講義形式ではなく、自ら学ばせ、討論・発表というのが効果的なのは、新人研修などやっていると実感できるだろうけど、そこに留まらずに、もう一歩進んでいるところが偉いなと思った。安易なテストで効果を測定するのではなく、毎日書く活動報告を使って定量的な比較をするというのは良い視点だと思う。表面上の知識偏重にならないのがいい(まあ、そういうことも実際にはやるだろうけどバランスの問題として)。

知識偏重にならないようにと表面上、心がける会社は多いだろうが、実はこれが意外に難しいところがある。数値偏重の今日この頃、研修をやればそれを定量的に示さなければいけないという風潮がある。そうすると、どうしても安易に知識テストをすることになって、これが結果として知識偏重になってしまう。知識偏重でなければ、何をして測定するのか。その一つの答えとして、こうしたやり方はありだと思う。

さらに、同一の組織に所属する複数の人が書いた文章を解析すると、非常に似たパターンを示すという。人の思考傾向が、企業風土や企業文化といったものに一定の影響を受けていることを示唆する結果だ。

中途入社が多い、中小企業の場合は必ずしもそうならないだろうが、退職率が比較的低い安定した職場の場合は、その傾向が強まるだろう。また、定型化された文書をたくさん扱うようなところも、その傾向が強まるだろう。ある意味での洗脳というかスタイルの定着が起きる。「お役所文書」的なイメージを考えてみれば、お堅い会社ほど、文書の傾向も同じようになる。逆に、締め付けが弱いところはバラエティーが広がるだろうが、逆にそれが、一つの特徴になるのかもしれない。

天声人語風メーカー みたいなものを見ると、特徴的なものってあるのねぇ。特徴をつかむと、あたかも、そこが作り出したような文章を作ることができる。

特におもしろいのは、このあたり。企業でこうしたことを継続的にやっていると、どの程度妥当性があるかも判断しやすいから、おもしろいだろうなと思う。

例えば「リーダー」(低干渉・低指示型)と「マネジャー」(高干渉・高指示型)のどちらにより向いているのか、あるいは「物販営業」と「提案営業」のどちらにより適性があるか、といったことも明らかになる。何気なく書いた文章から、自分が気づいていなかった眠れる能力や適性が浮かび上がる、ということもありそうだ。

でもですよ、「同一の組織に所属する複数の人が書いた文章を解析すると、非常に似たパターンを示す」ということと、個別のプロファイリングというのは、ある意味、相反するところがあるとか思えないこともない。まあ、大枠としてみると似ているけれど、細かいレベルに着目すれば個性は出るということなんだろうけど。

ちなみに、

文章の内容に無関係に書き手が特定されるという点は筆跡鑑定に似ているが、手で文章を書く機会が激減した昨今、文章解析はネット時代の筆跡鑑定とも言えそうだ。

とかあるけれど、どうあがいても、筆跡鑑定のような高精度は出せるはずがない。まあ、この手の記事で、多々ある行き過ぎ表現ってやつだな。参考になるにしても、それで個人の特定が必ずしも成功するわけではないわけだし。だいたい、極端な成功例を持ち出してきてあたかもすごいようにサービスで書いちゃうんだよなぁ。

でも、まあ、この分野、盗用の検知が進んでいるから、そちらから切り崩してもおもしろいところがある。

コピペの論文を検出するとかは英国ですでにやっているようだし。たとえば、ラビン-カープ文字列検索アルゴリズム などを応用したものなどがあるのだろうか。

plagiarism で検索すると、英語学科からのお知らせ: 2007 レポート等での盗作(Plagiarism)について)Osaka Jogakuin College Writing Center: Plagiarism(無断盗用)要点の日本語説明 が見つかった。これは自動的にどうこうという話ではなくて、無断盗用を戒め、Plagiarismを避けるためにはどうしたらいいかの説明やリンクがある。上智大学のページには(リンクが切れているが)、plagiarism.org のリンクがあった。これはおもしろいリソース。

そこからさらに iThenticateturnitin など知る。

そういえば、NHK chairman apologizes for reporter's plagiarism とか検索すると出てくるな。NHK記者記事盗用:長野放送局長が視聴者に謝罪 /長野 の話。まあ、今の報道って、まともに取材しないで垂れ流しが多いから、だんだんと末端の社員がおかしくなっちゃってるのかもね。こういう社員が出ないような教育っていうのは、難しいねぇ。マスメディアは、恥をかかないように剽窃チェックのシステムが必要かもしれない。

その他、SAGraderCriterion (Criterion とは)のようにレポートを採点するようなシステムもあるようだ。

自然言語処理の世界って、まだまだこれからなところが多いから、応用システムもおもしろい分野が残されていると思う。ただし、地道で地味な分野だろうけど。でも、おもしろい。ちょっと違う話になってしまうが言葉の処理として、KiTT (KiTT とは)なども、おもしろいと思う。「感情」や「興味」に焦点をあてて、そこを自分らしさの基準とする。そして、似ている人と結びつけるといったコンセプトのようだ。残念ながら楽天ブログは、対応ブログ一覧に入っていないので、私は使えない。使えない。使えない。

ブログには、「感情」や「興味」が知らず知らずのうちに表れます。
KiTTでは、そんなブログの言葉を解析し、さまざまな「あなた」を読み取ります。
新しいブログを書けば、新しい「あなた」を発見できるかもしれません。
今のあなたに似た「知らない誰か」とつながることができるかもしれません。


さて、元にもどって、もし、会社の提携パターンの理想的なものと判断される文章パターンがあったとき、それにマッチする形の文章を書く人が理想的とされるかどうか。兵隊レベルではそれはそれでいいんじゃなかろうか。つまり、plagiarism のチェックにかけたときにパクリ度高しの人ほど、忠実な社員。ところが、そんな社員ばかりじゃ、やっぱり会社は沈滞するから、そうでない人、部分も必要。会社固有のモードやトーンを身につけた上で、自らのモードやトーンでも語れる人を作るとき、どういう形でチェックをかけるかというのはおもしろい課題でもあると思う。

要領がよいタイプの人は、会社固有のモードやトーンを素早く身につけるが、意外に自分の言葉で語ることができずにおもしろくなかったりすることもある。逆に、おもしろいけど会社のカラーに合っているか微妙なタイプの人もいたりするだろう。そういう人をどのくらいの割合で許容するのかもおもしろ課題。

なかのひと





お気に入りの記事を「いいね!」で応援しよう

Last updated  2008.06.08 15:22:00
コメント(0) | コメントを書く
[ことばの処理] カテゴリの最新記事



© Rakuten Group, Inc.
X