|
カテゴリ:ことばの処理
協和発酵工業の「教えない教育」が眠れる能力を目覚めさせた を読む。この記事はおもしろい。
協和発酵工業では、シードウィン が開発した文章解析システム「文道」を使っているらしい。この文道を取り入れたシステム SAI は 日経産業新聞 2/7 社員の文章力 10秒で採点 の記事にもなっている。 体言率と用言率に注目し、統計データの分析から書き手のプロフィールを割り出す。「体言率」は「考える材料の多さ」を表し、用言率が高いと他人への命令が多いとか、「助詞・助動詞の使い方からは他人に対する配慮の度合いが分かる」などの特徴を利用しながら、文章を通して、研修のパフォーマンスをチェックするのだな。これはおもしろい。 研修は講義形式ではなく、自ら学ばせ、討論・発表というのが効果的なのは、新人研修などやっていると実感できるだろうけど、そこに留まらずに、もう一歩進んでいるところが偉いなと思った。安易なテストで効果を測定するのではなく、毎日書く活動報告を使って定量的な比較をするというのは良い視点だと思う。表面上の知識偏重にならないのがいい(まあ、そういうことも実際にはやるだろうけどバランスの問題として)。 知識偏重にならないようにと表面上、心がける会社は多いだろうが、実はこれが意外に難しいところがある。数値偏重の今日この頃、研修をやればそれを定量的に示さなければいけないという風潮がある。そうすると、どうしても安易に知識テストをすることになって、これが結果として知識偏重になってしまう。知識偏重でなければ、何をして測定するのか。その一つの答えとして、こうしたやり方はありだと思う。
中途入社が多い、中小企業の場合は必ずしもそうならないだろうが、退職率が比較的低い安定した職場の場合は、その傾向が強まるだろう。また、定型化された文書をたくさん扱うようなところも、その傾向が強まるだろう。ある意味での洗脳というかスタイルの定着が起きる。「お役所文書」的なイメージを考えてみれば、お堅い会社ほど、文書の傾向も同じようになる。逆に、締め付けが弱いところはバラエティーが広がるだろうが、逆にそれが、一つの特徴になるのかもしれない。 天声人語風メーカー みたいなものを見ると、特徴的なものってあるのねぇ。特徴をつかむと、あたかも、そこが作り出したような文章を作ることができる。 特におもしろいのは、このあたり。企業でこうしたことを継続的にやっていると、どの程度妥当性があるかも判断しやすいから、おもしろいだろうなと思う。
でもですよ、「同一の組織に所属する複数の人が書いた文章を解析すると、非常に似たパターンを示す」ということと、個別のプロファイリングというのは、ある意味、相反するところがあるとか思えないこともない。まあ、大枠としてみると似ているけれど、細かいレベルに着目すれば個性は出るということなんだろうけど。 ちなみに、
とかあるけれど、どうあがいても、筆跡鑑定のような高精度は出せるはずがない。まあ、この手の記事で、多々ある行き過ぎ表現ってやつだな。参考になるにしても、それで個人の特定が必ずしも成功するわけではないわけだし。だいたい、極端な成功例を持ち出してきてあたかもすごいようにサービスで書いちゃうんだよなぁ。 でも、まあ、この分野、盗用の検知が進んでいるから、そちらから切り崩してもおもしろいところがある。 コピペの論文を検出するとかは英国ですでにやっているようだし。たとえば、ラビン-カープ文字列検索アルゴリズム などを応用したものなどがあるのだろうか。 plagiarism で検索すると、英語学科からのお知らせ: 2007 レポート等での盗作(Plagiarism)について) と Osaka Jogakuin College Writing Center: Plagiarism(無断盗用)要点の日本語説明 が見つかった。これは自動的にどうこうという話ではなくて、無断盗用を戒め、Plagiarismを避けるためにはどうしたらいいかの説明やリンクがある。上智大学のページには(リンクが切れているが)、plagiarism.org のリンクがあった。これはおもしろいリソース。 そこからさらに iThenticate や turnitin など知る。 そういえば、NHK chairman apologizes for reporter's plagiarism とか検索すると出てくるな。NHK記者記事盗用:長野放送局長が視聴者に謝罪 /長野 の話。まあ、今の報道って、まともに取材しないで垂れ流しが多いから、だんだんと末端の社員がおかしくなっちゃってるのかもね。こういう社員が出ないような教育っていうのは、難しいねぇ。マスメディアは、恥をかかないように剽窃チェックのシステムが必要かもしれない。 その他、SAGrader や Criterion (Criterion とは)のようにレポートを採点するようなシステムもあるようだ。 自然言語処理の世界って、まだまだこれからなところが多いから、応用システムもおもしろい分野が残されていると思う。ただし、地道で地味な分野だろうけど。でも、おもしろい。ちょっと違う話になってしまうが言葉の処理として、KiTT (KiTT とは)なども、おもしろいと思う。「感情」や「興味」に焦点をあてて、そこを自分らしさの基準とする。そして、似ている人と結びつけるといったコンセプトのようだ。残念ながら楽天ブログは、対応ブログ一覧に入っていないので、私は使えない。使えない。使えない。
さて、元にもどって、もし、会社の提携パターンの理想的なものと判断される文章パターンがあったとき、それにマッチする形の文章を書く人が理想的とされるかどうか。兵隊レベルではそれはそれでいいんじゃなかろうか。つまり、plagiarism のチェックにかけたときにパクリ度高しの人ほど、忠実な社員。ところが、そんな社員ばかりじゃ、やっぱり会社は沈滞するから、そうでない人、部分も必要。会社固有のモードやトーンを身につけた上で、自らのモードやトーンでも語れる人を作るとき、どういう形でチェックをかけるかというのはおもしろい課題でもあると思う。 要領がよいタイプの人は、会社固有のモードやトーンを素早く身につけるが、意外に自分の言葉で語ることができずにおもしろくなかったりすることもある。逆に、おもしろいけど会社のカラーに合っているか微妙なタイプの人もいたりするだろう。そういう人をどのくらいの割合で許容するのかもおもしろ課題。 お気に入りの記事を「いいね!」で応援しよう
Last updated
2008.06.08 15:22:00
コメント(0) | コメントを書く
[ことばの処理] カテゴリの最新記事
|