Google の日本語入力ツールを試してみた
遅ればせながら、日本語入力ソフトウェア「Google日本語入力ベータ」を試してみた。かな漢字変換プログラム「VJE」がWebで復活、ヤフーがAPIで無償提供 とかと違って、ローカルで動くソフトなので、入力したものが全部、サーバに送られちゃうということがないので安心して使ってみる。「Google日本語入力」開発者が語る、その狙いによると、辞書と統計的言語モデルの作成には、Googleの大規模分散処理システム「MapReduce」を活用。数千台規模のクラスターを使い、頻度の計算などを効率良く行うことができるという。膨大なWebデータ、優れたエンジニア、豊富な計算機資源という条件が新しいIMEを生んだことになる。現状の問題としては、ただ、「Webのありのまま」を反映した結果、語句の誤用例などがそのまま変換やサジェストに反映されてしまっている例が多いことも指摘されている。これは開発側も認識しており、「もしかして」で培った技術などを導入して修正する方法などを検討していく。ということのようだ。予測入力システム: PRIME と、MeCabの作者が出会えばこうなるようなぁといった感じ。さらに、Anthyとかの関係者も加わっているのか。以前、Google の日本語解析データで、大規模日本語 n-gram データの公開について、こういうのを発表することによって Google が「日本語でも」重要な位置を占めるんだぞといういいアピールになっている。自然言語処理とかやっている学生の Google 脂肪率がいちだんと跳ね上がるんじゃなかろうか。そして、こういうニュースが流れると、Google っていったって、所詮は日本語は日本の会社の方が得意でしょ、というイメージを打ち砕いていったりする。そういう意味でも一般のニュースにこうしたものが載っていくのはインパクトがある。から 2年たって、今度は日本語入力ツール。地道に成果をあげているのが偉い。完成度としては、変換精度の点から見るとまだまだって感じだが、それなりに使えるレベルにはなっている。でも、現状では、ATOK かなぁ。IMEの複文節での変換精度比較に、「くにはこくみんからおさめられたぜいきんでおさめられる」という例があるが、「国は国民から納められた税金で治められる」とか、最初に間違えるのはまだ許せるが、学習してくれないのはちょっとあれだな。何回も試してみたが、学習してくれない。。。。。とりあえず学習がちゃんと行われるようになるまでは遊び用。新語とかは、この手の日本語入力システムの話が出たとき、Wnn の話が出てこないのが気の毒だな。Windows版がなくなっちゃったから仕方ないか。Wnnの名前はこうしてついたのだなとかいう話を思い起こすと、松茸、WX、VJE――懐かしのFEPを思い出す 。VJEの歩み 萩原健バックス社長に聞く(1) みたいなものも眺めてみる。携帯電話では世界初となる形態素解析機能を追加し、予測入力機能を強化した最新バージョン「Advanced Wnn V2」 みたいなものがある。Wnn8 Linux/BSD もあるし、Solaris にもバンドルされているし、OpenSolaris でも使える。と書きつつ、ごめんね、Solaris では ATOK しか使っていないや。そのうち試してみようと思いつつ。。。。ところで Google 日本語入力は、ReactOS で動くんだろうか。 ReactOSを日本語化する、非公式ReactOS日本語版パッケージ配布所。仮に動いたとしても、日本語を、ちゃんと扱えるようになるまでには道のりは長いのだろうけど。「グーグルでないと作れない日本語入力ツールを作った」--Google日本語入力の狙い「Google日本語入力」開発者が語る、その狙い「Google 日本語入力」はATOKやMS-IMEを超えることはできるのか、実際に使って実用に堪えるかどうか試してみたグーグルの日本語入力参入は「ウェルカム」--ジャストシステム、一太郎2010など発表Google、高い変換精度と圧倒的な辞書を実現した日本語入力ソフト「Google 日本語入力」を公開ATOKとGoogle日本語入力、IMEを選ぶならどっち?MS-IMEから「ATOK 2009」に乗り換えて「これは使える!」と思った新機能トップ3Inside IME 2010, IME2010 パブリックベータ日本語入力プログラムについて考える日本語入力News - 日本語入力プログラムの最新ニュース、バージョンアップ情報ChaIMEの現状と将来と(1)ドッグフードは割とおいしい。-- ChaIME は続くよどこまでもChaIME: Stochastic Input Method Editor 大規模コーパスを用いた統計的仮名漢字変換