3280106 ランダム
 HOME | DIARY | PROFILE 【フォローする】 【ログイン】

傀儡師の館.Python

傀儡師の館.Python

【毎日開催】
15記事にいいね!で1ポイント
10秒滞在
いいね! --/--
おめでとうございます!
ミッションを達成しました。
※「ポイントを獲得する」ボタンを押すと広告が表示されます。
x

PR

Recent Posts

Calendar

Keyword Search

▼キーワード検索

Category

Archives

2024.06
2024.05
2024.04
2024.03
2024.02
2024.01
2023.12
2023.11
2023.10
2023.09

Freepage List

Profile

kugutsushi

kugutsushi

Free Space

設定されていません。
2007.07.01
XML
カテゴリ:ことばの処理
以前に 日本語係り受け解析器 CaboCha/南瓜: Yet Another Japanese Dependency Structure Analyzer を Python から使うのに、ctypes で CaboCha を使って玉砕 (2003/11/29) したが、2005-12-24の cabocha 0.53 を使ってあらためてやり直したらうまく動くようになっていた。パスを通していないと libyamcha.dll が見つからないとエラーが出るが、インストールしたディレクトリをパスに追加したら問題なく使えた。

from ctypes import *
lib=cdll.LoadLibrary("c:/Program Files/cabocha/bin/libcabocha.dll")
lib.cabocha_new2.restype = c_void_p
lib.cabocha_new2.argtypes = [c_char_p, c_char_p]
lib.cabocha_sparse_tostr.restype = c_char_p
c = lib.cabocha_new2('-f1', 'c:/Program Files/cabocha/bin/libcabocha.dll')
print lib.cabocha_sparse_tostr(c, "今日は元気だ。")

* 0 1D 0/1 0.00000000
今日 キョウ 今日 名詞-副詞可能 B-DATE
は ハ は 助詞-係助詞 O
* 1 -1O 0/1 0.00000000
元気 ゲンキ 元気 名詞-形容動詞語幹 O
だ ダ だ 助動詞 特殊・ダ 基本形 O
。 。 。 記号-句点 O
EOS

でもって、形態素解析は mecab を使いたいので、'-f1' のオプションのところは、'-f1 -amecab' としてみる。が、それだと None が返って解析ができない。コマンドラインから 「cabocha -f1 -amecab' だとちゃんと解析できるので何がいけないのかな。。。。

とりあえず、その問題は先送りにしておき、先に進める。特におもしろいことではないが、文節ごとに出力してみる。


s = lib.cabocha_sparse_tostr(c, "太郎は大きい学校へ行った。").split("\n")
b = []
for l in s[:-1]:
l = l.split()
if l[0] in ["*", "EOS"]:
print "".join(b)
b = []
else:
b.append(l[0])

太郎は
大きい
学校へ
行った。






お気に入りの記事を「いいね!」で応援しよう

Last updated  2007.07.02 01:47:41
コメント(0) | コメントを書く
[ことばの処理] カテゴリの最新記事



© Rakuten Group, Inc.