【Vine Linux】IdeaPad U350 & Vine 5.0 苦闘録その4
【Vine Linux】IdeaPad U350 & Vine 5.0 苦闘録その4apache2 + namazu-cgiでローカルディレクトリに保存した学術論文のPDFファイルを管理・整理して、全文検索可能にしておき、PC上で読む。これがやりたいがためにノートパソコンにlinuxを入れたといっても過言ではない。それがVine 4.2までは楽勝だったのに、Vine 5.0になってえらくめんどくさくなってしまった。apache2まずhttpdはapache2である。設定ファイルが小分けされていていちいちうざいのだが、ともかくこれをとってきておく。defaultのhome directoryは/var/www//var/www/html の下にpdfというディレクトリをつくって、その中に論文pdfファイルをいれておく。namazuがいないapt-get install namazuapt-get install namazu-cgiapt-get install tknamazunamazu-cgiのdefaultのindex directoryは /usr/share/namazu/indexなので要注意。/var/namazu/indexではない。ちなみにpdfを全文検索するときのmknmzrc設定は以下のとおり package conf; # Don't remove this line! $HTML_SUFFIX = "html?|[ps]html|html\\.[a-z]{2}"; $ALLOW_FILE = ".*\\.(?:$HTML_SUFFIX)|.*\\.txt" . # HTML, plain text "|.*\\.gz|.*\\.Z|.*\\.bz2" . # Compressed files "|.*\\.pdf|.*\\.PDF" . # PDF "|.*\\.doc|.*\\.xls" . # Word, Excel "|\\d+|[-\\w]+\\.[1-9n]"; # Mail/News, man $SEARCH_FIELD = "message-id|subject|from|date|uri|newsgroups|to|summary|size"; %FIELD_ALIASES = ('title' => 'subject', 'author' => 'from'); $NON_SEPARATION_ELEMENTS = 'A|TT|CODE|SAMP|KBD|VAR|B|STRONG|I|EM|CITE|FONT|U|'. 'STRIKE|BIG|SMALL|DFN|ABBR|ACRONYM|Q|SUB|SUP|SPAN|BDO'; $ON_MEMORY_MAX = 5000000000; $FILE_SIZE_MAX = 16000000000000; $TEXT_SIZE_MAX = 1600000000000; $WORD_LENG_MAX = 2048; %Weight = ( 'html' => { 'title' => 16, 'h1' => 8, 'h2' => 7, 'h3' => 6, 'h4' => 5, 'h5' => 4, 'h6' => 3, 'a' => 4, 'strong' => 2, 'em' => 2, 'kbd' => 2, 'samp' => 2, 'var' => 2, 'code' => 2, 'cite' => 2, 'abbr' => 2, 'acronym'=> 2, 'dfn' => 2, }, 'headers' => 8, # for Mail/News' headers ); $MAX_FIELD_LENGTH = 900;$NKF = "module_nkf"; $KAKASI = "module_kakasi -ieuc -oeuc -w";$WAKATI = $KAKASI;mknmzrcを適宜編集しておく。重要なのはReplaceのところ。Replace /var/www/ http://localhost/というふうにしておく localhostじゃなくて別のホスト名などをいれると、インターネット越しに他のPCからもこのPCのディレクトリのPDFファイルが見れて便利だが、publicに公開すると著作権違反になってしまうので、そういう使いかたは禁止。/usr/share/namazu/filter/pdf.plを編集する@pdfconvopts = ('-q', '-raw')