[Namazu-users-ja 1228] Re: Windows7 へのnamazuのインストール

2011-07-11 スレッド表示 Tasamasa Teranishi
寺西です。

Namazu for Windows のことは namazu-win32-users...@namazu.org
メーリングリストをご利用ください。

http://www.namazu.org/ml.html#namazu-win32-users-ja

(2011/07/12 3:58), 小田切亘 wrote:
> 以下、同フォルダーにある「README-ja.txt」に従い作業しました。

まずは、そのファイルをしっかり読みましょう。
全てのことはそこに書かれているはずです。
-- 
=
寺西 忠勝(TADAMASA TERANISHI)  yw3t-t...@asahi-net.or.jp
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E
___
Namazu-users-ja mailing list
Namazu-users-ja@namazu.org
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja


[Namazu-users-ja 1227] Windows7 へのnamazuのインストール

2011-07-11 スレッド表示 小田切亘
小田切といいます

「複数の条件の検索」のスレッドでは、折角寺西さまから、懇切丁寧なコメントをい
ただきながら、力量不足で未消化の部分が多くて、面目ありません。

[Namazu-users-ja 1225] Re: 複数の条件の検索
にて、寺西さまから、いままで友人が使用していたのは、pnamazuであるとご指摘を
いただきました。

いままでインデックス作成は友人のPC(WindowsXP)上で行っていましたが、遅ればせ
ながら、我が家のWindows7へのnamazuのインストールを再挑戦しました。
友人もnamazuは初挑戦で、「perlのバージョンは5.8.xでないと、namazuは使えな
い」と聞き、perl5.8.8を探すのに苦労されたようです。
「何を今更」とお思いかもしれませんが、こちらのスレッドも、よろしくご指導お願
いいたします。
【質問1】下記の「nmz2.0.20.001-win32.zip」では、5.8.xでなく、最新の5.12.4で
差し支えないのでしょうか。

環境は自作PCでOSはWindows7 Pro、開発ツールはVisual Studio 2008 Pro(日本
語)、.NET Framework3.5SP1で、VB2008の使用経験はありますが、C++は初めてです。

perlは「ActivePerl-5.12.4.1205-MSWin32-x86-294981.msi」を実行し、c:\perlへイ
ンストールして、パスを通しました。
「nmz2.0.20.001-win32.zip」を解凍し、c:\nmz2.0.20.001-win32へコピーしまし
た。
以下、同フォルダーにある「README-ja.txt」に従い作業しました。

3.「Libiconv-1.12-ja-4.zip」を解凍し、c:\libiconv-1.12にコピー、コマンドライ
ンでnmakeを実行しました。
4.「gettext-0.13.1.zip」を解凍し、c:\gettext-0.13.1にコピー、コマンドライン
でnmakeを実行しました。
5. http://www.namazu.org/index.html.ja#downloadのページで
 「namazu-2.0.20.tar.gz (1,393,165 byte)」をクリックしたら、保存先に
「namazu-2.0.20.tar.tar」という、1,393,165 byteのファイルが得られました。
【質問2】保存ファイルは拡張子がgzでなく、tarとなりましたが、問題ないのでしょ
うか。

 Tar解凍は経験がなかったので、フリー解凍ソフト、Woopie.ZIPをインストールし
ました。
 「namazu-2.0.20.tar.tar」に2回の解凍を施して得た結果を、C:\ namazu-2.0.20
にコピーしました。
 念の為、解凍結果は5,300,978byte ファイル数: 597、フォルダー数: 34です。
6.「このアーカイブを解凍して得られたmsvcディレクトリ」と書かれているのが、よ
く理解できませんでしたが、
 c:\nmz2.0.20.001-win32 の中のmscvディレクトリをC:\ namazu-2.0.20にコピー
しました。
【質問3】mscvディレクトリの理解はこれで良かったでしょうか

7.Visual Studio を起動し、「ファイル」「ファイルを開く」から
c:\namazu-2.0.20\mscv\namazu.sinを開きました。
 するとVisual Studio変換ウィザードがでて、自動変換が行われましたが、エラー
はありませんでしたが、下記の3パターンで、全部で5個の警告が出ました。
 ログ表示 http://ikiiki.main.jp/UpgradeLog.XML.GIF
【質問4】これらの警告は無視して良いのでしょうか

8.警告を無視して、ソリューションエクスプローラで、namazuプロジェクトを選択
し、「ビルト」メニューの「ソリューションのビルト」を実行したら、3つの警告と
30の致命的エラーがでました。
エラー表示 http://ikiiki.main.jp/BuiltError.GIF
対象ファイルこそいろいろですが、内容は上記の2つのパターンです。
Windows7の検索で、「libintl.h」を検索したら、73ファイルから参照されているの
に、このような名前のファイルもディレクトリも見つかりませんでした。
【質問5】何故見つからないか、3項のやり方に問題があったのでしょうか。
【質問6】C++によるコンパイルなど行わないで、Windows7にnamazuをインストールす
る方法があれば、ご教示ください。
【質問7】本題から外れますが、
・テキストまたは画像ファイルを添付することは差し支えありませんか、その場合の
容量の制限は?
・HTML形式にして、簡単な画像を挿入することは差し支えありませんか

-Original Message-
From: namazu-users-ja-boun...@namazu.org
[mailto:namazu-users-ja-boun...@namazu.org] On Behalf Of Tasamasa Teranishi
Sent: Monday, July 11, 2011 10:35 PM
寺西さま>
>いや、pnamazu ですね。これは。--

___
Namazu-users-ja mailing list
Namazu-users-ja@namazu.org
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja


[Namazu-users-ja 1226] Re: 複数の条件の検索

2011-07-11 スレッド表示 Tasamasa Teranishi
寺西です。

(2011/07/07 6:56), 小田切亘 wrote:
> namazu.cgiは改行が省かれているので、終わりの方の検索結果表示をカスタマイ
> ズするのに、沢山改行記号を挿入して、ようやく把握できました。

pnamazu では、ちゃんと人が読みやすいソースコードがあって、
それを1つのファイルにまとめたのが namazu.cgi になっています。

まとめる時にできるだけサイズを小さくした方が読み込み速度も上がり
ますし、メモリ使用量も減るので実行に不要な改行コードや空白などが
削られています。
それを読もうとしているのですから、そりゃ読みにくいです。

元ソースを読んだり、カスタマイズした後、まとめなおしたものを
使いましょう。
-- 
=
寺西 忠勝(TADAMASA TERANISHI)  yw3t-t...@asahi-net.or.jp
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E
___
Namazu-users-ja mailing list
Namazu-users-ja@namazu.org
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja


[Namazu-users-ja 1225] Re: 複数の条件の検索

2011-07-11 スレッド表示 Tasamasa Teranishi
寺西です。

(2011/07/08 5:53), 小田切亘 wrote:
> という事で、perlでは書かれていますが、pnamazuではありませんでした。

いや、pnamazu ですね。これは。

$Pnamazu = '2006.12.23';

って入っているし。

> nmz2014beta.exe
> が適当でなかったのでしょうか。「本家のNamazu」の意味を教えて頂けるとありがた
> いです。

本家の Namazu は、http://www.namazu.org/ のもので、
namazu.cgi は実行形式のファイルになります。
絶対に Perl では書かれていません。


で、pnamazu だと先の話があまり当てはまらないような気がします。
-- 
=
寺西 忠勝(TADAMASA TERANISHI)  yw3t-t...@asahi-net.or.jp
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E
___
Namazu-users-ja mailing list
Namazu-users-ja@namazu.org
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja


[Namazu-users-ja 1224] Re: 巨大なPDFのインデクシング

2011-07-11 スレッド表示 Yukio USUDA
臼田です。

namazu-devel-ja 向きなので、そちらに移しましょう。


On 2011/07/09, at 21:10, Shigekazu Aoyagi wrote:

> 
> 100MBを越えるPDFをインデクシングしようとすると、mknmzがメモリ不足を
> 起こすという現象がありました。
> mknmzを追いかけてみたところ、830行目の次のところで落ちていました。
> 
>$mtype_m = $Magic->checktype_magic($$contref)
>  if ((! defined $mtype_c) ||
>  $mtype_c =~
>  /^(text\/html|text\/plain|application\/octet-stream)$/);
> 
> ファイル全体を $confref に読み込み、checktype_magic() にコピーで渡して
> 更に File::Magic 内でもコピーで渡されてという処理を繰り返している内に
> メモリ使用量が爆発してしまったようです。

$Magic->checktype_magic() ではファイル先頭の magic data を
チェックしているのでファイルの全体は必要ありません。
また、
$Magic->checktype_data() 内では受け取った値の 先頭部分を
切りとってから使用しています。

なので、mknmz から File::MMagic には先頭部分だけを渡せば
十分と思われます。

$ diff -u scripts/mknmz.org scripts/mknmz
--- scripts/mknmz.org   2011-07-11 21:21:23.0 +0900
+++ scripts/mknmz   2011-07-11 21:24:04.0 +0900
@@ -824,10 +824,11 @@
} elsif (defined $mmtype) {
$mtype = $mmtype;
} else {
+   my $truncatedcont = substr($$contref, 0, 0x8564);
my $mtype_n = $Magic->checktype_byfilename($cfile);
-   my $mtype_c = $Magic->checktype_data($$contref);
+   my $mtype_c = $Magic->checktype_data($truncatedcont);
my $mtype_m;
-   $mtype_m = $Magic->checktype_magic($$contref) 
+   $mtype_m = $Magic->checktype_magic($truncatedcont) 
  if ((! defined $mtype_c) ||
  $mtype_c =~ 
  /^(text\/html|text\/plain|application\/octet-stream)$/);


といった感じでいかがでしょうか。

臼田幸生

___
Namazu-users-ja mailing list
Namazu-users-ja@namazu.org
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja