野宮です.

ご面倒をお掛けし,申し訳ありません.m(_ _)m

In the Message; 

  Subject    : [Namazu-users-ja 1061] Re: gcnmz が非常な時間を要するようになった
  Message-ID : 
<[&#x30E1;&#x30FC;&#x30EB;&#x30A2;&#x30C9;&#x30EC;&#x30B9;&#x4FDD;&#x8B77;]>
  Date & Time: Sun, 06 Apr 2008 22:23:27 +0900

[寺西さん] == Tadamasa Teranishi 
<[&#x30E1;&#x30FC;&#x30EB;&#x30A2;&#x30C9;&#x30EC;&#x30B9;&#x4FDD;&#x8B77;]> 
has written:

小生>> 愕然としています.インデックスファイルのサイズが違い過ぎる,と.

寺西さん> やっと、

^^;;;

寺西さん>> たぶん、インデックスのサイズがその前後で随分変わったんではないかと
寺西さん>> 思いますよ。

寺西さん> この話に戻ってきましたが、だから gcnmz の処理時間が何倍にもなった
寺西さん> のでしょう。

寺西さん> という話を最初の方から言っているわけですけど...。

....<(_ _)>

小生の保有するファイル群の場合,</html>タグ以下を無視する,というFilterでは
駄目で,Content-Type: image/* なマルチパートを無視するというFilterにしなけ
ればならないようです.
つまり,ファイルに拠っては,元記事が複数ページに亘る,即ち,

<html>
<body>
本文1
</body>
</html>

<html>
<body>
本文2
</body>
</html>

Content-Type: image/*
[...]

という形式のものがあるからです.

全て 1ページなら -h オプションを使えるのですが.

ともあれ,Content-Type: image/* を無視するFilterが mailnews.pl にあるという
ところまでは解りました.
精進しなければ.....

---
  野宮  賢             mail-to: nomiya @ galaxy.dti.ne.jp
  
    「私たちが今日直面している化学物質の危険性に関する疑問に対し、通常の
     科学的な正確さをもって答えようとすれば、たぶんさらに数十年を要するで
     あろう。」                                      -- J. V. Rodricks --
_______________________________________________
Namazu-users-ja mailing list
Namazu-users-ja@namazu.org
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja

メールによる返信