甲斐です。 On 2006/01/28, at 21:00, Yukio USUDA wrote:
> 臼田です > > Yasuaki Kai wrote: > > >> 2. 動作チェック(3)の結果について >> 手元の html ファイルをもとに Namazu 2.0.15RC5 >> 使って >> みました。 >> 検索はちゃんとできていますが、「著者: 不明」となってし >> まいま >> した。 >> 著者に html ファイル中の LINK タグの mailto: >> 以下の部分を表示 >> させたいのですが。 Namazu 2.0.14_3 を Easy Package >> からインス >> トールしていたときにはうまく表示されていました。 >> <LINK REV=MADE HREF="mailto:[EMAIL PROTECTED]"> >> >> > > tests/data/ja/html.html を下記のように修正して > 試してみたところ > --- > 1. Namazu のテスト (スコア: 26) > 著者: [EMAIL PROTECTED] > 日付: Sat, 28 Jan 2006 20:52:31 +0900 > Namazu のテスト Namazu は手軽に使えることを第一に目指し > た日本語全文検索システムです。このファイルはテスト用です。 > > となりちゃんと著者が表示できました。 > 2.0.15 からは html 文書の中に > <META NAME="AUTHOR" CONTENT="author"> > があるとそちらの内容が優先されるように変更されているので > > <META NAME="AUTHOR" CONTENT=""> > というように著者名が空になった行が混ざっていると > 「不明」になることがあるようにも思えます。 > > 対象となるファイルに <META NAME="AUTHOR" という行は入っ > ていないでしょうか > namazu による検索に利用した HTML ファイルはメールデータの テキ ストファイルを MHonArc で変換したものですが、ソースを確認 して みると下記二つとも含まれるようになっていました。 <META NAME="AUTHOR" CONTENT="author"> <LINK REV=MADE HREF="mailto:[EMAIL PROTECTED]"> ただ、一方だけが含まれるようにしてみましたが、結果は同じでし た。著者は不明なままで、サブジェクトはファイル名となりました。 どうも MHonArc 形式の HTML ファイルになっていること に原因があ るようです。実際、下記に示す HTML ファイルの冒頭の1 行を削除す ると、著者、サブジェクトを表示するようにはなりました。ただ、 要約部分にナビゲーション用のデータなども表示してしまいます。 多分、通常の text/html として認識されるため、namazu のフィル タで余分な部分が除去されないためだと思います。 Namazu 2.0.15RC5 の動作確認の意味からは、素の 2.0.14 の結 果と 比較すべきだと思いますが、それは別途行うとして、以下に私のと ころで試してみた結果を書いてみました。 過去の記事を調べてみると、類似の現象について書かれたものもあ りましたが、私には具体的な対応がよく分かりませんでした。 ------------------------------------------------------------ ■メールのデータファイル ※「From [EMAIL PROTECTED] 入れています。 From [EMAIL PROTECTED] Date: Sun, 1 Jan 2006 00:30:19 +0900 From: Taro <[EMAIL PROTECTED]> Subject: MHonArc と Namazu の連携 To: Hoge ML <[EMAIL PROTECTED]> mhonarc による HTML ファイル作成と mknmz によるインデックス作成 From [EMAIL PROTECTED] Date: Mon, 2 Jan 2006 04:47:14 +0900 From: Jiro <[EMAIL PROTECTED]> Subject: Re: MHonArc と Namazu の連携 To: [EMAIL PROTECTED] namazu により検索: 「著者: 不明」、サブジェクトがファイル名になる。 ------------------------------------------------------------ ■MHonArc によって作成された HTML ファイル (msg00000.html) <!-- MHonArc v2.6.15 --> <!--X-Subject: MHonArc と Namazu の連携 --> <!--X-From-R13: Fneb <gnebNsbb.one.be.wc> --> <!--X-Date: Sun, 1 Jan 2006 00:30:19 +0900 --> <!--X-Message-Id: [EMAIL PROTECTED]-ID-FOUND.mhonarc.org --> <!--X-Content-Type: text/plain --> <!--X-Head-End--> <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML//EN"> <HTML> <HEAD> <TITLE>MHonArc と Namazu の連携</TITLE> <META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=ISO-2022- JP"> <LINK REV="made" HREF="mailto:[EMAIL PROTECTED]"> </HEAD> <BODY> <!--X-Body-Begin--> <!--X-User-Header--> <!--X-User-Header-End--> <!--X-TopPNI--> <hr> [Date Prev][<a href="msg00001.html">Date Next</a>][Thread Prev][<a href="msg00001.html">Thread Next</a>][<a href="maillist.html#00000">Date Index</a>][<a href="threads.html#00000">Thread Index</a>] <!--X-TopPNI-End--> <!--X-MsgBody--> <!--X-Subject-Header-Begin--> <h1>MHonArc と Namazu の連携</h1> <hr> <!--X-Subject-Header-End--> <!--X-Head-of-Message--> <ul> <li><em>To</em>: Hoge ML <<a href="mailto:hoge% 40foo.bar.or.jp">[EMAIL PROTECTED]</a>></li> <li><em>Subject</em>: MHonArc と Namazu の連携</li> <li><em>From</em>: Taro <<a href="mailto:taro% 40foo.bar.or.jp">[EMAIL PROTECTED]</a>></li> <li><em>Date</em>: Sun, 1 Jan 2006 00:30:19 +0900</li> </ul> <!--X-Head-of-Message-End--> <!--X-Head-Body-Sep-Begin--> <hr> <!--X-Head-Body-Sep-End--> <!--X-Body-of-Message--> <pre>mhonarc による HTML ファイル作成と mknmz によるインデックス作成</pre> <!--X-Body-of-Message-End--> <!--X-MsgBody-End--> <!--X-Follow-Ups--> <hr> <!--X-Follow-Ups-End--> <!--X-References--> <!--X-References-End--> <!--X-BotPNI--> <ul> <li>Next by Date: <strong><a href="msg00001.html">Re: MHonArc と Namazu の連 携</a></strong> </li> <li>Next by thread: <strong><a href="msg00001.html">Re: MHonArc と Namazu の連 携</a></strong> </li> <li>Index(es): <ul> <li><a href="maillist.html#00000"><strong>Date</strong></a></li> <li><a href="threads.html#00000"><strong>Thread</strong></a></li> </ul> </li> </ul> <!--X-BotPNI-End--> <!--X-User-Footer--> <!--X-User-Footer-End--> </body> </html> ------------------------------------------------------------ ■namazu による検索結果 $ namazu --early Namazu index 検索結果 参考ヒット数: [ Namazu: 2 ] 検索式にマッチする 2 個の文書が見つかりました。 1. msg00000.html (スコア: 33) 著者: 不明 日付: Sun, 01 Jan 2006 00:30:19 +0900 mhonarc による HTML ファイル作成と mknmz によるイン デックス作成 /Users/kai/html/msg00000.html (2,198 bytes) 2. msg00001.html (スコア: 34) 著者: 不明 日付: Mon, 02 Jan 2006 04:47:14 +0900 namazu により検索: 「著者: 不明」、サブジェクトが ファイル名になる。 /Users/kai/html/msg00001.html (2,196 bytes) 現在のリスト: 1 - 2 ------------------------------------------------------------ ■msg00000.html の先頭行を削除して namazu で検索した 結果 $ namazu --early Namazu index 検索結果 参考ヒット数: [ Namazu: 2 ] 検索式にマッチする 2 個の文書が見つかりました。 1. MHonArc と Namazu の連携 (スコア: 36) 著者: [EMAIL PROTECTED] 日付: Sun, 01 Jan 2006 00:30:19 +0900 MHonArc と Namazu の連携 [Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index] To: Hoge ML <[EMAIL PROTECTED]> Subject: MHonArc と Namazu の連携 From: Taro <[EMAIL PROTECTED]> /Users/kai/html/msg00000.html (2,170 bytes) 2. msg00001.html (スコア: 34) 著者: 不明 日付: Mon, 02 Jan 2006 04:47:14 +0900 namazu により検索: 「著者: 不明」、サブジェクトが ファイル名になる。 /Users/kai/html/msg00001.html (2,196 bytes) 現在のリスト: 1 - 2 ------------------------------------------------------------ Yasuaki KAI, [EMAIL PROTECTED] _______________________________________________ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja