甲斐です。

On 2006/01/28, at 21:00, Yukio USUDA wrote:


> 臼田です
>
> Yasuaki Kai wrote:
>
>
>> 2. 動作チェック(3)の結果について
>> 手元の html ファイルをもとに Namazu 2.0.15RC5  
>> 使って
>> みました。
>> 検索はちゃんとできていますが、「著者: 不明」となってし 
>> まいま
>> した。
>> 著者に html ファイル中の LINK タグの mailto:
>> 以下の部分を表示
>> させたいのですが。 Namazu 2.0.14_3 を Easy Package
>> からインス
>> トールしていたときにはうまく表示されていました。
>> <LINK REV=MADE HREF="mailto:[EMAIL PROTECTED]">
>>
>>
>
> tests/data/ja/html.html を下記のように修正して
> 試してみたところ
>
---

> 1. Namazu のテスト (スコア: 26)
> 著者: [EMAIL PROTECTED]
> 日付: Sat, 28 Jan 2006 20:52:31 +0900
> Namazu のテスト Namazu は手軽に使えることを第一に目指し 
> た日本語全文検索システムです。このファイルはテスト用です。
>
> となりちゃんと著者が表示できました。
> 2.0.15 からは html 文書の中に
> <META NAME="AUTHOR" CONTENT="author">
> があるとそちらの内容が優先されるように変更されているので
>
> <META NAME="AUTHOR" CONTENT="">
> というように著者名が空になった行が混ざっていると
> 「不明」になることがあるようにも思えます。
>
> 対象となるファイルに <META NAME="AUTHOR" という行は入っ 
> ていないでしょうか
>

namazu による検索に利用した HTML ファイルはメールデータの 
テキ
ストファイルを MHonArc で変換したものですが、ソースを確認 
して
みると下記二つとも含まれるようになっていました。

<META NAME="AUTHOR" CONTENT="author">
<LINK REV=MADE HREF="mailto:[EMAIL PROTECTED]">

ただ、一方だけが含まれるようにしてみましたが、結果は同じでし
た。著者は不明なままで、サブジェクトはファイル名となりました。

どうも MHonArc 形式の HTML ファイルになっていること 
に原因があ
るようです。実際、下記に示す HTML ファイルの冒頭の1 
行を削除す
ると、著者、サブジェクトを表示するようにはなりました。ただ、
要約部分にナビゲーション用のデータなども表示してしまいます。
多分、通常の text/html として認識されるため、namazu  
のフィル
タで余分な部分が除去されないためだと思います。

Namazu 2.0.15RC5 の動作確認の意味からは、素の 2.0.14 の結 
果と
比較すべきだと思いますが、それは別途行うとして、以下に私のと
ころで試してみた結果を書いてみました。
過去の記事を調べてみると、類似の現象について書かれたものもあ
りましたが、私には具体的な対応がよく分かりませんでした。

------------------------------------------------------------
■メールのデータファイル
※「From [EMAIL PROTECTED]
   入れています。

 From [EMAIL PROTECTED]
Date: Sun, 1 Jan 2006 00:30:19 +0900
From: Taro <[EMAIL PROTECTED]>
Subject: MHonArc と Namazu の連携
To: Hoge ML <[EMAIL PROTECTED]>

mhonarc による HTML ファイル作成と
mknmz によるインデックス作成


 From [EMAIL PROTECTED]
Date: Mon, 2 Jan 2006 04:47:14 +0900
From: Jiro <[EMAIL PROTECTED]>
Subject: Re: MHonArc と Namazu の連携
To: [EMAIL PROTECTED]

namazu により検索:
「著者: 不明」、サブジェクトがファイル名になる。

------------------------------------------------------------
■MHonArc によって作成された HTML ファイル  
(msg00000.html)
<!-- MHonArc v2.6.15 -->
<!--X-Subject: MHonArc と Namazu の連携 -->
<!--X-From-R13: Fneb <gnebNsbb.one.be.wc> -->
<!--X-Date: Sun, 1 Jan 2006 00:30:19 +0900 -->
<!--X-Message-Id:  
[EMAIL PROTECTED]&#45;ID&#45;FOUND.mhonarc.org -->
<!--X-Content-Type: text/plain -->
<!--X-Head-End-->
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML//EN">
<HTML>
<HEAD>
<TITLE>MHonArc と Namazu の連携</TITLE>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=ISO-2022- 
JP">
<LINK REV="made" HREF="mailto:[EMAIL PROTECTED]">
</HEAD>
<BODY>
<!--X-Body-Begin-->
<!--X-User-Header-->
<!--X-User-Header-End-->
<!--X-TopPNI-->
<hr>
[Date Prev][<a href="msg00001.html">Date Next</a>][Thread Prev][<a  
href="msg00001.html">Thread Next</a>][<a  
href="maillist.html#00000">Date Index</a>][<a  
href="threads.html#00000">Thread Index</a>]
<!--X-TopPNI-End-->
<!--X-MsgBody-->
<!--X-Subject-Header-Begin-->
<h1>MHonArc と Namazu の連携</h1>
<hr>
<!--X-Subject-Header-End-->
<!--X-Head-of-Message-->
<ul>
<li><em>To</em>: Hoge ML &lt;<a href="mailto:hoge% 
40foo.bar.or.jp">[EMAIL PROTECTED]</a>&gt;</li>
<li><em>Subject</em>: MHonArc と Namazu の連携</li>
<li><em>From</em>: Taro &lt;<a href="mailto:taro% 
40foo.bar.or.jp">[EMAIL PROTECTED]</a>&gt;</li>
<li><em>Date</em>: Sun, 1 Jan 2006 00:30:19 +0900</li>
</ul>
<!--X-Head-of-Message-End-->
<!--X-Head-Body-Sep-Begin-->
<hr>
<!--X-Head-Body-Sep-End-->
<!--X-Body-of-Message-->
<pre>mhonarc による HTML ファイル作成と
mknmz によるインデックス作成</pre>
<!--X-Body-of-Message-End-->
<!--X-MsgBody-End-->
<!--X-Follow-Ups-->
<hr>
<!--X-Follow-Ups-End-->
<!--X-References-->
<!--X-References-End-->
<!--X-BotPNI-->
<ul>
<li>Next by Date:
<strong><a href="msg00001.html">Re: MHonArc と Namazu の連 
携</a></strong>
</li>
<li>Next by thread:
<strong><a href="msg00001.html">Re: MHonArc と Namazu の連 
携</a></strong>
</li>
<li>Index(es):
<ul>
<li><a href="maillist.html#00000"><strong>Date</strong></a></li>
<li><a href="threads.html#00000"><strong>Thread</strong></a></li>
</ul>
</li>
</ul>

<!--X-BotPNI-End-->
<!--X-User-Footer-->
<!--X-User-Footer-End-->
</body>
</html>

------------------------------------------------------------
■namazu による検索結果
$ namazu --early Namazu index
検索結果

参考ヒット数:  [ Namazu: 2 ]

検索式にマッチする 2 個の文書が見つかりました。

1. msg00000.html (スコア: 33)
著者: 不明
日付: Sun, 01 Jan 2006 00:30:19 +0900
mhonarc による HTML ファイル作成と mknmz によるイン 
デックス作成
/Users/kai/html/msg00000.html (2,198 bytes)



2. msg00001.html (スコア: 34)
著者: 不明
日付: Mon, 02 Jan 2006 04:47:14 +0900
namazu により検索: 「著者: 不明」、サブジェクトが 
ファイル名になる。
/Users/kai/html/msg00001.html (2,196 bytes)



現在のリスト: 1 - 2

------------------------------------------------------------
■msg00000.html の先頭行を削除して namazu で検索した 
結果
$ namazu --early Namazu index
検索結果

参考ヒット数:  [ Namazu: 2 ]

検索式にマッチする 2 個の文書が見つかりました。

1. MHonArc と Namazu の連携 (スコア: 36)
著者: [EMAIL PROTECTED]
日付: Sun, 01 Jan 2006 00:30:19 +0900
MHonArc と Namazu の連携 [Date Prev][Date Next][Thread  
Prev][Thread Next][Date Index][Thread Index] To: Hoge ML  
<[EMAIL PROTECTED]> Subject: MHonArc と Namazu の連携  
From: Taro <[EMAIL PROTECTED]>
/Users/kai/html/msg00000.html (2,170 bytes)



2. msg00001.html (スコア: 34)
著者: 不明
日付: Mon, 02 Jan 2006 04:47:14 +0900
namazu により検索: 「著者: 不明」、サブジェクトが 
ファイル名になる。
/Users/kai/html/msg00001.html (2,196 bytes)



現在のリスト: 1 - 2
------------------------------------------------------------
Yasuaki KAI, [EMAIL PROTECTED]

_______________________________________________
Namazu-users-ja mailing list
Namazu-users-ja@namazu.org
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja

メールによる返信