Hallo!

> folgendes problem: ich bin dabei, eine volltextsuche f�r eine 
> website zu bauen. diese suche funktioniert soweit, l�uft �ber 
> das dateisystem, ich hab aber noch zwei, drei sachen, wo ich 
> nicht so recht weiter weiss. vielleicht kann mir hier wer 
> helfen? w�re eine tolle sache.

Allgemeines:

Volltextsuche und das vorherige Indizieren der Seiten belastet den
Rechner. Schon deshalb verwenden viele Webseiten daf�r eigene Rechner
oder fremde Dienstleistungen wie z. B. die von Google oder AltaVista.
Vielleicht schaust Du Dir den Service von Google erst einmal an und
pr�fst, ob das nicht eine schnelle und kosteng�nstige L�sung ist. Die
externe L�sung empfiehlt sich m. E. vor allem f�r Webseiten, deren
Datenbank nicht �ber Volltext-Such-Funktionen verf�gen (z. B. Access,
...).

Ansonsten w�rde ich f�r die Volltextsuche ausschlie�lich die
Index-Server f�r das Dateisystem und f�r SQL Server einsetzen. 

> 1. die seiten, die durchsucht werden sollen, sind asp seiten, 
> die per include noch einen seitenkopf einbinden bzw. die 
> teilweise noch asp code enthalten. wenn ich nun eine suche 
> �ber das dateisystem starte, dann werden nat�rlich auch diese 
> codezeilen gefunden, was ich nicht m�chte. frage: wie filter 
> ich am besten und effektivsten diese elemente (kommentare, 
> html tags, asp code) raus, sodass wirklich nur mehr der 
> eigentliche text durchsucht wird?

Der Index-Dienst kann (und sollte !!!) seine Arbeit auf bestimmte
Verzeichnisse beschr�nken. Wenn die Include-Dateien in einem separaten
Verzeichnis liegen, hilft das. Das Indexieren von Quellcode bringt
dagegen eine Menge Probleme. HTML geht da noch, weil man die Tags und
die Attribute ja im Index-Dienst ausschlie�en kann, aber VBScript /
JavaScript? Entweder nutzt Du hier ausschlie�lich den Index-Dienst des
SQL-Server oder Du indexierst nicht den Quellcode sondern das Ergebnis,
also HTML, wie es der Service von Google ja auch machen w�rde. Die mit
ASP erzeugten Seiten k�nnten dazu f�r die Indexierung in einem eigenen
Verzeichnis abgelegt werden und mit einem entsprechenden Meta-Tag
versehen werden, das f�r die Ausgabe wieder auf die Original-Asp-Seiten
umleitet. So etwas macht z. B. Amazon, was zur Folge hat, dass alle
einzelnen Buchtitel - obwohl sie aus einer Datenbank kommen - immer
direkt in allen m�glichen Suchmaschinen gefunden werden.

> 2. ideal w�re, wenn ich f�r jede zeile einen titel eingeben 
> k�nnte, der dann bei den suchergebnissen angezeigt wird. das 
> kann aber (nachdem der seitenkopf per include eingef�gt wird) 
> nur �ber einen kommentar oder asp passieren. wie kann ich 
> diesen titel am besten einbauen und dann bei der suche wieder 
> auslesen?
> 
> 3. hatte auch mal den gedanken, die suche �ber indexserver zu 
> l�sen. frage
> dazu: ist das gescheit, wenn man eigentlich nur asp seiten 
> hat und aus den einzelnen dateien noch informationen 
> rausfiltern m�chte, sodass diese infos bei der suche nicht 
> aufscheinen?

Wenn der Content �berwiegend aus der Datenbank kommt, dann nutze
unbedingt den Index-Dienst des SQL-Server. Hier kannst Du definieren,
welche Spalten in welchen Tabellen indexiert werden und bei der Ausgabe
kannst Du einen Titel aus der Datenbank beziehen. Dar�ber hinaus kannst
Du gewichtet suchen, also z. B. einem Treffer in einer �berschrift mehr
Bedeutung zumessen als einem Treffer im Flie�text.

Auf jeden Fall w�rde ich die Volltextsuche ohne Index mit "WHERE ...
LIKE '%...%'" innerhalb des normalen Betriebs einer Website vermeiden.
Bei entsprechend gro�en Datenmengen blockiert so etwas mitunter die
ganze Website.

Freundliche Gr��e
Joachim van de Bruck


| [aspgerman] als [email protected] subscribed
| http://www.aspgerman.com/archiv/aspgerman/ = Listenarchiv
| Sie k�nnen sich unter folgender URL an- und abmelden:
| http://www.aspgerman.com/aspgerman/listen/anmelden/aspgerman.asp

Antwort per Email an