Hinweise für die Suche in FMSO-Beiträgen

dies ist nur ein Anfang, also immermal wieder reinschauen! ;-)

Aktuell 19.07.2008: Für die Umlaute wurde eine "Umgehung" gefunden, es gibt schlichtweg keine mehr. Die Suchbegriffe werden entsprechend umgearbeitet. Die Originalbeiträge sind unverändert (die Suche hat einen eigenen Datenbestand).

Ein paar allgemeine Tips und Hintergründe

Tips zur Benutzung der Suche

Bitte nutzt die Kombinationsmöglichkeiten der Suchmaschine!
Wenn Ihr wisst, von wem ihr einen Beitrag sucht, schreibt den Namen oder einen Teil davon ins Eingabefeld "Autor"!
Ihr sucht einen Beitrag vom letzten Monat? Datum eingrenzen sind höchstes acht Klicks ;-)
Wichtig: Die Suchmaschine sucht nur nach Worten, sie besitzt keinerlei Intelligenz und ist keine Fragen-beantwort-Maschine!
Suchbegriffe wie "Alte Dieselmotoren mit Speiseöl betreiben" oder "bei welchen fahrzeugen ist es möglich" (alles echte Beispiele!) bringen bestimmt kein brauchbares Ergebnis.
"Renault Kangoo" bringt nur Treffer, in denen beide Worte vorkommen. "Kangoo" ist zielführender (dito "Opel Omega", "VW Golf" etc.).
"Pöl" als Suchbegriff bringt wenig (oder viel, je nach Sichtweise :-)

Was geht noch nicht oder ist geplant:
- Zusammenhängende Texte ala "PRG hat gewonnen" ;-) - "unscharfe" Suche, es werden also bestimmbar viele "Fehler" zugelassen - Wertung der Beiträge - Ausdehnung der Suche auf poelwiki.de und andere relevante Foren

Zu den Optionen:

- Großschreibung beachten: standardmäßig wird Groß/Kleinschreibung nicht unterschieden (ronny=Ronny=roNNY...), das kann hier umgeschalten werden.
- ich möchte alle Treffer finden: hier wird die Beschränkung auf die ersten 500 Treffer abgeschalten. Soviele Beiträge liest aber kaum jemand. Besser also die Suchkriterien verfeinern! Wer aber zu irgndwas eine vollständige Recherche braucht kann das nutzen. Es wird wirklich bis zum bitteren Ende gesucht, entsprechend lange kann das dauern!
- auch als Wortteil: in der Grundeinstellung findet "test" z.B. auch "hattest und "weitestgehend" ("pierro" findet verdächtig oft "Klopapierrolle" ;-), das kann hier umgeschalten werden, dann werden nur noch Suchbegriffe als ganze Worte gefunden ("filter" findet dann aber "filtern" nicht mehr!)

Hintergründe

Die Suche läuft grob folgendermassen ab:
- Initialisierung, Auswertung der Eingaben etc.
- Suche nach den Suchbegriffen, schon eingegrenzt nach Datum
- Das Ergebnis wird nach den Autoren durchsucht
- Ausgabe der Ergebnisseiten
Dabei werden die jeweiligen Zwischenergebnisse auf der Festplatte gespeichert. Einfach, weil es sehr große Datenmengen sind, die nicht mehr vollständig im Arbeitsspeicher zu halten sind. Nebeneffekt ist, dass die Zwischenergebnisse wiederverwendet werden können.
Beim Abruf der zweiten Ergebnisseite wird also aus der vorhandenen Datei nur die nächsten 20 (50/100) Treffer ausgelesen und formatiert.
Da der benötigte Festplattenplatz beschränkt werden muss, wird stündlich alles gelöscht, was seit (z. Z.) drei Stunden nicht mehr gelesen wurde. Das ist auch nötig, weil sonst aktuelle Beiträge nicht mit gefunden würden.

Das Suchprogramm sucht in einem eigenen Datenbestand, der unabhängig vom Forum ist und regelmässig (z. Z. einmal in der Nacht) aktualisiert wird.

Die Dauer der eigentlichen Suche (zweiter Anstrich) hängt hauptsächlich von der Anzahl der Treffer ab. Auch das ist ein Grund, besser genauere Begriffe und Kombinationen zu verwenden. "Filter" dauert recht lange, es werden etwa 60.000 Treffer gefunden. Und wer kann mit dem Ergebnis was anfangen? "Filter Golf", "Filter Feinheit" oder "Filterkopf" sind, je nach gesuchter Information, nützlicher.

Da wir auf einem virtuellen Server sind, müssen wir uns mit den anderen Nutzern arrangieren. In unserem Fall heisst das, dass täglich ab etwa 23:30 bis (sehr unterschiedlich) etwa 00:30 die Serverbelastung extrem steigt. Normaler Forumsbetrieb ist ohne Einschränkung möglich, aber sobald die Suche benutzt wird, wirds deutlich langsamer, weil ein anderer Nutzer um diese Zeit vermutlich viele Festplattenzugriffe ausführt.
Wir arbeiten daran, das noch zu optimieren.