| Hier können sie Live nach Begriffen suchen. Das Programm sucht in einer kleinen Datenbank nach Treffern. | Sie erhalten eine Liste aller Webseiten, die ihre(n) Such-Begriffe im Titel oder in den Stichworten enthalten. |
IT-Anwendung
|
|
Dokumentation |
| Suche | Live-Suche nach Themen-Seiten dieses Webs | |
| Programmierung | dieser Webseite | |
| Verwandte Themen | SiteMap: Hierarchische Liste der Webseiten |
Suche |
|
|
Zeit zur Herstellung dieser dynamischen Webseite am Server:
0.055 Sekunden
|
Zeit zum Aufbau dieser Webseite durch ihr Browser-Programm:
? Sekunden
|
Programmierung dieser Seite |
|
|
Die Live-Suche wurde so optimiert, dass sie in kurzer Zeit ein Ergebnis liefert
und dabei den Server so wenig wie möglich belastet. Prinzipiell sind 2 Verfahren üblich: ● In kleineren Webs durchsucht man für jeden einzelnen Such-Auftrag den Quelltext aller Webseiten mit einem Programm (Java, Perl, PHP, Python, ...). Das funktioniert erstaunlich rasch, meist <1 Sekunde. Der große Vorteil: Das Programm ist relativ einfach und reagiert automatisch auf jede Veränderung der Webseiten. Man verwendet eine Funktion, die rekursiv alle Verzeichnisse und (Text)-Dateien des Webs durchforstet (Beispiel mit → Perl, → PHP). Der Text wird zeilenweise analysiert, am besten mit → Regulären Ausdrücken. Wenn man nur Titel und <meta>-Elemente analysieren will, dann kann man die Suche nach jedem </head>-Element abbrechen. |
●
Für alle größeren Webs verwendet man eine Datenbank (hier
→
MySQL). Das gesamte Web wird regelmäßig oder bei Bedarf mit einem Programm durchforstet, ähnlich wie links beschrieben. Alle potentiellen Stichworte werden in der Datenbank gespeichert. Das dauert für dieses Web (ca. 1000 Text-Dateien) einige Sekunden und wird bei jeder Änderung (typisch 1x / Woche) durchgeführt. Für jeden Such-Auftrag wird die Datenbank durchsucht: Das dauert typisch nur wenige Millisekunden. Im Zweifel verlagert man möglichst viel Arbeit zum SQL-Server, der normalerweise wesentlich schneller als ein Programm (Perl, PHP, ...) arbeitet. |