Dieses spezielle Relevanzbewertungs-Verfahren wurde im Jahr 2000 im Rahmen eines Projektes im Auftrag von T-Nova (heute T-Systems) zur Entwicklung einer Suchmaschine für das Intranet der Deutschen Telekom von Helmut Hoffer von Ankershoffen (neofonie), Oliver Kai Paulus (neofonie), Marc Ewert (neofonie) und Dr. Thomas Hoppe (T-Nova) entwickelt. Das einst Besondere an dem Verfahren ist die Art und Weise der Auswertung von Links: Hypertext-Dokumente werden hier in der Indexierungs-Komponente von Suchmaschinen ausgewertet, womit eine wesentlich höhere Qualität und damit Relevanz der Ergebnistreffer erreicht werden konnte.
Das erfindungsgemäße Verfahren läuft in drei Phasen ab. In der so genannten Aufbauphase liefert das Robotersystem Hypertext-Dokumente an den Indexserver. Der Indexserver analysiert daraufhin den Inhalt der Dokumente nach verschiedenen Gesichtspunkten und es wird ein partieller Relevanzwert vorausberechnet. Mit unterschiedlichen Gewichtungswerten für Ankertexte, Phrasen und unterschiedliche Textmarkierungen ist die Relevanzbewertungsfunktion parametrisierbar und damit flexibel konfigurierbar. In der zweiten Phase, der Aktualisierungsphase, werden die Dokumente, deren Inhalt sich seit dem letzten Besuch verändert hat, zunächst aus dem Dokumenten-Index entfernt und die betroffenen Term-Einträge aktualisiert. Sofern das veränderte Dokument weiterhin verfügbar ist, wird es, den Arbeitsschritten der Aufbauphase entsprechend, wieder in den Index eingefügt. Diese Verfahrensweise hat den Vorteil, dass ein Dokument, solange es sich nicht verändert hat, nur einmal über das Netz von einem anderen Server geladen und nicht lokal gespeichert werden muss. Darüber hinaus können auch Verweise auf Dokumente, die selber noch nicht geladen und analysiert wurden, in den Index aufgenommen werden. Die partielle Vorausberechnung der Relevanzwerte minimiert zudem ihre Bestimmung zum Anfragezeitpunkt. In der dritten Phase, der Anfragephase, werden dann, in Abhängigkeit vom verwendeten Anfrage-Typ (z.B. komplexe Anfrage oder Phrasen-Anfrage), die Dokumente aus dem Index ermittelt, in denen die gesuchten Begriffe enthalten sind. Für jedes gefundene Dokument wird der eigentliche Relevanzwert aus den vorausberechneten Relevanzwertanteilen, der zum Anfragezeitpunkt vorliegenden Anzahl an Verweisen auf das Dokument sowie der Gesamtanzahl der Dokumente im Index zum Relevanzwert des Dokuments berechnet.
Patentinhaber sind die neofonie Technologieentwicklung und Informationsmanagement GmbH und die Deutsche Telekom AG. Das Patent ist unter dem Aktenzeichen 10029644 beim Patent- und Markenamt der Bundesrepublik Deutschland unter https://dpinfo.dpma.de/... einzusehen.