|
Webmaster Forum Suchmaschinenoptimierung Webpromotion Webdesign
 |
Alexa Internet-Archiv mit Volltextsuche |
 |
Verfasst am: 04.09.2003, 14:15 |
|
|
| Caschi |
| Administrator |

|
| |
| Anmeldungsdatum: 03.01.2003 |
| Beiträge: 6700 |
| Wohnort: Big City R :-) |
|
|
 |
 |
 |
|
Alexa Internet-Archiv mit Volltextsuche:
Das Internet-Archiv bewahrt Webseiten seit 1996 auf. Mit der Volltextsuche ergibt sich eine neue Qualität, den Bereich der Waybackmachine zu durchsuchen.
Zunächst sind im Index mehr als 11 Milliarden Webseiten erfasst. Die derzeit grössten Internet-Suchmaschinen wie Google und AllTheWeb bieten hingegen einen Index der (nur) knapp über 3 Milliarden Webseiten enthält. Dennoch stellen die 11 Milliarden Webseiten nur ein Teil des gesamten Datenbestandes der Waybackmachine dar.
weiterlesen: http://www.at-web.de/alexa/recall.htm |
|
|
|
|
 |
Die Such-Zeitmaschine |
 |
Verfasst am: 05.09.2003, 10:33 |
|
|
| Caschi |
| Administrator |

|
| |
| Anmeldungsdatum: 03.01.2003 |
| Beiträge: 6700 |
| Wohnort: Big City R :-) |
|
|
 |
 |
 |
|
Die Such-Zeitmaschine
quelle: http://www.heise.de/newsticker/data/jk-05.09.03-000/
| Zitat: | Das in San Francisco ansässige Internet Archive hat jetzt mit einem Beta-Test seiner neuen Suchmaschine namens Recall begonnen. Recall ermöglicht es, insgesamt 11 Milliarden archivierte Webseiten nach Stichwörtern zu durchsuchen. Der Gesamt-Datenbestand umfasst nach Angaben der Recall-Entwicklerin Anna Patterson 0,5 Petabytes. Der Suchindex ist demnach bereits 2 Terabytes groß. Bisher lassen sich erst Seiten ab dem Januar 1996 durchsuchen. Innerhalb dieses Zeitraums kann die Suche jedoch beliebig zeitlich eingeschränkt und präzisiert werden.
Recall unterscheidet sich fundamental von anderen Suchmaschinen, da es seinen Index nicht anhand der Verlinkungshäufigkeit einer Website bewertet. Stattdessen werden die Suchergebnisse durch Bewertung des Kontexts angeordnet, in dem sie auf der jeweiligen Seite genannt werden. Außerdem wird erstmals auch die Popularität eines Suchbegriffs zeitlich ausgewertet. So zeigt eine Grafik an, wann der jeweilige Suchbegriff am häufigsten im Web zu finden war. Eine zweite Grafik stellt die Popularität von mit dem Suchbegriff verwandten Themen dar. Wer beispielsweise nach "Iraq" sucht, erfährt so automatisch, dass der Begriff im Zeitraum von 1996 bis 1998 sehr oft im Zusammenhang mit Kurden genannt wurde. Während diese ab 1999 kaum noch im Web Erwähnung fanden, tauchten seit Januar 2000 immer mehr Webseiten auf, die über einen möglichen Krieg mit dem Irak spekulierten.
Die Suchmaschine versucht zudem, jedem Begriff Kategorien und Themen zuzuordnen, die ein weiteres Spezifizieren der Suche erlauben. So lässt sich etwa die Irak-Suche auf UN-Waffeninspektoren oder auch den Nordirak einschränken. Bisher wurden rund 50.000 Kategorien angelegt, die insgesamt 1.4 Millionen Suchbegriffe beinhalten. In Zukunft soll Recall schließlich auch noch um eine Personalisierungsmöglichkeit erweitert werden. Dann wird sich die Suchmaschine die vergangenen Suchen merken und diese in die Bewertung der weiteren Suchergebnisse einbeziehen. Außerdem sollen sich die Beschreibungen der Suchergebnisse abhängig von dem Profil des jeweiligen Nutzers unterscheiden.
Das Internet Archive wurde 1996 als Non-Profit-Organisation gegründet. Finanziert wird es im Wesentlichen vom Alexa-Gründer Brewster Kahle, der seine Firma 1999 für einen dreistelligen Millionenbetrag an Amazon.com verkaufte. Seit 2001 bietet das Archiv im Zusammenarbeit mit Alexa den Abruf alter Versionen zahlreicher Webseiten über sein Wayback-Angebot an. Bisher ließ sich dieser Datenbestand jedoch nicht nach Stichwörtern durchsuchen. (Janko Röttgers)
|
|
|
|
|
|
 |
| Masterhilfe Foren-Übersicht -> Sonstige Suchmaschinen oder Verzeichnisse |
Du kannst keine Beiträge in dieses Forum schreiben. Du kannst auf Beiträge in diesem Forum nicht antworten. Du kannst deine Beiträge in diesem Forum nicht bearbeiten. Du kannst deine Beiträge in diesem Forum nicht löschen. Du kannst an Umfragen in diesem Forum nicht mitmachen.
|
Alle Zeiten sind GMT + 1 Stunde
Seite 1 von 1
|
|
|
|
|
|
| Deutsche Übersetzung von phpBB.de |
Powered by phpBB � 2001-2003 phpBB Group. Theme created by Vjacheslav Trushkin.
G�nstige Handwerker und Dienstleister
Geld verdienen
Webverzeichnis
News
Webhosting
Musik
Regionales Web-Verzeichnis
Das Erotik und Porno Portal
Deutsches Erotik und Sex Webverzeichnis
das super live sex cams angebot
kostenlose kleinanzeigen
Versicherungsvergleich
Hardware Forum
zeitschrift abo service
Geld verdienen
Suchmaschinenoptimierung Lexikon
|