Webmaster Forum Suchmaschinenoptimierung Webpromotion Webdesign

Unsere Moderatoren
Webmasterlinks
Häufige Begriffe
Impressum
Masterhilfe Foren-Übersicht -> Newbiefragen -> Fragen zu robots.txt! Gehe zu Seite 1, 2  Weiter
Neues Thema eröffnen  Neue Antwort erstellen Vorheriges Thema anzeigen :: Nächstes Thema anzeigen 
Fragen zu robots.txt!
BeitragVerfasst am: 13.02.2004, 10:35 Antworten mit Zitat
Lightmaster-AH
Advanced-Member
Advanced-Member
 
Anmeldungsdatum: 29.01.2004
Beiträge: 118




Hallo zusammen und guten Morgen!

Jaja, der ver-rückte Newbie ist da und hat auch mal wieder ein paar Fragen mitgebracht Very Happy !

Diesmal geht es um robots.txt

Wie erstelle ich für meine Seite (Forum) eine robots.txt Datei, in der ich den Spidern erlaube alles zu sehen, ausser die Mitgliederliste und eine Forenunterkategorie in der privates gepostet wird?

Wo muss ich diese Datei dann einfügen?

Habt ihr Erfahrungen mit Spidern, die man ausschliessen sollte?
Wenn ja, wie wird dies in den robots.txt mit eingefügt?

Falls ihr mal in meine Seite oder den Quelltext schauen wollt, ihr findet sie unter: www. foren4all.de

Vielen lieben Dank schon einmal für Eure Hilfe und Bemühungen:

Lightmaster-AH
Benutzer-Profile anzeigen Private Nachricht senden Website dieses Benutzers besuchen
BeitragVerfasst am: 13.02.2004, 13:43 Antworten mit Zitat
Joerg
Moderator
Moderator
 
Anmeldungsdatum: 28.01.2003
Beiträge: 3156




hallo lichtmaster-ah,

eine robots.txt sieht z.b. folgendermaßen aus:

Code:

User-agent: *
Disallow: /bilder/
Disallow: /forum/privat/

User-agent: Boeserbot
Disallow: /


diese besteht aus zwei anweisungen:

- für alle bots ist es untersagt, die verzeichnisse "bilder" und "privat" zu spidern
- und "Boeserbot" darf gar nichts spidern

- ansonsten ist alles erlaubt

die datei robots.txt wird ins wurzelverzeicchnis der betreffenden domain hochgeladen, d.h. dort wo auch die index-datei liegt, die beim aufruf der domain ausgeliefert wird

mehr zur genauen syntax einer robots.txt kannst du z.b. unter selfhtml nachlesen

_________________
PC-Sicherheit | Nichtraucherforum | Webmaster-Forum
Benutzer-Profile anzeigen Private Nachricht senden Website dieses Benutzers besuchen
BeitragVerfasst am: 13.02.2004, 14:32 Antworten mit Zitat
Lightmaster-AH
Advanced-Member
Advanced-Member
 
Anmeldungsdatum: 29.01.2004
Beiträge: 118




Thanks, wie immer schnell und klasse beschrieben!

Hast du ein paar "Boesebots", die ich ausschliessen sollte?

Boeserbot gefällt mir richtig gut, wieder mal ein Grund zu lächeln, Danke!
Benutzer-Profile anzeigen Private Nachricht senden Website dieses Benutzers besuchen
BeitragVerfasst am: 13.02.2004, 14:44 Antworten mit Zitat
Joerg
Moderator
Moderator
 
Anmeldungsdatum: 28.01.2003
Beiträge: 3156




naja, bei so richtig bösen bots und grabbern besteht auch schon wieder das problem, dass sie sich nicht an die robots.txt halten - die müsste man dann gegebenenfalls über .htaccess aussperren. es gibt auch listen von grabbern, da müsste ich aber selbst erstmal noch schaun - oder vielleicht hat auch jemand anderes da was aktuelles zur hand Smile

nochwas zur robots.txt: so richtig geheime verzeichnisse sollte man dort nicth aufführen, es gibt ja auch noch neugierige zwitgenossen, die dort gerne mal nachschauen. es ist halt nicht mehr als eine anweisung für die bots, schützen kann man seine verzeichnisse damit nicht

_________________
PC-Sicherheit | Nichtraucherforum | Webmaster-Forum
Benutzer-Profile anzeigen Private Nachricht senden Website dieses Benutzers besuchen
BeitragVerfasst am: 13.02.2004, 15:11 Antworten mit Zitat
Lightmaster-AH
Advanced-Member
Advanced-Member
 
Anmeldungsdatum: 29.01.2004
Beiträge: 118




Noch einmal Danke,
und es ist mir schon klar, dass ich wirklich vertrauliche Dinge nicht mit einbeziehen, besser noch, erst garnicht im Forum habe.

Mir war und ist nur wichtig, das der robot eben nicht auch Dinge spidert, die in Sumas eh nichts bringen, wie z.B. das Mitgliederverzeichnis.

Eigentlich wollte ich garkeine robots.txt erstellen, wegen Faulheit und fehlender Kenntnisse, aber ich habe jetzt schon mehrfach gelesen, das es wichtig sei sie zu haben, selbst wenn der spider alles sehen darf.

Wenn ich meine robots.txt fertig habe, darf ich sie dann einmal posten, damit du/ihr schauen könnt, ob sie auch korrekt ist?

Ich möchte ja keinen "Müll" hochladen, der mir und meiner Seite mehr schadet, als das er nutzen bringt.
Benutzer-Profile anzeigen Private Nachricht senden Website dieses Benutzers besuchen
BeitragVerfasst am: 13.02.2004, 15:31 Antworten mit Zitat
Joerg
Moderator
Moderator
 
Anmeldungsdatum: 28.01.2003
Beiträge: 3156




Lightmaster-AH hat Folgendes geschrieben:
Wenn ich meine robots.txt fertig habe, darf ich sie dann einmal posten, damit du/ihr schauen könnt, ob sie auch korrekt ist?


ja klar Smile

_________________
PC-Sicherheit | Nichtraucherforum | Webmaster-Forum
Benutzer-Profile anzeigen Private Nachricht senden Website dieses Benutzers besuchen
BeitragVerfasst am: 13.02.2004, 16:00 Antworten mit Zitat
Lightmaster-AH
Advanced-Member
Advanced-Member
 
Anmeldungsdatum: 29.01.2004
Beiträge: 118




Hallo,
ich habe meine robots.txt nun erstellt und würde mich freuen, wenn ihr mal einen kurzen Blick darauf werft um mir zu sagen, das es so okay ist.
In Klammern habe ich das geschrieben, von dem ich meine, das der Befehl es bewirkt.

User-agent: * (erlaube allen robots)
Disallow: /images/ (verweigere Zugriff auf Ordner images)
Disallow: /privat.php/(verweigere Zugriff auf PN´s)
Disallow: /memberlist.php/(verweigere Zugriff auf Memberliste)
Disallow: /calendar.php/ (verweigere Zugriff auf die Kalender)
Disallow: /usercp.php/ (verweigere Zugriff auf Userprofil)
Disallow: /forumdisplay.php?f=1/ (verweigere Zugriff auf Adminforum mit der ID 1)

Ich denke zwar, das ich es richtig gemacht habe, aber eine kleine Kontrolle kann nicht schaden.

Noch etwas, im Browser steht zum Beispiel: ...../user.php?
auf meinem Server ist dieselbe Datei dann ohne das "?" am Ende.
Muss ich nun die Fragezeichen oben bei "privat-memberlist-calendar-usercp" mit angeben oder nicht?

Danke schon einmal: Lightmaster-AH
Benutzer-Profile anzeigen Private Nachricht senden Website dieses Benutzers besuchen
BeitragVerfasst am: 13.02.2004, 16:36 Antworten mit Zitat
Joerg
Moderator
Moderator
 
Anmeldungsdatum: 28.01.2003
Beiträge: 3156




was auf jeden fall raussollte sind die slashes nach den dateinamen:

Lightmaster-AH hat Folgendes geschrieben:
User-agent: *
Disallow: /images/
Disallow: /privat.php/
Disallow: /memberlist.php/
Disallow: /calendar.php/
Disallow: /usercp.php/
Disallow: /forumdisplay.php?f=1/


Zitat:
Noch etwas, im Browser steht zum Beispiel: ...../user.php?
auf meinem Server ist dieselbe Datei dann ohne das "?" am Ende.
Muss ich nun die Fragezeichen oben bei "privat-memberlist-calendar-usercp" mit angeben oder nicht?


ohne müsste m.e. reichen, aber ich hab auch nicht so die erfahrung mit einzelnen dynamischen dateien in der robots.txt, vielleicht kann da jemand anderes auch noch etwas zu schreiben Smile

_________________
PC-Sicherheit | Nichtraucherforum | Webmaster-Forum
Benutzer-Profile anzeigen Private Nachricht senden Website dieses Benutzers besuchen
BeitragVerfasst am: 13.02.2004, 16:45 Antworten mit Zitat
Lightmaster-AH
Advanced-Member
Advanced-Member
 
Anmeldungsdatum: 29.01.2004
Beiträge: 118




Alles klar und Danke.

Na, dann will ich mal hoffen, das ein "Experte" auch mal reinschaut.
Ich muss nämlich ab morgen erst eine 100qm Wohnung renovieren (in einer Woche) dann am nächsten WE umziehen und dann habe ich eine Woche Zeit meine jetzige 70qm Wohnung komplett zu renovieren.

Nebenbei fahre ich noch zu meiner Mutter ins Krankenhaus, die vor ein paar Tagen eine 6 stündige Herz-OP hinter sich gebracht hat.

Also, möchte ich das ganze gern online haben, weil ich wohl die nächsten Wochen kaum Zeit finden werde mich intensiv ums I-Net zu kümmern.

Sorry, gehört alles nicht hierher, aber ich musste mich jetzt einmal kurz ausko*****!

Vielen Dank, alles Liebe: Lightmaster-AH
Benutzer-Profile anzeigen Private Nachricht senden Website dieses Benutzers besuchen
BeitragVerfasst am: 13.02.2004, 17:34 Antworten mit Zitat
Joerg
Moderator
Moderator
 
Anmeldungsdatum: 28.01.2003
Beiträge: 3156




du kannst sie auch schon so hochladen - schaden tut sie nicht, und erfüllt für die andern dateien und verzeichnisse auch ihren zweck. ist halt nur die frage, inwieweit die bots das mit dem ? schnallen - und das siehst du dann ja auch in logs, ob die betreffenden dateien gespidert werden oder nicht

und bei einzelnen dateien bietet sich dann ja auch an, die aufnahme in den suchmaschinenindex durch ein entsprechendes metatag auszuschließen:

Code:
<meta name="robots" content="noindex">

_________________
PC-Sicherheit | Nichtraucherforum | Webmaster-Forum
Benutzer-Profile anzeigen Private Nachricht senden Website dieses Benutzers besuchen
Fragen zu robots.txt!
 Masterhilfe Foren-Übersicht -> Newbiefragen
Du kannst keine Beiträge in dieses Forum schreiben.
Du kannst auf Beiträge in diesem Forum nicht antworten.
Du kannst deine Beiträge in diesem Forum nicht bearbeiten.
Du kannst deine Beiträge in diesem Forum nicht löschen.
Du kannst an Umfragen in diesem Forum nicht mitmachen.
Alle Zeiten sind GMT + 1 Stunde  
Seite 1 von 2  
Gehe zu Seite 1, 2  Weiter
  
  
 Neues Thema eröffnen  Neue Antwort erstellen  
Deutsche Übersetzung von phpBB.de
Powered by phpBB � 2001-2003 phpBB Group. Theme created by Vjacheslav Trushkin.

G�nstige Handwerker und Dienstleister Geld verdienen Webverzeichnis News Webhosting Musik Regionales Web-Verzeichnis Das Erotik und Porno Portal Deutsches Erotik und Sex Webverzeichnis das super live sex cams angebot kostenlose kleinanzeigen Versicherungsvergleich Hardware Forum zeitschrift abo service Geld verdienen Suchmaschinenoptimierung Lexikon