+ Auf Thema antworten
Zeige Ergebnis 1 bis 9 von 9

Thema: Pro und Contra robots.txt

  1. #1
     Shrike ist offline
    MU Mitglied
    Registriert
    05.2008
    Beiträge
    545

    Pro und Contra robots.txt

    Hi,

    wie wichtig erachtet ihr robots.txt? Ich habe mir mal die Richtlinien von Googles Webmasters angetan und beim
    "Crawler-Zugriff" kann man sich ja problemlos eine robots.txt erstellen lassen für seine Website.

    Vielerorts gehört "..kannste vergessen..."

    Zugreifen tun die Crawler ja sowieso, die robots.txt sagt nochmal explizit das sie es dürfen und man kann Sachen ausschließen...

    Ich würde hier mal gerne pro und contra zu robots.txt eröffnen...

    LG E

  2. #2
     Hotze ist offline
    MU Mitglied Benutzerbild von Hotze
    Registriert
    06.2003
    Ort
    München
    Beiträge
    7.819
    Was ist daran schlimm eine einfache .txt zu erstellen? Schaden wird es nicht, von daher ist es doch eigentlich egal.
    Es wäre nichts so wie es ist, wär' es damals nicht gewesen wie es war

  3. #3
     /aquila ist offline
    MU Mitglied
    Registriert
    03.2006
    Beiträge
    195
    problem ist das sich nicht alle crawler dran halten, aber haben sollte sie man trotzdem
    MBP 13.3" 2.26 GHZ 4 GB

    "Wer glaubt, etwas zu sein, hat aufgehört, etwas zu werden." Sokrates

  4. #4
     Shrike ist offline
    MU Mitglied
    Registriert
    05.2008
    Beiträge
    545
    Themenstarter
    Na ja, also wenn's egal ist kann man's auch lassen...

    aber egal: alles zulassen in der robots.txt oder gewisse Einschränkungen?

  5. #5
     Hotze ist offline
    MU Mitglied Benutzerbild von Hotze
    Registriert
    06.2003
    Ort
    München
    Beiträge
    7.819
    Musst Du wissen. Alles zulassen und das was Du nicht im Netz sehen willst, verbieten.
    Es wäre nichts so wie es ist, wär' es damals nicht gewesen wie es war

  6. #6
     Shrike ist offline
    MU Mitglied
    Registriert
    05.2008
    Beiträge
    545
    Themenstarter
    Is' klar...

    Um nochmal Mißverständnisse auszuschließen - was man mit der robots.txt macht is' klar.

    Es geht um Sinn und Unsinn dieser kleinen Textdatei.

    /aquila erwähnte ja bereits, das sich nicht alle Crawler dran halten...

    Soweit ich weiß tun's aber alle großen Suchmaschinen

  7. #7
    MU Mitglied
    Registriert
    12.2006
    Beiträge
    397
    Meiner Erfahrung nach ist es nicht egal - nahezu alle Crawler, die auf meiner Seite aufgetaucht sind, halten sich an die Angaben im robots.txt. Ansonsten hat Hotze ja bereits alles gesagt. Lass halt Google und evtl. Yahoo deine Seite indizieren und die restlichen sperrst du aus, da sie ohnehin nicht von Bedeutung sind.

  8. #8
     Rupp ist offline
    MU Mitglied Benutzerbild von Rupp
    Registriert
    10.2004
    Beiträge
    4.840
    Also meine Seite wurde von Google geindext, obwohl die robots.txt eigtl. allen crawlern den gesamtzugriff verboten hatte und zwar von Anfang an. Seit bestehen des Webspace (war quasi bei der default-config des Webspace dabei).
    Macbook late 2008 13", mit leuchtender Tastatur
    iMac Late 2006 20", mit S-PVA-Panel
    iBook G3 12" & iMac G3 DV, natürlich beide in Tangerine

  9. #9
    MU Mitglied Benutzerbild von Kümmelkorn
    Registriert
    10.2008
    Beiträge
    1.517
    Zitat Zitat von Endymion Beitrag anzeigen
    aber egal: alles zulassen in der robots.txt oder gewisse Einschränkungen?
    Wenn du alles zulässt, kannst du die Datei weglassen – denn weglassen = alles zulassen!

    Falls du Einschränkungen machen willst, ist die robots.txt der einzige Weg und schon allein deshalb sinnvoll. Oder siehst du eine alternative? (nein, nicht-online-stellen zählt nicht!)
    “Laß den Herrn die Quelle deiner Freude sein: Er wird dir jeden Wunsch erfüllen!” (Psalm 37, 4 – Gute Nachricht)

+ Auf Thema antworten

Forumregeln

  • Es ist dir nicht erlaubt, neue Themen zu verfassen.
  • Es ist dir nicht erlaubt, auf Beiträge zu antworten.
  • Es ist dir nicht erlaubt, Anhänge hochzuladen.
  • Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.