Webcrawler

D

Discovery

Werden eigentlich Zugriffe von Webcrawlern und Robotern auf einem Zähler der Webseite angezeigt?

Danke für die Auskunft.


Und gleich noch eine Frage: wie kann man auf einfache Art und Weise die E-Mailadresse auf einer Webpage verschlüsseln, damit sie von Robotern nicht gelesen werden können?

Danke.

Discovery
 
Nicht allzuviel. Würde ich einen Bot schreiben der eMail-Addys auslesen soll, wäre das erste was ich machen würde Sonderzeichen umzuwandeln. Ich schätze mal jeder Harvester im Netz wird das ebenso machen. 100%igen Schutz gibt es nicht, ich denke dass ich aber einen ziemlich guten Ansatz auf meiner Seite verwende. Schau mal in den Quellcode: http://schroeder-daniel.de/impressum.html
 
Eine Idee davon, wie es gehen könnte, wird bei einem Plugin (Action) von Freeway gezeigt: http://www.freewayactions.com/product.php?id=002
Die gezeigte Action funkioniert wie gezeigt nur bei Freeway (logisch), aber die Technik dahinter ist eine allgemein gültige. Vielleicht kommst Du so auf die richtige Fährte.
 
du meinst mit der visitenkarte zum downloaden?
Nein, die Visitenkarte ist eher ein Problem, da man darin die Adresse nicht verschlüsseln kann. Ich meine die normale eMail-Adresse darüber. Der Link wird per JavaScript geschrieben. Im noscript-Bereich wird zusätzlich die Adresse ausgegeben, jedoch mit unsichtbaren Dummy-Tags zerstückelt. Der Bot müsste JavaScript oder CSS gut beherreschen um die Adresse da rauszufiltern.
 
dms schrieb:
Nein, die Visitenkarte ist eher ein Problem, da man darin die Adresse nicht verschlüsseln kann. Ich meine die normale eMail-Adresse darüber. Der Link wird per JavaScript geschrieben. Im noscript-Bereich wird zusätzlich die Adresse ausgegeben, jedoch mit unsichtbaren Dummy-Tags zerstückelt. Der Bot müsste JavaScript oder CSS gut beherreschen um die Adresse da rauszufiltern.

ok, begriffen, stand vorhin grad aufm schlauch, sorry.
 
Er hat zwischen jedem 3-5 Buchstaben seiner Emailsadresse folgendes geschrieben:
HTML:
<span style="display:none;">unsichtbar</span>
Ist eine interessante Lösung. Ich frage mich bloß wie lange es dauert bis die Bots wissen wie sie das umgehen. Wäre in deinem Fall ja nicht besonders schwierig, man müsste nur alle Tags die als style "display:none;" haben, weglassen.

Wie wäre es mit einem Bild? Mithilfe von GD und Co. könnte man ganz leicht die Emailsadresse als Bild speichern. Es hat nur einen Nachteil. Man müsste die Emailsadresse abschreiben.
Es gibt sicherlich sogar schon Bots die Bildanalysen machen können, doch diese sind bestimmt selten.
 
nein, es gibt keine bots, die bilder auslesen können... vorallem keine jpeg's, da diese auf einer bildeben gespeichert sind... der bot bräuchte ein texterkennungsprogramm um die schrift aus einem jpeg zu lesen...
und ich glaub nicht, dass sich jemand die mühe macht und einem simplen web-bot so ein programm einspeist! :rolleyes: :D
 
Dann ist das ja die fast perfekte Lösung mit bloß einem kleinen Schönheitsfehler.
 
Nein, ist keine perfekte Lösung. :)

So einen Bot hab ich Dir in wenigen Minuten geschrieben. Gibt genug komandozeilenbasierte OCR-Tools, wie z.B. OOCR. Der Bot muss das Bild nur speichern und den Pfad an das Tool übergeben. Schon hab ich den Inhalt als Text. Glaube aber nicht dass das wirklich viele Bots machen. Nur möglich wäre es eben sehr leicht.

Das mit dem Abschreiben der Adresse finde ich übrigens nicht zumutbar. Einen Link à la mailto: kann man dann auch gleich knicken, denn da müsste ja wieder die Adresse drin stehen. Und für barrierefreie Seiten ist's sowieso nicht diskutabel.

Meine Lösung ist sicher auch nicht perfekt und relativ leicht zu umgehen. Aber ich denke es ist eine ziemlich gute Mischung aus Usability und Sicherheit. Eine Lösung die beide Punkte 100%ig erfüllt, behaupte ich mal, gibt es nicht.
 
TerminalX schrieb:
HTML:
<span style="display:none;">unsichtbar</span>
Ist eine interessante Lösung. Ich frage mich bloß wie lange es dauert bis die Bots wissen wie sie das umgehen. Wäre in deinem Fall ja nicht besonders schwierig, man müsste nur alle Tags die als style "display:none;" haben, weglassen.

Ist zumindest ein interessanter Ansatz. Anstatt 'display: none' direkt in den <span> zu schreiben, könnte man den Bots die Arbeit noch erschweren, indem man das ganze in eine Klasse steckt, die im externen Stylesheet definiert ist. Ohne zusätzliche Analyse des CSS kann der Bot nicht erkennen, ob es sich um relevante Informationen handelt oder nicht.

Matt
 
Ich habe übrigens jetzt mal das Tool von Freeway genommen, da ich Freeway mag. Ich werds ja sehen.

Ne sichere "Alternative" wäre, wenn man die E-Mailadresse als Sound vorgesprochen bekommt. :D:D:D
 
@ dms, ich hätte da noch ne andere idee. wäre es nicht sinnvoll, man würde spamserverlisten austauschen? Ich kann bei mir via Webmail die Listen bearbeiten. Dann könnte man doch spammserver von anderen hinzufügen, oder? Das sähe dann so aus:

@abento.com
@absconsulting.uk.com
@academyhealth.com
@access-one.com
@access.mountain.net
@bluemail.ch
@hotmail.co.uk
@supernet.ab.ca
Sandra@web.de
anne@4waterloo.freeserve.co.uk
0beppe@7thman.com
334hai@abento.com

Das ist alles Viagrazeugs. Die könnte man dann in die Ausschlussliste kopieren. Oder macht sowas keinen Sinn?
 
Man könnte aber auch einfach auf die bestehenden RBLs zurückgreifen...

Matt
 
Für mich macht sowas zumindest keinen Sinn. Hab mir meinen eigenen Mailserver auf qmail-Basis zusammengestrickt. Da wird unter anderem mit Spamassassin jede eingehende Mail gefiltert. Spamassassin gleicht sich auch mit öffentlichen Black/Whitelists ab. Seit dem ich den Server betreibe hatte ich keine ernstzunehmenden Probleme mit Spam. Die Logs von heute morgen 5:00 Uhr sagen dass dieses Jahr 249 Mails als Spam gefiltert und 106 Mails mit Viren geblockt wurden. Interessanter Schnitt. ;) 86 der Viren waren übrigens Pishing-Tools. Bei 32 Mails war sich der Filter nicht sicher, hat sie deshalb nur markiert. An den Mails bin ich aber selbst schuld, da ich mich an so beschissenen Gewinnspielen angemeldet habe, ich Depp. ;) Lange Rede kurzer Sinn: Spam-mässig fühle ich mich ziemlich sicher. :)
 
Ich mich soweit auch. Ich bekomme pro Tag etwa ein bis zwei Spams. Kann mich also nicht klagen. Es sind eigentlich auch immer die gleichen zwei Angebote.

Hast den wenigstens was gewonnen. :D
 
@dms

Dein Javascript bringt garnichts wenn die Bots die Seite
als fertige Ausgaben parsen, also so wie alle und jeder
deine Seite angezeigt bekommen, wenn sie diese mit dem
Browser aufrufen.

Nichts für ungut, aber ich denke niemand wird einen Bot
schreiben, der jedes Bild nach E-Mail Adressen durchsucht...

E-Mail als Bild ist mit Sicherheit die beste Methode.

Gruß, Micha
 
Zurück
Oben Unten