Wie stoppt man Crawler und Ghost Spam in Google Analytics?
Dieses Tutorial behandelt die folgenden Themen:
Eine der nützlichsten Funktionen von Google Analytics hilft Webmastern dabei, die Verweis-URLs zu verfolgen, von denen Nutzer auf ihre Website gelangen. Unglücklicherweise nutzen Spammer diese Möglichkeit, um ihre eigenen Websites zu bewerben oder das Image nicht verbundener Unternehmen zu schädigen, indem sie ihre Domainnamen als Referrer-URLs in Ihre Analytics-Daten einfügen. Es gibt zwei Haupttypen von Spam, die diese Funktionalität nutzen können- Ghost-Spam und Crawler-Spam.
Was ist Ghost Spam und wie kann ich es herausfiltern
Spammer, die diese Methode verwenden, besuchen Ihre Website nicht wirklich. Stattdessen verwenden sie das Analytics Measurement Protocol, mit dem Menschen Daten direkt an Google Analytics senden und schädliche Informationen hinzufügen können. Normalerweise generieren sie zufällig Analytics-Tracking-Codes (UA-XXXXX-1). Auf diese Weise hinterlassen sie gefälschte Daten in Ihrem Konto ohne jede Spur.
Da Ghost-Spammer nicht wissen, an welche Domain sie Daten an Google Analytics senden, verwenden sie entweder ihren Hostnamen, der nichts mit Ihrer Website zu tun hat, oder geben keinen Domainnamen an. Sie können leicht eine Liste der gültigen Hostnamen erhalten, die Informationen an Ihr Konto senden sollen. Normalerweise wäre das nur yourdomain.com plus alle Subdomains, die Sie haben, wie blog.yourdomain.com oder sogar www.yourdomain.com. Um diese Informationen zu erhalten, gehen Sie zu Google Analytics > Netzwerk und wählen Sie die Option Hostname als Primäre Dimension . Dann müssen Sie eine Liste aller Ihrer Hostnamen mit Regular Expression wie folgt erstellen:
yourdomain.com|blog.yourdomain.com|www.yourdomain.com
Fügen Sie alle Hostnamen, die Ihnen gehören, zu dieser Liste hinzu und speichern Sie sie in einer leeren Textdatei. Wir werden sie gleich brauchen.
Als nächstes, klicken Sie auf den Admin-Link oben auf der Website, wählen Sie Ihr Konto, die entsprechende Eigenschaft und Ansicht für die betreffende Website, und klicken Sie auf die Filter > Filter hinzufügen . Dadurch können Sie einen neuen Filter erstellen. Legen Sie einen Namen dafür fest, wie “Ghost Spam-Filter”, und wählen Sie dann den Filtertyp Benutzerdefiniert . Wählen Sie nun Hostname aus dem Filterfeld Dropdown und klicken Sie auf Einschließen . Schließlich fügen Sie die Liste der gültigen Domains im Feld Filtermuster hinzu. Es ist gut, vor dem Aktivieren auf den Link Filter überprüfen zu klicken. Sobald Sie dies tun, sehen Sie die Informationen, die aus Ihren Analytics-Daten entfernt werden. Klicken Sie abschließend auf Speichern .
Wie Sie Crawlers Spam stoppen
Den Spam von Crawlern zu stoppen ist einfacher, weil sie tatsächlich auf Ihre Website zugreifen. Sie können ihre Hostnamen auf die gleiche Weise wie Ihre gültigen Hostnamen erhalten. Dieses Mal, erhalten Sie alle verdächtigen, die seltsame/unerwartete Quelle und Hostname anders als Ihre haben. Dann können Sie sie mit der folgenden .htaccess-Regel blockieren:
## STOP REFERRER SPAM
RewriteCond %{HTTP_REFERER} spammybot.com [NC,OR]
RewriteCond %{HTTP_REFERER} buysomething.com [NC]
RewriteRule .* - [F]
Beachten Sie, dass .htaccess-Dateien sinnvoll sind und Sie das Punkt-Zeichen mit einem Schrägstrich umschreiben müssen. Wenn Sie zum Beispiel spam-bot-site.net blockieren möchten, müssen Sie spam-bot-site.net in die Regeln einfügen.