Seite 1 von 2 12 LetzteLetzte
Ergebnis 1 bis 10 von 18

Thema: Antispam-Forum in Suchmaschinen

  1. #1
    Neues Mitglied
    Registriert seit
    09.07.2009
    Beiträge
    6

    Standard Antispam-Forum in Suchmaschinen

    Ja, ein etwas provokanter Titel, ich weiß. Aber es entspricht durchaus der Wahrheit. Schließlich werden gleiche Inhalte unter diversen URIs indizert, weil in der robots.txt die URIs mit Post-ID nicht ausgeschlossen werden. Ein Beispiel:

    Als hier eben in einem unerwünschten Anruf die 09003080810 beworben wurde, habe ich über Google nach dieser Nummer gesucht. Ich erhielt in den Ergebnissen zwei Links auf dieser Site hier. Allerdings handelt es sich bei beiden Links um den gleichen Thread und sogar um die gleiche Seite darin. Lässt man sich den einen unterdrückten Link noch anzeigen, erhält man sogar drei Links auf die gleichen Inhalte:

    http://www.antispam-ev.de/forum/showthread.php?p=225044
    http://www.antispam-ev.de/forum/showthread.php?p=225033
    http://www.antispam-ev.de/forum/showthread.php?p=225025

    Es wäre daher sinnvoll, in der robots.txt den Eintrag
    Code:
    /forum/showthread.php?p=
    aufzunehmen. Auch sollte
    Code:
    /forum/showpost.php
    ergänzt werden, denn diese Datei liefert auch nur unnötige redundante Informationen.

  2. #2
    Mitglied Avatar von SpamRam
    Registriert seit
    11.09.2005
    Beiträge
    910

    Standard

    Es sind drei verschiedene Beiträge, die da bei Google angezeigt werden! Jeder einzelne Forenbeitrag wird bei Google gelistet!
    Forum-Statistik: 80%: 100x dieselbe Frage! Kaum einer liest, bevor er fragt! 10% zu faul, selbst zu suchen, oder man liest "leudz, lol, oO" und vokalloses SMS-Gestammel. => 90% Ausschuss. 10% helfen weiter, Schreiber hat überlegt, was er schreibt und Rechtschreibung geprüft. Traumhaft :-). [(M.Goldmann, gekürzt, Internet Professionell 4/07)]
    Die deutsche Sprache ist Freeware, jeder darf sie kostenlos nutzen. Sie ist jedoch nicht OpenSource und eigenmächtige Veränderungen sind nicht gestattet.

  3. #3
    mareike26
    Gast

    Standard

    Ich lasse mir nicht gerne vorwerfen, dass wir spammen. Daher ist der Threadtitel geändert.

  4. #4
    Ritter der Tafelrunde Avatar von Arthur
    Registriert seit
    15.01.2007
    Ort
    Avalon
    Beiträge
    10.576

    Standard

    Wenn man keine Problem hat, sucht man sich eben welche, auch wenn es keine sind.

  5. #5
    Neues Mitglied
    Registriert seit
    09.07.2009
    Beiträge
    6

    Standard

    Zitat Zitat von SpamRam Beitrag anzeigen
    Es sind drei verschiedene Beiträge, die da bei Google angezeigt werden! Jeder einzelne Forenbeitrag wird bei Google gelistet!
    Jein, es ist nämlich auch gleichzeitig immer der gleiche Thread und die gleiche Seite indiziert, es wird lediglich ein anderer Beitrag darin angesprungen. Ist das sinnvoll? Wohl kaum. Jedes mal werden nämlich alle anderen Beiträge auf der Seite mit indiziert. Bei einer vollständigen Indizierung wäre dann jede Seite eines Threads 11 mal zu finden. 10 mal über die Post-IDs und einmal über die Thread-ID und Seitenzahl. Dass Google hier schon wegen Duplicate Content nur zwei (bzw. auf Wunsch) drei URIs listet und offenbar von der weiteren Indizierung absieht, sollte doch zu denken geben. Was bringt es, wenn ein Thread drei mal gelistet ist und andere (infolge der unvollständigen Indizierung) dafür nie? Würde man wirklich jeden Post separat indizieren wollen, so sollte man besser die /forum/showpost.php aus der robots.txt entfernen. Aber da kaum ein Besucher einen einzelnen Beitrag lesen wollen wird, ist diese Datei sinnvollerweise dort gesperrt. Es wäre daher nur konsequent, eben auch /forum/showthread.php?p= zu sperren, sodass jeder Thread pro Seite nur unter einem kanonischen URI erreichbar ist. Die Beiträge innerhalb einer Seite kann man auch dann noch anspringen:

    http://www.antispam-ev.de/forum/show...=27#post225025
    http://www.antispam-ev.de/forum/show...=27#post225033
    http://www.antispam-ev.de/forum/show...=27#post225044

    Ganz nebenbei funktionieren diese Links dann sogar ohne JavaScript korrekt. Ohne JS landet man bei den von mir bemängelten URIs mit p-Parameter immer nur am Seitenanfang, da der Sprung unsinnigerweise per JS erfolgt, anstatt einfach eine Weiterleitung auf den (idealerweise) kanonischen URI mit Anker auf den Beitrag zu generieren.

    Dass Google wegen dem unnötigen Indizierungsaufwand und dem fehlenden Wert für seine Nutzer keinen Duplicate Content mag sollte klar sein, ansonsten kann man das auch unter http://www.google.com/support/webmas...y?answer=66359 nachlesen. Für andere Suchmaschinen gilt das natürlich ebenso.

    Ich lasse mir nicht gerne vorwerfen, dass wir spammen.
    Verständlich. Ich meinte aber, dass das Forum durch seine Konfiguration (natürlich unabsichtlich) selbst (Suchmaschinen-)Spam produziert, nicht ihr als Betreiber. Der Smiley dahinter sollte eigentlich zeigen, dass meine Überschrift keinesfalls so ernst zu nehmen war, wie du es offenbar getan hast. Schade, das hat wohl nicht geklappt.

    Arthur, wen meinst du? Mich? Ich dachte eigentlich, dass ein Hinweis auf ein Problem bei der Indizierung des Forums dankbar aufgenommen wird. Ich wäre zumindest über solche Hinweise sehr dankbar, da sie eine Menge Traffic sparen können und zu einer besseren Listung in den SERPs beitragen.
    Geändert von Brettermeier (10.07.2009 um 11:24 Uhr) Grund: Antwort auf Arthurs Beitrag

  6. #6
    Urgestein Avatar von Eniac
    Registriert seit
    18.07.2005
    Ort
    Dragasani - Lagos - Moskau - Cloppenburg
    Beiträge
    5.201

    Standard

    Ist Dir langweilig? Dann geh doch lieber mit Kurt und Gürgen einen saufen.


    Eniac
    Die weltweit grösste Fakeseiten-Datenbank: http://db.aa419.org/fakebankslist.php
    Viele falsche Escrow-Seiten: http://escrow-fraud.com/search.php

    DER HERR ERSCHUF IN SEINEM ZORN - CLOPPENBURG UND BÜTTELBORN

  7. #7
    Mitglied Avatar von heinerle
    Registriert seit
    07.09.2005
    Beiträge
    776

    Standard

    Zitat Zitat von Brettermeier Beitrag anzeigen
    ..
    Dass Google wegen dem unnötigen Indizierungsaufwand und dem fehlenden Wert für seine Nutzer keinen Duplicate Content mag sollte klar sein, ...
    Zur Not könnte man ja in den Seitenheader
    Code:
    <link rel="canonical" href="http://www.antispam-ev.de/forum/showthread.php?t=xyz">
    einbauen, dann wird der Inhalt zwar evtl. mehrfach gelistet, kostet aber keinen Pagerank wegen "doppeltem Content" ...

    Quelle: http://www.drweb.de/magazin/der-cano...elten-content/

  8. #8
    BOFH Avatar von exe
    Registriert seit
    17.07.2005
    Ort
    Serverraum
    Beiträge
    5.936

    Standard

    Hi,

    Zitat Zitat von Brettermeier Beitrag anzeigen
    Dass Google wegen dem unnötigen Indizierungsaufwand und dem fehlenden Wert für seine Nutzer keinen Duplicate Content mag sollte klar sein, ansonsten kann man das auch unter http://www.google.com/support/webmas...y?answer=66359 nachlesen.
    Wenn Google Einzel-Beiträge und Threads als Duplicate Content in seine Datenbank haut, ist dass dann unser Problem oder das von Google? Warum sollten wir an unserer robots.txt basteln, nur weil Google seinen Spider nicht im Griff hat?
    Dieser Beitrag kann Spuren von Ironie und billiger Polemik enthalten. Die Schöpfungshöhe ist technisch bedingt.

    Wir müssen die Religion des anderen respektieren, aber nur in dem Sinn und dem Umfang, wie wir auch seine Theorie respektieren, wonach seine Frau hübsch und seine Kinder klug sind.
    Richard Dawkins

  9. #9
    Neues Mitglied
    Registriert seit
    09.07.2009
    Beiträge
    6

    Standard

    Zitat Zitat von heinerle Beitrag anzeigen
    Zur Not könnte man ja in den Seitenheader
    Code:
    <link rel="canonical" href="http://www.antispam-ev.de/forum/showthread.php?t=xyz">
    einbauen, dann wird der Inhalt zwar evtl. mehrfach gelistet, kostet aber keinen Pagerank wegen "doppeltem Content" ...
    Das rel="canonical" wird zwar auch unter http://www.google.com/support/webmas...?answer=139066 erwähnt, allerdings sehe ich hier den Nachteil, dass die Robots immer noch den Server belasten und unnötig Traffic verschwenden würden. Auch wäre es schwieriger einzurichten, als einfach die unnötigen URIs in der robots.txt zu sperren.

    Zitat Zitat von exe Beitrag anzeigen
    Wenn Google Einzel-Beiträge und Threads als Duplicate Content in seine Datenbank haut, ist dass dann unser Problem oder das von Google? Warum sollten wir an unserer robots.txt basteln, nur weil Google seinen Spider nicht im Griff hat?
    Klar, es wäre natürlich schön, wenn Google nicht kanonische URIs zuverlässig erkennen könnte und dann am besten sogar die kanonische Form ableiten könnte. Das ist allerdings zum einen Wunschdenken, zum anderen gibt es aus den Post-IDs vorab gar keine Möglichkeit den zugehörigen Thread zu erkennen. Es müsste also zumindest einiges an Traffic verschwendet werden, um den DC festzustellen. Gut, man könnte natürlich die Ankernamen in den Threads auswerten, aber eine Maschine erkennt hier den Zusammenhang nicht.

    Wenn man deine Argumentation weiterspinnt, bräuchte man eigentlich überhaupt keine robots.txt mehr, weil die Suchmaschinen automatisch erkennen sollten, welche URIs interessante Inhalte bieten und welche nicht. Da aber ein Mensch solch eine Entscheidung immer noch sehr viel effizienter und effektiver fällen kann, nutzt man eben weiterhin die robots.txt. So stehen auch in eurer robots.txt viele Einträge ausschließlich deshalb dort, weil sie keine interessanten und/oder doppelte Inhalte bieten würden. Insofern wäre es nur konsequent, diese Liste weiter zu verfeinern.
    Geändert von Brettermeier (11.07.2009 um 12:20 Uhr) Grund: bbCode korrigiert

  10. #10
    Mitglied Avatar von SpamRam
    Registriert seit
    11.09.2005
    Beiträge
    910

    Standard

    Sag mal, habe ich das richtig verstanden, dass die robots.txt für jeden Beitrag manuell gepflegt werden soll?

    Da lobe ich mir doch den aktuellen Zustand, wo jeder Beitrag bei Google gelstet wird, so dass häufige Namen/Stichwörter eben auch häufiger in der Ergebnisliste erscheinen.

    Außerdem bin ich der Meinung, das ein neuer Forenteilnehmer in seinem allerersten Beitrag, auch wenn er meint etwas von der Sache zu verstehen, nicht unbedingt die Forenverwaltung mehr oder weniger als unfähig hinstellen und fast ultimativ dazu auffordern sollte, ein jahrelang bewährtes Verfahren von Grund auf zu ändern.

    Die Indizierung jedes einzelnen Beitrags und dadurch Mehrfachindizierung einer Forenseite, wenn das Suchwort in mehreren Beiträgen vorkommt, ist meines Wissens bisher nicht negativ bewertet worden. Außerdem ist das Google-Bewertungsverfahren in allen Foren gleich. Soll da vielleicht jeder Forenbetreuer Hand anlegen um Mehrfachindizierung von Forenseiten abzustellen.

    Das aktuelle Verfahren hat schließlich den Vorteil, dass die Links direkt zu den einzelnen Beiträgen führen, so dass der suchende User nicht erst nach den einzelnen für ihn relevanten Beiträgen suchen muss.
    Geändert von SpamRam (11.07.2009 um 15:25 Uhr)
    Forum-Statistik: 80%: 100x dieselbe Frage! Kaum einer liest, bevor er fragt! 10% zu faul, selbst zu suchen, oder man liest "leudz, lol, oO" und vokalloses SMS-Gestammel. => 90% Ausschuss. 10% helfen weiter, Schreiber hat überlegt, was er schreibt und Rechtschreibung geprüft. Traumhaft :-). [(M.Goldmann, gekürzt, Internet Professionell 4/07)]
    Die deutsche Sprache ist Freeware, jeder darf sie kostenlos nutzen. Sie ist jedoch nicht OpenSource und eigenmächtige Veränderungen sind nicht gestattet.

Seite 1 von 2 12 LetzteLetzte

Ähnliche Themen

  1. antispam.de/forum Suche
    Von Rava im Forum 5.2 News, Kritik & Anregungen
    Antworten: 8
    Letzter Beitrag: 07.06.2009, 14:55
  2. forum.antispam.de heute im Schneckentempo
    Von Flink im Forum 4.2 Diskussion
    Antworten: 8
    Letzter Beitrag: 19.09.2002, 16:09
  3. irc channel zum antispam.de forum
    Von Sinclair3 im Forum 4.2 Diskussion
    Antworten: 2
    Letzter Beitrag: 08.08.2002, 21:41

Lesezeichen

Lesezeichen

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •  
Partnerlink:
REDDOXX Anti-Spam Lösungen