Warum werden einige Wörter höher bewertet als andere
Die Contaxe-Crawler bewerten Schlüsselwörter anhand ihrer HTML-Formatierung, daher werden zB. Wörter in Überschriften (<h1> bis <h4>) höher bewertet als andere Wörter, die nur innerhalb von Texten vorkommen.
Lesen die Contaxe-Crawler Meta-Angaben aus?
Ja. Die Contaxe-Crawler lesen alle gängigen Meta-Angaben aus dem Head-Bereich einer Seite aus. Dazu gehören natürlich vorallem die Schlüsselwörter (keywords), der Titel(title) und die Seitenbeschreibung (description). Neben den Standardangaben werden auch die Angaben der Dublin Core beachtet.
Werden "alt" und "title" Angaben beachtet?
Ja. Contaxe liest alt und title Attribute aus HTML-Tags aus um auch bei wenig Text auf einer Seite, möglichst viele Schlüsselwörter zu erhalten. Wenn Sie auf einer Seite zB. nur Bilder haben, können Sie mit einer guten Beschreiben (title) und einem guten Alternativtext (alt) weiterhin passende Werbung erhalten.
Werden Linktexte indiziert?
Ja. Da Linktexte zum Inhalt der Seite gehören, bewertet Contaxe auch Schlüsselwörter oder Wortgruppen (Phrasen) in Linktexten (zwischen <a href="..."> und </a>), allerdings werden sie nicht so stark bewertet wie regulärer Text, da sie zum Teil nur sehr wenig mit dem Inhalt der Seite zu tun haben, wie z. B. in Navigationsleisten.
Können Teile einer Seite vom Indizieren ausgeschlossen werden?
Ja. Ähnlich wie bei einigen Suchmaschinen, können auch bei Contaxe Inhalte bestimmter HTML-Elemente vom Indizieren ausgeschlossen werden. Wenn sie zB. eine Navigationsleiste in einem DIV-Container haben, können sie dem DIV-Container die Klasse (class) robots-nocontent zuweisen und Contaxe wird zukünftig diesen Teil der Seite ignorieren. Sie können diese Klasse natürlich auch jedem anderen HTML-Element zuweisen.
Beachten Sie auch hierzu die nachfolgenden Erläuterungen:
Kontextsensitivität eingrenzen
Wie erkennt Contaxe den Zeichensatz einer Seite?
Contaxe liest die Charset-Angabe aus dem HTTP-Header einer Seite aus. Sollte diese nicht vorhanden sein, wird die Charset-Angabe aus den Meta-Angaben verwendet. Wenn beide Möglichkeiten nicht gegeben sind wird der Westliche-Standard-Zeichensatz "iso-8859-1" angenommen. Für den Fall das beide Angaben vorhanden sind, sich aber unterscheiden, verwendet Contaxe die Angabe aus dem HTTP-Header. Wenn auf Ihrer Seite Werbung mit einem falschen Zeichensatz eingeblendet wird, sollten Sie Ihre Zeichensatzangaben überprüfen.
Welchen User-Agent verwenden die Contaxe-Crawler?
Die Contaxe-Crawler identifizieren sich als contaxe.com . Mit Hilfe von Serverstatistiksystemen können Sie so am einfachsten die Aktivitäten der Crawler überwachen.
Beachten die Contaxe-Crawler die Regeln der robots.txt?
Nein. Die Crawler die Contaxe einsetzt sind sogenannte On-Demand-Crawler. Sie indizieren nur Seiten, die vom entsprechenden Webmaster durch Einbindung von Bannercode freigegeben sind.
Wie kann ich verhindern, dass bestimmte Seiten nicht indiziert werden?
Wenn Contaxe bestimmte Seiten nicht indizieren soll, können sie das ganz einfach verhindern, indem Sie auf diesen Seiten keine Contaxe-Bannercodes platzieren.
Was ist bei der Verwendung von Spider-Traps zu beachten?
Spider-Traps sind Sicherheitssysteme die "böse" Crawler/Spider daran hintern sollen ungewollt viel Traffic zu generieren bzw. Inhalte gesperrter Seiten zu indizieren. Da die Contaxe-Crawler nur Computerprogramme sind und nicht die robots.txt beachten, werden sie von Spider-Traps blockiert. In diesem Fall ist es Contaxe nicht möglich passende Werbung für eine Seite auszuliefern. Um dieses Problem zu umgehen, sollten Sie den User-Agent contaxe.com eine generelle Freigabe erteilen.
Wie lange werden indizierte Seiten gespeichert?
Contaxe speichert indizierte Seiten in der Regel für 24 Stunden. Nach dieser Zeit indizieren die Contaxe-Crawler mit dem nächsten Banner-Abruf die jeweilige Seite erneut.
Warum wurde beim ersten Aufruf einer Seite keine passende Werbung angezeigt?
Dieses Problem kann auftauchen, wenn die Contaxe-Crawler eine Seite nicht schnell genug indizieren konnten. In diesem Fall wird - falls gewünscht - andere Werbung geschaltet. In der Regel kann beim nächsten Aufruf der Seite bereits passende Werbung geschaltet werden.













