SR3: Indexierte Seiten bei Y.

Verfasst am: 15. 09. 2011 [11:11]
bhvmedia
Dabei seit: 04.06.2009
Themenersteller

156 Beiträge
Beitrag hilfreich?

Moin,

eine Frage zu den Analysen, genauer zu den Indexierten Seiten bei Y.

Wenn ich eine Internetpräzenz mit 100 Seiten habe und auch 100 Seiten bei Y. als eigenständig indexiert wurden, sollte da in der Bewertung nicht 100 % stehen?

Schon mal Danke!

Gruß Thomas

Meine-Stadt-Bremerhaven.de
Vieles rund um die Seestadt Bremerhaven
BHV-media.de Meine kleine Agentur
 
Verfasst am: 15. 09. 2011 [11:35]
Ultima
Dabei seit: 09.07.2010

759 Beiträge
Beitrag hilfreich?

Hi Thomas,

diese Bewertung fand ich auch schon immer etwas merkwürdig. Das betrifft ja auch SR-V2.
Aber woher soll der SR Bot wissen, aus wie vielen Seiten deine HP besteht?

Gruß Thomas

 
Verfasst am: 15. 09. 2011 [11:44]
klaus_b
Dabei seit: 17.12.2009

327 Beiträge
Beitrag hilfreich?

Hallo Thomas,
"Ultima" schrieb:
Aber woher soll der SR Bot wissen, aus wie vielen Seiten deine HP besteht?
Der SR Bot überprüft ja bereits das Vorhandensein einer sitemap.xml. Also könnte er die sitemap.xml laden und in einem Durchlauf die übermittelten Seiten zählen. Anschließend mit den Y. gemeldeten Seiten verrechnet und ein aussagekräftiges Ergebnis liegt vor.

Servus,
Klaus

klaus_b@.NET über alles was an .NET und C# Spass macht.
http://www.seitenreport.de/twitter_icon_small.png
 
Verfasst am: 15. 09. 2011 [11:52]
hansen
Dabei seit: 18.05.2009

1422 Beiträge
Beitrag hilfreich?

"bhvmedia" schrieb:

Wenn ich eine Internetpräzenz mit 100 Seiten habe und auch 100 Seiten bei Y. als eigenständig indexiert wurden, sollte da in der Bewertung nicht 100 % stehen?

Hallo Thomas,

die Analyse bewertet nicht, ob Du alle Seiten im Index hast, sondern wie viele.
Die 100% bekommst Du etwa bei 200000 Seiten im Index.

Gruß
hansen

[Dieser Beitrag wurde 1mal bearbeitet, zuletzt am 15.09.2011 um 11:58.]

 
Verfasst am: 15. 09. 2011 [12:07]
joerg
Dabei seit: 09.06.2009

1540 Beiträge
Beitrag hilfreich?

"klaus_b" schrieb:

Also könnte er die sitemap.xml laden und in einem Durchlauf die übermittelten Seiten zählen. Anschließend mit den Y. gemeldeten Seiten verrechnet und ein aussagekräftiges Ergebnis liegt vor.


Hallo Klaus

Du damit habe ich mal experimentiert. Ich bin aber von der robots.txt ausgegangen. Aus dem Grunde da die sitemap.xml im Root Verzeichnis keine Standardadresse ist.

Zuerst einmal die sitemap.xml im Rootverzeichnis kann auch ein Sitemapindex sein.

Ich generiere dir auch mit PHP mit noch nicht mal 50 Zeilen Code einen Sitemapindex der Tausende von Sitemaps enthält. Dann müsste jede dieser Sitemaps wiederum aufgerufen werden um die Seitenanzahl gesamt zu ermitteln.

Bei kleinen Portalen funktioniert das ganze ja noch.

Als ich damit dann mal ein grösseres Portal überprüft habe hat mein PHP Skript dann gestreikt.

Wie würdest du denn den Fall bewerten wenn Seiten zwar im Index bein Yahoo sind aber keine Sitemap gefunden werden kann?

Ausserdem wenn ich richtig informiert bin wird es den Yahoo Site Explorer bald nicht mehr geben. Ab heute wird er nicht mehr gepflegt wenn die Informationen stimmen.

Gruß
Jörg

 
Verfasst am: 15. 09. 2011 [12:27]
klaus_b
Dabei seit: 17.12.2009

327 Beiträge
Beitrag hilfreich?

Hallo Jörg,

"joerg" schrieb:
Ich bin aber von der robots.txt ausgegangen. Aus dem Grunde da die sitemap.xml im Root Verzeichnis keine Standardadresse ist.
Da SR die sitemap Adresse aus der robots.txt liest und sich nicht auf den Namen verlässt, sollte dieser Punkt erledigt sein.

"joerg" schrieb:
Zuerst einmal die sitemap.xml im Rootverzeichnis kann auch ein Sitemapindex sein.
Das kann bereits mit "einem Blick" in das XML geklärt werden, also nicht weiter tragisch.


"joerg" schrieb:
Ich generiere dir auch mit PHP mit noch nicht mal 50 Zeilen Code einen Sitemapindex der Tausende von Sitemaps enthält. Dann müsste jede dieser Sitemaps wiederum aufgerufen werden um die Seitenanzahl gesamt zu ermitteln.
Am längsten hierbei dürfte das Laden vom Server dauern. Da aber die SR Analyse in weiten teilen asynchron läuft, sollte das auch kein Problem darstellen.

"joerg" schrieb:
Bei kleinen Portalen funktioniert das ganze ja noch.

Als ich damit dann mal ein grösseres Portal überprüft habe hat mein PHP Skript dann gestreikt.
Für solche Analysen sollten performante und typsicher Sprachen verwendet werden, und keine interpretierte Skriptsprache. Das ist nicht abwertend gemeint, sondern rein faktisch icon_smile.gif

"joerg" schrieb:
Wie würdest du denn den Fall bewerten wenn Seiten zwar im Index bein Yahoo sind aber keine Sitemap gefunden werden kann?
Eben genau so wie jetzt; mit einer fiktiven maximalen Anzahl möglicher indizierter Seiten.
Das sollte aber zweitrangig sein, da ein fehlen einer sitemap.xml bereits ein schlechtes Bewertungskriterium darstellt.

"joerg" schrieb:
Ausserdem wenn ich richtig informiert bin wird es den Yahoo Site Explorer bald nicht mehr geben. Ab heute wird er nicht mehr gepflegt wenn die Informationen stimmen.
Das habe ich auch schon genau so gehört/gelesen.

Ich will hier keine neue Diskussion lostreten, sondern lediglich aufzeigen, dass die von Thomas, AKA bhvmedia, angesprochene Lösung nicht so kompliziert wäre.

Servus,
Klaus

klaus_b@.NET über alles was an .NET und C# Spass macht.
http://www.seitenreport.de/twitter_icon_small.png
 
Verfasst am: 15. 09. 2011 [13:56]
Ultima
Dabei seit: 09.07.2010

759 Beiträge
Beitrag hilfreich?

"klaus_b" schrieb:
Da SR die sitemap Adresse aus der robots.txt liest und sich nicht auf den Namen verlässt, sollte dieser Punkt erledigt sein.

Nun nur wissen das die wenigsten.

"klaus_b" schrieb:
Das kann bereits mit "einem Blick" in das XML geklärt werden, also nicht weiter tragisch.
Nicht mit einem, eine Index Map kann genauso gut weitere Index Maps enthalten.

"klaus_b" schrieb:
Am längsten hierbei dürfte das Laden vom Server dauern. Da aber die SR Analyse in weiten teilen asynchron läuft, sollte das auch kein Problem darstellen.

Bei Sitemaps mit über 10k an Urls kommt eine recht große Datenmenge zusammen. Diese zu verarbeiten kann sehr aufwendig werden.

"klaus_b" schrieb:
Für solche Analysen sollten performante und typsicher Sprachen verwendet werden, und keine interpretierte Skriptsprache. Das ist nicht abwertend gemeint, sondern rein faktisch icon_smile.gif
Du meinst typisiert, wobei php das auch ist. Aber welche Sprachen würdest du denn empfehlen?


Was ist denn eigentlich mit dem bei Google indizierten Seiten? Die werden bei der Analyse noch gar nicht berücksichtigt.


Schöne Grüße
Thomas

 
Verfasst am: 15. 09. 2011 [14:21]
klaus_b
Dabei seit: 17.12.2009

327 Beiträge
Beitrag hilfreich?

"Ultima" schrieb:
Bei Sitemaps mit über 10k an Urls kommt eine recht große Datenmenge zusammen. Diese zu verarbeiten kann sehr aufwendig werden.

Warum Datenmenge? Es geht um ein simples zählen während des ladens. Das sollte normalerweise in einem Stream synchron zum laden zu erledigen sein. So muss ausser der ermittelten Anzahl der enthaltenen uri-Einträge nichts gespeichert werden.

"Ultima" schrieb:
Du meinst typisiert, wobei php das auch ist. Aber welche Sprachen würdest du denn empfehlen?
Ich meine typsicher.
Da hier die meisten Linux-Server verwenden würde ich zu C oder C++ raten. Auf einem Windows-Server würde ich C# mit dem .NET-Framework verwenden.


"Ultima" schrieb:
Was ist denn eigentlich mit dem bei Google indizierten Seiten? Die werden bei der Analyse noch gar nicht berücksichtigt.

Das solltest du den Matthias fragen icon_smile.gif

Servus,
Klaus


Schöne Grüße
Thomas


klaus_b@.NET über alles was an .NET und C# Spass macht.
http://www.seitenreport.de/twitter_icon_small.png
 
Verfasst am: 15. 09. 2011 [14:36]
hansen
Dabei seit: 18.05.2009

1422 Beiträge
Beitrag hilfreich?

"Ultima" schrieb:

Was ist denn eigentlich mit dem bei Google indizierten Seiten? Die werden bei der Analyse noch gar nicht berücksichtigt.

Hallo Thomas,

Yahoo hat bis heute einen Dienst angeboten, die Backlinks abzufragen.
http://developer.yahoo.com/search/siteexplorer/
Weder Google noch Bing bieten so etwas an.

Gruß
hansen


 
Verfasst am: 15. 09. 2011 [15:25]
joerg
Dabei seit: 09.06.2009

1540 Beiträge
Beitrag hilfreich?

Hallo Klaus

Also man könnte das Skript dann noch soweit verfeinern das man mit einem Sitemapindex anfängt der wiederum 16 Sitemapindex erhält und so weiter bis am Ende dann eine Sitemap in einem Sitemapindex steht.

Aber fangen wir damit mal an das du es schaffst diesen Sitemapindex vollständig auszulesen.

Sitemapindex

So eine Analyse wirklich lauffähig zu machen und das in einer angemessenen Zeit bei dem was möglich ist nach der Spezifikation aufzubauen bezweifle ich etwas.

Gruß
Jörg

 




Du bist nicht eingeloggt. Bitte beachte, dass Du eingeloggt sein musst, um Themen zu erstellen oder auf Beiträge zu antworten.

RSS Feed abonnieren

Werde in Echtzeit über neue Foren-Beiträge informiert:



8 Mitglieder waren innerhalb der letzten 15 Minuten online (109 heute gesamt):
fotopalm, mawsmp, presse, Schlifff, speed4tr, Sport-Mentaltraining, wakoda, zauberlinchen

Administratoren und Moderatoren:
[keine]

Seitenreport hat 18138 registrierte Mitglieder, 3002 Themen und 29106 Beiträge.
Der aktuelle Mitgliederzuwachs liegt bei durchschnittlich 12 bestätigten Neuregistrierungen pro Tag.
Pro Tag werden im Seitenreport Forum durchschnittlich 1 neues Thema und 7 Beiträge erstellt.
Die Durchschnittszahlen berechnen sich aus den letzten 7 Tagen.

Mehrfach empfohlen

Seitenreport ist einer der bekanntesten SEO und Website Analyse Dienste im deutschsprachigen Raum und wurde u.a. schon empfohlen:
von Mr. Wong im Wong Letter
vom Leserservice der Deutschen Post
vom Technik Blog SiN
und vielen anderen

Partnerprogramm

12% Lifetime Provision auf alle Buchungen von Dir geworbener Mitglieder sowie 0,50 € für jede Registrierung. Eines der besten deutschen Partnerprogramme laut den appCharts von 100partnerprogramme.de. Nimm jetzt teil am Seitenreport Partnerprogramm und verdiene gutes Geld dabei!

* = Partnerlinks