Ein alter Spezi erzählte mir letzthin, es sei ziemlich schwierig, Freunden und Bekannten sein Forschungsgebiet des semantischen Web näher zu bringen. Ich bin (via ebiquity) auf ein Video von Manu Sporny gestoßen, das das klassische “Kind, jetzt sag mal, was du in der Ferne so treibst”-Weihnachtsdilemma für alle Semantiker dieser Welt lösen sollte. ;-)

Ach, und: Frohes neues Jahr allerseits!

Die European Interactive Advertising Association (EIAA) hat in Teilen Zentral- und Nordeuropas Menschen bezüglich ihrer Mediennutzung befragt. Der Studie zu Folge sind in den 10 befragten Ländern Europas mittlerweile 169 Millionen Menschen online - im Durchschnitt satte 12 Stunden pro Woche. Besonders stark steigt die Nutzung des Internets bei den 16- bis 24-jährigen - sie nutzen das “neue” Medium mittlerweile 10 Prozent mehr als beispielsweise den TV.

Als Resultat wird vor allem das hohe Potential innerhalb des rasanten Wachstums herausgestellt, das Vermarkter in Zukunft noch mehr nutzen können, wenn sie das Userverhalten besser verstehen lernen.

Die sechsseitige Zusammenfassung der Studie auf Grundlage von Befragten aus Belgien, Dänemark, Deutschland, Frankreich, Großbritannien, Italien, den Niederlanden, Norwegen, Schweden und Spanien findet sich hier.

Für das Monitoren von Blogs gibt es eine Vielzahl unterschiedlicher Herangehensweisen, unter denen sich bisher keine Standards etablieren konnten. Für ein Referat an der Uni habe ich versucht, die derzeit gängigsten Methoden zu systematisieren und in einen Kontext zu stellen. Diese Systematisierung möchte ich hier (aufgeteilt auf mehrere Beiträge) vorstellen und zeigen, an welchen Stellen die wesentlichen Limitationen unterschiedlicher Blog-Monitoring-Verfahren liegen.

Ich habe zur Systematisierung ein Chart erstellt, das ihr unter CC-Lizenz gerne verwenden und weiterentwickeln könnt. Ich gehe nicht davon aus, dass dieses Chart perfekt ist – aber möglicherweise findet ihr es brauchbar, und für Verbesserungsvorschläge bin ich immer offen. An diesem Chart werde ich mich im Folgenden “entlang hangeln”.

Systematisierung Blog-Monitoring
Creative Commons License

Liste relevanter Blogs generieren

Auf die erste Herausforderung stößt man beim Blog-Monitoring bereits sehr früh: bei der Definition der Grundgesamtheit, die analysiert werden soll – also bei der vollständigen Erfassung der aller relevanter Blogs (bzw. der gesamten Blogosphäre). Weder gibt es eine vollständige Liste aller Blogs, um sicherzustellen, dass kein Blog im Monitoring vergessen wird, noch ist die Blogosphäre eine statische Grundgesamtheit. Selbst wenn es eine Liste aller Blogs gäbe, wäre sie nur für kurze Zeit aktuell – denn ständig entstehen neue Blogs und manche bestehenden Blogs werden nicht weiter aktualisiert (wobei letzteres unproblematisch ist – außer, dass damit die Größe der Blogosphäre überschätzt wird). Technisch kann nicht ermittelt werden, ob es sich bei einer Website um einen Blog handelt oder beispielsweise um eine klassische Nachrichten-Website, die RSS-Feeds einsetzt.

Dieses Problem kann nur über Workarounds gelöst werden: Technorati definiert seine Grundgesamtheit beispielsweise als all jene Blogs bzw. Webseiten, die sich aktiv dort indizieren lassen. Google legt (in gewohnter Manier) mit seiner Blog-Suche das Aufgreifkriterium erst gar nicht offen. Professionell arbeitende Blog-Monitoring-Anbieter erstellen und aktualisieren ihre Grundgesamtheit üblicherweise selbst, beispielsweise indem sie (wie hier für BlogPulse beschrieben) von unvollständigen Blog-Listen ausgehend nach weiteren URLs crawlen – über Blogrolls, Trackbacks, Kommentare und/oder klassische Querverweise.

Entscheidend bei der Auswahl einer Blog-Suchmaschine oder eines Blog-Monitoring-Services ist also auf der Ebene der Blog-Erfassung die Vollständigkeit und die Geschwindigkeit, mit der neue Blogs gefunden und der zu analysierenden Grundgesamtheit hinzugefügt werden. Die Kriterien dafür sollten für den Kunden offen gelegt und nachvollziehbar sein.

Relevante Einträge filtern

Wenn eine Grundgesamtheit steht, werden daraus im nächsten Schritt relevante Beiträge gefiltert. In aller Regel geschieht dies über eine Schlagwortsuche nach Begriffen, die der Kunde vorgibt – beispielsweise Marken- oder Produktnamen des eigenen Unternehmens und von Wettbewerbern. Für viele Fragestellungen mag dieses Vorgehen ausreichend sein – es entspricht der Logik konventioneller automatisierter Presseclipping-Services.

Die Grenze der Schlagwortsuche liegt an jenem Punkt, an dem auch Blog-Beiträge von Interesse sind, die nicht zwingend ein oder mehrere vorhersehbare Suchbegriffe enthalten. Will ein Unternehmen ein echtes Issues-Monitoring betreiben, ist nicht nur entscheidend, ob der Unternehmens- oder Markenname in einem Blog-Beitrag auftaucht – sondern, ob ein Thema in einem Blog-Beitrag aufgegriffen wird, das z. B. in Zusammenhang mit dem Tätigkeitsbereich eines Unternehmens steht. Energieversorger können beispielsweise daran interessiert sein, wie bestimmte Verfahren zur Energiegewinnung in der Blogosphäre beurteilt werden. Besonders anspruchsvoll zu monitoren sind Themen, von denen dem Unternehmen noch gar nicht bekannt ist, dass sie überhaupt existieren.

Inhaltsanalytische Verfahren können theoretisch dazu dienen, weitere Phrasen in Zusammenhang mit den ursprünglichen Suchphrasen zu entdecken, und diese dann wiederum in die Filterung der Beiträge einfließen lassen. Als iteratives Verfahren könnte dieser Schritt beliebig oft wiederholt werden. Mir ist derzeit kein Blog-Monitoring-Anbieter bekannt, der solche lernende Filter einsetzt. Für sachdienliche Hinweise bin ich dankbar. :-)

Um die Inhaltsanalyse von Blogs soll es dann im nächsten Beitrag gehen.