Facebook: Datamining ohne Zustimmung der Nutzer

 Fast wäre die Meldung an mir vorbeigegangen. Der Blog-Eintrag des Facebook-Data-Team mit dem eher sperrigen Titel „Politico, Facebook Team Up to Measure GOP Candidate Buzz“ lässt die weitreichenden Konsequenzen dieses Deals aber kaum erahnen. Denn Facebook gibt das erste (?) Mal einer fremden Firma – in diesem Fall dem auf Polit-News spezialisiertem US-Medium Politico – die Erlaubnis, seine Nutzerdaten zu analysieren. In anderen Worten: Facebook betreibt Datamining und gewährt Kunden tiefen Zugriff auf die Inhalte der Nutezr. Bisher hat Mark Zuckerbergs Firma offiziell nur seine eigenen Ingenieure Datamining machen lassen (z.B. beim Gross National Happiness Index), jetzt gehen die Daten auch außer Haus – in streng anonymisierter Form, wie betont wird. Geld soll dabei keines an Facebook geflossen sein.

Politico untersucht dabei die Stimmung unter den Nutzern in Bezug auf republikanische Kandidaten bei den US-Vorwahlen in South Carolina am 21. Jänner. Dazu werden sämtliche (ja, sämtliche) Statusmeldungen und Kommentare von US-Nutzern dahingehend ausgewertet, ob die Namen der Kandidaten in einem positiven oder negativen Zusammenhang erwähnt werden. Diese werden dann von Software analysiert, heraus kommen Grafiken und Statistiken wie jene oben, die Politico samt Analyse (z.B. diese hier) veröffentlicht.

Protest vorprogrammiert
Was bei Politberatern und Wahlkampf-Leitern (in den USA gibt es bereits mehr Facebook-Nutzer als Wähler) wohl für Herzrasen sorgt, wird bei Datenschützern und auf Privatsphäre bedachten Nutzern für Proteste sorgen, und zwar aus drei Gründen:

1. Facebook gibt Politico auch Zugriff auf als „privat“ einzustufende Nutzer-Inhalte (z.B. nur „sichtbar für Freunde“)

2. Facebook hat die Nutzer nicht um Erlaubnis gefragt, ob sie analysiert werden wollen

3. Es gibt keine Möglichkeit zum Opt-out, also keine Chance, das Datamining für seine eigenen Daten abzudrehen.

Warum Facebook wieder einmal diesen Weg wählt, ist mir nach der langjährigen Kritik an den Praktiken der Firma schleierhaft. Man hätte die Nutzer etwa fragen können, ob sie mitmachen wollen, sie über die anstehende Auswertung informieren können oder ihnen zumindest die Möglichkeit zu Aussteigen aus der Analyse geben sollen – für ein Unternehmen der Kommunikations-Branche ist das sehr fragwürdig. Immerhin geht es hier nicht um Wurstsemmel-Postings, sondern um politische Ansichten von US-Wählern.

Kritik an der Methode
Wie der US-Autor Micah Sifry, in einem Artikel seines Tech-Polit-Magazins TechPresident.com argumentiert, sei die von Facebook verwendete Methode „Sentiment Analysis“ aber ein „Schwindel“. Denn einfach Wörter zu zählen und diese als positive oder negative Erwähnung einzustufen, wurde falsche Ergebnisse liefern. Würde etwa ein Facebook-Nutzer schreiben, „I’m so happy that Newt Gingrich is staying in the race“, könne die Analyse nicht feststellen, ob das ehrlich, sarkastisch oder sonstwie gemeint war.

Für dieses Problem hätte ich aber einen Lösungsansatz. Wie ich kürzlich in dem Blog-Eintrag „Like, fail und wtf: Social Media als Sprachwandler“ beschrieben habe, verwenden Social-Media-Nutzer zunehmends Kürzel wie „fail“ oder „ftw“, um eine Bewertung zu einem Sachverhalt abzugeben. Wer eine Methode entwickelt, diese Kürzel auszuwerten, könnte mit einem Schlag viel qualitativere Daten bekommen als mit einer reinen Wortzählung.

Datamining in Österreich
Facebook wird aber nicht nur in den USA zu Datamining-Zwecken herangezogen. Die Österreichische Gesellschaft für Marketing betreibt Datamining für meinen Arbeitgeber KURIER, wie ich in einem Artikel beschrieben habe. Die „Web2Watch“ getaufte Software durchsucht Quellen wie Facebook, Twitter, Internet-Foren und Weblogs auf besonders häufig genannte Stichwörter. Der große Unterschied: Anders als in den USA werden dabei aber nur öffentliche Daten (sichtbar „für alle“) ausgelesen. Außerdem wird laut OGM eine Möglichkeit zum Optout gegeben. Verwendet wird zur Analyse das beliebte Tool Radian6, dass dem Cloud-Spezialisten Salesforce gehört (ein Blogeintrag darüber hier).

Datamining ist jedenfalls ein lukratives Geschäft: OGM kann seine Dienste für bis zu 150.000 Euro pro Jahr der Wirtschaft und der Politik anbieten. Nicht auszudenken, wie viel Geld Facebook mit einem ungleich größeren Daten-Pool scheffeln könnte. Sollte der US-Firma aufgrund kommender neuer EU-Datenschutzbestimmungen (ein Blog-Eintrag von mir zum Thema hier) eine Einnahmequelle (personalisierte Werbung) wegbrechen, könnte man auf dieses neue Geschäftsfeld umsatteln. Politico ist damit wohl nur der erste Akt eines neuen Dramas.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Du kannst folgende HTML-Tags benutzen: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>