Chamerstrasse 44, 6331 Hünenberg
+41 41 511 10 10

Big Data im Marketing: Tappen Sie nicht in die Tech-Falle!

Big Data liegt im Trend. Wir sehen das rasch wachsende Datenvolumen im Online Marketing und können damit erahnen, was dann erst beim «Internet der Dinge» auf uns zukommen wird. Aber was verstehen wir eigentlich unter Big Data und braucht es dazu wirklich neue technische Lösungen?

Big Data Definition: 3v oder 5v?

Als Marketer wird man natürlich direkt an die 4p’s (product, price, place und promotion) erinnert, die man im Studium eingeimpft bekommen hat. Und ich empfinde den Ansatz der 3 respektive 5v’s im Big Data als sehr sinnvolle Illustration der Problemstellung:

  • Volume
  • Velocity
  • Variety
  • Value
  • Validity

Die letzten beiden Punkte Value und Validity sind bei den 3v nicht enthalten, aber für mich gehören sie zu Big Data zwingend dazu, wie nachfolgend erläutert. Also ein klares Votum für Big Data 5v!

Wenn wir von Big Data reden, dann sehen wir gleich die grossen Datenberge vor uns, die zu handhaben sind. Das erste V steht dabei für Volume, das Datenvolumen. Aber wann sprechen wir nun von Big Data bezüglich Datenvolumen? Es gibt Kunden von uns, die sprechen von Big Data, wenn sie die Daten nicht mehr mit MS Excel verarbeiten können.

Wir sprechen von Big Data, wenn wir die Daten nicht mehr auf einem herkömmlichen Datenbanksystem mit einer handelsüblichen Hardware verarbeiten können. Und bei dieser Definition liegen die Schranken dann schon recht hoch, denn wir sprechen über Volumina mit über einer Milliarde Beobachtungen in relationalen Tabellen. Und das ist natürlich immer abhängig von der Anzahl grossen Entitäten (Tabellen) und der «Fettheit» der Tabellen (Anzahl Spalten). Natürlich hängt es auch davon ab, was man mit den Daten machen möchte.

Die Velocity (Schnelligkeit, Performance) betrifft einerseits die Datenverarbeitung im Hintergrund (Ladestrecken) und andererseits die für den Nutzer spürbare Performance. Im Big Data Online Marketing ist Realtime Marketing bereits Alltag, aber im Internet der Dinge dürften wir noch vor viel grösseren Herausforderungen stehen.

Die Variety (Variabilität der Datenstrukturen) ist aus meiner Sicht ein ganz wichtiger Aspekt für Big Data. Bei «Data» denkt man oft sofort an relationale Tabellenstrukturen, aber die Datenvielfalt hat sich «vervielfältigt». Texte, Bilder und Videos spielen im Online Marketing eine zentrale Rolle und aus dem Geomarketing sowie aus Google Maps kennen wir die georeferenzierten Daten. Weitere Datenstrukturen und Quellen werden dazukommen.

Bis zum Online Marketing war der Value der Daten (Datenwert) kein grosses Thema. Bei den Verhaltensdaten aus dem Internet sehen wir, dass der Wertverfall rasend schnell ist. Hier einige Beispiele von Daten mit ihrer Halbwertszeit (unsere Erfahrungswerte):

  • Schäden bei Versicherungen: ca. 15 Jahre Kaufvergangenheit
  • Im Handel: ca. 5-10 Jahre (abhängig vom Geschäftsfeld)
  • Abos bei Verlagshäusern: ca. 5 Jahre
  • Kontakthistorie klassische Kanäle: ca. 2 Jahre
  • Besuche Website: ca. 1 Jahr
  • Page Impressions Website: < 0.5 Jahre

Wie kann man solche Werte ermitteln? Wir nutzen diese Daten für das Modeling und lassen die Modelle entscheiden, welche Datenhistorie relevant für Entscheidungsprozesse ist. Entsprechend lassen sich die oben genannten Werte ungefähr ableiten.

Validity steht für Datenqualität, also für Eigenschaften wie Korrektheit, Aktualität oder Vollständigkeit der Daten (siehe auch Datenmanagement). Wenn Sie mit Daten arbeiten, dann kennen Sie dieses zeit- und nervenaufreibende Thema, um das am liebsten alle einen grossen Bogen machen. Aber Sie wissen auch, dass es für hochwertige Analysen und Reports das wichtigste Thema überhaupt ist. Und es wird auch bei Big Data das wichtigste Thema bleiben! Ich bin gerade am letzten Wochenende in der Sonntagspresse (Sonntagszeitung vom 19.03.2017) über zwei interessante Artikel zu diesem Thema gestolpert:

  • «Wer brav fährt, wird vom Versicherer belohnt» (Artikel Seite 38): «…Allerdings sind die Daten nicht immer zuverlässig. Der Versicherungskonzern Axa zog seinen Drive Recorder, einen im Auto eingebauten Fahrtenschreiber, Ende Jahr aus dem Verkehr. Die Daten waren nicht präzise genug»
  • «Intelligente Stromzähler messen falsch» (Artikel Seite 44): Hier geht es um eine Studie, die aufzeigt, dass unglaublich grosse Ungenauigkeiten bei den Messungen auftreten.

Wir sehen also, dass es bezüglich Datenqualität im Internet der Dinge nicht besser, sondern eher schwieriger wird. Das Monitoring der Datenqualität wird ein wichtiges Thema in den nächsten Jahren werden und die Big Data Solutions müssen in diesem Punkt deutlich mehr leisten als das meist klägliche Monitoring, das heutige Systeme bieten! Zudem muss der Umgang mit fehlenden (missing values) oder falschen Daten deutlich besser automatisiert werden können.

Big Data Analytics

Unter Marketing Analytics werden sehr unterschiedliche Themen verstanden, deswegen möchte ich diese etwas differenzieren und auf folgende Punkte eingehen:

  • Reporting
  • Machine Learning / Data Mining
  • Realtime Decision Marketing

Im Reporting bestehen die Anforderungen an Big Data vor allem in puncto Performance. Abfragen sollten gute Antwortzeiten haben, auch wenn grosse Datenmengen darunterliegen und sie anspruchsvoller sind. Wir haben hier in den letzten Jahren vor allem «technische» Innovationen gesehen, z.B. «In-Memory» Lösungen wie Qlikview, Tableau, SAP-Hana oder auch neue Lösungen für Web Analytics. Nüchtern betrachtet führten diese Ansätze zu keinen Quantensprüngen in der Performance, sondern erbrachten eher gute Verkaufsargumente für die Firmen. Ich würde mir wünschen, dass sich die Reporting-Lösungen mehr hinsichtlich Umgang mit schwierigeren Daten, z.B. historisierten Stammdaten oder Vertragsdaten, verbessern würden. Noch immer sehen wir (zu) oft simple Snowflake-Schemas, die heutigen Anforderungen nicht mehr genügen.

Im Machine Learning und Data Mining sehen wir über die letzten Jahre kontinuierliche Entwicklungen und eine Rückkehr zu den kostenlosen Statistiksoftware Paketen R-Project oder Python. Die im Machine Learning angewendeten Methoden wie Predictive Analytics können Sie auch in der Big Data Analytics nutzen, da das Performance-Thema durch Stichprobenbildung umgangen werden kann. Wir sehen in den Machine Learning Tools eine Ausweitung der Algorithmen hinsichtlich Variety der Daten, d.h. die Tools enthalten nun auch Module im Umgang mit Texten oder Bildern (Mustererkennung).

In den letzten 5 Jahren haben wir eine starke Entwicklung des Realtime Decision Marketings gesehen. Im Online Marketing müssen in Realtime Entscheidungen getroffen werden, z.B. was dem Kunden empfohlen werden soll. Technisch wird im Hintergrund meist eine Mischung aus vorberechneten Kundeninformationen (z.B. persönliche Empfehlungen) und einem Realtime Regelwerk angewendet. So können Sie durch eine geschickte Splittung auf diese beiden Komponenten die Performance-Thematik in den Griff kriegen.

Big Data Software

Neue Big Data Solutions stecken noch in der Entwicklungsphase. Die bekannteste Lösung ist «Apache Hadoop» (Open Source) basierend auf der Big Data Architecture «MapReduce». Hadoop kann wie die üblichen Datenbanksysteme von kommerziellen Tools wie SAS angesprochen werden. Wie der Name schon sagt, werden bei diesen Ansätzen die Daten reduziert, was aber auch Auswirkungen auf die Genauigkeit der Resultate hat.

Wir gehen davon aus, dass alle grossen Softwarehäuser wie Microsoft, Oracle, IBM oder SAP zu gegebener Zeit eigene Big Data Applications in Ergänzung zu Ihren bestehenden Lösungen präsentieren werden. Ob sich ein «Big Data Standard» durchsetzen wird, ist noch völlig offen. Aufgrund des starken Konkurrenzkampfes zwischen diesen grossen Playern sehen wir das eher kritisch. Im Moment betrachten wir den Einstieg in die technische Big Data Solution Thematik nur für die ganz grossen Firmen als sinnvoll. In der Schweiz reden wir hier vielleicht von 10-20 Unternehmen, die bereits entsprechende Datenvolumen und Fragestellungen vorliegen haben und sich an der Forschung zu diesen Themen beteiligen möchten.​

Big Data Trends im Marketing

Wir sehen folgende Big Data Trends im Marketing, die in greifbarer Zukunft Realität werden könnten:

  • Die Datenvolumen werden weiter zunehmen – vor allem aus dem Online Marketing und den zunehmend aufgreifbaren Daten aus dem Internet der Dinge
  • Datensilos hinsichtlich Variety der Daten werden sich weiter auflösen. Auch die Maschine Learning Tools werden mit den unterschiedlichen Daten umgehen und sie auch kombiniert analysieren können
  • Im Realtime Decision Marketing werden wir neue Ansätze sehen, bei denen sich die Empfehlungslogik besser in die Online Systeme integrieren lässt und auch echte lernende Systeme möglich sind

Fazit

Spezielle Big Data Solutions stecken noch in den Kinderschuhen und bieten Ihnen für gängige Fragestellungen aus dem Marketing momentan keinen Mehrwert. Falls Sie sich nicht an der Forschung und Entwicklung in Big Data Architecture beteiligen möchten, dann sollten Sie nicht in die Technologie, sondern in die Umsetzung konkreter Fragestellungen investieren, um diese Learnings für die Zukunft mitzunehmen.

Fragestellungen aus dem Online Marketing und auch Realtime Marketing können Sie mit der bestehenden Technologie realisieren. Wählen Sie die Technologie aufgrund Ihrer Anforderungen aus. Damit bringen Sie Kosten/Nutzen am besten in ein vernünftiges Verhältnis. Investieren Sie in den Aufbau Ihres Data Warehouse und in dessen Ladeprozesse und Datenqualität. Und lernen Sie, welche analytischen Komponenten für Sie wichtig und welche Ansätze erfolgreich sind. Um dieses Know-how aufzubauen brauchen Sie mehrere Jahre und Sie brauchen es später auch bei Big Data!

Gerne unterstützen Sie unsere (Big) Data Scientists bei Fragen rund um Data Warehousing, Machine Learning oder andere Big Data Analyse Themen aus Sicht der Anwendung. Auch bei der Identifizierung und Priorisierung von Fragestellungen in Ihrem Unternehmen können Sie von unserem reichen Erfahrungsschatz in unterschiedlichen Branchen profitieren.

7. April 2017

Leave a reply