Bericht mit Graf Zahl: Daten aussaugen für E-Book-Vertrieb und Marketing

Veronica Maidl (Open Publishing) und Sibylle Bauschinger (Bilandia) gestalteten Ihr Panel zu Daten als eine Mischung von Vortrag und Gruppenbrainstorming.

Anhand des klassischen 3 Äpfel Clips, mit Graf Zahl und dem Krümelmonster, gab es einen kurzen Rückblick auf die ursprüngliche linearer Datenerhebung, wie sie lange Zeit, wenn auch ein wenig komplexer (Absatz, Umsatz, Vertriebsweg) von Verlagen praktiziert wurde und auch heute noch oft im Einsatz ist.

Heute gibt es jedoch nicht nur mehr Daten die jeder Verlag selber erhebt bzw. erheben kann und mit externen Daten anreichern kann (Stichwort: Big Data), sondern auch die technischen Möglichkeiten diese Daten in komplexeren Abfragen in Korrelation zu setzen und auszuwerten (Stichwort: Data Mining).

So wurde als erstes das Beispiel von Graf Zahl dahingegen erweitert, dass beiden Charakteren heute mehr Informationen zu den 3 Äpfeln (Sorte, Geschmack, Herkunft, Beliebtheit etc.) zur Verfügung stehen würden. Diese würden es dem KM erlauben den Apfel zu wählen der am ehesten seinem Geschmack entspricht und GZ wertvolle Hinweise liefern zum Verhalten des Apfeldiebes.

Doch egal wie viele Ausgangsdaten wir sammeln (Quelle, Art, Menge, Qualität, Zeitraum etc.) um sie gut auswerten zu können gibt es zwei grundlegende Frage die wir uns als erstes stellen müssen:

  1. Qualität unser Daten? Ist sie gut oder schlecht? Wenn die Daten an sich gut sind, aber in einem Format existieren, welches sich schlecht auswerten lässt, wie können wir sie aufbereiten damit sie nutzbar werden? Denn eine grundlegende Wahrheit der Datenauswertung bleibt auch bei großen Datenmengen relevant:

    Sprich auch zu viele Daten sind nicht unbedingt zielführend, es sei denn, ich weiß genau, wozu und wieso ich sie anwende!
  2. Data Mining zielt auf das Finden von Mustern ab, doch auch hier muss ich mich nicht nur fragen ob meine Daten meine Fragen beantworten können, sondern auch ob ich die Daten auf diese Art und Weise auswerten darf! So sieht der Datenschutz, z.B. vor, dass ich in DACH nur anonymisierte Daten analysieren darf.

Nachdem ich nun meine Daten in Ordnung gebracht habe, kann ich mich entscheiden welche und wie genau formulierte Fragen ich an welche Datensätze stellen will. Sobald ich durch diese Fragestellungen erste Muster erkannt habe, kann ich diese wiederum auf andere Datensätze anwenden um ihre Validität zu überprüfen und neue Fragen herauszuarbeiten.

Dank dieses Ansatzes wächst im Laufe der Zeit nicht nur mein Verständnis der einzelnen Faktoren welche meine Produkte und ihre Chancen im Markt betrifft, ich erarbeite mir auch ein Wissen über z.B. das Zusammenspiel der einzelnen Marktfaktoren.

So können uns Daten in Zukunft z.B. dabei helfen nicht nur den richtigen Preis eines Produktes, sondern auch ein ausgesteuertes flexibles Pricing zu ermöglichen (Preisaktionen bzw. Lebenszyklusplanung von Preisen)

Statt weiter komplett im theoretischen zu verharren wurden sechs Gruppen gebildet, welche sich nach folgenden Parametern Gedanken zu für Bücher relevanten Pseudo Anfragen machen sollten:

Zuerst machte sich jede Gruppe Gedanken dazu, welche Datenquellen und Arten für uns interessant sein könnten. Aus diesen bildeten wir dann Beispiel Codes. Allgemeine Erkenntnisse aus allen Gruppen lassen sich wie folgt zusammenfassen:

  • Neben Sales und Metadaten stellen vor allem aus Marketing und Medien gewonnene Daten unsere Grundlage da auf der wir durch Veränderungen & Verschiebungen eine Muster herausfiltern können, welches es uns gestattet den Verkauf anzukurbeln und Trendmining zu betreiben.
  • Unsere Quellen lassen sich grob nach intern und externen Daten unterschieden. Beide bedürfen der Bearbeitung (intern = Anonymisierung, extern = Gewichtung der Daten in Bezug auf Vertrauen und Einsatz)
  • Man kann nicht nur wenn-dann Abfragen stellen, sondern auch wenn-wenn-dann bzw. wenn-dann-dann usw.
  • Gut organisierte Dashboards sind bei diesen Datenmenge nötig um den Überblick zu behalten.

Open Publishing brachte neben der Theorie und dem Workshop Anteil aber auch noch zwei reale Beispiele zu Datenauswertungen mit zum diesjährigen eBook Camp mit. Diese Beispiele stammen aus den bereits analysierten Daten, welche Open Publishing seit 2013 fortlaufend sammelt.

Diese Daten wurden normalisiert und greifen der Vergleichbarkeit halber auf den BISAC Code als Ordnungsanker zurück. Hintergrund dieser Entscheidung ist die klarere Definition von Gruppen als es mit der VLB Systematik möglich wäre.

Unser erstes Beispiel fokussiert sich auf einen Titel mit 4 Jahre Lebensspanne der in diesem Zeitraum mehrere Preisaktionen durchlebte. Diese mal mit klarer Marketingeinbindung auf mindestens einer Plattform, mal ohne ausgesteuerte Maßnahmen. Dies ermöglicht somit einen längerfristigen Überblick in dem sich verschiedene Faktoren gewichten und vergleichen lassen:

Wie man hier sieht, ist das ‚Ziel der Aktion‘ somit eingebunden und man kann gewichten ob sich die aktive ‚Investition‘ in ein Handelspartner bei einer solchen Aktion auszahlt. Langfristig ist das Ziel anhand solcher Einzelauswertungen ein Predictive Machine Learning Modul aufzusetzen, welches dem betreuenden Produktmanager vorschlägt bei welchem Titel sich welche Art von Aktion lohnen würde. Die endgültige Entscheidung der Umsetzung liegt jedoch beim Produktmanager selber basierend auf den eigenen gesammelten Erfahrungen.

Im zweiten Beispiel kamen wir auch auf eine mögliche Preiserhöhung für einen Titel zu sprechen. Hierbei suggeriert die derzeit bereits ausgewertete Datenlage stark vom Titel abhängig ist. Es gibt solche die es vertragen (e.g. Zugpferd Autor) und solche die es nicht tun (Stichwort: Genre bekannt für durchschnittlich niedrige Preise).

Hier wurde noch die Frage in den Raum gestellt, dass es Genre gibt welche sich besser oder schlechter für Preisaktionen anbieten, unabhängig vom rabattierten Titel selber. Eine klare Antwort lässt sich hier derzeit jedoch noch nicht liefern.

Dr. Silke Niehusmann



Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.