Meldung
08.12.2015

„Aus Big Data muss Smart Data werden“

Interview mit Prof. Dr. Dr. Stefan Jähnichen und Prof. Dr. Volker Markl

Im Interview erläutern Prof. Dr. Dr. Stefan Jähnichen und Prof. Dr. Volker Markl, warum das Thema „Big Data“ so wichtig für den Standort Deutschland ist, was es mit dem Begriff „Smart Data“ auf sich hat und welchen Herausforderungen sich das Technologieprogramm „Smart Data – Innovationen aus Daten“ und das „Smart Data Forum“ gegenüber sehen.

Prof. Dr. Volker Markl und Prof. Dr. Dr. Stefan Jähnichen
Prof. Dr. Volker Markl (links) und Prof. Dr. Dr. Stefan Jähnichen (rechts)
Prof. Dr. Dr. Stefan Jähnichen und Prof. Dr. Volker Markl

Prof. Dr. Dr. Stefan Jähnichen leitet die Begleitforschung des vom Bundesministerium für Wirtschaft und Energie (BMWi) geförderten Technologieprogramms „Smart Data – Innovationen aus Daten“. Er ist Direktor am FZI Forschungszentrum Informatik und lehrt an der Technischen Universität Berlin.

Prof. Dr. Volker Markl leitet das Fachgebiet Datenbanksysteme und Informationsmanagement (DIMA) an der Technischen Universität Berlin sowie die Forschungsgruppe „Intelligente Analyse von Massendaten – Smart Data“ am Deutschen Forschungszentrum für künstliche Intelligenz (DFKI). Er hält auch eine Professur an der School of Information der Universität Toronto. Zudem ist er Direktor des vom BMBF eingerichteten Kompetenzzentrums „Berlin Big Data Center“ (BBDC) und leitet das vom BMWi geförderte „Smart Data Forum“.

Daten werden immer häufiger als neuartige Rohstoffquelle, als Öl des 21. Jahrhunderts, bezeichnet. Was hat es damit auf sich?

Stefan Jähnichen: Wir produzieren tagtäglich Informationen, in allen möglichen Lebenslagen, sei es am Arbeitsplatz, beim Arzt, am Steuer unseres Autos oder beim Bäcker, sei es via Smartphone, via Smartwatch oder via Computer. Es handelt sich dabei um Text-, Bild- oder Sensor-Daten. Die Datenflut steigt und in der Tat, es ist schon fast unheimlich, was für eine schiere Masse an Daten wir produzieren. Wenn wir aber einkalkulieren, dass man diese Daten analysieren, auswerten und nutzen kann, dann kann man tatsächlich von Daten als einem Rohstoff sprechen. Denn es liegt ungeheuer viel Potenzial in diesen Datenmassen, den Big Data.

Neben dem Thema Cloud Computing und der IT-Sicherheit gehört laut Branchenverband BITKOM Big Data aus Sicht der IKT-Branche zu den wichtigsten Hightech-Trends. Warum ist das Thema so aktuell?

Volker Markl: Als Folge der Digitalisierung wachsen zum einen die verfügbaren Datenquellen und -mengen, zum anderen ergeben sich aus der Vernetzung neue Möglichkeiten des Zugriffs auf oftmals sehr heterogene, verteilte Datenbestände. Dabei kann es um Modelldaten im Maschinenbau gehen, wie RFID- oder Sensordaten in Produktionsprozessen, Energiedaten aus Smart Grids, Simulationsdaten aus der Klimaforschung oder um die Flut semistrukturierter Daten sowie Text-, Bild- und Videodaten aus sozialen Netzwerken im Internet. Allerdings sind diese Daten per se weder Informationen noch Wissen. Genauso wie Öl, sind Daten zunächst ein Rohstoff, der erst durch zahlreiche Verarbeitungs- und Verfeinerungsschritte einen vielfältigen Nutzen erzeugen kann. Big Data ist heute so aktuell, weil wir mittlerweile über die Rechner- und Speicherkapazitäten sowie die Technologien verfügen, um diese enormen Datenmengen nutzbringend zu verarbeiten.

Was verbirgt sich hinter dem Ausdruck Smart Data in Abgrenzung zu Big Data?

Stefan Jähnichen: Big Data bezeichnet zunächst einmal Datenmengen, die zu groß, zu komplex und zu heterogen sind oder sich zu schnell ändern, um sie mit bisherigen Methoden der Datenverarbeitung schnell und korrekt analysieren und nutzen zu können. Der Ansatz von Smart Data hingegen geht über diesen reinen Begriff der großen Datenmenge, ihrer Analyse und Auswertung hinaus: Smart Data sind aus den heterogenen und hochdimensionierten Datenmengen gewonnene nutzbringende, hochwertige und abgesicherte Informationen, bei denen neben der technischen Beherrschung der Datenmengen auch die Datenqualität, die Datensicherheit, den Datenschutz und der Nutzen im Blick genommen wurde. Damit wird aus den Daten letztlich Wissen generiert.

Grundlage einer Aufwertung und Nutzung solcher Datenbestände sind Technologien, die eine komplexe Verarbeitung möglich machen und damit aus den Daten Wissen generieren, das Mehrwert schafft und Grundlage der neuen Datenökonomie werden wird. Deshalb muss aus Big Data Smart Data werden. Die Technologien für diese Verarbeitung müssen mit Hochdruck entwickelt werden, da sie Grundlage für die Wettbewerbsfähigkeit unserer Industrien und Gesellschaften sind.

Was sind die größten Herausforderungen im Kontext von Smart Data?

Volker Markl: Erstens befindet sich die Technologie zur Erstellung komplexer Analysen aus sehr großen, heterogenen und dynamischen Datenquellen noch in den Kinderschuhen. Zweitens mangelt es an qualifizierten Data Scientists, die in der Lage sind, mit den vorhandenen Technologien Big-Data-Analysen durchzuführen. Dafür sind Kenntnisse aus verschiedenen Gebieten der Mathematik und Informatik erforderlich, beispielsweise aus den Bereichen Graphen- und Netzwerkanalyse, Statistik, Signal- und Sprachverarbeitung sowie Datenmanagement und Hardwareadaption. Und drittens gibt es noch große Herausforderungen im Bereich der Datensicherheit und des Datenschutzes. Digitalisierte Daten sind extrem schnell übertragbar, vervielfältigbar, verbreitbar, bearbeitbar und verwertbar, daher muss die Technologiedebatte zwingend durch eine Debatte über Mechanismen der Datensicherheit und des Datenschutzes und deren wirksamen und sinnvollen Vollzug begleitet werden.

Es muss sichergestellt werden, dass wir die Chancen von Big Data trotz Datenschutz nutzen können, um diese riesigen Potenziale zum Wohl von Gesellschaft, Wirtschaft und Wissenschaft ausschöpfen zu können. Hier muss man darüber nachdenken, ob unsere Konzepte des Datenschutzes und der Datensparsamkeit noch zeitgemäß sind, oder ob wir anstelle von Datenschutz nicht über Analyseschutz nachdenken sollten. Daten per se sind ja nicht das Problem, sondern kritisch wird es erst, wenn etwas mit erhobenen Daten gemacht werden soll. Es ist wichtig, dass wir eine sachliche Diskussion über Risiken und Nutzen führen, um zeitgemäß mit Daten und Analysen umzugehen. Eventuell kann man analog zu einem Organspenderausweis über eine Art persönlichen „Datenspenderausweis“ nachdenken, der den Analyseschutz in den Vordergrund stellt.

Stefan Jähnichen: Die Smart-Data-Begleitforschung hat gemeinsam mit dem Business Application Research Center BARC und dem Bundesverband der IT-Anwender VOICE 340 IT- und Businessentscheider befragt und das Thema Datenschutz war für über die Hälfte der Befragten eine der größten Herausforderungen beim Einsatz von Big-Data-Technologien. Da sich viele Einsatzszenarien auf den Kunden konzentrieren, bedürfen ihre Daten auch eines besonderen Schutzes. Dazu müssen Unternehmen die Daten nicht nur ausreichend anonymisieren, sondern auch vor Angriffen von außerhalb schützen. Je stärker Big-Data-Analysen allerdings Verbreitung finden, desto komplexer wird auch die technologische Infrastruktur. Diese samt der darin enthaltenen Daten zu schützen, ist eine große Herausforderung. Es muss hierfür auch eine klare Rechtslage im Umgang mit Smart Data geschaffen werden. Innerhalb der Begleitforschung haben wir hierzu eigens die Fachgruppe „Rechtsrahmen“ ins Leben gerufen, die sich mit diesen Fragestellungen auseinander setzt.

In welchem Bereich sehen Sie die größten Potenziale?

Stefan Jähnichen: Praktisch jeder gesellschaftliche und wirtschaftliche Bereich kann von der intelligenten Nutzung von Daten profitieren. Im Finanzwesen oder im Marketing sind Big-Data-Technologien bereits an vielen Stellen im Einsatz. Es gibt aber auch Branchen, in denen besonders viele heterogene Daten generiert und ausgewertet werden könnten, in denen das aber aufgrund unterschiedlicher Hemmnisse, bisher noch nicht flächendeckend passiert. Das Gesundheitswesen ist da sicherlich einer der spannendsten und gleichzeitig einer der kritischsten Bereiche, weil es hier eben um sehr sensible Daten geht. Innerhalb des Technologieprogramms werden neben der Gesundheit die Bereiche Mobilität, Energie und Industrie adressiert, weil es sich hier einerseits um wirtschaftlich eminent wichtige Bereiche handelt und diese andererseits besonders schutzbedürftig sind und einen besonders sensiblen Umgang mit den Daten erfordern. Neben dem Bereich Dienstleistungen und Handel sind das übrigens auch die Branchen, in denen die Befragten der Studie, die größten Potenziale sehen.

Volker Markl: Ich stimme Herrn Jähnichen absolut zu. Ich möchte noch ergänzen, dass Big und Smart Data Querschnittstechnologien sind, die praktisch alle Bereiche unseres Lebens durchdringen und nachhaltig verändern werden. Daher sehe ich ein sogar noch größeres Potenzial im Datenmanagement und der Softwareindustrie insgesamt, die die Basis für die Anwendungen in den genannten Bereichen durch Datenmanagementsysteme und Analysetechnologien schafft. Ein großer Teil der Arbeitsplätze wird meines Erachtens in diesem Bereich entstehen.

Mit welchem Ziel tritt das Smart Data Forum an?

Volker Markl: Die Veränderungen, die mit der Smart-Data-Nutzung einhergehen haben im Grunde die Kraft einer Revolution, die sich nicht nur im eigenen Land abspielt. Parallel forschen und entwickeln Länder weltweit Smart-Data-Lösungen. Das Smart Data Forum unterstützt das Technologieprogramm daher durch die Vernetzung auf europäischer und internationaler Ebene. Außerdem möchten wir noch intensiver die Anwender aus den unterschiedlichen Branchen miteinbeziehen. Im Laufe der Zeit werden wir einen Demonstrations- und Erlebnisraums für Smart-Data-Lösungen aufbauen. Wir haben in Deutschland eine hervorragende Forschungslandschaft, welche bahnbrechende und weltweit führende Technologien zu Big und Smart Data entwickelt.

Insgesamt wollen wir mit dem Smart Data Forum zeigen, dass Technologien „Made in Germany“ und „Made in Europe“ zur Weltspitze gehören und darauf aufbauende Lösungen große Potenziale für Wirtschaft, Wissenschaft und Gesellschaft entfalten. Das Smart Data Forum wird geleitet von einem Konsortium aus DFKI, Fraunhofer HHI und Fraunhofer IAIS und wird eng mit der Begleitforschung zusammenarbeiten.

Was ist Aufgabe der Smart-Data-Begleitforschung und wie wollen Sie künftig zusammenarbeiten?

Stefan Jähnichen: Die Aufgabe der Begleitforschung mit den Partnern FZI Forschungszentrum Informatik, der Gesellschaft für Informatik (GI) und der Agentur LoeschHundLiepold Kommunikation (LHLK) ist sehr vielfältig. Einerseits sind wir dafür da, die Förderprojekte des Technologieprogramms bei der möglichst effizienten Umsetzung ihrer Vorhaben zu unterstützen. Wir vernetzen die einzelnen Förderprojekte untereinander und gewährleisten einen breiten Transfer valider Ergebnisse in den Markt. Wir haben außerdem drei Fachgruppen etabliert, zu Querschnittsthemen, die alle Förderprojekte betreffen: Das sind rechtliche Fragestellungen, Fragen der Datensicherheit sowie Fragen nach wirtschaftlichen Potenziale und der gesellschaftliche Akzeptanz. Es sind zahlreiche Veranstaltungen geplant, wie Kongresse und Workshops, bei denen sich alle Interessieren einbringen können. Und wir sind auf Messen und Konferenzen präsent. Das ist nur ein kleiner Auszug unserer Aktivitäten.

Volker Markl: Während Die Begleitforschung die Themen und Ergebnisse der 13 Leuchtturmprojekte aufbereitet und nach außen trägt, wird das Smart Data Forum zusätzliche Stakeholder – national und international – adressieren und an die Innovationen im Rahmen dieses vielversprechenden Technologieprogramms heranführen. Von daher ergänzen wir uns gut und ziehen bereits heute erfolgreich an einen Strang.