Navigation

Datenanalyse und Big Data

Big Data und die sich hierdurch bietenden Möglichkeiten der Datenanalyse haben einen immer größeren Einfluss auf unsere Gesellschaft und unser alltägliches Leben. Durch die Speicherung und Analyse großer Datenmengen kann oftmals ein großer Mehrwert für den Nutzer entstehen, wie zum Beispiel:

  • Taxis können schon vorab zu stark frequentierten Orten gesendet werden.
  • Google Flu Trends prognostiziert Grippewellen oftmals genauer und wesentlich schneller als herkömmliche Vorhersagen.
  • Betrugsversuche mit Kreditkarten können wesentlich besser als traditionell verhindert werden.

Allerdings muss unterschieden werden zwischen für den Nutzer offensichtlichen Datenerfassungen und -auswertungen (wie z. B. SmartWatches) und für den Nutzer verborgenen (wie z. B. Sensorik von Smartphones). Für eine fundierte Meinungsbildung und einen mündigen Umgang mit diesen Möglichkeiten müssen daher beide Sichtweisen betrachtet werden.

In diesem Seminar sollen Potenziale, Grenzen und Risiken von großen und vielfältigen Datensammlungen betrachtet werden. Dabei soll ein tieferer Einblick hinter die Bedeutung der unter dem Buzzword „Big Data“ zusammengefassten Entwicklungen gewonnen werden. Während im allgemeinen Sprachgebrauch unter Big Data lediglich ein „großer Haufen Daten“ verstanden wird, sind diese Datenmengen weiterhin – neben der Quantität – auch durch unterschiedliche Strukturierung sowie die immer schnellere Erzeugung und Verarbeitung gekennzeichnet. Dies stellt eine große Herausforderung für die Auswertung dar. Insgesamt hat sich das Vorgehen geändert: Anstatt konkrete Datensätze für spezielle Analysen zu erheben, gilt es aus einem riesigen und stetig wachsenden Datenpool (der unabhängig vom Analysezweck „einfach so“ erhoben wird) Informationen zu gewinnen. Der Begriff Data Mining beschreibt hierbei das Prinzip des „Schürfens“ nach wertvollen Informationen in einem solchen großen Datenberg (in Analogie zum Bergbau).

Literatur:

  • Mayer-Schönberger, V. (2013). Big Data: die Revolution, die unser Leben verändern wird. München: Redline.
  • Cleve, J. & Lämmel, U. (2016). Data Mining. Berlin: De Gruyter Oldenbourg.

Mögliche Themen für die Seminararbeiten

  • Entwicklung und Auswertung eines Fitnesstrackers: Was finden wir über den Träger heraus?
    Martini, M. (2015). Big Data als Herausforderung für das Datenschutzrecht und den Persönlichkeitsschutz. In Die digitale Lebenswelt gestalten (S. 97-162). Baden-Baden: Nomos Verlagsgesellschaft.
  • Für welche Anwendungen eignen sich SQL- bzw. NoSQL-Datenbanken besser? Wir vergleichen deren Performance.
    Meier, A., Kaufmann, M. & Kaufmann, M. (2016). SQL-& NoSQL-Datenbanken. Berlin: Springer.
  • Taxifahrten in New York: Welche Informationen ergeben sich aus der öffentlichen Datenbank? Methoden und Grenzen von Big-Data-Auswertungen am praktischen Beispiel.
    Barnickel, N. & Klessmann, J. (2012). Open Data-Am Beispiel von Informationen des öffentlichen Sektors. In Open Initiatives: Offenheit in der digitalen Welt und Wis-senschaft (S. 127-158). Saarbrücken: universaar.
  • Simulation einer Smart City: Welche Daten können gewonnen werden und was finden wir über die Bewohner heraus?
    Martini, M. (2015). Big Data als Herausforderung für das Datenschutzrecht und den Persönlichkeitsschutz. In Die digitale Lebenswelt gestalten (S. 97-162). Baden-Baden: Nomos Verlagsgesellschaft.
  • Predictive Policing: Was verraten uns die Daten der Polizei in Los Angeles (oder San Francisco) über Kriminalitätsschwerpunkte und deren zeitliche Abhängigkeit?
    Rolfes, M. (2017). Predictive Policing: Beobachtungen und Reflexionen zur Einführung und Etablierung einer vorhersagenden Polizeiarbeit. Geoinformation & Visualisierung (S. 51-76).
  • Wie kann mich eine Website identifizieren und welche Analyseverfahren werden dazu eingesetzt? Eine empirische Analyse
    Pieronczyk, T. (2012). Device Fingerprinting mit dem Web-Browser. Innovative Internet Technologies and Mobile Communications (IITM), and Aerospace Networks (AN) (S. 23-30)

Voraussetzungen

Was muss ich mitbringen?

  • Interesse am Fach und Neugier, neue Inhalte zu lernen
  • Motivation, sich selbstständig in ein Fachgebiet einzuarbeiten um Erkenntnisse zu erlangen

Was muss ich nicht (zwingend) mitbringen?

  • Programmierkenntnisse