Grundvorlesung - Sommersemester 2016
1 Einführung und Einordnung 1.1 Einordnung und Abgrenzung: Data Science 1.2 Wert von Daten: Das Gold des 21. Jahrhunderts 1.3 Bedeutung von Datenbanksystemen 1.4 Architekturen: 2-Tier, 3-Tier, etc 1.5 Was sind eigentlich Daten? 1.6 Modellierung vs Realität 1.7 Kosten mangelhafter Modellierung 1.8 Datenbanksystem nutzen vs selbst entwickeln 1.9 Positive Beispiele für Apps 1.10 Anforderungen 1.11 Literaturhinweise 1.12 Vorlesungsmodus 2 Datenmodellierung 2.1 Motivation 2.2 E/R 2.3 UML 2.4 Relationales Modell 2.5 Hierarchische Daten 2.6 Graphen und RDF 2.7 Redundanz und Normalisierung 2.8 Objektrelationale DBMS 3 Anfragesprachen 3.1 Relationale Algebra 3.2 Hierarchische Daten 3.3 Graphen und RDF 4 SQL 4.1 Grundlagen 4.2 Zusammenhang mit relationaler Algebra 4.3 PostgreSQL 4.4 Integritätsbedingungen 4.5 Transaktionskonzept 4.6 Sichten (und ACLs) 4.7 ACID 5 Implementierungstechniken 5.1 Übersicht 5.2 vom WAS zum WIE 5.3 Kosten verschiedener Operationen 5.4 EXPLAIN 5.5 Physisches Design 5.6 Indexe, Tuning 5.7 Datenbank-Tuning 5.8 Anfrageoptimierung 6 Zeitliche und räumliche Daten 6.1 als Teil des Schemas 6.2 as of 6.3 append-only und Streaming 6.4 Versioning 6.5 Snapshotting 6.6 Differential Files 6.7 Publish/Subscribe 6.8 Indexstrukturen 7 Recovery, Durability, Archivierung 7.1 Grundproblematik 7.2 Vergessen vs Komprimieren vs Kondensieren 7.3 Heiße vs kalte Daten 7.4 Archivierung 7.5 Redundanz 7.6 Implementierungsaspekte 7.7 UNDO/REDO 7.8 Logging 8 Nebenläufigkeitskontrolle 8.1 Isolationlevels 8.2 Eventual Consistency 8.3 2PL 8.4 Verteilte Datenbanksysteme: Grundkonzepte: Sharding, HP; VP, QP 8.5 Implementierungsaspekte 9 ETL 9.1 Datenbankschnittstellen: JDBC et al 9.2 Textdatenbanken: NoDB, CSV 9.3 Föderierte Datenbanken 9.4 Data Warehousing 9.5 Schema Matching 9.6 Reporting 9.7 Data Cleaning 9.8 Denormalisierung 9.9 Workflows 10 Big Data 10.1 Was ist eigentlich Big Data? 10.2 Big Data vs Privatheit 10.3 Beispiele: Zusammenführen von Daten 10.4 Physische Barrieren 11 NoSQL 11.1 Key/Value Stores 11.2 KeyDocument Stores: MongoDB 11.3 MapReduce 11.4 Flink 11.5 Spark 12 Information Retrieval 12.1 Inverted Files 12.2 Stemming 12.3 Ranking 13 Potpourri 13.1 Deduktive DBMS 13.2 Räumliche Daten 13.3 Probabilistische DBMS