Abstract: In diesem Vortrag zeigen wir an einem Anwendungsfall aus der Dokumentenverwaltung auf, wie man neue Erkenntnisse aus existierenden Daten und besonders deren Strukturen gewinnen kann. Viele arbeiten mit verstreut gespeicherten Daten, die nicht wirklich gut ausgewertet und hinterfragt werden können. Fragen nach kausalen Zusammenhängen können oft nicht beantwortet werden. Detektivisch begeben wir uns auf die Suche nach Antworten und erläutern nebenbei grundlegende Graphenalgorithmen und den Umgang mit verlinkten Daten. Schritt für Schritt gehen wir von der Modellierung in die Analyse der Daten über. Es werden Wege aufgezeigt, wie komplexe Zusammenhänge zwischen Daten aus verschiedenen Quellen aufgespürt werden können.
Graphdatenbanken sind das Tool der Wahl, wenn es um Verknüpfung heterogener Daten geht. Ob aufgrund der verschiedenen Datenquellen, Datentypen oder Formate: Durch das flexible Schema lassen sich die in einem Graphenmodell abgelegten Daten nach Bedarf dynamisch umstrukturieren und neu verlinken. Wie das funktioniert, wird während des Vortrags demonstriert.
Unser Werkzeuge sind die Graphendatenbank Neo4j und die Abfragesprache Cypher. Beide sind sehr intuitiv, einfach und trotzdem mächtig in der Benutzung. Die für uns relevanten Handgriffe im Umgang mit den Tools werden begleitend erläutert, sodass Zuhörer auch ohne Vorkenntnisse dem Vortrag folgen können.
Bio: Ich bin IT-Consultant und Software-Entwicklerin mit Schwerpunkt Data Engineering by PRODYNA AG. Themen wie Linked Data, Graphen und Graphendatenbanken gehören zu meinen Steckenpferden. Den vorliegenden Vortrag habe ich bei JavaLand 2018 gehalten und präsentiere ihn gerne nochmal bei der RheinJUG.
Kontaktdaten: https://twitter.com/ira_res, http://www.linkedin.com/in/ifeuerstein/
Link zum Vortrag bei JavaLand: https://programm.javaland.eu/2018/#/scheduledEvent/549166