Institut für Medizin, Informatik und Ökonomie (GECKO)

Oktober 2011

Titel

Erschließung von Routinedaten für die klinische Forschung

Das Research Warehouse Projekt

Einleitung

Das Research Warehouse Projekt (RWH) ist ein Gemeinschaftsprojekt der Abteilung Innere Medizin III der Medizinischen Universitätsklinik Heidelberg und dem Studiengang Medizinische Informatik der Hochschule Heilbronn und Universität Heidelberg. Ziel des Projektes ist die Zusammenführung von klinischen Routinedaten und Forschungsdaten aus unterschiedlichen spezialisierten Datenbankanwendungen der Abteilung Innere Medizin III. Die Zusammenführung erfolgt in einem Data- Warehouse unter Berücksichtigung der geltenden Datenschutzbestimmungen. Auf diese Art sollen Routinedaten für die klinische Forschung in Datenbank übergreifenden Abfragen erschlossen werden.

Methodik

Grundsätzlich wird angestrebt, erfolgreiche sowie generische Konzepte als Ausgangsbasis zu nutzen und so auf etablierte Technologien aufbauen zu können. Für das Datenbankmodell wird das HOLAP-Konzept zugrunde gelegt. Für die ID-Verwaltung werden IHE-Profile berücksichtigt [1] und im Datenschutz auf das generische Konzept der TMF aufgebaut. [2]

Die Grafik zeigt einen groben Überblick über die Architektur der RWH Datenbank. Ein zentrales Element bildet der leicht konfigurierbare Extract, Transform, Load (ETL) Prozess. Hier werden Daten aus den links stehenden Quellsystemen extrahiert, validiert und in ein multidimensonales Modell überführt. Der ETL Prozess ist, als nicht statischer und konfigurierbarer Prozess, auf Änderung des Dimensionsmodells ausgerichtet. Hier unterscheidet sich die Architektur von klassischen Data-Warehouse Anwendungen. Wissenschaftliche Abfragen sind mithilfe der RWH Report-Browser Webapplikation möglich. Selektierte Daten können hier im CSV oder XLS Format exportiert werden.

 

 

 

 

 

 

Herausforderungen

Gegenüber klassischen Data-Warehouse-Konzepten ist eine sehr flexible Konfigurierbarkeit sowohl im ETL Prozess als auch im Erstellen von Reports erforderlich, um eine praktikable Anwendung für Forschungsfragestellungen bereit zu stellen. Weiterhin ist, gerade unter Publikationsgesichtspunkten, eine hohe Transparenz, aus welchen Quellen sich ein Ergebnis zusammensetzt, erforderlich. Die Komplexität medizinischer Parameter stellt besondere Anforderungen an die Datenvalidierung und den Integrationsprozess. Ein sicherer Re-Pseudonymierungsprozess wird benötigt, um Abfragen als Ausgangsbasis für prospektive Studien nutzen zu können.

Zwischenstand

Es konnte gezeigt werden, dass die Basisarchitektur des RWH zur Lösung der Integrationsproblematik geeignet ist und so Routinedaten für die klinische Forschung zur Verfügung gestellt werden können. Erste Endanwendertests zeigen, dass sich hier der Aufwand für die Eigenentwicklung eines Report-Browsers lohnt, da es die speziell auf die Bedürfnisse der Benutzer angepasste Oberfläche ermöglicht, flexible Fragestellungen zu beantworten. Der konfigurierbare ETL Prozess sowie das nicht feststehende Dimensionsmodell des Research Warehouse Projektes öffnen die Anwendung für die wissenschaftlichen Fragen der Zukunft.

Referenzen / Weiterführende Links

[1] Integrating the Healthcare Enterprise, IHE IT Infrastructure (ITI) Technical Framework, Revision 7.0, 2010, http://www.ihe.net/Technical_Framework/#IT ,Letzter Aufruf: 31.03.2011

[2] Pommerening K et al., Das TMF-Datenschutzkonzept für medizinische Datensammlungen und Biobanken, 2005, http://www.staff.uni-mainz.de/pommeren/Artikel/05_pommerening_sax_mueller_speer_ganslandt_drepper.pdf, Letzter Aufruf: 31.03.2011

 

Ansprechpartner

Name Hund Vorname Hauke
E-Mail hauke.hund@hs-heilbronn.de    
Art des Projekts Diplomarbeit/Forschung Status Laufend