[PDF][PDF] Komplexe Datenanalyseprozesse in serviceorientierten Umgebungen

DID Habich - 2008 - qucosa.de
2008qucosa.de
Zusammenfassung Der Begriff serviceorientierte Architektur (SOA) ist gegenwärtig in aller
Munde, wenn es um die Gestaltung einer unternehmensweiten, beziehungsweise einer
unternehmensübergreifenden, Anwendungslandschaft geht. Die Vorteile einer SOA sind
natürlich nicht nur für den Bereich der Geschäftsprozesse interessant, sondern können auch
in anderen Gebieten gewinnbringend eingebracht werden. Genau an dieser Stelle setzt
diese Arbeit an: sie betrachtet komplexe Datenanalyseprozesse zur Auswertung empirisch …
Zusammenfassung
Der Begriff serviceorientierte Architektur (SOA) ist gegenwärtig in aller Munde, wenn es um die Gestaltung einer unternehmensweiten, beziehungsweise einer unternehmensübergreifenden, Anwendungslandschaft geht. Die Vorteile einer SOA sind natürlich nicht nur für den Bereich der Geschäftsprozesse interessant, sondern können auch in anderen Gebieten gewinnbringend eingebracht werden. Genau an dieser Stelle setzt diese Arbeit an: sie betrachtet komplexe Datenanalyseprozesse zur Auswertung empirisch erfasster Datenbestände im biologischen Umfeld und deren Einbettung in eine serviceorientierte Umgebung. Dazu untergliedert sich diese Arbeit in einen methodischen und einen infrastrukturellen Teil, wobei in beiden Teilen wissenschaftlichen Fragestellungen nachgegangen wird.
Die Erörterung dieses Themenkomplexes beginnt mit einer Einführung in das Fachgebiet der Genexpressionsanalyse, welches als übergeordnetes Anwendungsgebiet dieser Dissertationsschrift dient. Durch das Humangenomprojekt stehen heutzutage Sequenzinformationen für etwas 25.000 menschliche Gene zur Verfügung. Die Hauptaufgabe der kommenden Jahre wird die Erforschung dieser biologischen Gensequenzen sein, wobei zahlreiche Projekte in aller Welt sich bereits konkret mit dieser Zielsetzung befassen. In diesem Zusammenhang stellen die Entwicklung und Optimierung der Mikroarraytechnologie die bedeutendsten technischen Fortschritte dar. Durch diese Technologie kann die Aktivität tausender Gene gleichzeitig in einer Gewebeprobe untersucht werden. Damit ist dieses Fachgebiet ein repräsentatives Beispiel, in dem Datenanalyseprozesse eine entscheidende Rolle zur Wissensgewinnung spielen und in dem ohne derartige Techniken kein Fortschritt erzielt werden kann. Durch weltweite Projekte existieren immer mehr Studien zum Aktivitätsverhalten von Genen in Gewebeproben. Die Molekularbiologie würde jetzt von der Möglichkeit studienübergreifender Analysen profitieren, wodurch relevante Studien anderer Forschergruppen in die eigene Analyse integriert werden könnten, um sowohl die Anzahl der eigenen Experimente zu reduzieren als auch die Konfidenz der Resultate zu erhöhen. Auf der anderen Seite könnten durch studienübergreifende Analysen neuartige Fragestellungen, wie beispielsweise die Identifikation von Gemeinsamkeiten zwischen Tumoren, untersucht werden. Im methodischen Teil dieser Arbeit wird ein entwickelter Ansatz präsentiert, um Untergruppen von Genen studienübergreifend zu extrahieren, die ein gleiches Aktivitätsverhalten aufweisen (studienübergreifendes Clustering). Dadurch, dass die Daten unterschiedlicher Studien nicht direkt vergleichbar sind und damit als heterogen betrachtet werden müssen, ist ein komplexer Analyseprozess aufzustellen. In dem entwickelten Prozess werden die Daten jeder einzelnen Studie in einem ersten Schritt einer separaten Analyse (Vorverarbeitung und Clustering) unterzogen. In einem zweiten Schritt erfolgt dann eine Er-
qucosa.de
Showing the best result for this search. See all results