Freitag, 14. Januar 2011

Entwurf und Implementierung eines Verfahrens zur Analyse komplexer Daten insbesondere auf strukturelle Ähnlichkeit

eBook – Die Ähnlichkeitensuche gewinnt mit zunehmender Komplexit¨at der Dokumente an Bedeutung. Während existierende Ansätze den inhaltlichen Aspekt der Suche in den Fokus der Betrachtung setzten, wird die strukturelle Ähnlichkeit weitestgehend außen vor gelassen. Im Rahmen dieser Diplomarbeit wird ein einheitlicher Ansatz für die Ähnlichkeitensuche vorgestellt, welcher die strukturellen Aspekte der Zusammensetzung der komplexen Datentypen ebenfalls berücksichtigt und separat als strukturelle Ähnlichkeit ausweist. Die Berechnung der inhaltlichen Ähnlichkeit erlaubt die Erkennung ähnlicher Teilbäume innerhalb beliebiger komplexer Datentypen. Die Daten werden dem System im XML-Dokument- Format übergeben. Diese werden vom System so weit abstrahiert, dass keine Unterschiede aufgrund verschiedener stilistischer Möglichkeiten der Serialisierung von komplexen Datentypen in das XML-Dokument-Format Auswirkungen auf den inhaltlichen Vergleich nehmen können. Dies ermöglicht den Vergleich komplexer Datentypen hinsichtlich ihres Aufbaus und ihres Inhalts.

Autor: Maciej Niemczyk / Umfang: PDF 130 Seiten / Sprachen: Deutsch / Erschienen 2010

Keine Kommentare:

Kommentar posten