Uebungsthemen
Jedes Übungsthema besteht aus dem Lesen (zumind.) eines Papers, und dem Arbeiten an einem Projekt (Übung/Implementierung/Survey/etc):
Intentional Structures on the Web (Markus Strohmaier)
Teamgrösse: 3
Paper:
- The proposition bank: An annotated corpus of semantic roles, M. Palmer and D. Gildea and P. Kingsbury, Computational Linguistics 31 71–106 (2005)
- DIRT-Discovery of Inference Rules from Text, D. Lin and P. Pantel Proceedings of ACM Conference on Knowledge Discovery and Data Mining(KDD-01) pp. 323-328 (2001)
Beschreibung: “A survey of linguistic corpora and semantic role tagging systems”. Dieses Projekt befasst sich mit der Identifikation und Analyse verschiedener Ansätze zur Identifikation und Zuordnung von semantischen Labels in natürlich-sprachigem Text wie z.B. PropBank, SWIRL, und andere.
Aufgaben: Literaturrecherche, Analyse
Graph/Network Programming Frameworks (Markus Strohmaier / Mark Kröll)
Teamgrösse: 3
Paper: TBA
Beschreibung: In diesem Projekt sind eine Reihe von Graph/Network Programming Frameworks in Hinblick auf Ihre Eigenschaften zu untersuchen, und beispielhafte Import-schnittstellen zu implementieren.
Ontology Modeling und Analyse (Andreas Juffinger)
Teamgrösse: 2-3
Anzahl teams: 1-2
Paper:
Beschreibung: Es sind Ontologien für die Vorgegebenen Themen zu erstellen, welche ieweils die wesentlichsten Konzepte und deren Relationen abdeckt. Dafür sollte das AVALON Tool verwendet werden. Nachdem eine “ausreichend” große Ontology erstellt wurde sollte dann die Bedeutung von verschiedenen Grapheneigenschaften analysiert werden. Was bedeutet ein “Pfad” ein “Kürzester Pfad”, ein “Minimaler Spannbaum”, ein “Steiner Baum” usw. Es können auch andere Algorithmen basierend auf unserem Framework in Java implementiert werden. Die Ergebnisse sollen mit entsprechender Literatur (aktuelle Papers) verglichen werden.
Information visualization (Vedran Sabol)
Teamgrösse: 2-3
Anzahl teams: 2-3
Paper:
* Visualisierung von temporalen Daten:
- “Visualization of linear time-oriented data: a survey”, Silva, S.F., Catarci, T.,
Proceedings of the First International Conference on Web Information Systems Engineering, Volume 1, Page(s):310 – 319, June 2000
- “Visualizing time-oriented data-A systematic view”, Wolfgang Aigner, Silvia Miksch, Wolfgang Müller, Heidrun Schumann, Christian Tominski, Computers and Graphics, Volume 31, Issue 3, Pages 401-409, June 2007
* Visualisierung von hoch-dimensionalen Daten:
-“Multidimensional Data Visualization Techniques for Financial Performance Data: A Review”, Dorina Marghescu, TUCS Technical Report No 810, Finland, February 2007
Beschreibung: Ziel ist die Untersuchung der Eigenschaften von existierenden Visualisierungsframeworks auf Anwendbarkeit im Gebiet Visualisierung von temporalen oder multi-dimensionalen Datensätzen. Durch Analyse der obigen Publikationen soll die Einarbeitung in das jeweilige Untergebiet (temporale oder hoch-dimensionale Visualisierung) erfolgen. Neben einem kurzen Vergleich der unterschiedlichen Visualisierungsmethoden soll der Schwerpunkt auf der Analyse der frei zugänglichen Visualisierungsframeworks liegen wie z.B. prefuse visualization toolkit (http://prefuse.org/) oder InfoVis Toolkit (http://ivtk.sourceforge.net/).
Clustering Techniken im Vergleich (Michael Granitzer)
Teamgrösse: 2-3
Anzahl teams: 2-3
Paper:
A Segment-based Approach To Clustering Multi-Topic Documents (2008). Andrea Tagarelli and George Karypis. Text Mining Workshop, SIAM Datamining Conference, 2008.
Topic-Driven Clustering for Document Datasets. Ying Zhao and George Karypis. SIAM International Conference on Data Mining, pp. 358-369, 2005.
Beschreibung: Ziel ist die Untersuchung der Eigenschaften von Dokument Clustering Ansätzen zur automatischen Gruppierung von Dokumenten und Dokumentteilen. Durch Analyse und Studium der obigen Publikationen erfolgt die Einarbeitung in das Thema. Die Untersuchung der Genauigkeit und Laufzeitkomplexität unterschiedlicher Clustering-Techniken erfolgt im praktischen Teil der Vorlesung. Unter Anwendung bereits existierender Software (e.g. CLUTO, TCT) soll diese Untersuchung erfolgen. Die Ergebnisse werden am Ende des Semesters präsentiert und diskutiert.
Projektionsmethoden unter Verwendung Neuronaler Netzwerke (Michael Granitzer/Vedran Sabol)
Teamgrösse: 2-3
Anzahl teams: 2-3
Paper:
1. Heinke, D.; Hamker, F.H., “
Comparing neural networks: a benchmark on growing neural gas, growing cell structures, and fuzzy ARTMAP,” Neural Networks, IEEE Transactions on , vol.9, no.6, pp.1279-1291, Nov 1998
2. Alterantiv dazu:
Jim Holmstroem, Growing Neural Gas, Master Thesis
Beschreibung: Projektionsmethoden werden verwendet, um Beziehungen in hochdimensionalen Räume visualisierbar und damit dem Benutzer zugänglich zu machen. Ziel im vorliegenden Themenkomplex ist ein Vergleich der unterschiedlichen Methoden einerseits auf theoretischer Basis durch eine Literaturanalyse und andererseits durch Analyse der verschiedenen frei zugänglichen Demonanwendungen wie z.B. dem Growing Neural Gas Demo der Univerisät Bochum (http://www.neuroinformatik.ruhr-uni-bochum.de/ini/VDM/research/gsn/DemoGNG/GNG.html).