2 Diplomarbeiten “Web-Science” am IWM

Sehr geehrte Studierende,

Ich möchte Sie auf 2 aktuelle Diplomarbeitsausschreibungen am Institut für Wissensmanagement hinweisen. Beide Themen eröffnen die Möglichkeit zum Erhalt eines Stipendiums im Rahmen eines vom FWF geförderten Forschungsprojekts.

1) Intent Analysis: Mining and Correlating Human Goals from Social Media Corpora
2) Simulation of Cooperation and Diffusion in Social Media

Nähere Details finden Sie unter: http://kmi.tugraz.at/staff/markus/open-topics/

Sollten Sie Interesse und/oder Fragen haben, melden Sie sich bitte via e-mail oder telefonisch zur Vereinbarung eines unverbindl. Informationsgesprächs - Ich stehe gerne für weitere Auskünfte zur Verfügung.

mit vielen Grüssen,

Markus Strohmaier

Semantic Web & Open Linked Data

Linked Open Data (LOD) is an initative to interlink data sources available in the web by using semantic web technologies, in particular RDF. It targets to establish a Web of data, similar to the Web of documents today.
In their work, students can explore the following topics

  1. Develop a application scenario using LOD data and implement a web application therefore
  2. Develop a web service & web application to semi-automatically create links between different LOD repositories
  3. Develop and analyse ontology alignment algorithms for automaticall creating links between different LOD repositories
  4. Discovery and add new data sets and interlink them with the LOD cloud (see for example RIESE)
  5. Analyse the quality of LOD repositories and their interlinkage

Relevant Literature:

Bizer C, Heath T, Berners-Lee T. Linked data–the story so far. International Journal on Semantic Web and Information Systems. 2009. Available at: http://tomheath.com/papers/bizer-heath-berners-lee-ijswis-linked-data.pdf

Shadbolt N, Berners-Lee T, Hall W. The Semantic Web Revisited. IEEE Intelligent Systems. 2006;21(3):96-101. Available at: http://ieeexplore.ieee.org/lpdocs/epic03/wrapper.htm?arnumber=1637364.

Plagiarism Analysis & Misuse Detection

With the growing amount of information its quality decreases. Furthermore, the populartiy of social networks offers a broad field for misuse, ranging form simple spam to user masquarades. Within this topic, students should explore either plagiarism analysis or misuse in social networks. Work covers the development of services countering misuse or plagiarism detection or the analysis of respective data set and new algorithms.

Details, data sets and algorithms on the topic can be found on the PAN09 Workshop site.

Web Page Cleaning and Blog Extraction

Web-Seiten sind zur Darstellung von Information für den Menschen optimiert. Die maschinelle Verarbeitung von Web Seiten erweist sich dadurch als schwierig und benötigt spezielle Techniken zur Extraktion relevanter Teile einer Webseite. Für die maschinelle Verarbeitung von Blogs sollten die eigentlich Blog-Einträge und Kommentare von Werbeeinblendungen und Navigationselementen getrennt werden.

Ziel der Arbeit ist die Entwicklung eines Algorithmus zur Analyse des DOM Baums einer HTML Seite und der Trennung in Blogs, Kommentare und nicht relevante Element. Der Algorithmus soll dabei auf unterschiedliche Statistiken wie Anzahl der Wörter im DOM Element, Anzahl der Links im DOM Element etc. zurück greifen. Die Entwicklung erfolgt in Java unter Einsatz von Open Source Bibliotheken.

Links zu relevanter Literatur:

  1. http://trec.nist.gov/pubs/trec15/papers/umbc-jhu.blog.final.pdf
  2. http://portal.acm.org/citation.cfm?doid=1046456.1046459

Sentiment Detection in Blogs

Sentiment Detection bezeichnet die Erkennung von Stimmungen und Ausrichtungen von Meinungen in Texten. Anwendung findet diese Technik z.B. in der Analyse von Blog-Kommentaren, in der Blog-Suche oder der Ssozialen Netzwerkanalyse.

Ziel des vorliegenden Themas ist die Entwicklung eines Web Services zur Annotation von Sentiments in Web Seiten. Das Ergebnis des Prozesses soll als JSON oder RDF zu Verfügung gestellt werden.

Entwicklung erfolgt in Java und unter Verwendung von Open Source Bibliotheken zur Verarbeitung natürlicher Sprache wie z.B. Mallet oder OpenNLP. Diese Bibliotheken arbeiten auf Basis maschineller Lerntechniken (MAximum Entropy basierte modelle, Conditional Random Fields).

Links:

  1. Sentiment Detection Survey: http://www.cs.cornell.edu/home/llee/opinion-mining-sentiment-analysis-survey.html
  2. Mallet: mallet.cs.umass.edu/
  3. OpenNLP: http://opennlp.sourceforge.net/

Anwendung von unkonventionellen Eingabemedien zur Interaktion mit visuellen Navigationssystemen für digitale Enzyklopädien

Klassische digitale Enzyklopädien ermöglichen Anwendern die stichwortbasierte Suche nach Artikeln und die Navigation zwischen Artikeln mittels Querverweisen. Moderne multimediale Enzyklopädien sind zunehmend semantisch strukturiert und erfordern daher erweiterte Such- und Navigationsmöglichkeiten. Die digitale Enzyklopädie des Brockhaus bietet eine dreidimensionales System zur Navigation zwischen Artikeln. Der OCZ Neural Impulse Actuator (http://www.ocztechnology.com/products/ocz_peripherals/nia-neural_impulse_actuator) ermöglicht kostengünstig die Nutzung von Gesichtsmuskelspannung, Augenbewegung und Gehirnströmen als Eingabemedium für Standard-PCs.
Inhalt der Arbeit ist der Entwurf von adaptierten Interaktionsformen für den 3D-Wissensraum der Brockhaus Enzyklopädie, welche die Verwendung des OCZ Neural Impulse Actuator für Anwender ermöglichen sowie die Evaluierung der entwickelten Interaktionsformen im Vergleich zu Standard-Eingabegeräten (Maus, Tastatur).

Evaluation of automatically generated prerequisite relation

Contact:Viktoria Pammer (vpammer@know-center.at), Barbara Kump (bkump@tugraz.at)

The topic “Evaluation of automatically generated prerequisite relation” belongs to the research field of Modelling and Model Evaluation. Here, with the term Model, we refer to an ontology.

The purpose of an ontology in computer science is to formally and unambiguously describe the relevant notions of a domain. People constructing an ontology need to be supported by design methodologies, tools and methods to create and evaluate their ontologies.

For a Bachelor or Master Thesis or Project in the field of Modelling and Model Evaluation, you need basic programming skills and interest for the following fields

Knowledge representation formalisms (description logics/OWL-DL), Semantic technologies, Knowledge elicitation techniques, and Cognitive theories

Short description of the project “Evaluation of automatically generated prerequisite relation”

  • In the case of the skill model, prerequisite relations between skills are implicit in the mappings from tasks to required skills
  • For a human user, automatic inferences are often not obvious. Manually modelled statements lead to unwanted entailed statements.
  • Goal of the project: Modifications of the explicit statements (prerequisite relation between skills) shall be reflected in the original structure (skill model)

For an overview of all topics related to Modelling and Model Evaluation see
Modelling and Model Evaluation - Themen SS 2009

Ontology Questionnaire: Evaluation of Skill Model in APOSDLE with respect to its semantics

Contact:Viktoria Pammer (vpammer@know-center.at), Barbara Kump (bkump@tugraz.at)

The topic “Ontology Questionnaire: Evaluation of Skill Model in APOSDLE with respect to its semantics” belongs to the research field of Modelling and Model Evaluation. Here, with the term Model, we refer to an ontology.

The purpose of an ontology in computer science is to formally and unambiguously describe the relevant notions of a domain. People constructing an ontology need to be supported by design methodologies, tools and methods to create and evaluate their ontologies.

For a Bachelor or Master Thesis or Project in the field of Modelling and Model Evaluation, you need basic programming skills and interest for the following fields

Knowledge representation formalisms (description logics/OWL-DL), Semantic technologies, Knowledge elicitation techniques, and Cognitive theories

Short description of the project “Ontology Questionnaire: Evaluation of the Skill Model in APOSDLE with respect to its semantics”

  • Skill Model: A task is assigned a number of skills (hierarchy) which are required to perform the task
  • The task-skill assignment needs to be evaluated
  • Currently this evaluation requires the manual creation of a questionnaire
  • Goal of the project: Automated creation of the questionnaire and automated correction of the skill model in dependence of the answer

For an overview of all topics related to Modelling and Model Evaluation see
Modelling and Model Evaluation - Themen SS 2009

User Motivations Study: What are the goals of users when browsing/searching the web?

You will implement a Firefox Plugin that allows participants of a study to document their goals behind each 1) search query entered 2) each URL typed into the address bar. You will implement the Plugin and corresponding logging data, design and execute a user study and evaluate the results. This is a larger topic suitable for a follow-up master’s thesis.

Intentional Metadata and Bibsonomy.org

Your task is to develop and evaluate goal/purpose oriented extensions for bibsonomy.org. This is a larger topic suitable for a follow-up master’s thesis. Related Work