Browse Wiki & Semantic Web

Jump to: navigation, search
Http://www.aifb.kit.edu/id/Thema3585
  This page has no properties.
hide properties that link here 
  No properties link to this page.
 
http://www.aifb.kit.edu/id/Thema3585
http://semantic-mediawiki.org/swivt/1.0#page http://www.aifb.kit.edu/web/Thema3585 +
http://semantic-mediawiki.org/swivt/1.0#wikiNamespace 0
http://semantic-mediawiki.org/swivt/1.0#wikiPageContentLanguage de
http://semantic-mediawiki.org/swivt/1.0#wikiPageModificationDate "2017-10-27T13:00:32Z"^^xsd:dateTime
http://semantic-mediawiki.org/swivt/1.0#wikiPageSortKey Thema3585
http://www.aifb.kit.edu/id/Property-3AAbschlussarbeitsstatus Abgeschlossen
http://www.aifb.kit.edu/id/Property-3AAbschlussarbeitstyp Master
http://www.aifb.kit.edu/id/Property-3AArchivierungsnummer 3585
http://www.aifb.kit.edu/id/Property-3ABeschreibung DE '''Lust auf exploratives Data Mining im Se'''Lust auf exploratives Data Mining im Semantic Web?''' Stichworte: OLAP, Linked Open Data, OLAP auf Graphdaten, Data Mining auf Web-Daten, Semantic Web ==Motivation== Als [http://de.wikipedia.org/wiki/Linked_Open_Data Linked Open Data] wird die Menge aller Daten bezeichnet, die im Web durch Semantische Technologien mit einer freien Lizenz veröffentlicht worden sind. Beispiele für enthaltene Datensätze sind [http://thedatahub.org/dataset/dbpedia DBpedia], [http://thedatahub.org/dataset/freebase Freebase], [http://thedatahub.org/dataset/2000-us-census-rdf US Census] (Für eine Übersicht, siehe the [http://thedatahub.org/dataset/2000-us-census-rdf Linking Open Data cloud Diagramm]) Seit mehreren Jahren wächst Linked Open Data exponentiell. Die große und thematisch breite Menge an Linked Open Data verspricht nützliches Wissen zu erzeugen. Data-Mining-Methoden extrahieren interessante Muster aus riesigen Datenmengen. [http://de.wikipedia.org/wiki/Online_Analytical_Processing Online Analytical Processing] (OLAP) ist eine explorative Data-Mining-Methode, die sich insbesondere in der Industrie zur Analyse von Statistikdaten bewährt hat. Vorteile von OLAP sind: * Bekannte konzeptuelles Modell aus Datenwürfeln (Data Cubes), Dimensionen und Kennzahlen (Measures). * Operationen zur explorativen Analyse von Datenwürfeln, z.B. Slice, Dice, Roll-Up, Drill-Down * Systematische und automatische Vorverarbeitung von Daten in wiederholbaren ETL-Prozessen * Optimierungstechniken zur effizienten Ausführung von OLAP-Operationen (z.B. Materialisierung) In der Arbeit soll OLAP auf Linked Open Data erlaubt werden. ==Herausforderungen== Folgende Herausforderungen gibt es beispielsweise beim Anwenden von OLAP auf Linked Open Data: * Milliarden von Daten. * Daten sind über Server verteilt. * Nicht relationale Daten, sondern graph-basierte Daten * Unsaubere Daten * Besondere Semantik der Daten (Inferenzen möglich) * Verschiedene Abstraktionslevel, z.B., Top-Level-Domänen, Domains, Datei, URI ==Ziele der Arbeit== Folgende Fragestellungen sollen in der Arbeit untersucht werden: * Welche Kennzahlen zu Linked Open Data sind interessant? * Wie kann man OLAP-Operationen auf Linked Open Data ausführen? * Wie können OLAP-Operationen effizient ausgeführt werden? * Wie können Ergebnisse von OLAP-Analysen visualisiert werden? Unterstützung: * Für die Arbeit kann auf leistungsstarke Server zugegriffen werden. * Als repräsentatives Linked Open Data kann auf das [http://km.aifb.kit.edu/projects/btc-2012/ Billion Triple Challenge Dataset] zurückgegriffen werden. ==Benachbarte Arbeiten== Folgende Arbeiten sind beispielsweise für die Arbeit interessant (Hinweis: Arbeiten können ggf. nur im Intranet der Uni heruntergeladen werden): ===Data Mining auf Linked Open Data=== * Analyse des "Billion Triple Challenge Dataset" [http://gromgull.net/blog/2012/07/some-basic-btc2012-stats/ Some basic BTC2012 Stats] * [http://vocab.cc/ vocab.cc] * [http://www.springerlink.com/index/C4770X06907V8467.pdf Generating Possible Interpretations for Statistics from Linked Open Data] * [http://linkinghub.elsevier.com/retrieve/pii/S1570826812000352 An empirical survey of Linked Data conformance] * [http://link.springer.com/chapter/10.1007%2F978-3-642-38288-8_15 Observing Linked Data Dynamics] ===OLAP auf Graphdaten=== * [http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=4781105 Graph OLAP: Towards Online Analytical Processing on Graphs] * [http://www.cs.uiuc.edu/~hanj/pdf/sigmod11_pzhao.pdf Graph cube: On warehousing and OLAP multidimensional networks] * [http://www.springerlink.com/index/717235V47JH175M5.pdf A Framework and a Language for On-Line Analytical Processing on Graphs] ===Effiziente Abfrage von riesigen Datenmengen=== * [http://research.google.com/pubs/pub36632.html Google Dremel] erlaubt analytische Abfragen über mehr als 10.000 Servern und auf Petabytes von Daten in Sekunden. * Hadoop, Hive und MapReduce sind als Technologien geplant, um Abfragen parallelisiert auszuführen. ==Voraussetzungen== * Sehr gutes technisches Verständnis. * Vorkenntnisse in Semantischen Technologien. Empfohlen zu Lesen: [http://www.semantic-web-book.org/page/Foundations_of_Semantic_Web_Technologies Foundations of Semantic Web Technologies].Foundations of Semantic Web Technologies].
http://www.aifb.kit.edu/id/Property-3ABetreuer Benedikt Kämpgen + , http://www.aifb.kit.edu/id/Achim_Rettinger +
http://www.aifb.kit.edu/id/Property-3AForschungsgruppe http://www.aifb.kit.edu/id/Web_Science +
http://www.aifb.kit.edu/id/Property-3AModification date-23aux 2458054.042037
http://www.aifb.kit.edu/id/Property-3ATitel OLAP auf Linked Open Data
rdf:type http://semantic-mediawiki.org/swivt/1.0#Subject + , http://www.aifb.kit.edu/id/Category-3AAbschlussarbeit +
rdfs:isDefinedBy http://www.aifb.kit.edu/web/Special:ExportRDF/Thema3585 +
rdfs:label Thema3585
hide properties that link here 
  This page has no properties.
 

 

Enter the name of the page to start semantic browsing from.