Logo - Fakultät Illustration
 

Dr.-Ing. Mario Kubek

Mario Kubek
E-Mail: mario.kubek
Telefon: +49 2331 987-1153
Fax: +49 2331 987-353
Homepage: http://www.mario-kubek.de [externer Link]

Akademischer Rat

Besuchsadresse:
Universitätsstraße 27
Philipp-Reis-Gebäude, Raum C 110

Lehrtätigkeit

  • Betreuung der Lehrveranstaltungen und Präsenzseminare zu
    • „Kommunikationsnetze und Protokolle I + II“
    • „Sicherheit im Internet 2“
    • „Fehlertoleranz in Computersystemen und Netzwerken“
  • Betreuung von Abschlussarbeiten


Aktuelles Forschungsthema: Kontextbasierte und interaktive Suche nach und mit Textdokumenten

Die Entwicklung lokal arbeitender Verfahren und Methoden, um Menschen eine effektivere und effizientere Navigation im World Wide Web (WWW, Web) als bislang mit klassischen Suchmaschinen zu bieten, ist das Anliegen der prototypisch umgesetzten Suchapplikationen „Researcher“ und „DocAnalyser“. Diese wurden mit dem Ziel entworfen, nicht eine Flut von Dokumenten zu suchen, die eventuell eine nur geringe Anzahl relevanter Schlüsselwörter enthalten, sondern genau diejenigen, die das aktuelle Informationsbedürfnis (d.h. den Wunsch nach passendem Neuen) unter Vorgabe thematischer Kontexte, bestimmt durch die Inhalte lokaler Textdokumente, tatsächlich befriedigen.

Motivation und Ziele

Websuchmaschinen wie Google täuschen dem Nutzer vor, jede erdenkliche Information im WWW präsentieren zu können, die dem Anliegen des in wenigen (oft unter erheblichem Aufwand gefundenen) Schlüsselwörtern präsentierten Problems entspricht. Dabei decken selbst alle gängigen Suchmaschinen lediglich 50% des gesamten WWW bei oftmals geringer Aktualität ab und sind ebenfalls kaum in der Lage, sich auf die individuellen Charakteristika eines jeden Nutzers auch nur annähernd einzustellen.

Darum wurde in den genannten Applikationen "Researcher" und "DocAnalyser" der Ansatz verfolgt, passende Suchworte durch Analyse lokal gespeicherter Textdokumente ("Researcher") wie auch momentan betrachtete Webdokumente ("DocAnalyser") zu bestimmen und diese als Suchworterweiterungen sowie als eigenständige Suchanfragen dem Nutzer zu präsentieren. Dies geschieht mit dem Ziel, weitere relevante oder ähnliche Dokumente im WWW aufzuspüren. In "DocAnalyser" wird zudem erstmals das neuartige Paradigma der Suche mit Textdokumenten als alleinigem Anfrageparameter konsequent umgesetzt. Die auf DocAnalyser aufsetzende Erweiterung "PDSearch" (Picture-Document-Search) zielt zudem darauf ab, ähnliche Webdokumente mittels selektierbarer Bilder aus Webseiten, die als textueller Kontext hierzu analysiert werden, zu finden. Auf diese Weise ermöglicht "PDSearch" eine interaktive und visuelle Disambiguierung von Nutzeranfragen (Intuition: "Ein Bild sagt mehr als tausend Worte.") und offeriert zudem eine bildbasierte und sprachübergreifende Themenanalyse und -verfolgung.

Illustration

Die Suchlösungen erheben somit lokales bzw. situatives Wissen (Suchkontext) noch bevor die jeweilige Websuchmaschine angesprochen wird. Dadurch wird die Navigation im Web spürbar erleichtert. Die lokale Analyse von Nutzerdokumenten trägt dabei dem Datenschutz der Nutzer in besonderem Maße Rechnung, da diese den Nutzerrechner nicht verlassen. Die Wahrung des Datenschutzes spielt insbesondere im Lichte der bekannt gewordenen Praxis der Suchmaschinenanbieter und staatlichen Behörden, möglichst viele Nutzerprofildaten zu sammeln (ohne deren Einsatzzweck transparent zu machen), eine zunehmend wichtige Rolle. Der Nutzer selbst entscheidet, welche Daten der Dokumente (anonymisiert) zur Bildung von Suchanfragen verwenden werden sollen. Die Applikationen geben dem Nutzer hierbei wertvolle Hinweise.

Die drei genannten Suchlösungen wurden nach folgendem Konzept entworfen:

  • Unterstützung der individuellen Webrecherche durch dezentrale Bestimmung thematisch passender Erweiterungsterme zu Websuchanfragen auf der Nutzerseite unter Einbeziehung des Wissens lokaler Textdokumente und ihrer thematischen Korrelationen („Researcher“),
  • Analyse aktuell betrachteter Webdokumente bzw. von Webseiten, deren Bilder zuvor zur Erzeugung von Suchanfragen selektiert wurden, durch graphenbasierte Extraktion ihrer Schlüsselwörter und Quellthemen (thematisch einflussreiche Konzepte) auf Basis der zwischen ihnen technisch erfassten Assoziationen unterschiedlicher Stärke und Nutzung der so gewonnenen Terme als Suchanfragen, um thematisch ähnliche und verwandte Webdokumente zu finden („DocAnalyser“, „PDSearch“),
  • Ermöglichung der Themenverfolgung (Untersuchung der Grundlagen eines Themas) durch Verwendung der dokumentabhängigen Quellthemen als Suchanfragenterme („DocAnalyser“),
  • Intuitive Handhabung der Anwendungen durch einheitliche, browser-basierte Darstellung der Suchergebnisse mit der Möglichkeit der interaktiven An- und Abwahl von Suchtermen durch einfachen Klick auf diese zur individuellen und iterativen Verfeinerung bzw. Modifikation der Anfragen.

Die genannten Punkte erforderten:

  • den Entwurf und Umsetzung lokal arbeitender Methoden und Verfahren der Textanalyse mit der Maßgabe hochqualitativer und effizienter Suchwortextraktion („Researcher“ und „DocAnalyser“),
  • Verfahren zur Bestimmung des Grades der Korrelation zwischen aktueller Suchanfrage und lokaler Textinhalte („Researcher“),
  • Methoden der thematischen Clusterung von Termen unter Beachtung ihrer semantischen Relationen und Gewichte zur Differenzierung zwischen Schlüsselwörtern und Quellthemen („DocAnalyser“),
  • die Erstellung eines intuitiven Nutzerinterface, das die Suchergebnisse (ähnlich zu Google) transparent darstellt und eine weitere Verfeinerung der Suche auch ohne Eintippen von Suchtermen ermöglicht.

Die Applikationen werden zurzeit einem Praktikabilitätstest durch eine breite Nutzergruppe unterzogen. Es ist geplant, die Lösungen als „vorausschauender“ Wegweiser bei der individuellen Websuche zu etablieren und hierzu explizite Funktionen zur Themenverfolgung und der kooperativen Suche zwischen Nutzern (z.B. Forschergruppen) bereitzustellen. Dabei steht die Entwicklung von Methoden der feingranularen thematischen Clusterung von Suchergebnissen unter Einbeziehung des Nutzerfeedback im Mittelpunkt der weiteren Forschung.

Der Dienst DocAnalyser zur Suche nach inhaltlich ähnlichen und semantisch verbundenen Webdokumenten wird vom Lehrgebiet Kommunikationsnetze kostenlos unter http://www.docanalyser.de/ angeboten.


Weitere Forschungsschwerpunkte

  • Automatische Sprachverarbeitung auf Basis statistischer Textanalyse
  • Graphenbasierte Textanalyse
  • Anwendungsbezogenes Data und Text Mining
  • Verteiltes und interaktives Information Retrieval
  • Semantische und kontextabhängige Suche nach Inhalten
  • Inhaltsbasierte Netzwerkevolution
  • Modellierung und Simulation des Nutzerverhaltens in sozialen Netzen
  • Funktionale Sicherheit in der Echtzeitprogrammierung

Publikationen (Auswahl)

  • Kubek, M.; Unger, H.: A Concept Supporting Resilient, Fault-tolerant and Decentralised Search, In: Autonomous Systems 2017, VDI-Verlag Düsseldorf, 2017
  • Kubek M., Schweda R., Unger H.: Android IR - Full-Text Search for Android. In: Recent Advances in Information and Communication Technology 2017 (IC2IT 2017). Advances in Intelligent Systems and Computing, Vol. 566. Springer, Cham
  • Komkhao M., Kubek M., Halang W.A.: Sequentially Grouping Items into Clusters of Unspecified Number. In: Recent Advances in Information and Communication Technology 2017 (IC2IT 2017). Advances in Intelligent Systems and Computing, Vol. 566. Springer, Cham
  • Kubek, M.; Unger, H.: Centroid Terms and their Use in Natural Language Processing, In: Autonomous Systems 2016, VDI-Verlag Düsseldorf, 2016
  • Kubek, M.; Unger, H.: Centroid Terms as Text Representatives, In: DocEng2016, Proceedings of 16th ACM Symposium on Document Engineering, ACM, 2016
  • Coltzau, H.; Kubek, M.: User-Triggered Structural Changes in OSN-Alike Distributed Content Networks, In: Recent Advances in Information and Communication Technology, Proceedings of the 12th International Conference on Computing and Information Technology (IC2IT 2016), Advances in Intelligent Systems and Computing, Vol. 463, S. 7-15, Springer International Publishing, 2016
  • Kubek, M.; Unger, H.: Real-Time Control of Mobile Communication Channels, In: Recent Advances in Information and Communication Technology, Proceedings of the 12th International Conference on Computing and Information Technology (IC2IT 2016), Advances in Intelligent Systems and Computing, Vol. 463, S. 301-308, Springer International Publishing, 2016
  • Kubek, M.; Unger, H.; Dusik, J.: Correlating Words - Approaches and Applications, In: Proceedings of the 16th International Conference on Computer Analysis of Images and Patterns Part 1, CAIP 2015, S. 27-38, Springer International Publishing Switzerland, 2015
  • Vongsingthong, S.; Boonkrong, S.; Kubek, M.; Unger, H.: On the Distributions of User Behaviors in Complex Online Social Networks, In: Recent Advances in Information and Communication Technology, Proceedings of the 11th International Conference on Computing and Information Technology (IC2IT 2015), Advances in Intelligent Systems and Computing, Vol. 361, Springer International Publishing, 2015
  • Kubek, M.: Interaktive Anwendungen kontextbasierter Suchverfahren, Fortschritt-Berichte VDI, Reihe 10 Nr. 839, VDI-Verlag Düsseldorf, 2014
  • Kubek, M.: DocAnalyser - Searching with Web Documents, In: Autonomous Systems 2014, Fortschritt-Berichte VDI, Reihe 10 Nr. 835, S. 221-234, VDI-Verlag Düsseldorf, 2014
  • Kubek, M.; Suwanich, W.; Wongyaowaruk, K.: Mobile Echtzeitkontrolle von Kommunikationskanälen, In: Industrie 4.0 und Echtzeit, Echtzeit 2014, S. 121- 128, Springer-Verlag Berlin Heidelberg, 2014
  • Sukjit, P.; Kubek, M.; Böhme, T.; Unger, H.: PDSearch: Using Pictures as Queries, In: Recent Advances in Information and Communication Technology, Proceedings of the 10th International Conference on Computing and Information Technology (IC2IT 2014), Advances in Intelligent Systems and Computing, Vol. 265, Springer International Publishing, 2014
  • Kubek, M.; Unger, H.: On N-Term Co-occurrences, In: Recent Advances in Information and Communication Technology, Proceedings of the 10th International Conference on Computing and Information Technology (IC2IT 2014), Advances in Intelligent Systems and Computing, Vol. 265, Springer International Publishing, 2014
  • Kubek, M.; Unger, H.: Special-purpose Text Clustering, In: International Journal of Intelligent Information Processing (IJIIP), Vol. 4 No. 4, 2013
  • Kubek, M.; Unger, H.; Hussein, P.; Tiranalinvit, W.; Chatpaiboonwat, P.: Contextual Rearrangement of Web Content, In: Proceedings of the 3rd International Conference on IT and Intelligent Systems (ICITIS'2013), Bangkok, 2013
  • Kubek, M.; Unger, H.: Generating Topically Induced Document Links, In: Networked Information Systems, Fortschritt-Berichte VDI, Reihe 10 Nr. 826, S. 85 – 93, VDI-Verlag Düsseldorf, 2013
  • Neuser, P.; Unger, H.; Kubek, M.: An Extended, Decentralized Version of the VIVALDI-Mechanism to Create Synthetic Network Coordinates based on Peer Data, In: Networked Information Systems, Fortschritt-Berichte VDI, Reihe 10 Nr. 826, S. 140 – 151, VDI-Verlag Düsseldorf, 2013
  • Kubek, M.; Unger, H.; Loauschasai, T.: A Quality- and Security-improved Web Search using Local Agents, In: Intl. Journal of Research in Engineering and Technology (IJRET), Vol. 1 No. 6, 2012
  • Kubek M.; Unger, H.: Detecting Source Topics by Analysing Directed Co-occurrence Graphs, In: Proceedings of 12th Intl. Conf. on Innovative Internet Community Systems, GI Lecture Notes in Informatics Vol. P-204, S. 202–211, Köllen Verlag, Bonn, 2012
  • Kubek, M.: Dezentrale, kontextbasierte Steuerung der Suche im Internet, Dissertation, FernUniversität in Hagen, 2012
  • Kubek, M.; Unger, H.: Detecting Source Topics using Extended HITS. In: Proceedings of the 8th International Conference on Computing and Information Technology (IC2IT), S. 104 - 108, Pattaya City, IEEE Thailand Section, 2012
  • Sodsee, S.; Meesad, P.; Kubek, M.; Unger, H.: Calculating Rank of Nodes in Decentralised Systems from Random Walks and Network Parameters, In: Intl. Journal of Computer Science and Information Security, Vol. 10 No. 1, S. 32-41, 2012
  • Kubek, M.; Unger, H.: Search Word Extraction Using Extended PageRank Calculations. In: Autonomous Systems: Developments and Trends, SCI 391, S. 325 - 337, Springer-Verlag Berlin Heidelberg, 2011
  • Kubek, M.; Unger, H.: Topic Detection Based on the PageRank's Clustering Property. In: Proceedings of the 11th International Innovative Internet Community Systems (I2CS 2011), GI-Edition LNI Vol. P-186, Berlin, S. 139 - 148, Köllen Verlag Bonn, 2011
  • Kubek, M.; Unger, H.: Empiric Considerations of the PageRank's Clustering Property. In: Proceedings of the 7th International Conference on Computing and Information Technology (IC2IT), S. 22 - 26, Bangkok, IEEE Thailand Section, 2011
  • Kubek, M.; Witschel, H. F.: Searching the Web by Using the Knowledge in Local Text Document. In: Smart System Technologies Bd. 6, Proceedings of Mallorca Workshop 2010 Autonomous Systems, S. 75 - 79, Shaker Verlag Aachen, 2010

Düring | 05.10.2017
FernUni-Logo FernUniversität in Hagen, Lehrgebiet Kommunikationsnetze , 58084 Hagen, Tel.: +49 2331 987-1141