PD Dr.-Ing. habil. Mario Kubek

Mario Kubek Foto: FernUniversität

E-Mail: mario.kubek

Telefon: +49 2331 987-4413

Homepage: http://www.mario-kubek.de


Akademischer Rat

Zum 1. August 2019 Wechsel in den Zentralbereich der Fakultät für Mathematik und Informatik mit dem Schwerpunkt IT-Sicherheit

Homepage

Besuchsadresse: Universitätsstraße 11, Informatikzentrum, Gebäude 3, Raum 0G005

Fakultätspreis 2019

Der Fakultätspreis 2019 für die beste wissenschaftliche Arbeit 2018 wurde an PD Dr.-Ing. Mario Kubek für seine Habilitationsschrift "Concepts and Methods for a Librarian of the Web" verliehen.

Die Habilitationsschrift [externer Link] wurde im Springer-Verlag unter der Print ISBN 978-3-030-23135-4 und der Online ISBN 978-3-030-23136-1 veröffentlicht.

Venia Legendi

Dr.-Ing. Mario Kubek wurde am 14. Januar 2019 die VENIA LEGENDI für das Fach Informatik verliehen.

Am 25. November 2019 hielt Dr. Kubek seine Antrittsvorlesung als Privatdozent zum Thema:
"Die WebEngine - Wie baut man eine dezentrale Websuchmaschine?" (Video).

Lehrtätigkeit

  • Betreuung der Lehrveranstaltungen und Präsenzseminare zu
    • „Kommunikationsnetze und Protokolle I + II“
    • „Sicherheit im Internet 2“
    • „Fehlertoleranz in Computersystemen und Netzwerken“
  • Betreuung von Abschlussarbeiten

Aktuelles Forschungsthema: Kontextbasierte und interaktive Suche nach und mit Textdokumenten

Die Entwicklung lokal arbeitender Verfahren und Methoden, um Menschen eine effektivere und effizientere Navigation im World Wide Web (WWW, Web) als bislang mit klassischen Suchmaschinen zu bieten, ist das Anliegen der prototypisch umgesetzten Suchapplikationen „Researcher“ und „DocAnalyser“. Diese wurden mit dem Ziel entworfen, nicht eine Flut von Dokumenten zu suchen, die eventuell eine nur geringe Anzahl relevanter Schlüsselwörter enthalten, sondern genau diejenigen, die das aktuelle Informationsbedürfnis (d.h. den Wunsch nach passendem Neuen) unter Vorgabe thematischer Kontexte, bestimmt durch die Inhalte lokaler Textdokumente, tatsächlich befriedigen.

Motivation und Ziele

Websuchmaschinen wie Google täuschen dem Nutzer vor, jede erdenkliche Information im WWW präsentieren zu können, die dem Anliegen des in wenigen (oft unter erheblichem Aufwand gefundenen) Schlüsselwörtern präsentierten Problems entspricht. Dabei decken selbst alle gängigen Suchmaschinen lediglich 50% des gesamten WWW bei oftmals geringer Aktualität ab und sind ebenfalls kaum in der Lage, sich auf die individuellen Charakteristika eines jeden Nutzers auch nur annähernd einzustellen.

Darum wurde in den genannten Applikationen "Researcher" und "DocAnalyser" der Ansatz verfolgt, passende Suchworte durch Analyse lokal gespeicherter Textdokumente ("Researcher") wie auch momentan betrachtete Webdokumente ("DocAnalyser") zu bestimmen und diese als Suchworterweiterungen sowie als eigenständige Suchanfragen dem Nutzer zu präsentieren. Dies geschieht mit dem Ziel, weitere relevante oder ähnliche Dokumente im WWW aufzuspüren. In "DocAnalyser" wird zudem erstmals das neuartige Paradigma der Suche mit Textdokumenten als alleinigem Anfrageparameter konsequent umgesetzt. Die auf DocAnalyser aufsetzende Erweiterung "PDSearch" (Picture-Document-Search) zielt zudem darauf ab, ähnliche Webdokumente mittels selektierbarer Bilder aus Webseiten, die als textueller Kontext hierzu analysiert werden, zu finden. Auf diese Weise ermöglicht "PDSearch" eine interaktive und visuelle Disambiguierung von Nutzeranfragen (Intuition: "Ein Bild sagt mehr als tausend Worte.") und offeriert zudem eine bildbasierte und sprachübergreifende Themenanalyse und -verfolgung.

Die Suchlösungen erheben somit lokales bzw. situatives Wissen (Suchkontext) noch bevor die jeweilige Websuchmaschine angesprochen wird. Dadurch wird die Navigation im Web spürbar erleichtert. Die lokale Analyse von Nutzerdokumenten trägt dabei dem Datenschutz der Nutzer in besonderem Maße Rechnung, da diese den Nutzerrechner nicht verlassen. Die Wahrung des Datenschutzes spielt insbesondere im Lichte der bekannt gewordenen Praxis der Suchmaschinenanbieter und staatlichen Behörden, möglichst viele Nutzerprofildaten zu sammeln (ohne deren Einsatzzweck transparent zu machen), eine zunehmend wichtige Rolle. Der Nutzer selbst entscheidet, welche Daten der Dokumente (anonymisiert) zur Bildung von Suchanfragen verwenden werden sollen. Die Applikationen geben dem Nutzer hierbei wertvolle Hinweise.

[mehr erfahren]

Die drei genannten Suchlösungen wurden nach folgendem Konzept entworfen:

  • Unterstützung der individuellen Webrecherche durch dezentrale Bestimmung thematisch passender Erweiterungsterme zu Websuchanfragen auf der Nutzerseite unter Einbeziehung des Wissens lokaler Textdokumente und ihrer thematischen Korrelationen („Researcher“),
  • Analyse aktuell betrachteter Webdokumente bzw. von Webseiten, deren Bilder zuvor zur Erzeugung von Suchanfragen selektiert wurden, durch graphenbasierte Extraktion ihrer Schlüsselwörter und Quellthemen (thematisch einflussreiche Konzepte) auf Basis der zwischen ihnen technisch erfassten Assoziationen unterschiedlicher Stärke und Nutzung der so gewonnenen Terme als Suchanfragen, um thematisch ähnliche und verwandte Webdokumente zu finden („DocAnalyser“, „PDSearch“),
  • Ermöglichung der Themenverfolgung (Untersuchung der Grundlagen eines Themas) durch Verwendung der dokumentabhängigen Quellthemen als Suchanfragenterme („DocAnalyser“),
  • Intuitive Handhabung der Anwendungen durch einheitliche, browser-basierte Darstellung der Suchergebnisse mit der Möglichkeit der interaktiven An- und Abwahl von Suchtermen durch einfachen Klick auf diese zur individuellen und iterativen Verfeinerung bzw. Modifikation der Anfragen.

Die genannten Punkte erforderten:

  • den Entwurf und Umsetzung lokal arbeitender Methoden und Verfahren der Textanalyse mit der Maßgabe hochqualitativer und effizienter Suchwortextraktion („Researcher“ und „DocAnalyser“),
  • Verfahren zur Bestimmung des Grades der Korrelation zwischen aktueller Suchanfrage und lokaler Textinhalte („Researcher“),
  • Methoden der thematischen Clusterung von Termen unter Beachtung ihrer semantischen Relationen und Gewichte zur Differenzierung zwischen Schlüsselwörtern und Quellthemen („DocAnalyser“),
  • die Erstellung eines intuitiven Nutzerinterface, das die Suchergebnisse (ähnlich zu Google) transparent darstellt und eine weitere Verfeinerung der Suche auch ohne Eintippen von Suchtermen ermöglicht.

Die Applikationen werden zurzeit einem Praktikabilitätstest durch eine breite Nutzergruppe unterzogen. Es ist geplant, die Lösungen als „vorausschauender“ Wegweiser bei der individuellen Websuche zu etablieren und hierzu explizite Funktionen zur Themenverfolgung und der kooperativen Suche zwischen Nutzern (z.B. Forschergruppen) bereitzustellen. Dabei steht die Entwicklung von Methoden der feingranularen thematischen Clusterung von Suchergebnissen unter Einbeziehung des Nutzerfeedback im Mittelpunkt der weiteren Forschung.

Der Dienst DocAnalyser zur Suche nach inhaltlich ähnlichen und semantisch verbundenen Webdokumenten wird vom Lehrgebiet Kommunikationsnetze kostenlos unter http://www.docanalyser.de/ angeboten.

Weitere Forschungsschwerpunkte

  • Automatische Sprachverarbeitung auf Basis statistischer Textanalyse
  • Graphenbasierte Textanalyse
  • Anwendungsbezogenes Data und Text Mining
  • Verteiltes und interaktives Information Retrieval
  • Semantische und kontextabhängige Suche nach Inhalten
  • Inhaltsbasierte Netzwerkevolution
  • Modellierung und Simulation des Nutzerverhaltens in sozialen Netzen
  • Funktionale Sicherheit in der Echtzeitprogrammierung

Publikationen (Auswahl)

  • Kubek, M.; Böhme, T.; Unger, H.: Spreading Activation: A Fast Calculation Method for Text Centroids. In: Proceedings of the 3rd International Conference on Communication and Information Processing (ICCIP 2017), Tokyo, ACM, 2017
  • Kubek, M.; Meesad, P.; Unger, H.: User-based Document Ranking. In: Proceedings of the 3rd International Conference on Communication and Information Processing (ICCIP 2017), Tokyo, ACM, 2017
  • Kubek, M.; Unger, H.: A Concept Supporting Resilient, Fault-tolerant and Decentralised Search, In: Autonomous Systems 2017, VDI-Verlag Düsseldorf, 2017
  • Kubek, M.; Schweda, R.; Unger, H.: Android IR - Full-Text Search for Android. In: Recent Advances in Information and Communication Technology 2017 (IC2IT 2017). Advances in Intelligent Systems and Computing, Vol. 566. Springer, Cham
  • Komkhao, M.; Kubek, M.; Halang, W.A.: Sequentially Grouping Items into Clusters of Unspecified Number. In: Recent Advances in Information and Communication Technology 2017 (IC2IT 2017). Advances in Intelligent Systems and Computing, Vol. 566. Springer, Cham
  • Kubek, M.; Böhme, T.; Unger, H.: Empiric Experiments with Text Representing Centroids. In: Proceedings of the 6th International Conference on Software and Information Engineering (ICSIE 2017), Singapore, 2017
  • Kubek, M.; Unger, H.: Towards a Librarian of the Web. In: Proceedings of the 2nd International Conference on Communication and Information Processing (ICCIP 2016), Singapore, ACM, 2016
  • Kubek, M.; Unger, H.: Centroid Terms and their Use in Natural Language Processing, In: Autonomous Systems 2016, VDI-Verlag Düsseldorf, 2016
  • Kubek, M.; Unger, H.: Centroid Terms as Text Representatives, In: DocEng2016, Proceedings of 16th ACM Symposium on Document Engineering, ACM, 2016
  • Coltzau, H.; Kubek, M.: User-Triggered Structural Changes in OSN-Alike Distributed Content Networks, In: Recent Advances in Information and Communication Technology, Proceedings of the 12th International Conference on Computing and Information Technology (IC2IT 2016), Advances in Intelligent Systems and Computing, Vol. 463, S. 7-15, Springer International Publishing, 2016
  • Kubek, M.; Unger, H.: Real-Time Control of Mobile Communication Channels, In: Recent Advances in Information and Communication Technology, Proceedings of the 12th International Conference on Computing and Information Technology (IC2IT 2016), Advances in Intelligent Systems and Computing, Vol. 463, S. 301-308, Springer International Publishing, 2016
  • Kubek, M.; Unger, H.; Dusik, J.: Correlating Words - Approaches and Applications, In: Proceedings of the 16th International Conference on Computer Analysis of Images and Patterns Part 1, CAIP 2015, S. 27-38, Springer International Publishing Switzerland, 2015
  • Eberhardt, R.; Kubek, M.; Unger, H.: Why Google Isn’t the Future. Really Not. In: Autonomous Systems 2015, Fortschritt-Berichte VDI, Reihe 10 Nr. 842, S. 268–281, VDI-Verlag Düsseldorf, 2015
  • Vongsingthong, S.; Boonkrong, S.; Kubek, M.; Unger, H.: On the Distributions of User Behaviors in Complex Online Social Networks, In: Recent Advances in Information and Communication Technology, Proceedings of the 11th International Conference on Computing and Information Technology (IC2IT 2015), Advances in Intelligent Systems and Computing, Vol. 361, Springer International Publishing, 2015
  • Kubek, M.: Interaktive Anwendungen kontextbasierter Suchverfahren, Fortschritt-Berichte VDI, Reihe 10 Nr. 839, VDI-Verlag Düsseldorf, 2014
  • Kubek, M.: DocAnalyser - Searching with Web Documents, In: Autonomous Systems 2014, Fortschritt-Berichte VDI, Reihe 10 Nr. 835, S. 221-234, VDI-Verlag Düsseldorf, 2014
  • Kubek, M.; Suwanich, W.; Wongyaowaruk, K.: Mobile Echtzeitkontrolle von Kommunikationskanälen, In: Industrie 4.0 und Echtzeit, Echtzeit 2014, S. 121- 128, Springer-Verlag Berlin Heidelberg, 2014
  • Sukjit, P.; Kubek, M.; Böhme, T.; Unger, H.: PDSearch: Using Pictures as Queries, In: Recent Advances in Information and Communication Technology, Proceedings of the 10th International Conference on Computing and Information Technology (IC2IT 2014), Advances in Intelligent Systems and Computing, Vol. 265, Springer International Publishing, 2014
  • Kubek, M.; Unger, H.: On N-Term Co-occurrences, In: Recent Advances in Information and Communication Technology, Proceedings of the 10th International Conference on Computing and Information Technology (IC2IT 2014), Advances in Intelligent Systems and Computing, Vol. 265, Springer International Publishing, 2014
  • Kubek, M.; Unger, H.: Special-purpose Text Clustering, In: International Journal of Intelligent Information Processing (IJIIP), Vol. 4 No. 4, 2013
  • Kubek, M.; Unger, H.; Hussein, P.; Tiranalinvit, W.; Chatpaiboonwat, P.: Contextual Rearrangement of Web Content, In: Proceedings of the 3rd International Conference on IT and Intelligent Systems (ICITIS'2013), Bangkok, 2013
  • Kubek, M.; Unger, H.: Generating Topically Induced Document Links, In: Networked Information Systems, Fortschritt-Berichte VDI, Reihe 10 Nr. 826, S. 85 – 93, VDI-Verlag Düsseldorf, 2013
  • Neuser, P.; Unger, H.; Kubek, M.: An Extended, Decentralized Version of the VIVALDI-Mechanism to Create Synthetic Network Coordinates based on Peer Data, In: Networked Information Systems, Fortschritt-Berichte VDI, Reihe 10 Nr. 826, S. 140 – 151, VDI-Verlag Düsseldorf, 2013
  • Kubek, M.; Unger, H.; Loauschasai, T.: A Quality- and Security-improved Web Search using Local Agents, In: Intl. Journal of Research in Engineering and Technology (IJRET), Vol. 1 No. 6, 2012
  • Kubek M.; Unger, H.: Detecting Source Topics by Analysing Directed Co-occurrence Graphs, In: Proceedings of 12th Intl. Conf. on Innovative Internet Community Systems, GI Lecture Notes in Informatics Vol. P-204, S. 202–211, Köllen Verlag, Bonn, 2012
  • Kubek, M.: Dezentrale, kontextbasierte Steuerung der Suche im Internet, Dissertation, FernUniversität in Hagen, 2012
  • Sodsee, S.; Meesad, P.; Kubek, M.; Unger, H.: Calculating Rank of Nodes in Decentralised Systems from Random Walks and Network Parameters, In: Intl. Journal of Computer Science and Information Security, Vol. 10 No. 1, S. 32-41, 2012
  • Kubek, M.; Unger, H.: Search Word Extraction Using Extended PageRank Calculations. In: Autonomous Systems: Developments and Trends, SCI 391, S. 325 - 337, Springer-Verlag Berlin Heidelberg, 2011
  • Kubek, M.; Unger, H.: Topic Detection Based on the PageRank's Clustering Property. In: Proceedings of the 11th International Innovative Internet Community Systems (I2CS 2011), GI-Edition LNI Vol. P-186, Berlin, S. 139 - 148, Köllen Verlag Bonn, 2011
  • Kubek, M.; Witschel, H. F.: Searching the Web by Using the Knowledge in Local Text Document. In: Smart System Technologies Bd. 6, Proceedings of Mallorca Workshop 2010 Autonomous Systems, S. 75 - 79, Shaker Verlag Aachen, 2010
Düring | 02.03.2023