Zentroide

Bedeutungsschwerpunkte

Menschliche Leser sind nach nur wenigen Zeilen im Stande zu bestimmen, zu welcher thematischen Kategorie von Texten vorgegebene Dokumente gehören. Dies demonstriert eindringlich, wie gut und schnell das menschliche Gehirn, besonders der menschliche Cortex, Daten verarbeiten und interpretieren kann. Es ist nicht nur im Stande, die Bedeutung von einzelnen Wörtern (als Darstellungen von wirklichen Entitäten), sondern auch bestimmte Zusammenhänge zu verstehen. Darüber hinaus dient es als Wissensdatenbank beim thematischen Klassifizieren vorher unbekannten Inhalts. Es versucht, die Begriffe (d.h. die Bedeutung von Wörtern) in solchen Dokumenten mit vorher erlernten Fachbegriffen abzugleichen und kann sie so unverzüglich und unbewusst grob klassifizieren.

Die Bedeutungsschwerpunkte (Centroid terms) repräsentieren eine völlig neue Methode und Technologie inspiriert von der Physik und den Prozessen im Gehirn, um diese Aufgaben in einer besseren Art und Weise zu lösen als alle herkömmlichen Ansätze, welche größtenteils auf der Bag-of-words Methode oder der Term Frequency – Inverse Document Frequency (TF-IDF) Methode basieren.

Nähere Informationen


Veröffentlichung in der ACM Digital Library

The WebEngine: A Fully Integrated, Decentralised Web Search Engine
Proceedings of the "2nd International Conference on Natural Language Processing and Information Retrieval" in Bangkok/Thailand, September 07 - 09, 2018:

This paper presents a basic, new concept for decentralized web search which addresses major shortcomings of current web search engines. Its methods are characterised by their local working principles, making it possible to employ them on diverse hardware configurations. The concept's implementation in form of an interactive, librarian-inspired peer-to-peer software client, called 'WebEngine', is elaborated on in detail. This software extends and interconnects common web servers creating and forming a decentralised web search system on top of the existing web structure while -for the first time- combining modern text analysis techniques with novel and efficient search functions as well as approaches for the semantically induced P2P-network construction and its exible management. This way, an alternative, fully integrated and powerful web search engine under the motto 'The Web is its own search engine.' is built making the web searchable without any central authority.

URL: https://dl.acm.org/citation.cfm?id=3278294

Düring | 08.04.2024