Method and system of ranking and clustering for document indexing and retrieval

   
   

A relevancy ranking and clustering method and system that determines the relevance of a document relative to a user's query using a similarity comparison process. Input queries are parsed into one or more query predicate structures using an ontological parser. The ontological parser parses a set of known documents to generate one or more document predicate structures. A comparison of each query predicate structure with each document predicate structure is performed to determine a matching degree, represented by a real number. A multilevel modifier strategy is implemented to assign different relevance values to the different parts of each predicate structure match to calculate the predicate structure's matching degree. The relevance of a document to a user's query is determined by calculating a similarity coefficient, based on the structures of each pair of query predicates and document predicates. Documents are autonomously clustered using a self-organizing neural network that provides a coordinate system that makes judgments in a non-subjective fashion.

Eine Bedeutung Klassifizierung und sammelnde eine Methode und ein System, das die Bedeutung eines Dokumentes im Verhältnis zu einer Benutzeranfrage mit einem Ähnlichkeitvergleich Prozeß feststellt. Eingang Fragen werden in eine oder in mehr Frage Prädikatstrukturen mit einer ontological grammatischen Definition analysiert. Die ontological grammatische Definition analysiert einen Satz bekannte Dokumente, um eine oder mehr Dokumentprädikatstrukturen zu erzeugen. Ein Vergleich jeder Frage Prädikatstruktur mit jeder Dokumentprädikatstruktur wird durchgeführt, um einen zusammenpassenden Grad zu bestimmen, dargestellt durch eine reale Zahl. Eine Mehrebenenmodifizierfaktorstrategie wird eingeführt, um unterschiedliche Bedeutung Werte den unterschiedlichen Teilen jedes Prädikatstrukturgleichen zuzuweisen, um den zusammenpassenden Grad der Prädikatstruktur zu errechnen. Die Bedeutung eines Dokumentes zu einer Benutzeranfrage wird festgestellt, indem man einen Ähnlichkeitkoeffizienten errechnet, basiert auf den Strukturen jedes Paares Frage Prädikate und Dokumentprädikate. Dokumente werden autonom mit einem self-organizing neuralen Netz gesammelt, das ein beigeordnetes System liefert, das Urteile auf eine objektive Art und Weise bildet.

 
Web www.patentalert.com

< System and method for re-routing of e-mail messages

< Data selection apparatus

> Search engine with natural language-based robust parsing for user query and relevance feedback learning

> Promoters for gene expression in caryopses of plants

~ 00121