Registration method and search method for structured documents

   
   

A registration/search method for structured documents where correspondence data is prepared between a fixed-length-string and a string occurrence position within a structured document for all fixed-length-strings in the document and for each structured document. A list of a character and all hierarchical elements containing the character and element lengths is prepared. An occurrence frequency and an occurrence position of a search term is obtained using the plurality of fixed-length-substrings and the occurrence frequency extracting index. A search character is selected from the search term. A hierarchical element containing the search character is obtained using the character from the element length index. A length of the element corresponding to a search range is extracted using the obtained occurrence position. A matching degree for the search term is calculated from the obtained occurrence frequency of the search term and the extracted element length of the element corresponding to the search range.

Eine registration/search Methode für strukturierte Dokumente, in denen Korrespondenzdaten zwischen eine örtlich festgelegt-Länge-Zeichenkette und eine Zeichenketteauftretenposition innerhalb eines strukturierten Dokumentes für alle örtlich festgelegt-Länge-Zeichenketten im Dokument und für jedes strukturierte Dokument vorbereitet werden. Eine Liste eines Buchstabens und aller hierarchischen Elemente, welche die Buchstabe und Elementlängen enthalten, wird vorbereitet. Eine Auftretenfrequenz und eine Auftretenposition einer Suchbezeichnung wird mit der Mehrzahl von örtlich festgelegt-Länge-Teilketten und von Auftretenfrequenz, die Index extrahiert erreicht. Ein Suchbuchstabe wird von der Suchbezeichnung vorgewählt. Ein hierarchisches Element, das den Suchbuchstaben enthält, wird mit dem Buchstaben vom Elementlänge Index erhalten. Eine Länge des Elements, das einer Suchstrecke entspricht, wird mit der erreichten Auftretenposition extrahiert. Ein zusammenpassender Grad für die Suchbezeichnung wird von der erreichten Auftretenfrequenz der Suchbezeichnung und von der extrahierten Elementlänge des Elements errechnet, das der Suchstrecke entspricht.

 
Web www.patentalert.com

< Automatic profiler

< GUI interpretation technology for client/server environment

> Managing results of federated searches across heterogeneous datastores with a federated result set cursor object

> Storage management across multiple time zones

~ 00147