Structured-text cataloging method, structured-text searching method, and portable medium used in the methods

   
   

A text cataloging method includes a step of cataloging already-analyzed-text data obtained from an analysis of a logical structure of a text to be cataloged in a text database, a step of creating a structure index by sequentially superposing logical structures of texts to be cataloged, wherein a single metaelement is used for representing a group of elements in the texts having the same position of appearance in one of the texts and the same element type, a single piece of meta-character-string data is used for representing a group of pieces of character-string data in the texts having the same position of appearance in one of the texts, and a context identifier is assigned to each metanode composing a tree-like structure of the structure index for uniquely identifying the metanode; a step of generating structured-full-text data composed of definitions of associative relations between all pieces of character-string data included in already-analyzed-text data of each text to be cataloged, and context identifiers of pieces of meta-character-string data in the structure index used for representing the pieces of character-string data; and a character-string-index updating step, including the sub-steps of extracting partial character strings, generating structured-character-position information, and updating a character-string index.

Een tekst het catalogiseren methode omvat een stap van het catalogiseren van reeds-analyseren-tekstgegevens die uit een analyse van een logische structuur van een tekst die in een tekstgegevensbestand moet worden gecatalogiseerd, een stap van het creëren van een structuurindex door logische structuren van teksten opeenvolgend superposing worden verkregen, waarin één enkele metaelement voor het vertegenwoordigen van een groep elementen in de teksten gebruikt wordt die de zelfde positie van verschijning in één van de teksten en het zelfde elemententype hebben, één enkel stuk meta-karakter-koord gegevens te catalogiseren wordt gebruikt voor het vertegenwoordigen van een groep stukken character-string gegevens in de teksten die de zelfde positie van verschijning in één van de teksten hebben, en een contextherkenningsteken wordt toegewezen aan elke metanode context identifier is assigned to each metanode composing a tree-like structuur van de structuurindex voor uniek het identificeren van metanode; een stap van het produceren van structureren-volledig-tekstgegevens die uit definities van associatieve relaties tussen alle stukken character-string gegevens inbegrepen in reeds-analyseren-tekstgegevens worden samengesteld van elke te catalogiseren tekst, en contextherkenningstekens van stukken meta-karakter-koord gegevens in de structuurindex die voor het vertegenwoordigen van de stukken character-string gegevens wordt gebruikt; en een karakter-koord-index bijwerkende stap, met inbegrip van de sub-stappen van het halen van gedeeltelijke karakterkoorden, het produceren van structureren-karakter-positieinformatie, en het bijwerken van een character-string index.

 
Web www.patentalert.com

< Method for visualizing data backup activity from a plurality of backup devices

< System and method for providing a multi-tiered hierarchical transient message store accessed using multiply hashed unique filenames

> Method and system for building a family tree

> Method of indexing and searching feature vector space

~ 00114