A text cataloging method includes a step of cataloging
already-analyzed-text data obtained from an analysis of a logical
structure of a text to be cataloged in a text database, a step of creating
a structure index by sequentially superposing logical structures of texts
to be cataloged, wherein a single metaelement is used for representing a
group of elements in the texts having the same position of appearance in
one of the texts and the same element type, a single piece of
meta-character-string data is used for representing a group of pieces of
character-string data in the texts having the same position of appearance
in one of the texts, and a context identifier is assigned to each metanode
composing a tree-like structure of the structure index for uniquely
identifying the metanode; a step of generating structured-full-text data
composed of definitions of associative relations between all pieces of
character-string data included in already-analyzed-text data of each text
to be cataloged, and context identifiers of pieces of
meta-character-string data in the structure index used for representing
the pieces of character-string data; and a character-string-index updating
step, including the sub-steps of extracting partial character strings,
generating structured-character-position information, and updating a
character-string index.
Een tekst het catalogiseren methode omvat een stap van het catalogiseren van reeds-analyseren-tekstgegevens die uit een analyse van een logische structuur van een tekst die in een tekstgegevensbestand moet worden gecatalogiseerd, een stap van het creëren van een structuurindex door logische structuren van teksten opeenvolgend superposing worden verkregen, waarin één enkele metaelement voor het vertegenwoordigen van een groep elementen in de teksten gebruikt wordt die de zelfde positie van verschijning in één van de teksten en het zelfde elemententype hebben, één enkel stuk meta-karakter-koord gegevens te catalogiseren wordt gebruikt voor het vertegenwoordigen van een groep stukken character-string gegevens in de teksten die de zelfde positie van verschijning in één van de teksten hebben, en een contextherkenningsteken wordt toegewezen aan elke metanode context identifier is assigned to each metanode composing a tree-like structuur van de structuurindex voor uniek het identificeren van metanode; een stap van het produceren van structureren-volledig-tekstgegevens die uit definities van associatieve relaties tussen alle stukken character-string gegevens inbegrepen in reeds-analyseren-tekstgegevens worden samengesteld van elke te catalogiseren tekst, en contextherkenningstekens van stukken meta-karakter-koord gegevens in de structuurindex die voor het vertegenwoordigen van de stukken character-string gegevens wordt gebruikt; en een karakter-koord-index bijwerkende stap, met inbegrip van de sub-stappen van het halen van gedeeltelijke karakterkoorden, het produceren van structureren-karakter-positieinformatie, en het bijwerken van een character-string index.