A method of automatically generating a topical description of text by receiving the text containing input words; stemming each input word to its root form; assigning a user-definable part-of-speech score to each input word; assigning a language salience score to each input word; assigning an input-word score to each input word; creating a tree structure under each input word, where each tree structure contains the definition of the corresponding input word; assigning a definition-word score to each definition word; collapsing each tree structure to a corresponding tree-word list; assigning a tree-word-list score to each entry in each tree-word list; combining the tree-word lists into a final word list; assigning each word in the final word list a final-word-list score; and choosing the top N scoring words in the final word list as the topic description of the input text. Document searching and sorting may be accomplished by performing the method described above on each document in a database and then comparing the similarity of the resulting topical descriptions.

Une méthode de produire automatiquement d'une description topique de texte en recevant le texte contenant des mots d'entrée ; refoulement de chaque mot d'entrée à sa forme de racine ; assigner des points utilisateur-définissables de partie du discours à chaque mot d'entrée ; assigner des points de prépondérance de langue à chaque mot d'entrée ; assigner des points d'entrée-mot à chaque mot d'entrée ; créant une structure arborescente sous chaque mot d'entrée, où chaque structure arborescente contient la définition du mot d'entrée correspondant ; assigner des points de définition-mot à chaque mot de définition ; s'effondrant chaque structure arborescente à une liste correspondante d'arbre-mot ; assigner des points d'arbre-mot-liste à chaque entrée dans chaque liste d'arbre-mot ; la combinaison du l'arbre-mot énumère dans une liste finale de mot ; en assignant chaque mot dans le mot final énumérez des points de final-mot-liste ; et choisissant les mots de marquage du dessus N dans la liste finale de mot comme description de matière du texte d'entrée. Le document recherchant et assortissant peut être accompli en exécutant la méthode décrite ci-dessus sur chaque document dans une base de données et puis en comparant la similitude des descriptions topiques résultantes.

 
Web www.patentalert.com

< (none)

< Mechanism for embedding network based control systems in a local network interface device

> Data base development system with methods facilitating copying of data from one data source to another

> (none)

~ 00001