A text mining program is provided that allows a user to perform text mining operations, such as: information retrieval, term and document visualization, term and document clustering, term and document classification, summarization of individual documents and groups of documents, and document cross-referencing. This is accomplished by representing the text of a document collection using subspace transformations. This subspace transformation representation is performed by: constructing a term frequency matrix of the term frequencies for each of the documents, transforming the term frequencies for statistical purposes, and projecting the documents or the terms into a lower dimensional subspace. As the document collection is updated, the subspace is dynamically updated to reflect the new document collection.

Um programa minando do texto está contanto que permite que um usuário execute operações de mineração do texto, como: recuperação de informação, visualization do termo e do original, aglomerar-se do termo e do original, classificação do termo e do original, summarization de originais individuais e grupos dos originais, e de fazer remissão recíproca do original. Isto é realizado representando o texto de uma coleção do original usando transformações do subspace. Esta respresentação da transformação do subspace é executada perto: construindo uma matriz da freqüência do termo das freqüências do termo para cada um dos originais, transformando as freqüências do termo para finalidades estatísticas, e projetar os originais ou os termos em um subspace dimensional mais baixo. Enquanto a coleção do original é updated, o subspace está atualizado dinâmicamente para refletir a coleção nova do original.

 
Web www.patentalert.com

< Image processing apparatus

< Scanned image alignment systems and methods

> Method for combining partially measured data

> Device and method for interpolating image data and medium on which image data interpolating program is recorded

~ 00082