Concerning feature extraction of documents in text mining, a method and an
apparatus for extracting features having the same nature as those by LSA
are provided that require smaller memory space and simpler program and
apparatus than the apparatus for executing LSA. Features of each document
are extracted by feature extracting acts on the basis of a term-document
matrix updated by term-document updating acts and of a basis vector,
spanning a space of effective features, calculated by basis vector
calculations. Execution of respective acts is repeated until a
predetermined requirement given by a user is satisfied.
Referente a la extracción de la característica de documentos en la explotación minera del texto, un método y un aparato para extraer las características que tienen la misma naturaleza que ésas de LSA están a condición de que requiera una memoria más pequeña y un programa más simple y aparato que el aparato para ejecutar LSA. Las características de cada documento son extraídas por la característica que extrae actos en base de una matriz del te'rmino-documento puesta al día por el te'rmino-documento que pone al día actos y de un vector de la base, atravesando un espacio de características eficaces, calculado por cálculos del vector de la base. La ejecución de actos respectivos se repite hasta que un requisito predeterminado dado por un usuario está satisfecho.