System and method for extracting knowledge from documents

   
   

A program product characterizes a set of information to determine common characteristics among subsets of the set of information. The program product includes computer instructions which obtain characteristic data that describe characteristics of an entity. For example, the characteristic data may include titles of individuals within an organization. The computer instructions also obtain a set of information associated with the entity (e.g. a set of e-mail messages, Web pages, business memoranda, etc.) The computer instructions identify key terms within the set of information and classify the set of information into at least first and second subsets. In addition, the computer instructions characterize the first subset as more important than the second subset, based on the key terms and the characteristic data. For example, a subset of documents associated with officers of a company may be characterized as more important than a subset of documents associated with temporary employees.

Un produit de programme caractérise un ensemble d'information pour déterminer des caractéristiques communes parmi des sous-ensembles de l'ensemble d'information. Le produit de programme inclut les instructions machine qui obtiennent les données caractéristiques qui décrivent des caractéristiques d'une entité. Par exemple, les données caractéristiques peuvent inclure des titres des individus dans une organisation. Les instructions machine obtiennent également un ensemble d'information lié à l'entité (par exemple un ensemble des messages de E-mail, des Pages Web, des mémorandums d'affaires, etc...) Les instructions machine identifient les limites principales dans l'ensemble d'information et classifient l'ensemble d'information dans au moins d'abord et des deuxièmes sous-ensembles. En outre, les instructions machine caractérisent le premier sous-ensemble comme plus important que le deuxième sous-ensemble, basé sur les limites principales et les données caractéristiques. Par exemple, un sous-ensemble de documents liés aux officiers d'une compagnie peut être caractérisé comme plus important qu'un sous-ensemble de documents liés aux employés temporaires.

 
Web www.patentalert.com

< Voice clip search

< Information processing apparatus and method for storing and managing objects together with additional information

> Dynamic generation of optimizer hints

> Method, system, and program for optimizing the processing of queries involving set operators

~ 00117