Information extraction from documents with regular expression matching

   
   

Techniques are provided for enumerating regularly identifiable or stereotypical phrases that people commonly use to convey particular information, and where exactly in these phrases the particular information is to be found. In one embodiment, such phrases are referred to as "regular expressions." Using such enumerated phrases, the invention is able to automatically identify them in an input data stream and then identify and extract the particular information associated with the phrase that is being sought, e.g., important or relevant information.

De technieken worden verstrekt voor regelmatig het opsommen van identificeerbare of stereotiepe uitdrukkingen die de mensen algemeen gebruiken om bijzondere informatie te vervoeren, en waar precies in deze uitdrukkingen de bijzondere informatie moet worden gevonden. In één belichaming, worden dergelijke uitdrukkingen bedoeld als "regelmatige uitdrukkingen." Gebruikend dergelijke opgesomde uitdrukkingen, kan de uitvinding hen in een stroom van inputgegevens automatisch identificeren en dan de bijzondere informatie identificeren en halen verbonden aan de uitdrukking die, b.v., belangrijke of relevante informatie wordt gestreefd naar.

 
Web www.patentalert.com

< IC conductor capacitance estimation method

< Method for generating code for processing a database

> Apparatus and methods for copying, backing up and restoring logical objects in a computer storage system by transferring blocks out of order or in parallel

> System and method for preventing sector slipping in a storage area network

~ 00154