Ambient data is data created or retained as an artifact of a computer system, rather than by an intention of the user. Ambient data typically includes both textual and binary, i.e., non-textual, data. Ambient data can include information of which the user is unaware, and an investigator can review ambient data to learn about the Internet-related activity performed on the computer. Most of the information in the ambient data is not useful, and the large amount of ambient data on a typical computer system can require significant time to review. The invention locates useful internet-related information in the ambient data and outputs the information in a useful database format, excluding non-textual data and text that is unrelated to Internet activity. The system locates internet-related information of interest using proximity rules, that is, the system writes output when only when certain characters appear in the ambient data within a specified proximity to other characters. The characters can include including symbols, abbreviations, or words, specified either individually or on a pre-compiled list. Exclusionary rules can also eliminate firewall aliases, internet identifiers that are less useful to an investigator. By applying such rules, an output file including only textual data representing useful Internet addresses and URL is presented to an investigator.

Los datos ambiente son datos creados o conservaron como artefacto de un sistema informático, más bien que por una intención del usuario. Los datos ambiente incluyen típicamente textual y binario, es decir, no-textual, datos. Los datos ambiente pueden incluir la información de la cual el usuario es inconsciente, y un investigador puede repasar datos ambiente para aprender sobre la actividad Internet-relacionada realizada en la computadora. La mayoría de la información en los datos ambiente no es útil, y la cantidad grande de datos ambiente sobre un sistema informático típico puede requerir hora significativa de repasar. La invención encuentra la información Internet-relacionada útil en los datos ambiente y hace salir la información en un formato útil de la base de datos, excepto datos y el texto no-textuales que está sin relación a la actividad del Internet. El sistema encuentra la información Internet-relacionada del interés usando reglas de la proximidad, es decir, el sistema escribe salida cuando solamente cuando ciertos caracteres aparecen en los datos ambiente dentro de una proximidad especificada a otros caracteres. Los caracteres pueden incluir incluyendo los símbolos, abreviaturas, o las palabras, especificaron individualmente o en una lista pre-compilada. Las reglas exclusionary pueden también eliminar los alias del cortafuego, los identificadores del Internet que son menos útiles a un investigador. Aplicando tales reglas, un archivo de salida incluyendo solamente los datos textuales que representan direcciones útiles del Internet y el URL es presentado a un investigador.

 
Web www.patentalert.com

< (none)

< Dynamic JAVA.TM. class selection and download based on changeable attributes

> Method and system for emulating web site traffic to identify web site usage patterns

> (none)

~ 00012