Method and apparatus for indexing document content and content comparison with World Wide Web search service

   
   

Methods and related systems for indexing the contents of documents for comparison with the contents of other documents to identify matching content. A method for comparing the contents of a query document to the content on the World Wide Web is set forth. The contents of a query document are indexed and compared to content from the World Wide Web which is continuously retrieved and indexed. The method for indexing may comprise selecting substrings from the document, hashing the substrings to generate a plurality of hash values having a known range of values, selecting certain hash values to save from the generated hash values, and sorting the saved hash values. Methods for selecting certain hash values to save are set forth.

Μέθοδοι και σχετικά συστήματα για το περιεχόμενο των εγγράφων για τη σύγκριση με το περιεχόμενο άλλων εγγράφων για να προσδιορίσει το ταιριάζοντας με περιεχόμενο. Μια μέθοδος για το περιεχόμενο ενός εγγράφου ερώτησης με το περιεχόμενο στο World Wide Web εκτίθεται. Το περιεχόμενο ενός εγγράφου ερώτησης συντάσσεται και συγκρίνεται με το περιεχόμενο από το World Wide Web που ανακτάται συνεχώς και συντάσσεται. Η μέθοδος για μπορεί να περιλάβει την επιλογή των substrings από το έγγραφο, που κομματιάζει τα substrings για να παραγάγει μια πολλαπλότητα hash των τιμών που έχουν μια γνωστή σειρά των τιμών, που επιλέγουν ορισμένες hash τιμές για να σώσει από τις παραγμένες hash τιμές, και που ταξινομούν τις σωζόμενες hash τιμές. Οι μέθοδοι για ορισμένες hash τιμές που σώζουν εκτίθενται.

 
Web www.patentalert.com

< Search system and method based on search condition combinations

< Intranet mediator

> Alerting users to items of current interest

> Method of downloading web content to a network kiosk in advance

~ 00118