A list of data of a database arranged in an order of a value of each component of a vector is formed for each component. For each component sequentially selected from base indexes, a pointer indicating data in an ascending order of a difference between data in the list and a test data is updated. Whether an end condition is satisfied or not is judged from a difference of component value between the data indicated by the pointer and the test data. If the end condition is not satisfied, whether a rejection condition is satisfied or not is judged from a distance in a partial space between the data indicated by the pointer and the test data. If the rejection condition is not satisfied, a distance in a whole space between the data indicated by the pointer and the text data is calculated. A predetermined number of data pieces are retrieved in an ascending order of a calculated distance. In this manner, the predetermined number of data pieces having a high similarity to the test vector can be retrieved at high speed from data of a vector format in the database.

Ένας κατάλογος στοιχείων μιας βάσης δεδομένων που τακτοποιείται κατά σειρά μια αξία κάθε συστατικού ενός διανύσματος διαμορφώνεται για κάθε συστατικό. Για κάθε συστατικό που επιλέγεται διαδοχικά από τους δείκτες βάσεων, ένας δείκτης που δείχνει τα στοιχεία κατά σειρά ανόδου μια διαφορά μεταξύ των στοιχείων στον κατάλογο και ενός στοιχείου δοκιμής ενημερώνεται. Εάν ένας όρος τελών είναι ικανοποιημένος ή δεν κρίνεται από μια διαφορά της συστατικής αξίας μεταξύ των στοιχείων που υποδεικνύονται από το δείκτη και των στοιχείων δοκιμής. Εάν ο όρος τελών δεν είναι ικανοποιημένος, εάν ένας όρος απόρριψης είναι ικανοποιημένος ή δεν κρίνεται από μια απόσταση σε ένα μερικό διάστημα μεταξύ των στοιχείων που υποδεικνύονται από το δείκτη και των στοιχείων δοκιμής. Εάν ο όρος απόρριψης δεν είναι ικανοποιημένος, μια απόσταση ολόκληρο σε ένα διάστημα μεταξύ των στοιχείων που υποδεικνύονται από το δείκτη και των στοιχείων κειμένων υπολογίζεται. Ένας προκαθορισμένος αριθμός κομματιών στοιχείων ανακτάται κατά σειρά ανόδου μια υπολογισμένη απόσταση. Με αυτόν τον τρόπο, ο προκαθορισμένος αριθμός κομματιών στοιχείων που έχουν μια υψηλή ομοιότητα στο διάνυσμα δοκιμής μπορεί να ανακτηθεί με την υψηλή ταχύτητα από τα στοιχεία ενός διανυσματικού σχήματος στη βάση δεδομένων.

 
Web www.patentalert.com

< Method and apparatus for implementing a corporate directory and service center

< Apparatus and method for tracking access to data resources in a cluster environment

> Method for measuring system clock signal frequency variations in digital processing systems

> Database copy apparatus, database copy method and recording medium recorded with database copy program

~ 00074