Using adaptive random sampling with cross-validation helps determine when enough data of a database has been sampled to construct histograms on one or more columns of one or more tables of the database within a desired or predetermined degree of accuracy. An adaptive random sampling histogram construction tool constructs an approximate equi-height k-histogram using an initial sample of data values from the database and iteratively updates the histogram using an additional sample of data values from the database until the histogram is within the desired degree of accuracy. The accuracy of the histogram is cross-validated against the additional sample at each iteration, and the additional sample is used to update the histogram to help improve its accuracy. The accuracy of the histogram may be measured by an error in distribution of the additional sample over the histogram as compared to a threshold error using a suitable error metric. By attempting to sample only the number of data values necessary to construct the histogram within the desired degree of accuracy, the adaptive random sampling histogram construction tool attempts to avoid any cost increases in time and memory from sampling too many data values.

Χρησιμοποιώντας την προσαρμοστική τυχαία δειγματοληψία με τις βοήθειες διαγώνιος-επικύρωσης καθορίστε πότε αρκετό στοιχείο μιας βάσης δεδομένων έχει επιλεχτεί για να κατασκευάσει τα ιστόγραμμα σε μια ή περισσότερες στήλες ενός ή περισσότερων πινάκων της βάσης δεδομένων μέσα σε έναν επιθυμητό ή προκαθορισμένο βαθμό ακρίβειας. Ένα προσαρμοστικό εργαλείο κατασκευής ιστογράμμων τυχαίας δειγματοληψίας κατασκευάζει ένα κατά προσέγγιση Κ-ιστόγραμμο εquη-ύψους χρησιμοποιώντας ένα αρχικό δείγμα των τιμών στοιχείων από τη βάση δεδομένων και ενημερώνει iteratively το ιστόγραμμο χρησιμοποιώντας ένα πρόσθετο δείγμα των τιμών στοιχείων από τη βάση δεδομένων έως ότου είναι το ιστόγραμμο μέσα στον επιθυμητό βαθμό ακρίβειας. Η ακρίβεια του ιστογράμμου διαγώνιος-επικυρώνεται ενάντια στο πρόσθετο δείγμα σε κάθε επανάληψη, και το πρόσθετο δείγμα χρησιμοποιείται για να ενημερώσει το ιστόγραμμο για να βοηθήσει να βελτιώσει την ακρίβειά του. Η ακρίβεια του ιστογράμμου μπορεί να μετρηθεί από ένα λάθος στη διανομή του πρόσθετου δείγματος πέρα από το ιστόγραμμο σε σύγκριση με ένα λάθος κατώτατων ορίων χρησιμοποιώντας ένα κατάλληλο λάθος μετρικό. Με την προσπάθεια στο δείγμα μόνο του αριθμού τιμών στοιχείων απαραίτητων να κατασκευάσουν το ιστόγραμμο μέσα στον επιθυμητό βαθμό ακρίβειας, το προσαρμοστικό εργαλείο κατασκευής ιστογράμμων τυχαίας δειγματοληψίας προσπαθεί να αποφύγει οποιεσδήποτε αυξήσεις δαπανών εγκαίρως και τη μνήμη από τη δειγματοληψία πάρα πολλών τιμών στοιχείων.

 
Web www.patentalert.com

< (none)

< Sort system for text retrieval

> Offshore exploration or production operation

> (none)

~ 00012