Multi-stage large vocabulary speech recognition system and method

   
   

Multiple processing stages are provided with different vocabulary databases to improve processing time, efficiency, and accuracy in speech recognition. The entire vocabulary is divided into smaller vocabulary subsets, which are associated with particular keywords. A small vocabulary subset is generated or retrieved based on certain information, such as a calling party's locality. A user is prompted to provide input information, such as the locality in which a business whose phone number is requested is located, in the form of a spoken utterance to the system. If the utterance matches one of the entries in the initial small vocabulary subset, then the utterance is considered to be recognizable. If the utterance is not recognizable when compared to the initial small vocabulary subset, then the utterance is stored for later use. The user is then prompted for a keyword related to another subset of words in which his initial utterance may be found. A vocabulary subset associated with the received keyword is generated or retrieved. The initial stored utterance is then retrieved and compared to the newly loaded vocabulary subset. If the utterance matches one of the entries in the newly loaded vocabulary subset, then the utterance is recognizable. Otherwise, it is determined that the initial utterance was unrecognizable, and the user is prompted to repeat the initial utterance.

Στα πολλαπλάσια στάδια επεξεργασίας παρέχονται οι διαφορετικές βάσεις δεδομένων λεξιλογίου για να βελτιώσουν το χρόνο επεξεργασίας, την αποδοτικότητα, και την ακρίβεια στη λεκτική αναγνώριση. Το ολόκληρο λεξιλόγιο διαιρείται σε μικρότερα υποσύνολα λεξιλογίου, τα οποία συνδέονται με τις ιδιαίτερες λέξεις κλειδιά. Ένα μικρό υποσύνολο λεξιλογίου παράγεται ή ανακτάται βασισμένος σε ορισμένες πληροφορίες, όπως η τοποθεσία ενός καλώντας συμβαλλόμενου μέρους. Ένας χρήστης προτρέπεται για να παρέχει τις πληροφορίες εισαγωγής, όπως η τοποθεσία στην οποία μια επιχείρηση ο της οποίας τηλεφωνικός αριθμός ζητείται βρίσκεται, υπό μορφή προφορικής έκφρασης στο σύστημα. Εάν η έκφραση ταιριάζει με μια από τις καταχωρήσεις στο αρχικό μικρό υποσύνολο λεξιλογίου, κατόπιν η έκφραση θεωρείται αναγνωρίσιμη. Εάν η έκφραση δεν είναι αναγνωρίσιμη όταν συγκρίνεται με το αρχικό μικρό υποσύνολο λεξιλογίου, κατόπιν η έκφραση αποθηκεύεται για την πιό πρόσφατη χρήση. Ο χρήστης προτρέπεται έπειτα για μια λέξη κλειδί σχετική με ένα άλλο υποσύνολο των λέξεων στο οποίο η αρχική έκφρασή του μπορεί να βρεθεί. Ένα υποσύνολο λεξιλογίου που συνδέεται με τη λαμβανόμενη λέξη κλειδί παράγεται ή ανακτάται. Η αρχική αποθηκευμένη έκφραση ανακτάται έπειτα και συγκρίνεται με το πρόσφατα φορτωμένο υποσύνολο λεξιλογίου. Εάν η έκφραση ταιριάζει με μια από τις καταχωρήσεις στο πρόσφατα φορτωμένο υποσύνολο λεξιλογίου, κατόπιν η έκφραση είναι αναγνωρίσιμη. Διαφορετικά, καθορίζεται ότι η αρχική έκφραση ήταν unrecognizable, και ο χρήστης προτρέπεται για να επαναλάβει την αρχική έκφραση.

 
Web www.patentalert.com

< Motor vehicle navigation system that receives route information from a central unit

< Facsimile device and memory medium storing computer programs for controlling the facsimile device

> Call management implemented using call routing engine

> Identifying communications channels between nodes

~ 00116