A speaker verification method and apparatus which advantageously minimizes
the constraints on the customer and simplifies the system architecture by
using a speaker dependent, rather than a speaker independent, background
model, thereby obtaining many of the advantages of using a background
model in a speaker verification process without many of the disadvantages
thereof. In particular, no training data (e.g. speech) from anyone other
than the customer is required, no speaker independent models need to be
produced, no a priori knowledge of acoustic rules are required, and, no
multi-lingual phone models, dictionaries, or letter-to-sound rules are
needed. Nonetheless, in accordance with an illustrative embodiment of the
present invention, the customer is free to select any password phrase in
any language. Specifically, and in accordance with an illustrative
embodiment of the present invention, the background model comprises a
hidden Markov model having a cruder acoustic resolution than the customer
model, which may, for example, be achieved by providing a background model
containing fewer states than the customer model.
Μια μέθοδος και μια συσκευή επαλήθευσης ομιλητών που ελαχιστοποιεί ευνοϊκά τους περιορισμούς στον πελάτη και απλοποιεί την αρχιτεκτονική συστημάτων με τη χρησιμοποίηση ενός ομιλητή εξαρτώμενου, παρά έναν ανεξάρτητο ομιλητών, πρότυπο υποβάθρου, με αυτόν τον τρόπο λαμβάνοντας πολλών από τα πλεονεκτήματα ένα πρότυπο υποβάθρου σε μια διαδικασία επαλήθευσης ομιλητών χωρίς πολλά από τα μειονεκτήματα επ' αυτού. Ειδικότερα, κανένα στοιχείο κατάρτισης (π.χ. ομιλία) από καθεμία εκτός από τον πελάτη δεν απαιτείται, κανένα ανεξάρτητο πρότυπο ομιλητών δεν πρέπει να παραχθεί, καμία a priori γνώση των ακουστικών κανόνων δεν απαιτείται, και, κανένα πολύγλωσσο τηλεφωνικό πρότυπο, λεξικά, ή οι κανόνες επιστολή-$$$-ΉΧΟΥ απαιτούνται. Εν τούτοις, σύμφωνα με μια επεξηγηματική ενσωμάτωση της παρούσας εφεύρεσης, ο πελάτης είναι ελεύθερος να επιλέξει οποιαδήποτε φράση κωδικού πρόσβασης σε οποιαδήποτε γλώσσα. Συγκεκριμένα, και σύμφωνα με μια επεξηγηματική ενσωμάτωση της παρούσας εφεύρεσης, το πρότυπο υποβάθρου περιλαμβάνει ένα κρυμμένο markov πρότυπο που έχει ένα πιό ακατέργαστο ακουστικό ψήφισμα από το πρότυπο πελατών, το οποίο μπορεί, παραδείγματος χάριν, να επιτευχθεί με την παροχή ενός προτύπου υποβάθρου που περιέχει λιγότερα κράτη από το πρότυπο πελατών.