An audio retrieval system and method are provided for augmenting the transcription of an audio file with one or more alternate word or phrase choices, such as next-best guesses for each word or phrase, in addition to the best word sequence identified by the transcription process. The audio retrieval system can utilize a primary index file containing the best identified words and/or phrases for each portion of the input audio stream and a supplemental index file containing alternative choices for each word or phrase in the transcript. The present invention allows words that are incorrectly transcribed during speech recognition to be identified in response to a textual query by searching the supplemental index files. During an indexing process, the list of alternative word or phrase choices provided by the speech recognition system are collected to produce a set of supplemental index files. During a retrieval process, the user-specified textual query is matched against the primary and supplemental indexes derived from the transcribed audio to identify relevant documents. An objective ranking function scales matches found in the supplemental index file(s) using a predefined scaling factor, or a value reflecting the confidence value of the corresponding alternative choice as identified by the speech recognition system.

Een audioherwinningssysteem en een methode worden verstrekt voor het vergroten van de transcriptie van een audiodossier met één of meerdere afwisselende woord of uitdrukkingskeuzen, zoals meest op é3n na beste gissingen voor elke woord of uitdrukking, naast de beste woordopeenvolging die door het transcriptieproces wordt geïdentificeerd. Het audioherwinningssysteem kan een primair indexdossier de het best geïdentificeerde woorden en/of de uitdrukkingen voor elk gedeelte van de input audiostroom bevatten en een supplementair indexdossier gebruiken die alternatieve keuzen voor elke woord of uitdrukking in het afschrift bevatten. De onderhavige uitvinding staat woorden toe die verkeerd tijdens toespraakerkenning dat in antwoord op een tekstuele vraag moet worden geïdentificeerd door de supplementaire indexdossiers te zoeken worden getranscribeerd. Tijdens een het indexeren proces, wordt de lijst van alternatieve woord of uitdrukkingskeuzen die door het systeem van de toespraakerkenning worden verstrekt verzameld om een reeks supplementaire indexdossiers te veroorzaken. Tijdens een herwinningsproces, wordt de user-specified tekstuele vraag tegen de primaire en supplementaire indexen aangepast die uit de getranscribeerde audio worden afgeleid relevante documenten te identificeren. Een doelstelling de gelijken rangschikken van functieschalen die in het supplementaire indexdossier worden gevonden (s) die een vooraf bepaalde het schrapen factor gebruiken, of een waarde die op de vertrouwenswaarde van de overeenkomstige alternatieve keus wijzen zoals die door het systeem van de toespraakerkenning wordt geïdentificeerd.

 
Web www.patentalert.com

< (none)

< Method and system for supporting multiprocessor TLB-purge instructions using directed write transactions

> System, method, and product for dynamically aligning translations in a translation-memory system

> (none)

~ 00026