Signal noise reduction using magnitude-domain spectral subtraction

   
   

A method and apparatus for generating a noise-reduced feature vector representing human speech are provided. Speech data representing an input speech waveform are first input and filtered. Spectral energies of the filtered speech data are determined, and a noise reduction process is then performed. In the noise reduction process, a spectral magnitude is computed for a frequency index of multiple frequency indexes. A noise magnitude estimate is then determined for the frequency index by updating a histogram of spectral magnitude, and then determining the noise magnitude estimate as a predetermined percentile of the histogram. A signal-to-noise ratio is then determined for the frequency index. A scale factor is computed for the frequency index, as a function of the signal-to-noise ratio and the noise magnitude estimate. The noise magnitude estimate is then scaled by the scale factor. The scaled noise magnitude estimate is subtracted from the spectral magnitudes of the filtered speech data, to produce cleaned speech data, based on which a feature vector is generated.

Een methode en een apparaat om een lawaai-verminderde eigenschapvector te produceren die menselijke toespraak vertegenwoordigt worden verstrekt. De gegevens die van de toespraak een golfvorm van de inputtoespraak zijn vertegenwoordigen eerste input en gefiltreerd. De spectrale energieën van de gefiltreerde toespraakgegevens worden bepaald, en een proces van de lawaaivermindering wordt dan uitgevoerd. In het proces van de lawaaivermindering, wordt een spectrale omvang gegevens verwerkt voor een frequentieindex van veelvoudige frequentieindexen. Een raming van de lawaaiomvang wordt dan bepaald voor de frequentieindex door een histogram van spectrale omvang bij te werken, en dan de raming van de lawaaiomvang te bepalen als vooraf bepaalde percentile van de histogram. Een signal-to-noise verhouding wordt dan bepaald voor de frequentieindex. Een schaalfactor wordt gegevens verwerkt voor de frequentieindex, als functie van de signal-to-noise verhouding en de raming van de lawaaiomvang. De raming van de lawaaiomvang wordt dan geschraapt door de schaalfactor. De geschraapte raming van de lawaaiomvang wordt afgetrokken van de spectrale omvang gefiltreerde toespraakgegevens, om schoongemaakte gebaseerde toespraakgegevens, op die te produceren een eigenschapvector wordt geproduceerd.

 
Web www.patentalert.com

< Siloxane optical waveguides

< Object oriented fault tolerance

> Method and apparatus for zeroing a transfer buffer memory as a background task

> Method and apparatus to facilitate accessing data in network management protocol tables

~ 00138