Kirjasto - Tampereen teknillinen yliopisto

Voice activity detection in the presence of breathing noise

Show simple item record

Title: Voice activity detection in the presence of breathing noise
Author: Myllymäki, Mikko
Abstract: Voice activity detection stands for the process of recognizing speech segments from an input signal consisting of speech, pauses in the speech, silence, breathing and acoustic interference. Voice activity detection algorithm is an important part of many communication devices, such as mobile phones, because they can be used for example to reduce battery consumption and bandwidth usage. However, the communication devices and also the circumstances in which they are used vary greatly, and thus there does not exist one such voice activity detection algorithm that could be used in every case effectively but the algorithm has to be developed specifically for the problem at hand. In the thesis a voice activity detection algorithm was developed to be used in circumstances, where a very high-level breathing sound is present in the signal. Because the property is unique when compared to previous studies, previously developed voice activity detection algorithms could not be used. Instead, a new voice activity detection algorithm that constitutes of framewise feature extraction, classification of the features and postprocessing was developed. This was done by testing many different options for the parts of the voice activity detection algorithm, evaluating systematically their contribution to the results of the detection and selecting the best combination of parts as the final voice activity detection algorithm. The final voice activity detection algorithm constitutes of Mel-frequency band energies as the features, neural network as the classifier and hidden Markov model as the postprocessing method. All the different options of the algorithm parts and the results obtained with different algorithms were presented in the thesis.AB3:Puheen aktiivisuuden tunnistus tarkoittaa prosessia, jossa sisääntulosignaalista, joka sisältää puhetta, hiljaisuutta, hengitysääniä sekä akustisia häiriöitä, pyritään tunnistamaan puheosuudet. Puheen aktiivisuuden tunnistaminen on tarpeellista monissa kommunikaatiosovelluksissa, kuten matkapuhelimissa, koska sen avulla voidaan esimerkiksi säästää akkujen kulutusta ja pienentää kaistanleveyttä. Käyttökohteita on niin monia, että on mahdotonta kehittää yhtä sellaista puheen aktiivisuuden tunnistavaa algoritmia, joka toimisi kaikissa tapauksissa. Diplomityössä puheen aktiivisuuden tunnistava algoritmi kehitettiin käytettäväksi olosuhteissa, joissa hengitysäänen taso on hyvin suuri. Aiemmin kehitettyjä puheen aktiivisuuden tunnistavia algoritmeja ei ole kehitetty toimimaan tällaisessa tilanteessa, minkä takia tarvitaan sellainen algoritmi, joka ottaa huomioon mainitut poikkeavat olosuhteet. Kehitetty puheen aktiivisuuden tunnistava algoritmi koostuu piirteiden irrotuksesta kehyksittäin, luokittelusta ja jälkikäsittelystä. Kehitystyö toteutettiin niin, että algoritmin osiksi kokeiltiin monia erilaisia vaihtoehtoja, mitattiin näiden vaikutusta algoritmin kokonaissuorituskykyyn ja valittiin tulosten perusteella parhaat vaihtoehdot lopullisen puheen aktiivisuuden ja tunnistavan algoritmin osiksi. Lopullisessa algoritmissa käytettiin piirteinä Mel-taajuuskaistojen energioita, luokittelussa neuroverkkoa ja jälkikäsittelyssä piilotettua Markovin mallia. Diplomityössä esiteltiin kaikki testatut algoritmin osat sekä erilaisia algoritmeilla saavutettuja tuloksia.
Comment: TTY:n kirjastossa laadittu tiivistelmä
Issue date: 2008-06-04
URN: http://URN.fi/URN:NBN:fi:tty-200907104860
Publication type: Diplomityö
Language: eng
Pages: 60 s
Subject: puheen aktiivisuuden tunnistuspiirteiden irrotusluokittelujälkikäsittelyMel-taajuuskaistojen energiatneuroverkotpiilotettu Markovin malli
Examiner: Klapuri, AnssiVirtanen, Tuomas
University: Tampereen teknillinen yliopisto
Faculty: Tieto- ja sähkötekniikan tiedekunta
Department: Signaalinkäsittelyn laitos
Degree Programme: Tietoliikenne-elektroniikan koulutusohjelma

Files in this item

Files Size Format View

There are no files associated with this item.

This item appears in the following Collection(s)

Show simple item record

Search TUT DPub


Advanced Search

Browse

My Account

Statistics