| Title: | Talking over voice prompts in speech recognition systems |
| Author: | Iso-Sipilä, Juha |
| Abstract: |
AB3:Puheentunnistusteknologia on tulossa ihmisten jokapäiväiseen käyttöön lähiaikoina. Tietokonelaitteiston ja puheentunnistusalgoritmien kehitys on ollut voimakasta viimeisten vuosien aikana. Menetelmät, joita voitiin käyttää ainoastaan laboratorio-olosuhteissa viitisen vuotta sitten, voidaan nyt toteuttaa reaaliajassa toimiviin sovelluksiin. Joitakin jokapäiväisiä askareita voidaan pian suorittaa käyttäen puheentunnistusta. Tehtäviä, jotka voidaan suorittaa puheentunnistimella ovat mm. puhevalinta autopuhelimessa, aikataulukyselyt, pankkipalvelut ja raporttien sanelu puheella. Alan huipputuotteissa käytetyt menetelmät, etenkin hidden Markov mallien (HMM) käyttö, ovat luoneet kestävän pohjan puheentunnistusteknologian kehitykselle. Tässä diplomityössä kuvattu puheentunnistin perustuu myös hidden Markov -malleihin. -Työ keskittyy puheentunnistimen käyttäjäystävällisyyden parantamiseen. Tunnistimen käytön pitäisi olla yhtä helppoa ja mukavaa sekä aloittelevalle että taitavalle käyttäjälle. Puheentunnistin on käyttökelpoinen, jos palvelun tarjoaja säästää puheentunnistimen ansiosta. Palvelun käyttäjä kokee puheentunnistimen tarpeelliseksi, jos hänen asiointinsa kyseisessä palvelussa on helpompaa puheentunnistimen avulla. Kehittämäni menetelmä antaa käyttäjälle mahdollisuuden keskeyttää tunnistimen puhekehotteet ja jatkaa välittömästi sopivaa komentoa käyttäen seuraavaan dialogin vaiheeseen. Kun tämä on toteutettuna tunnistimessa, kehotteet voivat olla runsassisältöisiä palvellakseen aloittelevaa käyttäjää parhaiten ja tottunut käyttäjä voi jatkaa heti eteenpäin. Menetelmä, joka mahdollistaa puhekehotteen keskeyttämisen, on nimeltään talk-over. Speech recognition technology is about to reach the everyday life of the consumers. The evolution of computer hardware and speech recognition algorithms has been dramatic during the last five years. Algorithms that were only used in laboratory conditions five years ago, can now be implemented as real-time systems and some of them are actually in commercial use. This giant leap forward enables in the near future, the use of speech recognition to perform some of the everyday life activities. These involve, e.g. voice dialing in a mobile phone, time-table inquiry services and dictation of documents by voice. The methods used in the state-of-the-art speech recognizers, especially the frame-work of the hidden Markov models (HMM), have created a solid base for development of new speech recognition technology. The speech recognition equipment described in this thesis is also based on HMMs. -This thesis concentrates on the user friendliness of a speech recognizer. The usage of the recognizer should be equally easy and convenient for beginners as well as expert users. The recognition system is well applicable if the service provider also saves resources by providing speech recognition services. The service users find the application useful, if their activities are performed easier with the speech recognizer. The system that was designed, makes it possible for the user to interrupt machine voice prompts and proceed with the dialogue instantly. This allows the prompt to be informative for the beginners and the expert users can go on immediately to the next phase of the dialogue. The method that enables this feature is called talk-over. |
| Comment: | TTY:n kirjastossa laadittu tiivistelmä |
| Issue date: | 1996-12-11 |
| URN: | http://URN.fi/URN:NBN:fi:tty-200907104215 |
| Publication type: | Diplomityö |
| Language: | eng |
| Pages: | 58 s |
| Examiner: |
Laurila, Kari Haavisto, Petri |
| University: | Tampereen teknillinen korkeakoulu |
| Faculty: | Tietotekniikan osasto |
| Department: | Signaalinkäsittelyn laitos |
| Degree Programme: |
| Files | Size | Format | View |
|---|---|---|---|
|
There are no files associated with this item. |
|||