| Files | Size | Format | View |
|---|---|---|---|
|
There are no files associated with this item. |
|||
| URN: | http://URN.fi/URN:NBN:fi:tty-200907104926 |
| Title: | Self-organizing maps in codebook design for vector quantization |
| Author: | Yli-Rantala, Eero |
| Publication type: | Diplomityö |
| Issue date: | 1996-03-20 |
| University: | Tampereen teknillinen korkeakoulu |
| Faculty: | Sähkötekniikan osasto |
| Department: | Signaalinkäsittelyn laitos |
| Abstract: |
AB3:Tietokoneiden ja signaaliprosessoreiden jatkuva kehitys mahdollistaa yhä monimutkaisempien ja laskennallisesti vaativampien reaaliaikaisten signaalinkäsittelyalgoritmien toteuttamisen. Tämä on johtanut siihen, että liikkuvaa kuvaa ollaan liittämässä sellaisiin sovelluksiin, joihin sen liittäminen oli vielä muutama vuosi sitten mahdotonta. Tällaisia sovelluksia ovat esim. kuvapuhelin ja tilausvideopalvelut (video on demand). Digitaalinen kuvasekvenssi tuottaa kuitenkin niin paljon dataa, että se on pakattava lähetystä tai tallennusta varten. Vektorikvantisointi on eräs tehokkaimmista kuvan pakkausmenetelmistä. Siinä alkuperäinen kuva jaetaan ensin pienemmiksi kuvalohkoiksi, jonka jälkeen jokaiselle lohkolle etsitään ennalta määritellystä koodikirjasta parhaiten vastaava koodilohko. Pakkaus perustuu siihen, että koodilohkon etsimisen jälkeen siirretään vain sen indeksi eikä koko koodilohkoa. -Työssä verrataan kahta koodikirjan suunnittelumenetelmää: LBG (Linde-Buzo-Gray) -algoritmia sekä alunperin neuraaliverkkon opetukseen kehitettyä itseorganisoituvan kartan (SOM) algoritmia. LBG-algoritmi on opetusaineiston klusterointimenetelmä, jota yleisesti käytetään koodikirjojen suunnitteluun. Suomalaisen professorin Teuvo Kohosen kehittämän SOM-algoritmin erityispiirre on ns. naapuruston käyttö opetusvaiheessa. SOM-algoritmia käytettäessä koodikirjalle voidaan määritellä myös haluttu rakenne (kartta). Algoritmi saa aikaan kartan järjestäytymisen siten, että samankaltaiset koodivektorit sijaitsevat kartalla lähellä toisiaan. Kartta rakennetta hyväksi käyttämällä voidaan kuvalohkojen koodausta nopeuttaa merkittävästi. Tämä on erittäin tärkeä ominaisuus reaaliaikaisia sovelluksia ajatellen. -Vektorikvantisointia on yleisesti käytetty alkuperäisten kuvien koodaamiseen sellaisenaan. Tässä työssä vektorikvantisointia käytettiin hybridi DCT/DPCM-pakkausmenetelmän, H.261 koodauksen, kanssa. Pakattavat kuvalohkot ovat erotettu ns. erotuskuvien suurienergisimmistä osista, esim. reunoista. Continuous development of computers and signal processors enables implementations of more and more complicated and computationally exhausting signal processing algorithms in real time applications. Thus moving picture is becoming a part of such applications in which it was impossible only few years ago. Applications like this are e.g. video telephony and interactive video databases (video on demand). However, the digital image sequence produces so much data, that compression must be used for transmission or storage. Vector quantization is one of the most efficient image compression methods. In this method, the original image is first divided into blocks of smaller size. After that, the best matching codeblock is searched from the predefined codebook for all of these blocks. The compression is achieved, since after the search operation only the index of the best matching codeblock is transmitted instead of the whole codeblock. -In this work, two codebook design methods were compared: LBG (Linde-Buzo-Gray) algorithm and Self-Organizing Map (SOM) algorithm, which was originally developed for training of neural networks. The LBG algorithm is an iterative clustering method, which is very commonly used for codebooks design. The SOM algorithm was developed by Finnish professor Teuvo Kohonen, and it is based on the use of the neighborhood during the training. Also, the structure of the codebook (map) can be defined. Algorithm affords the ordering of the map, which means that similar codevectors are close each other in the map. By utilizing the structure of the map, the encoding of image blocks can be considerable accelerated. This is a very important property for a real time applications. -Vector quantization is commonly used for encoding of original images as such. In this work, the vector quantization was used with hybrid DCT/DPCM compression method, i.e. the H.261 coding. Image blocks to be encoded were extracted from the higher energy regions of so called residual images. |