JP2006246351A - Image coding unit and image decoding unit - Google Patents
Image coding unit and image decoding unit Download PDFInfo
- Publication number
- JP2006246351A JP2006246351A JP2005062477A JP2005062477A JP2006246351A JP 2006246351 A JP2006246351 A JP 2006246351A JP 2005062477 A JP2005062477 A JP 2005062477A JP 2005062477 A JP2005062477 A JP 2005062477A JP 2006246351 A JP2006246351 A JP 2006246351A
- Authority
- JP
- Japan
- Prior art keywords
- image
- block information
- unit
- block
- encoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
本発明は、画像符号化装置および画像復号化装置に関し、特に画像特性に適したブロックで符号化を行って符号化効率向上を可能とする画像符号化装置および画像復号化装置に関する。 The present invention relates to an image encoding device and an image decoding device, and more particularly to an image encoding device and an image decoding device that can improve encoding efficiency by performing encoding with blocks suitable for image characteristics.
近年、テロや犯罪件数の増加に伴い、数十台から百台規模の監視カメラを接続可能な映像監視システムが公共施設等で急速に普及しつつある。また、監視カメラの映像は、犯罪の証拠画像として利用されるという位置付けから、静止画像の画質、特に解像度が重要視され、カメラ撮像素子数の増化効果もあり、監視カメラにおける空間解像度の高解像度化が進んでいる。 In recent years, with the increase in the number of terrorism and crimes, video surveillance systems capable of connecting tens to hundreds of surveillance cameras are rapidly spreading in public facilities and the like. In addition, because the video from surveillance cameras is used as evidence images of crimes, the quality of still images, especially the resolution, is emphasized, and there is an effect of increasing the number of camera image sensors. Resolution is progressing.
監視カメラの高解像度化に伴い、数十台規模の監視カメラを接続する監視システムでは、記録容量に制約がある中で、長時間の映像を記録するために、高解像度映像を効率よく圧縮符号化する映像符号化方式が望まれている。 Along with the higher resolution of surveillance cameras, surveillance systems that connect dozens of surveillance cameras can efficiently compress high-resolution video in order to record long-term video with limited recording capacity. There is a demand for a video encoding method that can be realized.
映像符号化技術としては、例えばJPEG(Joint Picture Experts Group)方式、あるいはMPEG(Moving Picture Experts Group)方式など、画像の空間冗長性に着目しDCT(Discrete Cosine Transform)を利用した符号化方式が一般的である。このMPEG符号化方式では、8×8画素または4×4画素を1つの処理ブロックとしてDCT変換による符号化を行っており、ブロックサイズは固定的である。 As a video encoding technique, for example, an encoding system using DCT (Discrete Cosine Transform) focusing on spatial redundancy of an image such as JPEG (Joint Picture Experts Group) system or MPEG (Moving Picture Experts Group) system is generally used. Is. In this MPEG encoding method, encoding by DCT conversion is performed using 8 × 8 pixels or 4 × 4 pixels as one processing block, and the block size is fixed.
DCT処理においては、画像中の画素値に変化の少ない領域(例えば背景部分など)に対してDCT処理して得られるDCT係数は低周波領域に偏るため、大きなブロックを用いてDCT処理を行った方が符号化効率を向上することが可能である。逆に、画像中の画素値に変化の多い領域(例えばエッジ部分など)に対しては、DCT処理により得られるDCT係数は高周波領域に偏り、高周波を削除して符号化すると擬似輪郭ノイズが発生するため、大きなブロックサイズを用いることは適していない。したがって、DCTのブロックサイズを固定的にするのではなく、画像特性に合せてDCTのブロックサイズを可変にすることが符号化効率を高めるうえで有効である。 In the DCT processing, the DCT coefficient obtained by performing the DCT processing on a region where the pixel value in the image has little change (for example, the background portion) is biased to the low frequency region, so the DCT processing was performed using a large block. It is possible to improve the encoding efficiency. On the other hand, for regions where the pixel values in the image change a lot (for example, edge portions), the DCT coefficient obtained by DCT processing is biased toward the high frequency region, and pseudo-contour noise is generated when encoding is performed by removing high frequencies. Therefore, it is not suitable to use a large block size. Therefore, it is effective to increase the coding efficiency that the DCT block size is not fixed, but that the DCT block size is variable according to the image characteristics.
このようにDCTのブロックサイズを変更して符号化効率を高めるために、従来から、例えば特許文献1に示されるように、入力画像の画素変化値を用いて、DCTブロックサイズを決定し、DCTブロックサイズを木構造で符号化することにより、符号化効率の向上を図る画像符号化装置が知られている。図12は、特許文献1に記載された画像符号化装置の構成を示す図である。図12において、画像入力部1200は符号化対象の画像を入力する。ブロックサイズ割り当て部1201は、入力画像の画素変化値を算出し、画素変化値が大きい領域に小さなサイズのDCTブロックサイズを割り当てて、算出したブロックサイズをDCT部1202に出力する。DCT部1202、DQT部1203、量子化器1204、ジグザグ走査シリアライザ1205では、ブロックサイズ割り当て部1201により算出されたブロックサイズに従い、順次DCT変換、DQT変換、量子化処理および係数のジグザグ走査を行う。可変長コーダ1206は、符号化されたブロック情報およびブロックサイズ情報を可変長符号化して生成される画像データを、伝送チャネル1207を経て可変長デコーダ1208へ出力する。可変長デコーダ1208は、伝送チャネル1207経由で画像データを受信し、画像データを復号化しブロック情報およびブロックサイズ情報を復号化する。逆ジグザグ走査シリアライザ1209、逆量子化器1210、IDQT部1211およびIDCT部1212は、可変長デコーダにより復号化されたブロックサイズ情報に従い、符号化データに対して、順次逆ジグザグ走査、逆量子化処理、逆DQT処理、逆DCT処理を行い、復号化画像を生成し、画像出力部1213に出力する。
In order to increase the coding efficiency by changing the DCT block size in this way, conventionally, as shown in
また、非特許文献1には、動き予測符号化に用いたブロックサイズと同一のブロックサイズでDCT変換することにより、ブロックサイズ情報の符号化を省略する画像圧縮技術が開示されている。
しかしながら、上記した特許文献1の画像符号化装置のように、入力画像を用いてDCTブロックサイズを算出する方法には、次のような問題点がある。すなわち、符号化データを復号化する時に入力画像を用いることは不可能なので、DCT処理のブロックサイズ情報を復号化側の装置に伝える必要がある。従って、画像の符号化データと共に符号化の処理単位となったブロックサイズ情報も符号化されるが、このブロックサイズ情報の符号データの符号量は、画像が高解像度化するにつれて増大するため、ブロックサイズ情報のオーバーヘッドにより符号化効率が低下するという問題がある。
However, the method of calculating the DCT block size using the input image as in the image encoding device of
また、上記した非特許文献1の技術のように、動き予測ブロックのサイズを用いてDCTブロックサイズとする方法では、動き予測ブロック以外には適用することが出来ないため、映像監視においてランダムアクセス性の高い画面内符号化方式には使用することが出来ない。さらに、動き予測ブロックで用いるブロックサイズは画像の周波数特性を反映したものではないため、ブロックサイズを変更してDCT変換を行うことによる符号化向上が望めないという問題がある。
Further, as in the technique of
本発明は、かかる点に鑑みてなされたものであり、ブロック情報の符号化が不要で、かつ画像特性に応じてブロックを変更して符号化効率を向上させることを目的とする。 The present invention has been made in view of the above points, and an object of the present invention is to improve the coding efficiency by changing the block according to the image characteristics without the need for coding the block information.
本発明の画像符号化装置は、原画像を入力する原画像入力手段と、前記原画像の基本となる基本画像を取得する基本画像取得手段と、前記原画像と前記基本画像との差分画像を求める差分画像算出手段と、前記基本画像に含まれるエッジの情報に基づいて前記基本画像をサイズの異なる複数のブロックに分割し、分割の態様を示すブロック情報を取得するブロック情報取得手段と、前記ブロック情報に示す態様で分割された複数のブロックを処理単位として差分画像を符号化する差分画像符号化手段とを備えた構成を有する。 An image encoding apparatus according to the present invention includes an original image input unit that inputs an original image, a basic image acquisition unit that acquires a basic image serving as a basis of the original image, and a difference image between the original image and the basic image. Difference image calculation means to be obtained; block information acquisition means for dividing the basic image into a plurality of blocks having different sizes based on edge information included in the basic image; and obtaining block information indicating a division mode; And a differential image encoding means for encoding a differential image using a plurality of blocks divided in the mode shown in the block information as processing units.
この構成により、差分画像の符号化の処理単位であるブロックを示すブロック情報を差分画像と相関の強い基本画像から取得することができるので、ブロック情報を符号化する必要がない。また、平坦な部分とエッジ部分が混在する差分画像の符号化の処理単位を可変とすることによって符号化効率を向上できる。 With this configuration, block information indicating a block that is a processing unit for encoding a difference image can be acquired from a basic image that has a strong correlation with the difference image, so that block information need not be encoded. In addition, encoding efficiency can be improved by making the processing unit for encoding a differential image in which a flat portion and an edge portion are mixed variable.
本発明の別の態様に係る画像符号化装置は、原画像を入力する原画像入力手段と、前記原画像をダウンサンプル処理した画像を基本画像として取得する基本画像取得手段と、前記原画像と前記基本画像との差分画像を求める差分画像算出手段と、前記基本画像に含まれるエッジの情報に基づいて前記基本画像をサイズの異なる複数のブロックに分割し、分割の態様を示すブロック情報を取得するブロック情報取得手段と、前記ブロック情報に示す態様で分割された複数のブロックを処理単位として差分画像を符号化する差分画像符号化手段と、前記基本画像を符号化する基本画像符号化手段とを備えた構成を有する。 An image encoding apparatus according to another aspect of the present invention includes an original image input unit that inputs an original image, a basic image acquisition unit that acquires an image obtained by down-sampling the original image as a basic image, and the original image Difference image calculation means for obtaining a difference image from the basic image, and dividing the basic image into a plurality of blocks having different sizes based on edge information included in the basic image, and obtaining block information indicating a division mode Block information acquisition means, differential image encoding means for encoding a difference image using a plurality of blocks divided in the mode shown in the block information as processing units, and basic image encoding means for encoding the basic image; It has the composition provided with.
この構成により、原画像をダウンサンプル処理した基本画像(基本レイヤ)と差分画像(拡張レイヤ)を用いて、復号化側の装置の環境に適応可能な符号化データを作成する階層符号化において、差分画像の符号化の処理単位であるブロックを示すブロック情報を基本画像から取得することができるので、ブロック情報を符号化する必要がない。また、平坦な部分とエッジ部分が混在する差分画像の符号化の処理単位を可変とすることによって符号化効率を向上できる。 With this configuration, in hierarchical encoding that creates encoded data that can be adapted to the environment of a decoding-side apparatus, using a basic image (basic layer) obtained by down-sampling an original image and a differential image (enhancement layer), Since block information indicating a block which is a processing unit of differential image encoding can be acquired from the basic image, it is not necessary to encode the block information. In addition, encoding efficiency can be improved by making the processing unit for encoding a differential image in which a flat portion and an edge portion are mixed variable.
本発明の別の態様に係る画像符号化装置は、複数の連続したフレームからなる画像を入力する画像入力手段と、符号化すべき原画像のフレームの前フレームを基本画像として取得する基本画像取得手段と、前記原画像と前記基本画像との差分画像を求める差分画像算出手段と、前記基本画像に含まれるエッジの情報に基づいて前記基本画像をサイズの異なる複数のブロックに分割し、分割の態様を示すブロック情報を取得するブロック情報取得手段と、前記ブロック情報に示す態様で分割された複数のブロックを処理単位として差分画像を符号化する差分画像符号化手段とを備えた構成を有する。 An image encoding device according to another aspect of the present invention includes an image input unit that inputs an image composed of a plurality of continuous frames, and a basic image acquisition unit that acquires a previous frame of a frame of an original image to be encoded as a basic image. A difference image calculation means for obtaining a difference image between the original image and the basic image, and dividing the basic image into a plurality of blocks of different sizes based on edge information included in the basic image, Block information acquisition means for acquiring block information indicating the difference information, and difference image encoding means for encoding a difference image using a plurality of blocks divided in the mode shown in the block information as processing units.
この構成により、複数のフレームからなる画像において、差分画像の符号化の処理単位であるブロックを示すブロック情報を差分画像と相関の強い前フレームから取得することができるので、ブロック情報を符号化する必要がない。また、平坦な部分とエッジ部分が混在する差分画像の符号化の処理単位を可変とすることによって符号化効率を向上できる。 With this configuration, in an image composed of a plurality of frames, block information indicating a block that is a processing unit for encoding a difference image can be acquired from a previous frame having a strong correlation with the difference image, so that the block information is encoded. There is no need. In addition, encoding efficiency can be improved by making the processing unit for encoding a differential image in which a flat portion and an edge portion are mixed variable.
上記画像符号化装置において、前記ブロック情報取得手段は、前記基本画像を符号化した符号化データを復号化して得られる復号画像を複数のブロックに分割して前記ブロック情報を取得してもよい。 In the image encoding device, the block information acquisition unit may acquire the block information by dividing a decoded image obtained by decoding encoded data obtained by encoding the basic image into a plurality of blocks.
このように復号化された基本画像からブロック情報を取得することにより、符号化および復号化に伴う画像情報の欠落による基本画像の変化を画像の符号化時に考慮して、復号化時と同じブロック情報を取得することができる。 By obtaining block information from the basic image decoded in this way, the same block as at the time of decoding is taken into consideration when changing the basic image due to loss of image information accompanying encoding and decoding. Information can be acquired.
上記画像符号化装置において、前記基本画像の符号化および復号化によって前記復号画像に生じた符号化ノイズを除去する符号化ノイズ除去手段を備えてもよい。 The image coding apparatus may further include coding noise removing means for removing coding noise generated in the decoded image by coding and decoding the basic image.
この構成により、擬似エッジノイズの発生を抑え正確なエッジ画像を生成することができる。符号化ノイズ除去手段としては、例えば、デブロックフィルタ、ローパスフィルタを用いることができる。 With this configuration, generation of pseudo edge noise can be suppressed and an accurate edge image can be generated. As the coding noise removing means, for example, a deblocking filter or a low-pass filter can be used.
上記画像符号化装置において、前記ブロック情報取得手段は、前記基本画像のエッジを抽出したエッジ抽出画像において、各ブロック内のエッジ強度が所定の閾値より小さくなるように分割してもよい。 In the image encoding device, the block information acquisition unit may divide an edge extracted image obtained by extracting an edge of the basic image so that an edge intensity in each block is smaller than a predetermined threshold.
この構成により、エッジ強度が大きい領域を含むブロックは小さいブロックに分割して、エッジ付近での擬似輪郭ノイズの発生を低減し、エッジ強度が大きい領域を含まないブロックは大きいブロックに分割して、ブロックの符号化の効率を向上できる。 With this configuration, a block including a region having a large edge strength is divided into small blocks to reduce the occurrence of pseudo contour noise near the edge, and a block not including a region having a large edge strength is divided into large blocks, The efficiency of block coding can be improved.
上記画像符号化装置において、前記ブロック情報取得手段で用いられる閾値は、ブロックのサイズに応じて複数設定されてもよい。 In the image encoding device, a plurality of threshold values used by the block information acquisition unit may be set according to the block size.
このように複数の閾値を設定しておくことにより、ブロックのサイズと平均エッジ強度との関係に拘束されずに、ブロックの分割の態様を設定できる。 By setting a plurality of threshold values in this way, it is possible to set the mode of block division without being restricted by the relationship between the block size and the average edge strength.
上記画像符号化装置において、前記差分画像に含まれるエッジの情報に基づいて前記差分画像を分割した場合と同じ態様で前記基本画像が分割されるように前記閾値を設定する閾値設定手段を備えてもよい。 The image encoding apparatus includes a threshold setting unit configured to set the threshold so that the basic image is divided in the same manner as when the difference image is divided based on edge information included in the difference image. Also good.
このように符号化対象の差分画像を処理単位のブロックに分割し、その分割の態様と同じ態様で基本画像が分割されるような閾値を設定しておく構成により、差分画像の符号化において符号化効率の高い処理単位のブロック情報を基本画像から取得することができる。 In this way, the difference image to be encoded is divided into processing unit blocks, and the threshold value is set so that the basic image is divided in the same manner as the division mode. The block information of the processing unit with high conversion efficiency can be acquired from the basic image.
上記画像符号化装置において、前記ブロック情報取得手段で用いる前記閾値を符号化する閾値符号化手段を備えてもよい。 The image encoding device may further include threshold encoding means for encoding the threshold used by the block information acquisition means.
この構成により、画像特性に合せて閾値を変更することが可能となり、処理単位となるブロックを柔軟に制御して符号化効率をさらに向上することが可能となる。 With this configuration, it is possible to change the threshold according to the image characteristics, and it is possible to further improve the coding efficiency by flexibly controlling the block as a processing unit.
上記画像符号化装置において、前記ブロック情報取得手段でエッジ抽出に用いるエッジ抽出フィルタを符号化するエッジ抽出フィルタ符号化手段を備えてもよい。 The image encoding apparatus may further include an edge extraction filter encoding unit that encodes an edge extraction filter used for edge extraction by the block information acquisition unit.
この構成により、画像特性に応じてエッジ抽出方式を選択して、処理単位のブロック決定の元となるエッジ画像を正確に生成することが可能となる。 With this configuration, it is possible to select an edge extraction method in accordance with image characteristics and accurately generate an edge image that is a source of block determination for each processing unit.
上記画像符号化装置において、前記ブロック情報取得手段は、前記基本画像の色差成分から色分布を求め、前記色分布に基づいて前記基本画像を複数のブロックに分割して前記ブロック情報を取得してもよい。 In the image encoding device, the block information acquisition unit obtains a color distribution from color difference components of the basic image, divides the basic image into a plurality of blocks based on the color distribution, and acquires the block information. Also good.
この構成により、入力画像が多くのエッジを含み、エッジに基づくブロックの分割が困難な画像に対しても、色差情報によって符号化効率の高い処理ブロックを決定できる。 With this configuration, a processing block with high coding efficiency can be determined based on color difference information even for an image in which an input image includes many edges and it is difficult to divide a block based on the edges.
上記画像符号化装置において、前記ブロック情報取得手段は、各ブロック内の色分布の分散値が所定の閾値より小さくなるように分割してもよい。 In the image coding apparatus, the block information acquisition unit may divide the color distribution dispersion value in each block so as to be smaller than a predetermined threshold value.
この構成により、入力画像の多くのエッジを含み、エッジに基づくブロックの分割が困難な画像に対しても、同色の色を有する相互相関の高い領域を1つのブロックにまとめて符号化することができ、符号化効率を向上可能である。 With this configuration, even for an image that includes many edges of an input image and it is difficult to divide a block based on the edges, a region having the same color and high cross-correlation can be encoded into one block. Encoding efficiency can be improved.
上記画像符号化装置において、前記差分画像符号化手段は、前記ブロック情報に示す態様で分割された複数のブロックを処理単位として直交変換を行ってもよい。 In the image encoding device, the difference image encoding means may perform orthogonal transform using a plurality of blocks divided in the mode shown in the block information as processing units.
この構成により、ブロック情報取得手段で取得したブロック情報を用いて、画像特性に適したブロックで直交変換を行うことが可能である。 With this configuration, it is possible to perform orthogonal transformation with a block suitable for image characteristics using the block information acquired by the block information acquisition means.
上記画像符号化装置において、前記差分画像符号化手段は、前記直交変換として離散コサイン変換を行ってもよい。 In the image encoding device, the difference image encoding means may perform a discrete cosine transform as the orthogonal transform.
この構成によれば、多数の画素値を含む大きなブロックを、低周波係数に集中しており少数の非ゼロである有効係数を含むDCT係数へと変換し、少数の有効係数を少ない符号量で符号化することができるため、符号化効率を向上可能である。 According to this configuration, a large block including a large number of pixel values is converted into a DCT coefficient including a small number of non-zero effective coefficients that are concentrated on low frequency coefficients, and the small number of effective coefficients are reduced with a small amount of code. Since encoding can be performed, encoding efficiency can be improved.
上記画像符号化装置において、前記差分画像符号化手段は、前記直交変換として離散ウェーブレット変換を行ってもよい。 In the image encoding device, the difference image encoding means may perform discrete wavelet transform as the orthogonal transform.
この構成によれば、多数の画素値を含む大きなブロックを、低サブバンド係数に集中しており少数の非ゼロである有効係数を含むDWT係数へと変換し、少数の有効係数を少ない符号量で符号化することができるため、符号化効率を向上可能である。 According to this configuration, a large block including a large number of pixel values is converted to a DWT coefficient including a small number of non-zero effective coefficients that are concentrated in low subband coefficients, and the small number of effective coefficients is reduced in code amount. Therefore, encoding efficiency can be improved.
上記画像符号化装置において、前記差分画像符号化手段は、前記ブロック情報に示す態様で分割された複数のブロックを処理単位として、エントロピー符号化を行ってもよい。 In the image encoding device, the difference image encoding means may perform entropy encoding using a plurality of blocks divided in the mode shown in the block information as processing units.
この構成によれば、多数の画素値を含む大きなブロックを、非ゼロである有効係数の偏りを利用して、少ない符号量で符号化することができるため、符号化効率を向上可能である。 According to this configuration, a large block including a large number of pixel values can be encoded with a small amount of code using a non-zero bias of the effective coefficient, so that the encoding efficiency can be improved.
上記画像符号化装置は、前記差分画像符号化手段にて符号化された符号化データを出力する出力手段を備え、前記出力手段は、符号化の処理単位のブロックのサイズごとに、前記符号化データを出力してもよい。 The image encoding device includes an output unit that outputs encoded data encoded by the difference image encoding unit, and the output unit performs the encoding for each block size of an encoding processing unit. Data may be output.
この構成により、連続する符号化データの処理単位のブロックサイズが揃っているため効率良く符号化データの伝送、または符号化データの復号化を行うことが可能である。 With this configuration, since the block sizes of processing units of continuous encoded data are uniform, it is possible to efficiently transmit encoded data or decode encoded data.
上記画像符号化装置において、前記出力手段は、処理単位のブロックのサイズが大きい符号化データから順に、前記符号化データを出力してもよい。 In the image encoding apparatus, the output unit may output the encoded data in order from encoded data having a larger block size in a processing unit.
この構成により、主観画質への影響が大きい平坦な領域を含むサイズの大きいブロックを先に伝送することができ、優先的に高画質化することが可能である。 With this configuration, a block having a large size including a flat area having a large influence on the subjective image quality can be transmitted first, and the image quality can be preferentially improved.
本発明の画像復号化装置は、画像が符号化された符号化データを入力する符号化データ入力手段と、前記符号化データの一部を復号化して原画像の基本となる基本画像を得る基本画像復号化手段と、前記基本画像復号化手段にて復号化された基本画像に含まれるエッジの情報に基づいて前記基本画像をサイズの異なる複数のブロックに分割し、分割の態様を示すブロック情報を取得するブロック情報取得手段と、前記ブロック情報に示す態様で分割された複数のブロックを処理単位として前記符号化データを復号化して差分画像を得る差分画像復号化手段とを備えた構成を有する。 An image decoding apparatus according to the present invention includes encoded data input means for inputting encoded data obtained by encoding an image, and a basic unit that obtains a basic image that is a basis of an original image by decoding part of the encoded data. Block information indicating a division mode by dividing the basic image into a plurality of blocks having different sizes based on image decoding means and edge information included in the basic image decoded by the basic image decoding means And a difference image decoding unit that obtains a difference image by decoding the encoded data using a plurality of blocks divided in the mode shown in the block information as a processing unit. .
この構成により、差分画像の復号化の処理単位であるブロックを示すブロック情報を差分画像と相関の強い基本画像から取得することができるので、ブロック情報を含まずに効率良く符号化された符号化データを、処理単位のブロックを用いて復号化を行うことができる。 With this configuration, block information indicating a block that is a processing unit for decoding a difference image can be acquired from a basic image having a strong correlation with the difference image, so that encoding is efficiently performed without including block information. Data can be decoded using a block of processing units.
本発明の別の態様に係る画像復号化装置は、画像が符号化された符号化データを入力する符号化データ入力手段と、前記符号化データの一部を復号化して原画像がダウンサンプル処理された基本画像を得る基本画像復号化手段と、前記基本画像復号化手段にて復号化された基本画像に含まれるエッジの情報に基づいて前記基本画像をサイズの異なる複数のブロックに分割し、分割の態様を示すブロック情報を取得するブロック情報取得手段と、前記ブロック情報に示す態様で分割された複数のブロックを処理単位として前記符号化データを復号化して差分画像を得る差分画像復号化手段とを備えた構成を有する。 An image decoding apparatus according to another aspect of the present invention includes encoded data input means for inputting encoded data obtained by encoding an image, and down-sampling processing of an original image by decoding a part of the encoded data Dividing the basic image into a plurality of blocks of different sizes based on edge information included in the basic image decoded by the basic image decoding unit; Block information acquisition means for acquiring block information indicating a division mode, and differential image decoding means for decoding the encoded data using a plurality of blocks divided in the mode indicated by the block information as processing units to obtain a differential image It has the composition provided with.
この構成により、原画像をダウンサンプル処理した基本画像(基本レイヤ)と差分画像(拡張レイヤ)を用いて、復号化側の装置の環境に適応可能な符号化データを作成する階層符号化において、差分画像の復号化の処理単位であるブロックを示すブロック情報を基本画像から取得することができるので、ブロック情報を含まずに効率良く符号化された符号化データを、処理単位のブロックを用いて復号化を行うことができる。 With this configuration, in hierarchical encoding that creates encoded data that can be adapted to the environment of a decoding-side apparatus, using a basic image (basic layer) obtained by down-sampling an original image and a differential image (enhancement layer), Since block information indicating a block that is a processing unit of differential image decoding can be obtained from a basic image, encoded data that is efficiently encoded without including block information can be obtained using a block of processing unit. Decryption can be performed.
本発明の別の態様に係る画像復号化装置は、複数の連続したフレームからなる画像が符号化された符号化データを入力する符号化データ入力手段と、前記符号化データに含まれる復号化すべきフレームの前フレームを基本画像とし、基本画像に含まれるエッジの情報に基づいて前記基本画像をサイズの異なる複数のブロックに分割し、分割の態様を示すブロック情報を取得するブロック情報取得手段と、前記ブロック情報に示す態様で分割された複数のブロックを処理単位として前記符号化データを復号化して差分画像を得る差分画像復号化手段と、前記基本画像と差分画像とに基づいて前記フレームの原画像を合成する原画像合成手段とを備えた構成を有する。 An image decoding apparatus according to another aspect of the present invention includes encoded data input means for inputting encoded data obtained by encoding an image composed of a plurality of continuous frames, and decoding to be included in the encoded data A block information acquisition means for setting a previous frame of the frame as a basic image, dividing the basic image into a plurality of blocks of different sizes based on edge information included in the basic image, and acquiring block information indicating a division mode; Difference image decoding means for obtaining a difference image by decoding the encoded data using a plurality of blocks divided in the mode shown in the block information as processing units, and an original of the frame based on the basic image and the difference image And an original image synthesis means for synthesizing images.
この構成により、複数のフレームからなる画像において、差分画像の復号化の処理単位であるブロックを示すブロック情報を差分画像と相関の強い前フレームから取得することができるので、ブロック情報を含まずに効率良く符号化された符号化データを、処理単位のブロックを用いて復号化を行うことができる。 With this configuration, in an image composed of a plurality of frames, block information indicating a block that is a processing unit for decoding a difference image can be acquired from a previous frame having a strong correlation with the difference image. The encoded data encoded efficiently can be decoded using a block of processing units.
上記画像復号化装置において、前記ブロック情報取得手段は、前記基本画像のエッジを抽出したエッジ抽出画像において、各ブロック内のエッジ強度が所定の閾値より小さくなるように分割してもよい。 In the image decoding apparatus, the block information acquisition unit may divide an edge extracted image obtained by extracting an edge of the basic image so that an edge strength in each block is smaller than a predetermined threshold.
この構成により、エッジ強度に基づいて分割されたブロックを処理単位として効率良く符号化された符号化データを復号化することができる。 With this configuration, it is possible to decode encoded data that has been efficiently encoded using blocks divided based on edge strength as processing units.
上記画像復号化装置において、前記ブロック情報取得手段で用いられる閾値は、ブロックのサイズに応じて複数設定されていてもよい。 In the image decoding apparatus, a plurality of threshold values used by the block information acquisition unit may be set according to the block size.
この構成により、複数の閾値を用いて分割されたブロックを処理単位として効率良く符号化された符号化データを復号化することができる。 With this configuration, it is possible to decode encoded data that has been efficiently encoded using blocks divided by using a plurality of thresholds as processing units.
上記画像復号化装置において、前記ブロック情報取得手段で用いられる閾値は、前記符号化データと共に入力されてもよい。 In the image decoding device, the threshold used by the block information acquisition unit may be input together with the encoded data.
この構成により、画像特性に合せて閾値を変更して効率良く符号化された符号化データに対しても、ブロック情報を必要とせず、画像データを復号化することができる。 With this configuration, it is possible to decode image data without requiring block information even for encoded data that is efficiently encoded by changing the threshold according to the image characteristics.
上記画像復号化装置は、前記符号化データに含まれるエッジ抽出フィルタを復号化するエッジ抽出フィルタ復号化手段を備え、前記ブロック情報取得手段は、前記エッジ抽出フィルタを用いて前記基本画像のエッジを抽出してもよい。 The image decoding apparatus includes an edge extraction filter decoding unit that decodes an edge extraction filter included in the encoded data, and the block information acquisition unit uses the edge extraction filter to detect an edge of the basic image. It may be extracted.
この構成により、画像特性に合せてエッジ抽出方法を変更して効率良く符号化された符号化データに対しても、ブロック情報を必要とせず、画像データを復号化することができる。 With this configuration, it is possible to decode image data without requiring block information even for encoded data that is efficiently encoded by changing the edge extraction method according to the image characteristics.
上記画像復号化装置において、前記ブロック情報取得手段は、前記基本画像の色差成分から色分布を求め、前記色分布に基づいて複数のブロックに分割して前記ブロック情報を取得してもよい。 In the image decoding apparatus, the block information obtaining unit may obtain a color distribution from a color difference component of the basic image, and obtain the block information by dividing into a plurality of blocks based on the color distribution.
この構成により、色分布に基づいて分割されたブロックを処理単位として効率良く符号化された符号化データを復号化することができる。 With this configuration, it is possible to decode the encoded data that is efficiently encoded using the blocks divided based on the color distribution as processing units.
上記画像復号化装置において、前記ブロック情報取得手段は、各ブロック内の色分布の分散値が所定の閾値より小さくなるように分割してもよい。 In the image decoding apparatus, the block information obtaining unit may divide the color distribution dispersion value in each block so as to be smaller than a predetermined threshold value.
この構成により、同色の色を有する相互相関の高い領域を1つのブロックにまとめて効率良く符号化された符号データを復号化することができる。 With this configuration, it is possible to decode code data that is efficiently encoded by combining regions having the same color and high cross-correlation into one block.
上記画像復号化装置において、前記差分画像復号化手段は、前記ブロック情報に示す態様で分割された複数のブロックを処理単位として、直交変換を行ってもよい。 In the image decoding apparatus, the differential image decoding means may perform orthogonal transform using a plurality of blocks divided in the mode shown in the block information as processing units.
この構成により、処理単位のブロックを変更した直交変換により符号化された符号化データに対しても復号化処理を行うことが可能である。 With this configuration, it is possible to perform a decoding process on encoded data encoded by orthogonal transform in which a processing unit block is changed.
上記画像復号化装置において、前記差分画像復号化手段は、前記直交変換として離散コサイン変換を行ってもよい。 In the image decoding apparatus, the difference image decoding means may perform discrete cosine transform as the orthogonal transform.
この構成により、処理単位のブロックを変更したDCT変換により効率良く符号化された符号化データに対しても復号化処理を行うことが可能である。 With this configuration, it is possible to perform decoding processing even on encoded data that has been efficiently encoded by DCT conversion in which processing unit blocks are changed.
上記画像復号化装置において、前記差分画像復号化手段は、前記直交変換として離散ウェーブレット変換を行ってもよい。 In the image decoding apparatus, the difference image decoding means may perform discrete wavelet transform as the orthogonal transform.
この構成により、処理単位のブロックを変更したDWT変換により効率良く符号化された符号化データに対しても復号化処理を行うことが可能である。 With this configuration, it is possible to perform decoding processing on encoded data that has been efficiently encoded by DWT conversion in which processing unit blocks are changed.
上記画像復号化装置において、前記差分画像復号化手段は、前記ブロック情報に示す態様で分割された複数のブロックを処理単位として、エントロピー復号化を行ってもよい。 In the image decoding device, the difference image decoding means may perform entropy decoding using a plurality of blocks divided in the mode shown in the block information as processing units.
この構成により、処理単位のブロックを変更したエントロピー符号化により効率良く符号化された符号化データに対しても復号化処理を行うことができる。 With this configuration, it is possible to perform a decoding process even on encoded data that is efficiently encoded by entropy encoding in which a block of a processing unit is changed.
本発明の画像符号化方法は、原画像を入力する原画像入力ステップと、前記原画像の基本となる基本画像を取得する基本画像取得ステップと、前記原画像と前記基本画像との差分画像を求める差分画像算出ステップと、前記基本画像に含まれるエッジの情報に基づいて前記基本画像をサイズの異なる複数のブロックに分割し、分割の態様を示すブロック情報を取得するブロック情報取得ステップと、前記ブロック情報に示す態様で分割された複数のブロックを処理単位として差分画像を符号化する差分画像符号化ステップとを備える。 An image encoding method of the present invention includes an original image input step for inputting an original image, a basic image acquisition step for acquiring a basic image serving as a basis of the original image, and a difference image between the original image and the basic image. A difference image calculation step to be obtained; a block information acquisition step for dividing the basic image into a plurality of blocks of different sizes based on edge information included in the basic image; and obtaining block information indicating a division mode; A differential image encoding step for encoding a differential image using a plurality of blocks divided in the mode shown in the block information as processing units.
この構成により、本発明の画像符号化装置と同様に、ブロック情報を符号化しないで差分画像の符号化の処理単位のブロックを可変とでき、符号化効率を向上できる。また、本発明の画像符号化装置の各種の構成を本発明の画像符号化方法に適用することも可能である。 With this configuration, similarly to the image encoding device of the present invention, the block of the processing unit for encoding the difference image can be made variable without encoding the block information, and the encoding efficiency can be improved. Various configurations of the image coding apparatus of the present invention can also be applied to the image coding method of the present invention.
本発明の画像復号化方法は、画像が符号化された符号化データを入力する符号化データ入力ステップと、前記符号化データの一部を復号化して原画像の基本となる基本画像を得る基本画像復号化ステップと、前記基本画像復号化ステップにおいて復号化された基本画像に含まれるエッジの情報に基づいて前記基本画像をサイズの異なる複数のブロックに分割し、分割の態様を示すブロック情報を取得するブロック情報取得ステップと、前記ブロック情報に示す態様で分割された複数のブロックを処理単位として前記符号化データを復号化して差分画像を得る差分画像復号化ステップとを備える。 The image decoding method of the present invention includes an encoded data input step for inputting encoded data obtained by encoding an image, and a basic method for obtaining a basic image serving as a basis of an original image by decoding a part of the encoded data. An image decoding step; dividing the basic image into a plurality of blocks of different sizes based on edge information included in the basic image decoded in the basic image decoding step; and block information indicating a division mode A block information acquisition step to be acquired; and a differential image decoding step of decoding the encoded data using a plurality of blocks divided in the mode shown in the block information as a processing unit to obtain a differential image.
この構成により、本発明の画像復号化方法と同様に、ブロック情報を含まずに効率良く符号化された符号化データを可変の処理単位のブロックを用いて復号化を行うことができる。また、本発明の画像復号化装置の各種の構成を本発明の画像復号化方法に適用することも可能である。 With this configuration, similarly to the image decoding method of the present invention, it is possible to decode encoded data that is efficiently encoded without including block information, using a variable processing unit block. Various configurations of the image decoding apparatus of the present invention can also be applied to the image decoding method of the present invention.
本発明によれば、差分画像の符号化の処理単位であるブロックを示すブロック情報を差分画像と相関の強い基本画像から取得する構成により、差分画像の符号化の処理単位のブロックを可変とし、かつ、その処理単位を決めるブロック情報を符号化する必要がないので符号化効率を向上できるというすぐれた効果を有する。 According to the present invention, the block information indicating the block which is the processing unit of the differential image encoding is obtained from the basic image having a strong correlation with the differential image, and the block of the differential image encoding processing unit is variable, In addition, since it is not necessary to encode the block information for determining the processing unit, it has an excellent effect of improving the encoding efficiency.
以下、本発明の実施の形態について、図面を参照して詳細に説明する。第1の実施の形態では、画像の符号化方式として階層符号化方式を用いる例について説明する。階層符号化方式とは、入力画像を基本レイヤと拡張レイヤとに分割して符号化を行う方式である。基本レイヤは単体で画像の復号化が可能であり、拡張レイヤは基本レイヤの補間データを符号化したものである。拡張レイヤを有することによって、基本レイヤから復号化された画像の品質を向上することが可能である。本実施の形態における拡張レイヤは、解像度を向上させる解像度拡張レイヤであるものとする。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. In the first embodiment, an example in which a hierarchical encoding method is used as an image encoding method will be described. The hierarchical coding method is a method of performing coding by dividing an input image into a base layer and an enhancement layer. The base layer can decode a single image, and the enhancement layer is obtained by encoding the interpolation data of the base layer. By having the enhancement layer, it is possible to improve the quality of the image decoded from the base layer. The enhancement layer in the present embodiment is assumed to be a resolution enhancement layer that improves resolution.
(第1の実施の形態)
図1は第1の実施の形態に係る画像符号化装置の構成を示す図、図2は第1の実施の形態の画像復号化装置の構成を示す図である。図1を用いた画像符号化装置の説明、および図2を用いた画像復号化装置の説明に先立って、画像符号化装置および画像復号化装置が用いられる映像監視システムの構成について説明する。
(First embodiment)
FIG. 1 is a diagram illustrating a configuration of an image encoding device according to the first embodiment, and FIG. 2 is a diagram illustrating a configuration of an image decoding device according to the first embodiment. Prior to the description of the image encoding device using FIG. 1 and the description of the image decoding device using FIG. 2, the configuration of a video surveillance system in which the image encoding device and the image decoding device are used will be described.
図3は、本発明の第1の実施の形態に係る画像符号化装置100、画像復号化装置200を用いた映像監視システムの構成を示すブロック図である。図3に示すように、画像符号化装置100と画像復号化装置200とは通信ネットワーク301を介して接続されている。図3において、画像符号化装置100は、カメラ302により撮像された画像を符号化し、符号化データを通信ネットワーク301に出力する。通信ネットワーク301は、画像符号化装置100によって符号化された符号化データを画像復号化装置200に転送する。画像復号化装置200は、通信ネットワーク301経由で受信した符号化データを復号化し、ディスプレイ303に画像を表示する。
FIG. 3 is a block diagram showing a configuration of a video surveillance system using the
次に、画像符号化装置100について説明する。図1に示す画像符号化装置100は、画像入力部101、差分処理部102、直交変換部103、エントロピー符号化部104、ダウンサンプル部105、基本レイヤ符号化/復号化部106、アップサンプル部107、ブロック情報取得部108、符号化データ出力部109を有している。
Next, the
画像入力部101は外部カメラ302と接続され、カメラ302により撮像された画像データを1フレーム毎に差分処理部102とダウンサンプル部105に出力する。
The
ダウンサンプル部105は、画像入力部101より入力された画像データを予め決められた空間解像度に落とすダウンサンプル処理を行い、ダウンサンプル画像を基本レイヤ符号化/復号化部106に出力する。ここで、ダウンサンプル画像は、階層符号化方式における基本レイヤの画像となる。
The
基本レイヤ符号化/復号化部106は、ダウンサンプル部105より入力されたダウンサンプル画像をMPEG−4等の符号化方式により符号化し、基本レイヤ符号化データを画像データ出力部109に出力する。また、基本レイヤ符号化/復号化部106は、符号化データを復号化し、復号化された基本レイヤの画像(基本レイヤ復号化画像)をアップサンプル部107に出力する。
The base layer encoding /
アップサンプル部107は、基本レイヤ符号化/復号化部106から入力された基本レイヤ復号化画像を既定の空間解像度にするアップサンプル処理を行い、アップサンプル後の基本レイヤ復号化画像を差分処理部102とブロック情報取得部108とに出力する。
The up-
ブロック情報取得部108は、アップサンプル部107から入力されたアップサンプル処理後の基本レイヤ復号化画像をエッジの情報に基づいて複数のブロックに分割する。具体的には、エッジ強度の大きい領域は小さいブロックに分割し、エッジ強度の小さい領域は大きいブロックに分割する。分割されたブロックが符号化および復号化の処理単位となる。ブロック情報取得部108は、分割されたブロックの態様を示すブロック情報を取得し、取得したブロック情報を直交変換部103およびエントロピー符号化部104に出力する。
The block
ここで、ブロック情報取得部108は、アップサンプル部107から入力された基本レイヤ復号化画像が、画像入力部101からの入力画像と比較して低画質である場合には、エッジ抽出を行う前に符号化ノイズを除去する処理を行ってもよい。低画質か否かの判定は、入力画像と基本レイヤ復号化画像との比較により算出したS/N値が所定の閾値を超えるか否かによって判定できる。この処理を行うことにより、擬似エッジノイズの発生を抑えて正確なエッジ画像を生成することが可能となる。
Here, when the base layer decoded image input from the
差分処理部102は、画像入力部101から入力された画像データと、アップサンプル部107から入力されたアップサンプル処理後の基本レイヤ復号化画像を用いて、画素単位の差分処理を行い、差分画像を生成する。差分処理部102は、生成された差分画像を直交変換部103に出力する。
The
直交変換部103は、差分処理部102から入力された差分画像に対してDCT(DISCRETE COSINE TRANSFORM)変換処理を行う。DCT変換処理の処理単位となるブロックは、ブロック情報取得部108より入力されたブロック情報に基づいて決定される。直交変換部103は、DCT変換処理により得られたDCT変換係数をエントロピー符号化部104に出力する。
The
エントロピー符号化部104は、直交変換部103から入力されたDCT変換係数をエントロピー符号化する。エントロピー符号化処理の処理単位となるブロックは、ブロック情報取得部108より入力されたブロック情報に基づいて決定される。エントロピー符号化部104は、エントロピー符号化した符号化データを符号化データ出力部109に出力する。
The
符号化データ出力部109は、通信ネットワーク301に接続しており、基本レイヤ符号化/復号化部106より入力された基本レイヤ符号化データと、エントロピー符号化部104より入力された拡張レイヤ符号化データを多重化し、通信ネットワーク301に出力する。
The encoded
次に、画像復号化装置200について説明する。図2に示すように、画像復号化装置200は、符号化データ入力部201と、エントロピー復号化部202と、直交変換部203と、画像加算部204と、基本レイヤ復号化部205と、ブロック情報取得部206と、アップサンプル部207と、画像出力部208とを有する。
Next, the
符号化データ入力部201は通信ネットワーク301に接続され、通信ネットワーク301経由で画像符号化装置100から送信された符号化データを受信する。符号化データ入力部201は、符号化データの中から各基本・拡張レイヤのスタートコードを検出し、基本レイヤ符号化データを基本レイヤ復号化部205に出力すると共に、拡張レイヤ符号化データをエントロピー復号化部202に出力する。
The encoded
基本レイヤ復号化部205は、符号化データ入力部201から入力された符号化データに対して、MPEG−4等の復号化方式によって復号化し、基本レイヤ復号化画像を生成し、アップサンプル部207に出力する。
The base
アップサンプル部207は、基本レイヤ復号化部205から入力された基本レイヤ復号化画像を、予め設定された空間解像度にするアップサンプル処理を行い、アップサンプル処理後の基本レイヤ復号化画像をブロック情報取得部206および画像加算部204に出力する。
The
ブロック情報取得部206は、アップサンプル部207から入力されたアップサンプル後の基本レイヤ復号化画像をエッジの情報に基づいて複数のブロックに分割し、分割の態様を示すブロック情報を取得する。ここで分割されたブロックが復号化の処理単位となる。ブロック情報取得部20は、取得したブロック情報を、直交変換部203およびエントロピー復号化部202に出力する。
The block
エントロピー復号化部202は、符号化データ入力部201から入力された拡張レイヤ符号化データをエントロピー復号化してDCT変換係数を生成する。エントロピー復号化処理の処理単位となるブロックは、ブロック情報取得部206より入力されたブロック情報に基づいて決定される。エントロピー復号化部202は、復号化されたDCT変換係数を直交変換部203に出力する。
The
直交変換部203は、エントロピー復号化部202から入力されたDCT変換係数に逆DCT変換処理を行って差分復号化画像を生成する。逆DCT変換処理の処理単位となるブロックは、ブロック情報取得部206より入力されたブロック情報に基づいて決定される。直交変換部203は、生成された差分復号化画像を画像加算部204に出力する。
The
画像加算部204は、アップサンプル部207から入力されたアップサンプル処理後の基本レイヤ復号化画像と、直交変換部203から入力された差分復号化画像とを画素単位で加算処理して復号化画像を生成し、画像出力部208に出力する。
The
画像出力部208は、ディスプレイ303に接続されており、画像加算部204から入力された復号化画像をディスプレイに出力する。
The
次に、上記構成を有する画像符号化装置100の動作について、図4に示すフロー図を用いて説明する。なお、図4に示すフロー図の動作は、画像符号化装置100の図示しない記憶装置(例えばROMやフラッシュメモリなど)に制御プログラムとして記憶されており、図示しないCPUによって制御される。
Next, the operation of the
まず、画像符号化装置100の画像入力部101は、接続されたカメラ302からの撮像画像の入力処理を行う(S10)。具体的には、画像入力部101は、入力された画像データを1フレーム毎に差分処理部102とダウンサンプル部105に出力する。
First, the
次に、ダウンサンプル部105は、画像入力部101から入力された画像データを予め決められた空間解像度に落とすダウンサンプル処理を行い(S12)、ダウンサンプル処理後の画像を基本レイヤ符号化/復号化部106に出力する。本実施の形態では、ダウンサンプルの一例として、入力画像の空間解像度を水平、垂直それぞれ1/2にするものとする。すなわち、入力画像の空間解像度を(X画素×Y画素)とすると、ダウンサンプル処理後の空間解像度は(X/2画素×Y/2画素)となる。ダウンサンプルの方法に関しては、空間解像度を変更する方法であれば、如何なる方法も適用可能である。例えば、WAVELET変換を用いたサブバンド分割を利用することも可能である。
Next, the down-
次に、基本レイヤ符号化/復号化部106は、ダウンサンプル部105から入力されたダウンサンプル画像をMPEG−4等の符号化方式により符号化し、基本レイヤ符号化データを画像データ出力部109に出力する(S14)。また、基本レイヤ符号化/復号化部106は、符号化データを復号化し、基本レイヤ復号化画像をアップサンプル部107に出力する。ここで、基本レイヤ符号化の方法は、MPEG−4以外の如何なる符号化方法も利用可能である。
Next, the base layer encoding /
次に、ブロック情報取得部108は、アップサンプル部107から入力されたアップサンプル処理後の基本レイヤ復号化画像を用いて、ブロックの分割の態様を示すブロック情報を取得する(S16)。ここで、ブロック情報の取得処理について詳しく説明する。
Next, the block
図5は、ブロック情報取得処理のフローを示す図である。まず、ブロック情報取得部108は、基本レイヤ復号化画像に対してエッジ抽出処理を行い、エッジ画像を生成する(S30)。本実施の形態では、エッジ抽出処理は、例えば、SOBELオペレータを用いたエッジ検出フィルタ処理を行うことにより実現されるものとする。
FIG. 5 is a diagram showing a flow of block information acquisition processing. First, the block
次に、ブロック情報取得部108は、基本レイヤのエッジ画像に対して、ある画素数で構成される大ブロックを単位としてエッジ強度を算出する(S32)。ここで大ブロックは32×32画素で構成される格子状のブロック、中ブロックは16×16画素で構成される格子状のブロック、小ブロックは8×8画素で構成される格子状のブロックであるとする。
Next, the block
大ブロックiのエッジ強度AE(i)は、(x,y)∈AREA(i)を大ブロックi内に含まれる画素の位置の集合、Nを大ブロック内の画素数、Edge(x,y)を画素位置(x,y)におけるエッジ画像の画素値として、以下の式(1)によって計算される。
次に、エッジ強度と大ブロック閾値との比較を行う(S34)。具体的には、大ブロックのエッジ強度と大ブロック閾値(TH_1)を比較し、真であれば大ブロックiのブロックサイズを大ブロックに決定し(S36)、終了判定処理(S48)へ移動し、AE(i)<TH_1の式が偽であればステップS38の処理を行う。 Next, the edge strength is compared with the large block threshold value (S34). Specifically, the edge strength of the large block and the large block threshold (TH_1) are compared. If true, the block size of the large block i is determined to be the large block (S36), and the process proceeds to the end determination process (S48). , AE (i) <TH_1 is false, the process of step S38 is performed.
次に、大ブロック閾値の判定が偽だった場合には、ブロック情報取得部108は、中ブロックのエッジ強度の算出を行う(S38)。具体的には、図6(b)に示すように大ブロック602には、4つの中ブロック603a〜603dが含まれている。それぞれの中ブロック603a〜603dについて、エッジ強度の算出を行う。
Next, when the determination of the large block threshold is false, the block
大ブロックiのj番目の中ブロックのエッジ強度AE(i)は、(x,y)∈AREA(i)を大ブロックiの中ブロックj内に含まれる画素の位置の集合、Nを中ブロック内の画素数、Edge(x,y)を画素位置(x,y)におけるエッジ画像の画素値として、以下の式(2)によって計算される。
続いて、ブロック情報取得部108は、エッジ強度と中ブロック閾値との比較を行う(S40)。具体的には、中ブロックのエッジ強度と中ブロック閾値(TH_2)を比較し、AE(i,j)<TH_2の式が真であれば中ブロックjのブロックサイズを中ブロックに決定し(S42)、ステップS46の処理へ移動する。逆に、AE(i,j)<TH_2の式が偽であれば、中ブロックjのブロックサイズを小ブロックに決定する(S44)。すなわち、図6(c)に示すように、中ブロック603を4つの8×8画素の小ブロックに分割した後、ステップS46の処理へ移動する。
Subsequently, the block
ステップS46では、ブロック情報取得部108は、中ブロック終了判定を行う。具体的には、大ブロック602内の4つの中ブロック603a〜603dに対してエッジ強度算出処理および閾値判定処理を行ったか否かを判定する。全ての中ブロックの処理が終了した場合はステップS48の処理に移動し、終了していない場合は次の中ブロックを処理対象として、ステップS38の処理を行う。
In step S46, the block
最後に、ブロック情報取得部108は、終了判定を行う(S48)。具体的には、1フレーム内の全ての大ブロックに対してエッジ強度算出および閾値判定処理を行ったか判定する。全ての大ブロック処理が終了した場合は処理を終了し、そうでない場合は、次の大ブロックを処理対象として、処理をステップS32へ移動する。全ての大ブロックの処理が終了した後、1フレーム内の全ての大ブロックに対して算出したブロック情報を直交変換部103に出力する。
Finally, the block
ここで、ブロックの判定に用いた2つの閾値は、TH_1<TH_2であるものとし、エッジ強度が小さい程、大ブロックが選択されるように設定するものとする。このように閾値を設定することにより、エッジ強度が小さく低周波数の係数が比較的多いと予想される領域ほど、処理単位を大きなブロックサイズに設定することが可能となる。なお、ブロックの決定のための閾値処理の回数は2回に限らず、ブロックサイズに関しても大、中、小の3つに限定されない。また、縦横のサイズが等しい正方形ブロックに限定されるものでもない。 Here, it is assumed that the two threshold values used for block determination are TH_1 <TH_2, and that the larger block is selected as the edge strength is smaller. By setting the threshold value in this way, the processing unit can be set to a larger block size in a region where the edge strength is small and the low frequency coefficient is expected to be relatively large. The number of threshold processes for determining a block is not limited to two, and the block size is not limited to three, large, medium, and small. Moreover, it is not limited to square blocks having the same vertical and horizontal sizes.
ブロック情報の取得が完了すると、ブロック情報取得処理部108は、ブロック情報を直交変換部103およびエントロピー符号化部104に出力する。
When the acquisition of the block information is completed, the block information
次に、図4に戻って、画像符号化装置100は、拡張レイヤ符号化処理を行う(S18)。具体的には、差分処理部102は、画像入力部101より入力された画像データと、アップサンプル部107より入力されたアップサンプル処理後の基本レイヤ復号化画像を画素単位で差分処理を行い、差分画像を直交変換部103に出力する。なお、ここで算出した差分画像は、本来入力画像データに存在し、基本レイヤ符号化において削減された画像成分、すなわち符号化処理で失われやすいエッジ成分を多く含むため、基本レイヤのエッジ画像と相関が高い画像である。従って、基本レイヤのエッジ画像を用いて算出したブロック情報は、差分画像を用いて算出したブロック情報と類似する結果が得られる。
Next, returning to FIG. 4, the
直交変換部103は、差分処理部102より入力された差分画像に対して、DCT(DISCRETE COSINE TRANSFORM)変換処理を行う。ここでは、ブロック情報取得部108から入力されたブロック情報に示されるブロックを処理単位として、DCT変換処理を行う。具体的には、差分画像内のすべての大ブロックに対して、ブロック情報取得部108において算出されたブロック情報で示されるブロックを処理単位として順次DCT変換処理を行う。大ブロックが複数の中ブロックに分割されている場合、さらに小ブロックに分割されている場合には、それらの中ブロックまたは小ブロックを処理単位としてDCT変換処理を行う。直交変換部103は、1フレーム分のDCT変換係数をエントロピー符号化部104に出力する。ここで、直交変換はDCTに限定されず、DWT(DISCRETE WAVELET TRANSFORM)も利用可能である。
The
エントロピー符号化部104は、直交変換部103より入力されたDCT変換係数に対して、ブロック情報取得部108から入力されたブロック情報で示されるブロックを用いてエントロピー符号化し、拡張レイヤ符号化データを画像出力部109に出力する。
The
次に、画像符号化装置100の符号化データ出力部109は、符号化データを出力する(S20)。具体的には、画像出力部109は、基本レイヤ符号化/復号化部106より入力された基本レイヤ符号化データと、エントロピー符号化部104より入力された拡張レイヤ符号化データを多重化し、接続された通信ネットワーク301に出力する。
Next, the encoded
次に、画像符号化装置100は、終了判定を行う(S22)。具体的には、カメラ302からの画像入力が終了した場合、あるいは既定のフレーム数以上の処理を行った場合には,処理を終了し、そうでない場合には処理をステップS10に移動する。
Next, the
続いて、画像復号化装置200の動作について、図7に示すフロー図を用いて説明する。なお、図7に示すフロー図の動作は、画像復号化装置200の図示しない記憶装置(例えばROMやフラッシュメモリなど)に制御プログラムとして記憶されており、図示しないCPUによって制御される。
Next, the operation of the
画像復号化装置200は、まず、符号化データの入力を行う(S50)。具体的には、符号化データ入力部201は、通信ネットワーク301経由で画像符号化装置100から送信された1フレーム分の符号化データを受信する。そして、画像復号化装置200は、受信した符号化データの中から基本・拡張レイヤのスタートコードをそれぞれ検出し、基本レイヤ符号化データを基本レイヤ復号化部205に出力すると共に、拡張レイヤ符号化データをエントロピー復号化部202に出力する。
The
次に、画像復号化装置200は、基本レイヤの復号化を行う(S52)。具体的には、基本レイヤ復号化部205は、符号化データ入力部201より入力された基本レイヤの符号化データに対して、MPEG−4等の復号化方式によって復号化し、基本レイヤ復号化画像を生成しアップサンプル部207に出力する。
Next, the
続いて、アップサンプル部207は、基本レイヤ復号化部205より入力された基本レイヤ復号化画像を、予め設定された空間解像度にアップサンプル処理し、アップサンプル後の基本レイヤ復号化画像をブロック情報取得部206と、画像加算部204に出力する。
Subsequently, the
次に、ブロック情報取得部206は、ブロック情報取得処理を行う(S54)。具体的には、ブロック情報取得部206は、アップサンプル部207より入力されたアップサンプル処理後の基本レイヤ復号化画像をエッジの情報に基づいて分割し、分割の態様を示すブロック情報を取得する。ここで、ブロック情報取得部206は、画像符号化装置100のブロック情報取得部108と同一の処理(図5参照)を行う。ブロック情報取得部206は、取得したブロックの情報をエントロピー復号化部202および直交変換部203に出力する。
Next, the block
ブロック情報を取得した後、画像復号化装置200は、拡張レイヤの復号化を行う(S56)。具体的には、エントロピー復号化部202は、符号化データ入力部201より入力された拡張レイヤ符号化データをエントロピー復号化し、DCT変換係数を生成する。ここで、エントロピー復号化の処理単位は、ブロック情報取得部206から入力されたブロック情報で示されるブロックである。エントロピー復号化部202は、復号化されたDCT変換係数を直交変換部203に出力する。
After acquiring the block information, the
続いて、直交変換部203は、エントロピー復号化部202より入力されたDCT変換係数に逆DCT変換処理を行い、差分復号化画像を生成する。ここで逆DCT変換処理の処理単位は、ブロック情報取得部206から入力されたブロック情報で示されるブロックである。直交変換部203は、生成された差分復号化画像を画像加算部204に出力する。
Subsequently, the
続いて、画像加算部204は、アップサンプル部207から入力されたアップサンプル処理後の基本レイヤ復号化画像と、直交変換部203より入力された差分復号化画像を画素単位で加算して画像合成処理を行って復号化画像を生成する(S58)。画像加算部204は、生成された復号化画像を画像出力部208に出力する。
Subsequently, the
画像出力部208は、画像加算部204から入力された復号化画像を出力する(S60)。具体的には、画像出力部208は、画像加算部204から入力された復号化画像をディスプレイに出力する。
The
次に、画像復号化装置200は、終了判定を行う(S62)。具体的には、通信ネットワーク301からの符号化データの受信が停止した場合、あるいは既定のフレーム数以上の復号化処理を行った場合には処理を終了し、そうでない場合には処理をステップS50に移動する。
Next, the
以上、第1の実施の形態の画像符号化装置100および画像復号化装置200について説明した。
Heretofore, the
本実施の形態の画像符号化装置100では、画像符号化装置100のブロック情報取得部103が、符号化済みの基本レイヤ符号化データを復号化した復号化画像を用いて、処理単位であるブロックを示すブロック情報を取得することよって、ブロック情報の符号化を必要とせず、階層符号化における拡張レイヤの符号化の処理単位のブロックを変更することが可能である。これにより、画像の符号化効率の向上を図れる。
In
また、本実施の形態の画像復号化装置200は、ブロック情報取得部206が、基本レイヤ符号化データを復号化して得られる基本レイヤ復号化画像を用いてブロック情報を取得することによって、符号化データにブロック情報を含まずに、ブロックを変更して効率良く符号化された拡張レイヤの画像データを復号化することが可能である。
Also, in the
(第2の実施の形態)
次に、本発明の第2の実施の形態の画像符号化装置および画像復号化装置について説明する。第2の実施の形態では、画像の符号化方式として階層符号化方式ではなく通常の符号化方式を用いる例を示す。第2の実施の形態においても、第1の実施の形態と同様に、画像符号化装置および画像復号化装置は、映像監視システムに適用される(図3参照)。
(Second Embodiment)
Next, an image encoding device and an image decoding device according to the second embodiment of the present invention will be described. In the second embodiment, an example is shown in which a normal encoding method is used as an image encoding method instead of a hierarchical encoding method. Also in the second embodiment, as in the first embodiment, the image encoding device and the image decoding device are applied to a video surveillance system (see FIG. 3).
図8は、本発明の第2の実施の形態に係る画像符号化装置800の構成を示すブロック図である。図8に示すように、画像符号化装置800は、画像入力部801、動き予測部802、直交変換部803、エントロピー符号化部804、符号化データ出力部805、動き補償部806、ブロック情報取得部807を有している。
FIG. 8 is a block diagram showing a configuration of an image coding apparatus 800 according to the second embodiment of the present invention. As illustrated in FIG. 8, the image encoding device 800 includes an
画像入力部801は外部カメラ302に接続され、カメラ302で撮像された画像データを1フレーム毎に動き予測部802に出力する。
The
動き予測部802は、画像入力部801から入力された画像データと、動き補償部806から入力された1フレーム前の復号化画像(参照画像と定義する)を比べ、16×16画素のブロック毎に入力画像データと参照画像間の相関が高い位置への動きベクトルを算出する。続いて、入力画像データを動きベクトル方向に移動した後、参照画像との差分処理を行って差分画像を生成し、直交変換部803に出力する。さらに、動き予測部802は、動きベクトルを動き補償部806およびエントロピー符号化部804に出力する。
The
直交変換部803は、動き予測部802より入力される差分画像に対して、DCT(DISCRETE COSINE TRANSFORM)変換を行い、DCT係数を生成する。ここでは、ブロック情報取得部807から入力されブロック情報に示されるブロックを処理単位として、DCT変換処理を行う。直交変換部803は、生成されたDCT係数をエントロピー符号化部804に出力するとともに、DCT係数を逆DCT変換し、差分画像を復号化し、復号化差分画像を動き補償部806に出力する。
The
エントロピー符号化部804は、直交変換部803より入力されたDCT係数に対して、エントロピー符号化処理を行う。ここでは、ブロック情報取得部807から入力されたブロック情報に示されるブロックを処理単位として、エントロピー符号化を行う。また、エントロピー符号化部804は、動き予測部802から入力された動きベクトルを符号化することにより符号化データを生成する。そして、生成された画像および動きベクトルの符号化データを符号化データ出力部805に出力する。
The
動き補償部806は、内部にフレームバッファを持ち1フレーム前の復号化画像を保存している。そして、動き補償部806は、直交変換部803から入力された復号化差分画像を、動き予測部802から入力された動きベクトルの方向に画像を移動した後、フレームバッファ内の画像と加算処理をすることにより復号化画像を生成する。そして、動き補償部806は、生成した復号化画像を動き予測部802およびブロック情報取得部807に出力するとともに、フレームバッファ内のデータを新しく生成された復号化画像に置き換える。
The
ブロック情報取得部807は、動き補償部806により入力された復号化画像を用いてブロック情報を取得し、取得したブロック情報を直交変換部803とエントロピー符号化部804に出力する。
The block
符号化データ出力部805は通信ネットワーク301に接続され、エントロピー符号化部804により入力された符号化データを通信ネットワーク301に出力する。
The encoded
図9は、第2の実施の形態における画像復号化装置900の構成を示すブロック図である。図9に示すように、画像復号化装置900は、符号化データ入力部901、エントロピー復号化部902、直交変換部903、動き補償部904、画像出力部905、ブロック情報取得部906を有する。
FIG. 9 is a block diagram illustrating a configuration of an image decoding apparatus 900 according to the second embodiment. As illustrated in FIG. 9, the image decoding apparatus 900 includes an encoded
符号化データ入力部901は、通信ネットワーク301に接続され、通信ネットワーク301経由で画像符号化装置800から出力された符号化データを受信し、符号化データの中からスタートコードを検出し、1フレーム分の符号化データをエントロピー復号化部902に出力する。
The encoded
エントロピー復号化部902は、符号化データ入力部901より入力された符号化データに対してエントロピー復号化処理を行ってDCT変換係数を生成する。ここでは、ブロック情報取得部906より入力されたブロック情報に示されるブロックを処理単位として、エントロピー復号化処理を行う。エントロピー復号化部902は、生成されたDCT変換係数を直交変換部903に出力するとともに、符号化データから動きベクトルを復号化し、動き補償部904に出力する。
The
直交変換部903は、エントロピー復号化部902より入力されたDCT変換係数に対して、逆DCT変換処理を行って差分復号化画像を生成する。ここでは、ブロック情報取得部906から入力されたブロック情報に示されるブロックを処理単位として逆DCT変換処理を行う。直交変換部903は、生成された差分復号化画像を動き補償部904に出力する。
The
ブロック情報取得部906は、動き補償部904より入力された復号化画像をエッジの情報に基づいて分割し、分割の態様を示すブロック情報を取得する。ブロック情報取得部906は、取得したブロック情報を直交変換部903およびエントロピー復号化部901に出力する。
The block
動き補償部904は、内部にフレームバッファを持ち1フレーム前の復号化画像を保存している。そして、直交変換部903から入力された復号化差分画像を、エントロピー復号化部902より入力された動きベクトルの方向に画像を移動した後、フレームバッファ内の画像と加算処理をすることにより復号化画像を生成する。そして、動き補償部904は、生成した復号化画像を画像出力部905およびブロック情報取得部807に出力するとともに、フレームバッファ内のデータを新しく生成された復号化画像に置き換える。
The
画像出力部905は、ディスプレイ303に接続されており、動き補償部904から入力された復号化画像をディスプレイ303に出力する。
The
次に、画像符号化装置800の動作について、図10に示すフロー図を用いて説明する。なお、図10に示すフロー図の動作は、画像符号化装置800の図示しない記憶装置(例えばROMやフラッシュメモリなど)に制御プログラムとして記憶されており、図示しないCPUによって制御される。 Next, the operation of the image coding apparatus 800 will be described using the flowchart shown in FIG. Note that the operation of the flowchart shown in FIG. 10 is stored as a control program in a storage device (for example, a ROM or a flash memory) (not shown) of the image encoding device 800 and is controlled by a CPU (not shown).
まず、画像符号化装置800の画像入力部801は、接続されたカメラ302によって撮像された画像データを1フレーム毎に入力する(S70)。画像符号化装置800は、入力されたフレームが最初のフレームか否かの判定を行い(S72)、入力されたフレームが最初のフレームの場合は、ステップS74の処理を行い、最初のフレームでない場合は、ステップS76の処理を行う。
First, the
符号化フレームが最初のフレームの場合は、1フレーム前の復号化画像が存在しないため、ブロック情報取得部807は、固定サイズのブロックを選択する(S74)。具体的には、ブロック情報取得部807は、符号化処理単位であるブロックサイズを全て固定サイズ、例えば8×8画素の小ブロックと決定し、決定したブロックサイズ情報を直交変換部803とエントロピー符号化部804に出力する。
When the encoded frame is the first frame, there is no decoded image one frame before, so the block
符号化フレームが最初のフレームでない場合は、ブロック情報取得部807は、動き補償部806より入力された1フレーム前の復号化画像を用いてブロック情報を取得し、ブロック情報を直交変換部803とエントロピー符号化部804に出力する。本実施の形態におけるブロック情報の取得方法は、基本的に第1の実施の形態におけるブロック情報取得部108と同様であり、復号化画像をエッジ抽出後に閾値処理を行ってブロック情報を取得する。第1の実施の形態と異なる点は、第1の実施の形態では基本レイヤの復号化画像を用いたのに対し、第2の実施の形態では1フレーム前の復号化画像を用いる点である。
When the encoded frame is not the first frame, the block
次に、画像符号化装置800は、符号化処理を行う(S78)。具体的には、動き予測部802は、画像入力部801から入力された画像データと、復号化部806から入力された1フレーム前の復号化画像(以下、参照画像という)を比べ、16×16画素のブロック毎に入力画像データと参照画像間の相関が高い位置への動きベクトルを算出する。続いて入力画像データを動きベクトル方向に移動した後、参照画像との差分処理を行い、差分画像を生成し、直交変換部803に出力する。さらに、動き予測部802は、動きベクトルを動き補償部806とエントロピー符号化部804に出力する。
Next, the image encoding device 800 performs an encoding process (S78). Specifically, the
続いて、直交変換部803は、動き予測部802より入力される差分画像にDCT(DISCRETE COSINE TRANSFORM)変換を行う。DCT変換処理の処理単位となるブロックは、ブロック情報取得部108より入力されたブロック情報に基づいて決定される。直交変換部803は、DCT係数をエントロピー符号化部804に出力するとともに、DCT係数を逆DCT変換し、差分画像を復号化し、復号化差分画像を動き補償部806に出力する。なお、DCT係数値を小さくするため、DCT変換後にDCT係数を量子化パラメータで割った商で置き換える量子化処理を行うことも可能である。量子化処理を行った場合には、逆DCT変換処理の前にDCT係数に対して量子化パラメータの乗算結果で置き換える逆量子化処理を行うものとする。
Subsequently, the
続いて、エントロピー符号化部804は、直交変換部803より入力されたDCT係数に対して、エントロピー符号化を行う。エントロピー符号化の処理単位は、ブロック情報取得部807から入力されたブロック情報に示されるブロックである。エントロピー符号化部804は、動き予測部802から入力された動きベクトルを符号化することによって符号化データを生成し、符号化データ出力部805に出力する。
Subsequently, the
動き補償部806は、内部にフレームバッファを持ち1フレーム前の復号化画像を保存している。そして、直交変換部803より入力された復号化差分画像を、動き予測部802より入力された動きベクトル方向に画像を移動した後、フレームバッファ内の画像と加算処理をすることにより復号化画像を生成する。そして、生成した復号化画像を動き予測部802とブロック情報取得部807に出力するとともに、フレームバッファのデータを新しく生成された復号化画像に置き換える。
The
画像符号化装置800は、符号化データを出力する(S80)。具体的には、符号化データ出力部805は、エントロピー符号化部804より入力された符号化データを、接続された通信ネットワーク301に出力する。
The image encoding device 800 outputs encoded data (S80). Specifically, the encoded
符号化データを出力した後、画像符号化装置800は、終了判定を行う(S82)。具体的には、カメラ302からの画像入力が終了した場合、あるいは既定のフレーム数以上の処理を行った場合には,処理を終了し、そうでない場合には処理をステップS70に移動する。
After outputting the encoded data, the image encoding device 800 makes an end determination (S82). Specifically, when the image input from the
次に、画像復号化装置900の動作について、図11に示すフロー図を用いて説明する。なお、図11に示すフロー図の動作は、画像復号化装置900の図示しない記憶装置(例えばROMやフラッシュメモリなど)に制御プログラムとして記憶されており、図示しないCPUによって制御される。 Next, the operation of the image decoding apparatus 900 will be described using the flowchart shown in FIG. The operation of the flowchart shown in FIG. 11 is stored as a control program in a storage device (not shown) such as a ROM or a flash memory of the image decoding apparatus 900, and is controlled by a CPU (not shown).
画像復号化装置900は、まず、符号化データの入力を行う(S90)。具体的には、符号化データ入力部901は、通信ネットワーク301経由で画像符号化装置800から送信された1フレーム分の符号化データを受信し、エントロピー復号化部902に出力する。
The image decoding apparatus 900 first inputs encoded data (S90). Specifically, the encoded
次に、画像復号化装置900は、現在復号化するフレームが最初のフレームの場合は、ステップS94の処理を行い、最初のフレームでない場合は、ステップS96の処理を行う。 Next, the image decoding apparatus 900 performs the process of step S94 when the current frame to be decoded is the first frame, and performs the process of step S96 when it is not the first frame.
入力されたフレームが最初のフレームの場合は、1フレーム前の復号化画像が存在しないため、ブロック情報取得部906は、固定ブロックサイズを選択する。具体的には、ブロック情報取得部906は、復号化処理単位であるブロックを全て固定サイズ、例えば8×8画素の小ブロックと決定し、決定したブロック情報を直交変換部903とエントロピー復号化部902に出力する。
When the input frame is the first frame, there is no decoded image one frame before, so the block
入力されたブロックが最初のフレームでない場合は、ブロック情報取得部906は、動き補償部804より入力された1フレーム前の復号化画像をエッジの情報に基づいて分割し、分割の態様を示すブロック情報を取得する。本実施の形態におけるブロック情報の取得方法は、基本的に第1の実施の形態におけるブロック情報取得部206と同様であり、復号化画像をエッジ抽出後に閾値処理を行ってブロック情報を決定する。第1の実施の形態と異なる点は、第1の実施の形態では基本レイヤの復号化画像を用いたのに対し、第2の実施の形態では1フレーム前の復号化画像を用いる点である。そして、ブロック情報取得部906は、取得したブロック情報を直交変換部903およびエントロピー復号化部902に出力する。
When the input block is not the first frame, the block
次に、画像復号化装置900は復号化処理を行う(S98)。具体的には、エントロピー復号化部902は、符号化データ入力部901より入力された符号化データをエントロピー復号化し、DCT変換係数を生成する。エントロピー復号化の処理単位は、ブロック情報取得部906から入力されたブロック情報に示されるブロックである。エントロピー復号化部902は、生成されたDCT変換係数を直交変換部903に出力するとともに、符号化データから動きベクトルを復号化し、動き補償部904に出力する。
Next, the image decoding apparatus 900 performs a decoding process (S98). Specifically, the
続いて、直交変換部903は、エントロピー復号化部902より入力されたDCT変換係数に対して逆DCT変換処理を行って差分復号化画像を生成する。逆DCT変換処理の処理単位は、ブロック情報取得部906から入力されたブロック情報に示されるブロックである。直交変換部903は、生成された差分復号化画像を動き補償部904に出力する。
Subsequently, the
動き補償部904は、直交変換部903から入力された復号化差分画像を、エントロピー復号化部902から入力された動きベクトルの方向に画像を移動した後、フレームバッファ内に記憶された1フレーム前の画像と加算処理をすることにより復号化画像を生成する(S100)。そして、動き補償部904は、生成された復号化画像を画像出力部905とブロック情報取得部807に出力するとともに、フレームバッファ内のデータを新しく生成された復号化画像に置き換える。
The
画像出力部905は、動き補償部904から入力された復号化画像をディスプレイに出力する(S102)。次に、画像復号化装置200は、終了判定を行う(S104)。具体的には、通信ネットワーク301からの符号化データの受信が停止した場合、あるいは既定のフレーム数以上の復号化処理を行った場合には処理を終了し、そうでない場合には処理をステップS90に移動する。以上、本実施形態の画像符号化装置および画像復号化装置の構成および動作について説明した。
The
第2の実施の形態の画像符号化装置800では、ブロック情報取得部806が、1フレーム前の復号化画像を用いて、符号化処理単位であるブロックを示すブロック情報を取得することによって、ブロック情報の符号化を必要とせず、可変のブロックを処理単位として符号化することができ、符号化効率を向上させることが可能である。
In the image encoding device 800 according to the second embodiment, the block
また、本実施の形態の画像復号化装置900は、ブロック情報取得部906が、基本レイヤ符号化データを復号化して得られる基本レイヤ復号化画像を用いてブロック情報を取得することによって、符号化データにブロック情報を含まずに、ブロックを変更して効率良く符号化された拡張レイヤの画像データを復号化することが可能である。
Also, in the image decoding apparatus 900 according to the present embodiment, the block
以上、本発明の画像符号化装置および画像復号化装置について実施の形態を挙げて詳細に説明したが、本発明は上記した実施の形態に限定されるものではない。 The image coding apparatus and the image decoding apparatus according to the present invention have been described in detail with reference to the embodiments. However, the present invention is not limited to the above-described embodiments.
上記した第1の実施の形態では、画像符号化装置100のブロック情報取得部103による基本レイヤ復号化画像のエッジ抽出方法として、予め決められたSOBELフィルタを用いたが、エッジ抽出の方法を適宜変更してもよい。これにより、画像特性に応じてエッジ抽出方式を選択して、ブロックの決定の元となるエッジ画像を正確に生成することが可能となる。この場合、エントロピー符号化部104がエッジ抽出方法の情報を符号化した符号化データを生成してもよい。これにより、画像復号化装置200において、符号化データを復号化して得られたエッジ抽出方法に従って、基本レイヤ復号化画像のエッジ抽出を行うことができる。
In the first embodiment described above, a predetermined SOBEL filter is used as the edge extraction method of the base layer decoded image by the block
また、上記した第1の実施の形態では、画像符号化装置100のブロック情報取得部103は、基本レイヤ復号化画像のエッジ画像を行い、閾値処理によってブロック情報を取得したが、エッジ画像ではなく、色差画像を用いてブロック情報を取得することも可能である。これによって、入力画像が多くのエッジを含み、エッジ画像からはブロック情報の取得が困難な画像に対しても、色差情報によって符号化効率の高い処理ブロックを取得することが可能となる。例えば、画像符号化装置100のブロック情報取得部103は、基本レイヤ復号化画像の色差画像に対して、ブロック毎の分散値を求め、閾値処理によって分散値が小さいブロック程、大きなブロックサイズを決定することも可能である。これによって、入力画像の多くのエッジを含み、エッジによるブロック情報の取得が困難な画像に対しても、同色で相互相関の高い領域を1つのブロックにまとめて符号化することができ、符号化効率を向上可能である。この場合、画像復号化装置200においても、画像符号化装置100と同様に色差画像を用いてブロック情報を取得する。これにより、画像符号化装置100と画像復号化装置200で同じブロック情報を取得できる。
In the first embodiment described above, the block
また、上記した第1の実施の形態では、画像符号化装置100の直交変換部103は、ブロック情報取得部108が取得したブロック情報に従ってDCT変換を行ったが、DWT変換を行うことも可能である。これにより、エッジが少ない領域に対しては、多数の画素値を含む大きなブロックを、低サブバンド係数に集中し少数の有効係数を含むDWT係数へと変換し、少ない符号量で符号化することができるため、符号化効率を向上可能である。
In the first embodiment described above, the
また、上記した第1の実施の形態において、画像符号化装置100の符号化データ出力部119は、エントロピー符号化部104から入力された符号化データを、入力された順番で通信ネットワーク301に出力したが、ブロックサイズ毎にまとめて通信ネットワーク301に出力することも可能である。これにより、連続する符号化データのブロックサイズが揃っているため、効率良く符号化データの伝送、または符号化データの復号化を行うことが可能である。例えば、ブロックサイズが大きいものから先に通信ネットワーク301に出力することとすれば、主観画質への影響が大きい平坦な領域に対して、優先的に高画質化することができる。
In the first embodiment described above, the encoded data output unit 119 of the
また、上記した第1の実施の形態において、ブロック情報取得部103は、あらかじめ設定された閾値TH_1、TH_2を用いてエッジ強度に対する閾値処理を行ったが、画像特性に応じて閾値を決定することとしてもよい。例えば、画像特性に応じて閾値を決定するために、次のような構成を採用することができる。まず、ブロック単位で符号化処理すべき差分画像をエッジ強度に応じて分割する。差分画像を分割して得られたブロック情報は、差分画像を符号化するために適したブロック情報である。次に、差分画像に基づいて分割されたブロックと同じように、基本レイヤ復号化画像が分割される閾値を設定する。これにより、差分画像をDCT処理して得られるDCT係数値がより小さくなるため、符号化効率をさらに向上することが可能である。なお、このような構成を採用した場合、エントロピー符号化部104が閾値を符号化データとして符号化する。これにより、画像特性に合せて設定された閾値を画像復号化装置に通知することができる。
In the first embodiment described above, the block
以上、上記した第1の実施の形態の変形例について説明したが、上記の変形は、第2の実施の形態に適用することも可能である。 The modification of the first embodiment described above has been described above, but the above modification can also be applied to the second embodiment.
以上説明したように、本発明によれば、差分画像の符号化の処理単位であるブロックのブロック情報を差分画像と相関の強い基本画像から取得する構成により、差分画像の符号化の処理単位のブロックを可変とし、かつ、その処理単位を決めるブロック情報を符号化する必要がないので符号化効率を向上できるというすぐれた効果を有し、例えば、符号化データ量の増大する高解像度画像の符号化等の用途に利用することができる。 As described above, according to the present invention, the block information of the block, which is the processing unit of the differential image encoding, is acquired from the basic image having a strong correlation with the differential image. Since the block information is variable and it is not necessary to encode the block information that determines the processing unit, it has an excellent effect that the encoding efficiency can be improved. It can be used for applications such as conversion.
100 画像符号化装置
101 画像入力部
102 差分処理部
103 直交変換部
104 エントロピー符号化部
105 ダウンサンプル部
106 基本レイヤ符号化/復号化部
107 アップサンプル部
108 ブロック情報取得部
109 符号化データ出力部
200 画像復号化部
201 符号化データ入力部
202 エントロピー復号化部
203 直交変換部
204 画像加算部
205 基本レイヤ復号化部
207 アップサンプル部
206 ブロック情報取得部
208 画像出力部
301 通信ネットワーク
302 カメラ
303 ディスプレイ
601 フレーム
602 大ブロック
603 中ブロック
604 小ブロック
801 画像入力部
802 動き予測部
803 直交変換部
804 エントロピー符号化部
805 符号化データ出力部
806 動き補償部
807 ブロック情報取得部
900 画像符号化装置
901 符号化データ入力部
902 エントロピー復号化部
903 直交変換部
904 動き補償部
905 画像出力部
906 ブロック情報取得部
1200 画像入力部
1201 ブロックサイズ割り当て部
1202 DCT部
1203 DQT部
1204 量子化器
1205 ジグザグ走査シリアライザ
1206 可変長コーダ
1207 伝送チャネル
1208 可変長デコーダ
1209 逆ジグザグ走査シリアライザ
1210 逆量子化器値
1211 IDQT部
1212 IDCT部
1213 画像出力部
DESCRIPTION OF
Claims (33)
前記原画像の基本となる基本画像を取得する基本画像取得手段と、
前記原画像と前記基本画像との差分画像を求める差分画像算出手段と、
前記基本画像に含まれるエッジの情報に基づいて前記基本画像をサイズの異なる複数のブロックに分割し、分割の態様を示すブロック情報を取得するブロック情報取得手段と、
前記ブロック情報に示す態様で分割された複数のブロックを処理単位として差分画像を符号化する差分画像符号化手段と、
を備えた画像符号化装置。 An original image input means for inputting an original image;
Basic image acquisition means for acquiring a basic image as a basis of the original image;
Difference image calculation means for obtaining a difference image between the original image and the basic image;
Block information acquisition means for dividing the basic image into a plurality of blocks having different sizes based on edge information included in the basic image, and acquiring block information indicating a division mode;
Differential image encoding means for encoding a differential image using a plurality of blocks divided in the mode shown in the block information as processing units;
An image encoding device comprising:
前記原画像をダウンサンプル処理した画像を基本画像として取得する基本画像取得手段と、
前記原画像と前記基本画像との差分画像を求める差分画像算出手段と、
前記基本画像に含まれるエッジの情報に基づいて前記基本画像をサイズの異なる複数のブロックに分割し、分割の態様を示すブロック情報を取得するブロック情報取得手段と、
前記ブロック情報に示す態様で分割された複数のブロックを処理単位として差分画像を符号化する差分画像符号化手段と、
前記基本画像を符号化する基本画像符号化手段と、
を備えた画像符号化装置。 An original image input means for inputting an original image;
Basic image acquisition means for acquiring an image obtained by down-sampling the original image as a basic image;
Difference image calculation means for obtaining a difference image between the original image and the basic image;
Block information acquisition means for dividing the basic image into a plurality of blocks having different sizes based on edge information included in the basic image, and acquiring block information indicating a division mode;
Differential image encoding means for encoding a differential image using a plurality of blocks divided in the mode shown in the block information as processing units;
Basic image encoding means for encoding the basic image;
An image encoding device comprising:
符号化すべき原画像のフレームの前フレームを基本画像として取得する基本画像取得手段と、
前記原画像と前記基本画像との差分画像を求める差分画像算出手段と、
前記基本画像に含まれるエッジの情報に基づいて前記基本画像をサイズの異なる複数のブロックに分割し、分割の態様を示すブロック情報を取得するブロック情報取得手段と、
前記ブロック情報に示す態様で分割された複数のブロックを処理単位として差分画像を符号化する差分画像符号化手段と、
を備えた画像符号化装置。 Image input means for inputting an image composed of a plurality of continuous frames;
Basic image acquisition means for acquiring the previous frame of the frame of the original image to be encoded as a basic image;
Difference image calculation means for obtaining a difference image between the original image and the basic image;
Block information acquisition means for dividing the basic image into a plurality of blocks having different sizes based on edge information included in the basic image, and acquiring block information indicating a division mode;
Differential image encoding means for encoding a differential image using a plurality of blocks divided in the mode shown in the block information as processing units;
An image encoding device comprising:
前記出力手段は、符号化の処理単位のブロックのサイズごとに、前記符号化データを出力する請求項1〜3のいずれかに記載の画像符号化装置。 Output means for outputting encoded data encoded by the differential image encoding means;
The image encoding apparatus according to claim 1, wherein the output unit outputs the encoded data for each block size of an encoding processing unit.
前記符号化データの一部を復号化して原画像の基本となる基本画像を得る基本画像復号化手段と、
前記基本画像復号化手段にて復号化された基本画像に含まれるエッジの情報に基づいて前記基本画像をサイズの異なる複数のブロックに分割し、分割の態様を示すブロック情報を取得するブロック情報取得手段と、
前記ブロック情報に示す態様で分割された複数のブロックを処理単位として前記符号化データを復号化して差分画像を得る差分画像復号化手段と、
を備えた画像復号化装置。 Encoded data input means for inputting encoded data obtained by encoding an image;
Basic image decoding means for decoding a part of the encoded data to obtain a basic image serving as a base of the original image;
Block information acquisition for dividing the basic image into a plurality of blocks having different sizes based on edge information included in the basic image decoded by the basic image decoding means, and acquiring block information indicating a division mode Means,
Differential image decoding means for decoding the encoded data using a plurality of blocks divided in the mode shown in the block information as processing units to obtain a differential image;
An image decoding apparatus comprising:
前記符号化データの一部を復号化して原画像がダウンサンプル処理された基本画像を得る基本画像復号化手段と、
前記基本画像復号化手段にて復号化された基本画像に含まれるエッジの情報に基づいて前記基本画像をサイズの異なる複数のブロックに分割し、分割の態様を示すブロック情報を取得するブロック情報取得手段と、
前記ブロック情報に示す態様で分割された複数のブロックを処理単位として前記符号化データを復号化して差分画像を得る差分画像復号化手段と、
を備えた画像復号化装置。 Encoded data input means for inputting encoded data obtained by encoding an image;
Basic image decoding means for decoding a part of the encoded data to obtain a basic image obtained by down-sampling the original image;
Block information acquisition for dividing the basic image into a plurality of blocks having different sizes based on edge information included in the basic image decoded by the basic image decoding means, and acquiring block information indicating a division mode Means,
Differential image decoding means for decoding the encoded data using a plurality of blocks divided in the mode shown in the block information as processing units to obtain a differential image;
An image decoding apparatus comprising:
前記符号化データに含まれる復号化すべきフレームの前フレームを基本画像とし、基本画像に含まれるエッジの情報に基づいて前記基本画像をサイズの異なる複数のブロックに分割し、分割の態様を示すブロック情報を取得するブロック情報取得手段と、
前記ブロック情報に示す態様で分割された複数のブロックを処理単位として前記符号化データを復号化して差分画像を得る差分画像復号化手段と、
前記基本画像と差分画像とに基づいて前記フレームの原画像を合成する原画像合成手段と、
を備えた画像復号化装置。 Encoded data input means for inputting encoded data obtained by encoding an image composed of a plurality of continuous frames;
A block showing a mode of division by using a previous frame of a frame to be decoded included in the encoded data as a basic image, dividing the basic image into a plurality of blocks of different sizes based on edge information included in the basic image Block information acquisition means for acquiring information;
Differential image decoding means for decoding the encoded data using a plurality of blocks divided in the mode shown in the block information as processing units to obtain a differential image;
Original image combining means for combining the original image of the frame based on the basic image and the difference image;
An image decoding apparatus comprising:
前記ブロック情報取得手段は、前記エッジ抽出フィルタを用いて前記基本画像のエッジを抽出する請求項19〜21のいずれかに記載の画像復号化装置。 An edge extraction filter decoding means for decoding an edge extraction filter included in the encoded data;
The image decoding device according to any one of claims 19 to 21, wherein the block information acquisition unit extracts an edge of the basic image using the edge extraction filter.
前記原画像の基本となる基本画像を取得する基本画像取得ステップと、
前記原画像と前記基本画像との差分画像を求める差分画像算出ステップと、
前記基本画像に含まれるエッジの情報に基づいて前記基本画像をサイズの異なる複数のブロックに分割し、分割の態様を示すブロック情報を取得するブロック情報取得ステップと、
前記ブロック情報に示す態様で分割された複数のブロックを処理単位として差分画像を符号化する差分画像符号化ステップと、
を備えた画像符号化方法。 An original image input step for inputting the original image;
A basic image acquisition step of acquiring a basic image as a basis of the original image;
A difference image calculating step for obtaining a difference image between the original image and the basic image;
A block information acquisition step of dividing the basic image into a plurality of blocks of different sizes based on edge information included in the basic image, and acquiring block information indicating a division mode;
A differential image encoding step for encoding a differential image using a plurality of blocks divided in the mode shown in the block information as processing units;
An image encoding method comprising:
前記符号化データの一部を復号化して原画像の基本となる基本画像を得る基本画像復号化ステップと、
前記基本画像復号化ステップにおいて復号化された基本画像に含まれるエッジの情報に基づいて前記基本画像をサイズの異なる複数のブロックに分割し、分割の態様を示すブロック情報を取得するブロック情報取得ステップと、
前記ブロック情報に示す態様で分割された複数のブロックを処理単位として前記符号化データを復号化して差分画像を得る差分画像復号化ステップと、
を備えた画像復号化方法。
An encoded data input step for inputting encoded data obtained by encoding an image;
A basic image decoding step of decoding a part of the encoded data to obtain a basic image serving as a base of an original image;
Block information acquisition step of dividing the basic image into a plurality of blocks having different sizes based on edge information included in the basic image decoded in the basic image decoding step, and acquiring block information indicating a division mode When,
A differential image decoding step of decoding the encoded data using a plurality of blocks divided in a mode shown in the block information as processing units to obtain a differential image;
An image decoding method comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005062477A JP2006246351A (en) | 2005-03-07 | 2005-03-07 | Image coding unit and image decoding unit |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005062477A JP2006246351A (en) | 2005-03-07 | 2005-03-07 | Image coding unit and image decoding unit |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006246351A true JP2006246351A (en) | 2006-09-14 |
Family
ID=37052249
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005062477A Pending JP2006246351A (en) | 2005-03-07 | 2005-03-07 | Image coding unit and image decoding unit |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006246351A (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009006056A3 (en) * | 2007-06-28 | 2009-03-05 | Microsoft Corp | Efficient image representation by edges and low-resolution signal |
JP2010507352A (en) * | 2006-10-18 | 2010-03-04 | アップル インコーポレイテッド | Scalable video coding with lower layer filtering |
WO2010035403A1 (en) * | 2008-09-25 | 2010-04-01 | パナソニック株式会社 | Filter device and filter method |
JP2011511597A (en) * | 2008-02-05 | 2011-04-07 | トムソン ライセンシング | Method and apparatus for implicit block partitioning in video encoding and decoding |
WO2011049119A1 (en) * | 2009-10-20 | 2011-04-28 | シャープ株式会社 | Moving image coding device, moving image decoding device, moving image coding/decoding system, moving image coding method and moving image decoding method |
-
2005
- 2005-03-07 JP JP2005062477A patent/JP2006246351A/en active Pending
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010507352A (en) * | 2006-10-18 | 2010-03-04 | アップル インコーポレイテッド | Scalable video coding with lower layer filtering |
WO2009006056A3 (en) * | 2007-06-28 | 2009-03-05 | Microsoft Corp | Efficient image representation by edges and low-resolution signal |
US8116581B2 (en) | 2007-06-28 | 2012-02-14 | Microsoft Corporation | Efficient image representation by edges and low-resolution signal |
JP2011511597A (en) * | 2008-02-05 | 2011-04-07 | トムソン ライセンシング | Method and apparatus for implicit block partitioning in video encoding and decoding |
US8953679B2 (en) | 2008-02-05 | 2015-02-10 | Thomson Licensing | Methods and apparatus for implicit block segmentation in video encoding and decoding |
WO2010035403A1 (en) * | 2008-09-25 | 2010-04-01 | パナソニック株式会社 | Filter device and filter method |
WO2011049119A1 (en) * | 2009-10-20 | 2011-04-28 | シャープ株式会社 | Moving image coding device, moving image decoding device, moving image coding/decoding system, moving image coding method and moving image decoding method |
JP5562346B2 (en) * | 2009-10-20 | 2014-07-30 | シャープ株式会社 | Moving picture encoding apparatus, moving picture decoding apparatus, moving picture encoding method, and moving picture decoding method |
EA027182B1 (en) * | 2009-10-20 | 2017-06-30 | Шарп Кабусики Кайся | Moving image coding device, moving image decoding device, moving image coding/decoding system, moving image coding method and moving image decoding method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102126886B1 (en) | Decomposition of residual data during signal encoding, decoding and reconstruction in a tiered hierarchy | |
JP3788823B2 (en) | Moving picture encoding apparatus and moving picture decoding apparatus | |
Kim et al. | Hierarchical prediction and context adaptive coding for lossless color image compression | |
US9420279B2 (en) | Rate control method for multi-layered video coding, and video encoding apparatus and video signal processing apparatus using the rate control method | |
US10531094B2 (en) | Image processing device and moving image transmission method | |
TWI436286B (en) | Method and apparatus for decoding image | |
JP2001326936A (en) | Image encoding device and method | |
JP6042899B2 (en) | Video encoding method and device, video decoding method and device, program and recording medium thereof | |
JP2006229411A (en) | Image decoder and image decoding method | |
WO2008072500A1 (en) | Dynamic image encoding device and dynamic image decoding device | |
JPH08294119A (en) | Image coder/decoder | |
JP2006246351A (en) | Image coding unit and image decoding unit | |
JP2007174569A (en) | Encoding method | |
JP2007151062A (en) | Image encoding device, image decoding device and image processing system | |
US6876771B2 (en) | Efficiently adaptive double pyramidal coding | |
JP2006129248A (en) | Image encoding and decoding method and apparatus thereof | |
JP4749508B2 (en) | Image decoding method | |
JP2018032913A (en) | Video encoder, program and method, and video decoder, program and method, and video transmission system | |
JP3899737B2 (en) | Image coding apparatus and method | |
JP4522951B2 (en) | Moving picture encoding method and apparatus, decoding method and apparatus, moving picture processing program, and computer-readable recording medium | |
JP4667424B2 (en) | Image decoding device | |
JP4195978B2 (en) | Video signal encoding apparatus and method, and recording medium | |
JP4667423B2 (en) | Image decoding device | |
JP2001238220A (en) | Moving picture coding apparatus and moving picture coding method | |
JP3869303B2 (en) | Image decoding method and apparatus |