本發明涉及圖像數據編碼和解碼技術,并且更具體地,涉及用于對現實媒體服務的360度圖像進行編碼和解碼的方法和裝置。
背景技術:
1、隨著互聯網和移動終端的普及以及信息和通信技術的發展,多媒體數據的使用正在迅速增加。近來,在各種領域中出現了對諸如高清晰度(hd)圖像和超高清晰度(uhd)圖像的高質量圖像和高分辨率圖像的需求,并且對諸如虛擬現實、增強現實等的現實媒體服務的需求也正在迅速增加。具體地,由于用多個攝像裝置捕獲的多視圖圖像被處理用于虛擬現實和增強現實的360度圖像,因此針對處理生成的數據量大量增加,但是圖像處理系統的用于處理大量數據的性能不足。
2、如上所述,在現有技術的圖像編碼和解碼方法和裝置中,需要改進圖像處理方面的性能,特別是圖像編碼/解碼方面的性能。
技術實現思路
1、技術問題
2、本發明的目的是提供一種用于改進用于編碼和解碼的初始步驟中的圖像設置處理的方法。更具體地,本發明旨在提供一種用于在考慮360度圖像的特性的情況下改進圖像設置處理的編碼和解碼方法和裝置。
3、技術解決方案
4、根據本發明的一方面,提供了一種對360度圖像進行解碼的方法。
5、此處,對360度圖像進行解碼的方法可以包括:接收包括編碼的360度圖像的比特流;參考從所接收到的比特流獲取的語法信息來生成預測圖像;通過將所生成預測圖像與通過對比特流進行逆量化和逆變換所獲取的殘差圖像進行組合來獲取解碼圖像;以及根據投影格式將解碼圖像重構成360度圖像。
6、此處,語法信息可以包括360度圖像的投影格式信息。
7、此處,投影格式信息可以是指示以下中至少之一的信息:360度圖像被投影到2d平面中的等矩形投影(erp,equi-rectangular?projection)格式;360度圖像投影被投影到立方體的立方體映射投影(cmp,cubemap?projection)格式;360度圖像投影到八面體的八面體投影(ohp,octahedron?projection)格式;以及360度圖像被投影到多面體的二十面體投影(isp,icosahedral?projection)格式。
8、此處,重構可以包括:參考語法信息根據區域式打包來獲取排列信息;以及根據排列信息來重排解碼圖像的塊。
9、此處,預測圖像的生成可以包括:對通過恢復比特流獲取的參考圖片執行圖像擴展;以及參考被執行圖像擴展的參考圖片來生成預測圖像。
10、此處,執行圖像擴展可以包括:基于參考圖片的劃分單元來執行圖像擴展。
11、此處,基于劃分單元來執行圖像擴展可以包括:通過使用劃分單元的參考像素針對每個劃分單元單獨地生成擴展區域。
12、此處,可以使用與要擴展的劃分單元在空間上相鄰的劃分單元的邊界像素或使用與要擴展的劃分單元具有圖像連續性的劃分單元的邊界像素來生成擴展區域。
13、此處,基于劃分單元來執行圖像擴展可以包括:使用組合有劃分單元中的在空間上彼此相鄰的兩個或更多個劃分單元的區域的邊界像素,來生成組合區域的擴展圖像。
14、此處,基于劃分單元來執行圖像擴展可以包括:使用劃分單元中的在空間上彼此相鄰的劃分單元的所有相鄰像素信息,生成相鄰劃分單元之間的擴展區域。
15、此處,基于劃分單元來執行圖像擴展可以包括:使用在空間上相鄰的劃分單元的相鄰像素的平均值來生成擴展區域。
16、根據本發明的另一方面,提供了一種由圖像解碼裝置執行的對360度圖像進行解碼的方法,所述方法包括:接收所述360度圖像被編碼在其中的比特流,所述比特流包括擴展的二維圖像的數據,所述擴展的二維圖像包括二維圖像和預定擴展區域,并且所述二維圖像是從具有三維投影結構的圖像投影而得并包括一個或多個面;通過基于所述比特流中包括的關于預測的信息執行預測來生成預測圖像;以及基于所述預測圖像和殘差圖像重構所述擴展的二維圖像,其中,所述擴展區域的尺寸基于所述面的左側的所述擴展區域的第一寬度信息和所述面的右側的所述擴展區域的第二寬度信息來確定,所述第一寬度信息和所述第二寬度信息均是從所述比特流獲得的,其中,所述第一寬度信息和所述第二寬度信息均是基于所述擴展區域是否存在而獲得的,并且所述擴展區域是否存在是通過從所述比特流獲得的標記信息來確定的,其中,所述擴展區域的樣本值是通過根據從多種填補方法中選擇的填補方法水平復制所述面的樣本值來確定的,其中,所述擴展區域的尺寸是基于從所述比特流獲得的尺寸信息來確定的,其中,所述預測圖像與所述殘差圖像相加以重構所述擴展的二維圖像,其中,用于所述尺寸信息的語法元素的數量基于所述三維投影結構的投影格式來不同地確定,所述投影格式是多種投影格式之一,所述多種投影格式包括所述360度圖像被投影到二維平面上的erp格式和所述360度圖像被投影到立方體上的cmp格式,其中,所述殘差圖像是通過對所述比特流中包括的殘差信息進行解碼而獲得的,其中,所述三維投影結構是基于標識信息在多種預定義的投影格式中選擇性地確定的,所述多種預定義的投影格式包括所述360度圖像被投影到二維平面上的erp格式和所述360度圖像被投影到立方體上的cmp格式,其中,所述擴展區域的樣本值是根據從所述多種填補方法中選擇的填補方法不同地確定的,所述填補方法針對所述一個或多個面中的每個面彼此獨立地確定,以及所述尺寸信息被限制為根據所述二維圖像的顏色格式指示偶數個亮度樣本。
17、根據本發明的另一方面,提供了一種由圖像編碼裝置執行的對360度圖像進行編碼的方法,所述方法包括:獲得從具有三維投影結構的圖像投影而得并包括至少一個面的二維圖像;獲得包括所述二維圖像和預定擴展區域的擴展的二維圖像;通過執行預測來生成預測圖像,關于所述預測的信息被編碼到比特流中;以及基于所述預測圖像和殘差圖像,將所述擴展的二維圖像的數據編碼到所述比特流中,其中,所述擴展區域的尺寸基于所述面的左側的所述擴展區域的第一寬度信息和所述面的右側的所述擴展區域的第二寬度信息來編碼,所述第一寬度信息和所述第二寬度信息均被編碼到所述比特流中,其中,所述第一寬度信息和所述第二寬度信息均基于所述擴展區域是否存在來編碼,并且所述擴展區域是否存在是通過被編碼到所述比特流中的標記信息來編碼的,其中,所述擴展區域的樣本值是通過根據從多種填補方法中選擇的填補方法水平復制所述面的樣本值來確定的,其中,關于所述擴展區域的尺寸的尺寸信息被編碼到所述比特流中,其中,所述殘差圖像是基于所述擴展的二維圖像和所述預測圖像來獲得的,其中,用于所述尺寸信息的語法元素的數量基于所述三維投影結構的投影格式來不同地確定,所述投影格式是多種投影格式之一,所述多種投影格式包括所述360度圖像被投影到二維平面上的erp格式和所述360度圖像被投影到立方體上的cmp格式,其中,通過對所述殘差圖像進行編碼將殘差信息包括在所述比特流中,其中,所述三維投影結構是基于標識信息在多種預定義的投影格式中選擇性地確定的,所述多種預定義的投影格式包括所述360度圖像被投影到二維平面上的erp格式和所述360度圖像被投影到立方體上的cmp格式,其中,所述擴展區域的樣本值根據從所述多種填補方法中選擇的填補方法不同地確定,所述填補方法針對所述一個或多個面中的每個面彼此獨立地確定,以及所述尺寸信息被限制為根據所述二維圖像的顏色格式指示偶數個亮度樣本。
18、根據本發明的另一方面,提供了一種由傳送裝置執行的傳送比特流的方法,包括:將所述比特流傳送到圖像解碼裝置,其中,所述比特流是通過執行以下步驟生成的:獲得從具有三維投影結構的圖像投影而得并包括至少一個面的二維圖像;獲得包括所述二維圖像和預定擴展區域的擴展的二維圖像;通過執行預測來生成預測圖像,關于所述預測的信息被編碼到比特流中;以及基于所述預測圖像和殘差圖像,將所述擴展的二維圖像的數據編碼到所述比特流中,其中,所述擴展區域的尺寸基于所述面的左側的所述擴展區域的第一寬度信息和所述面的右側的所述擴展區域的第二寬度信息來編碼,所述第一寬度信息和所述第二寬度信息均被編碼到所述比特流中,其中,所述第一寬度信息和所述第二寬度信息均基于所述擴展區域是否存在來編碼,并且所述擴展區域是否存在是通過被編碼到所述比特流中的標記信息來編碼的,其中,所述擴展區域的樣本值是通過根據從多種填補方法中選擇的填補方法水平復制所述面的樣本值來確定的,其中,關于所述擴展區域的尺寸的尺寸信息被編碼到所述比特流中,其中,所述殘差圖像是基于所述擴展的二維圖像和所述預測圖像來獲得的,其中,用于所述尺寸信息的語法元素的數量基于所述三維投影結構的投影格式來不同地確定,所述投影格式是多種投影格式之一,所述多種投影格式包括所述360度圖像被投影到二維平面上的erp格式和所述360度圖像被投影到立方體上的cmp格式,其中,通過對所述殘差圖像進行編碼將殘差信息包括在所述比特流中,其中,所述三維投影結構是基于標識信息在多種預定義的投影格式中選擇性地確定的,所述多種預定義的投影格式包括所述360度圖像被投影到二維平面上的erp格式和所述360度圖像被投影到立方體上的cmp格式,其中,所述擴展區域的樣本值根據從所述多種填補方法中選擇的填補方法不同地確定,所述填補方法針對所述一個或多個面中的每個面彼此獨立地確定,以及所述尺寸信息被限制為根據所述二維圖像的顏色格式指示偶數個亮度樣本。
19、本發明的有益效果
20、利用根據本發明的實施方式的圖像編碼/解碼方法和裝置,可以增強壓縮性能。特別地,對于360度圖像,可以增強壓縮性能。