通過成像技術獲得的高光譜數據是一個三維數據立方體,根據高光譜圖像的特點,通過圖像空間表示方式、光譜空間表示方式和特征空間表示方式表示高光譜數據。在實際應用中,我們根據不同的數據處理要求,選用相應數據的表示方式。
高光譜圖像數據三種描述模型
(1)圖像模型表達方式:針對某一光譜波段,描述高光譜數據中的每個像元在圖像中的位置及它與鄰近像元之間的相互關系。該表達方式符合人類視覺特征,能夠形象的表述地物分布情況,為高光譜數據分析提供像元空間信息。
(2)光譜模型表達方式:高光譜遙感圖像中的每個像元包含多通道的連續光譜輻射信息,描述類別光譜響應與波長之間的對應關系。
(3)特征模型表達方式:在一個多維空間中,將高光譜數據中的像元表示為與之空間坐標相對應的點的集合,高光譜數據中每個像元由一個N維向量表示,能夠有效地體現地物類別之間的可分性。因此,在高光譜圖像分類中數據多采用特征空間描述方式。高光譜遙感圖像具有的大量光譜波段,為地物信息提取提供了豐富的信息,有助于地物更加精細的分類和目標識別。但是高光譜圖像波段較多,相鄰波段之間存在著重疊具有一定的相關性,這就使得高光譜數據在一定程度上存在冗余現象,提高數據處理的復雜性。具體表現在:
(1)相對龐大的數據:高光譜圖像包含上百個波段,使得數據在儲存,處理過程中的復雜性增加;
(2)數據計算量增加,為降低計算機的計算復雜度需要對數據進行預處理;
(3)樣本個數有限。而光譜波段數量相對來說較少,因此得到地物參數統計誤差相對較大,以分類問為例,高精度的分類結果往往建立在大量的樣本統計規律之上[l]。
因此,對高維度數據進行特征信息提取之前,需要對數據進行降維處理,用較少的綜合變量來代替原來較多的變量,同時綜合變量要盡可能多的反映原來多變量包含的信息。高光譜數據降維是以簡化數據量、優化圖像特征為目的,獲得的新的特征信息,利用低維數據來有效地表達高維數據的信息,使其能更好地反應對象本質,適合分類器的處理。
目前高光譜數據波段降維主要有兩種途徑:一是從許多波段中挑選感興趣的若干波段,即波段選擇;二是利用所有波段,通過數學變換來壓縮數據,常用的如主成分分析法(PCA)等。波段選擇和特征提取主要基于光譜特征、空間特征或者兩者結合的光譜空間特征,既可以對特定地物或像元進行光譜維特征挖掘,又可以從圖像空間維和光譜維進行綜合挖掘。