-
當前位置:首頁 > 創(chuàng)意學院 > 技術(shù) > 專題列表 > 正文
對圖像處理的認識(對圖像處理的認識,從圖像處理應用來看)
大家好!今天讓創(chuàng)意嶺的小編來大家介紹下關(guān)于對圖像處理的認識的問題,以下是小編對此問題的歸納整理,讓我們一起來看看吧。
開始之前先推薦一個非常厲害的Ai人工智能工具,一鍵生成原創(chuàng)文章、方案、文案、工作計劃、工作報告、論文、代碼、作文、做題和對話答疑等等
只需要輸入關(guān)鍵詞,就能返回你想要的內(nèi)容,越精準,寫出的就越詳細,有微信小程序端、在線網(wǎng)頁版、PC客戶端
官網(wǎng):https://ai.de1919.com。
創(chuàng)意嶺作為行業(yè)內(nèi)優(yōu)秀的企業(yè),服務客戶遍布全球各地,如需了解SEO相關(guān)業(yè)務請撥打電話175-8598-2043,或添加微信:1454722008
本文目錄:
一、淺談對遙感數(shù)字圖像處理的理解、認識、想法、看法
理解:數(shù)字圖像處理(Digital Image Processing)又稱為計算機圖像處理,它是指將圖像信號轉(zhuǎn)換成數(shù)字信號并利用 數(shù)字圖像處理
計算機對其進行處理的過程。數(shù)字圖像處理最早出現(xiàn)于20世紀50年代,當時的電子計算機已經(jīng)發(fā)展到一定水平,人們開始利用計算機來處理圖形和圖像信息。數(shù)字圖像處理作為一門學科大約形成于20世紀60年代初期。早期的圖像處理的目的是改善圖像的質(zhì)量,它以人為對象,以改善人的視覺效果為目的。圖像處理中,輸入的是質(zhì)量低的圖像,輸出的是改善質(zhì)量后的圖像,常用的圖像處理方法有圖像增強、復原、編碼、壓縮等。首次獲得實際成功應用的是美國噴氣推進實驗室(JPL)。他們對航天探測器徘徊者7號在1964年發(fā)回的幾千張月球照片使用了圖像處理技術(shù),如幾何校正、灰度變換、去除噪聲等方法進行處理,并考慮了太陽位置和月球環(huán)境的影響,由計算機成功地繪制出月球表面地圖,獲得了巨大的成功。隨后又對探測飛船發(fā)回的近十萬張照片進行更為復雜的圖像處理,以致獲得了月球的地形圖、彩色圖及全景鑲嵌圖,獲得了非凡的成果,為人類登月創(chuàng)舉奠定了堅實的基礎,也推動了數(shù)字圖像處理這門學科的誕生。在以后的 數(shù)字圖像處理技術(shù)
宇航空間技術(shù),如對火星、土星等星球的探測研究中,數(shù)字圖像處理技術(shù)都發(fā)揮了巨大的作用。數(shù)字圖像處理取得的另一個巨大成就是在醫(yī)學上獲得的成果。1972年英國EMI公司工程師Housfield發(fā)明了用于頭顱診斷的X射線計算機斷層攝影裝置,也就是我們通常所說的CT(Computer Tomograph)。CT的基本方法是根據(jù)人的頭部截面的投影,經(jīng)計算機處理來重建截面圖像,稱為圖像重建。1975年EMI公司又成功研制出全身用的CT裝置,獲得了人體各個部位鮮明清晰的斷層圖像。1979年,這項無損傷診斷技術(shù)獲得了諾貝爾獎,說明它對人類作出了劃時代的貢獻。與此同時,圖像處理技術(shù)在許多應用領(lǐng)域受到廣泛重視并取得了重大的開拓性成就,屬于這些領(lǐng)域的有航空航天、生物醫(yī)學工程、工業(yè)檢測、機器人視覺、公安司法、軍事制導、文化藝術(shù)等,使圖像處理成為一門引人注目、前景遠大的新型學科。隨著圖像處理技術(shù)的深入發(fā)展,從70年代中期開始,隨著計算機技術(shù)和人工智能、思維科學研究的迅速發(fā)展,數(shù)字圖像處理向更高、更深層次發(fā)展。人們已開始研究如何用計算機系統(tǒng)解釋圖像,實現(xiàn)類似人類視覺系統(tǒng)理解外部世界,這被稱為圖像理解或計算機視覺。很多國家,特別是發(fā)達國家投入更多的人力、物力到這項研究,取得了不少重要的研究成果。其中代表性的成果是70年代末MIT的Marr提出的視覺計算理論,這個理論成為計算機視覺領(lǐng)域其后十多年的主導思想。圖像理解雖然在理論方法研究上已取得不小的進展,但它本身是一個比較難的研究領(lǐng)域,存在不少困難,因人類本身對自己的視覺過程還了解甚少,因此計算機視覺是一個有待人們進一步探索的新領(lǐng)域。
想法:數(shù)字圖像處理主要研究的內(nèi)容有以下幾個方面: 1) 圖像變換由于圖像陣列很大,直接在空間域中進行處理,涉及計算量很大。因此,往往采用各種圖像變換的方法,如傅立葉變換、沃爾什變換、離散余弦變換等間接處理技術(shù),將空間域的處理轉(zhuǎn)換為變換域處理,不僅可減少計算量,而且可獲得更有效的處理(如傅立葉變換可在頻域中進行數(shù)字濾波處理)。目前新興研究的小波變換在時域和頻域中都具有良好的局部化特性,它在圖像處理中也有著廣泛而有效的應用。 2) 圖像編碼壓縮圖像編碼壓縮技術(shù)可減少描述圖像的數(shù)據(jù)量(即比特數(shù)),以便節(jié)省圖像傳輸、處理時間和減少所占用的存儲器容量。壓縮可以在不失真的前提下獲得,也可以在允許的失真條件下進行。編碼是壓縮技術(shù)中最重要的方法,它在圖像處理技術(shù)中是發(fā)展最早且比較成熟的技術(shù)。 3) 圖像增強和復原圖像增強和復原的目的是為了提高圖像的質(zhì)量,如去除噪聲,提高圖像的清晰度等。圖像增強不考慮圖像降質(zhì)的原因,突出圖像中所感興趣的部分。如強化圖像高頻分量,可使圖像中物體輪廓清晰,細節(jié)明顯;如強化低頻分量可減少圖像中噪聲影響。圖像復原要求對圖像降質(zhì)的原因有一定的了解,一般講應根據(jù)降質(zhì)過程建立"降質(zhì)模型",再采用某種濾波方法,恢復或重建原來的圖像。 4) 圖像分割圖像分割是數(shù)字圖像處理中的關(guān)鍵技術(shù)之一。圖像分割是將圖像中有意義的特征部分提取出來,其有意義的特征有圖像中的邊緣、區(qū)域等,這是進一步進行圖像識別、分析和理解的基礎。雖然目前已研究出不少邊緣提取、區(qū)域分割的方法,但還沒有一種普遍適用于各種圖像的有效方法。因此,對圖像分割的研究還在不斷深入之中,是目前圖像處理中研究的熱點之一。 5) 圖像描述圖像描述是圖像識別和理解的必要前提。作為最簡單的二值圖像可采用其幾何特性描述物體的特性,一般圖像的描述方法采用二維形狀描述,它有邊界描述和區(qū)域描述兩類方法。對于特殊的紋理圖像可采用二維紋理特征描述。隨著圖像處理研究的深入發(fā)展,已經(jīng)開始進行三維物體描述的研究,提出了體積描述、表面描述、廣義圓柱體描述等方法。 6) 圖像分類(識別)圖像分類(識別)屬于模式識別的范疇,其主要內(nèi)容是圖像經(jīng)過某些預處理(增強、復原、壓縮)后,進行圖像分割和特征提取,從而進行判決分類。圖像分類常采用經(jīng)典的模式識別方法,有統(tǒng)計模式分類和句法(結(jié)構(gòu))模式分類,近年來新發(fā)展起來的模糊模式識別和人工神經(jīng)網(wǎng)絡模式分類在圖像識別中也越來越受到重視。
1)圖像變換:由于圖像陣列很大,直接在空間域中進行處理,涉及計算量很大。因此,往往采用各種圖像變換的方法,如傅立葉變換、沃爾什變換、離散余弦變換等間接處理技術(shù),將空間域的處理轉(zhuǎn)換為變換域處理,不僅可減少計算量,而且可獲得更有效的處理(如傅立葉變換可在頻域中進行數(shù)字濾波處理)。目前新興研究的小波變換在時域和頻域中都具有良好的局部化特性,它在圖像處理中也有著廣泛而有效的應用。 2 )圖像編碼壓縮:圖像編碼壓縮技術(shù)可減少描述圖像的數(shù)據(jù)量(即比特數(shù)),以便節(jié)省圖像傳輸、處理時間和減少所占用的存儲器容量。壓縮可以在不失真的前提下獲得,也可以在允許的失真條件下進行。編碼是壓縮技術(shù)中最重要的方法,它在圖像處理技術(shù)中是發(fā)展最早且比較成熟的技術(shù)。 3 )圖像增強和復原:圖像增強和復原的目的是為了提高圖像的質(zhì)量,如去除噪聲,提高圖像的清晰度等。圖像增強不考慮圖像降質(zhì)的原因,突出圖像中所感興趣的部分。如強化圖像高頻分量,可使圖像中物體輪廓清晰,細節(jié)明顯;如強化低頻分量可減少圖像中噪聲影響。圖像復原要求對圖像降質(zhì)的原因有一定的了解,一般講應根據(jù)降質(zhì)過程建立“降質(zhì)模型”,再采用某種濾波方法,恢復或重建原來的圖像。 4 )圖像分割:圖像分割是數(shù)字圖像處理中的關(guān)鍵技術(shù)之一。圖像分割是將圖像中有意義的特征部分提取出來,其有意義的特征有圖像中的邊緣、區(qū)域等,這是進一步進行圖像識別、分析和理解的基礎。雖然目前已研究出不少邊緣提取、區(qū)域分割的方法,但還沒有一種普遍適用于各種圖像的有效方法。因此,對圖像分割的研究還在不斷深入之中,是目前圖像處理中研究的熱點之一。 5 )圖像描述:圖像描述是圖像識別和理解的必要前提。作為最簡單的二值圖像可采用其幾何特性描述物體的特性,一般圖像的描述方法采用二維形狀描述,它有邊界描述和區(qū)域描述兩類方法。對于特殊的紋理圖像可采用二維紋理特征描述。隨著圖像處理研究的深入發(fā)展,已經(jīng)開始進行三維物體描述的研究,提出了體積描述、表面描述、廣義圓柱體描述等方法。 6 )圖像分類(識別):圖像分類(識別)屬于模式識別的范疇,其主要內(nèi)容是圖像經(jīng)過某些預處理(增強、復原、壓縮)后,進行圖像分割和特征提取,從而進行判決分類。圖像分類常采用經(jīng)典的模式識別方法,有統(tǒng)計模式分類和句法(結(jié)構(gòu))模式分類,近年來新發(fā)展起來的模糊模式識別和人工神經(jīng)網(wǎng)絡模式分類在圖像識別中也越來越受到重視。
看法:
二、圖像分類和圖像處理的區(qū)別
主要內(nèi)容:
圖像處理
圖像分類
一、圖像處理
1 圖像的起源
1.1 圖像是什么
圖像是人類視覺的基礎,是自然景物的客觀反映,是人類認識世界和人類本身的重要源泉。
“圖”是物體反射或透射光的分布。
“像“是人的視覺系統(tǒng)所接受的圖在人腦中所形版的印象或認識,照片、繪畫、剪貼畫、地圖、書法作品、手寫漢學、傳真、衛(wèi)星云圖、影視畫面、X光片、腦電圖、心電圖等都是圖像?!γ? 數(shù)字圖像處理:機械工業(yè)出版社,2014年。
1.2 模擬圖像和數(shù)字圖像
圖像起源于1826年前后法國科學家Joseph Nicéphore Niépce發(fā)明的第一張可永久保存的照片,屬于模擬圖像。模擬圖像又稱連續(xù)圖像,它通過某種物理量(如光、電等)的強弱變化來記錄圖像亮度信息,所以是連續(xù)變換的。模擬信號的特點是容易受干擾,如今已經(jīng)基本全面被數(shù)字圖像替代。
在第一次世界大戰(zhàn)后,1921年美國科學家發(fā)明了Bartlane System,并從倫敦傳到紐約傳輸了第一幅數(shù)字圖像,其亮度用離散數(shù)值表示,將圖片編碼成5個灰度級,如下圖所示,通過海底電纜進行傳輸。在發(fā)送端圖片被編碼并使用打孔帶記錄,通過系統(tǒng)傳輸后在接收方使用特殊的打印機恢復成圖像。
1950年左右,計算機被發(fā)明,數(shù)字圖像處理學科正式誕生。
模擬圖像和數(shù)字圖像的對比,我們可以看一下:
2 數(shù)字圖像的表示
2.1 位數(shù)
計算機采用0/1編碼的系統(tǒng),數(shù)字圖像也是利用0/1來記錄信息,我們平常接觸的圖像都是8位數(shù)圖像,包含0~255灰度,其中0,代表最黑,1,表示最白。
人眼對灰度更敏感一些,在16位到32位之間。
二、 圖像的分類
二值圖像:
一幅二值圖像的二維矩陣僅由0、1兩個值構(gòu)成,“0”代表黑色,“1”代白色。由于每一像素(矩陣中每一元素)取值僅有0、1兩種可能,所以計算機中二值圖像的數(shù)據(jù)類型通常為1個二進制位。二值圖像通常用于文字、線條圖的掃描識別(OCR)和掩膜圖像的存儲。
灰度圖:
每個像素只有一個采樣顏色的圖像,這類圖像通常顯示為從最暗黑色到最亮的白色的灰度,盡管理論上這個采樣可以任何顏色的不同深淺,甚至可以是不同亮度上的不同顏色?;叶葓D像與黑白圖像不同,在計算機圖像領(lǐng)域中黑白圖像只有黑色與白色兩種顏色;但是,灰度圖像在黑色與白色之間還有許多級的顏色深度。灰度圖像經(jīng)常是在單個電磁波頻譜如可見光內(nèi)測量每個像素的亮度得到的,用于顯示的灰度圖像通常用每個采樣像素8位的非線性尺度來保存,這樣可以有256級灰度(如果用16位,則有65536級)。
彩色圖:
每個像素通常是由紅(R)、綠(G)、藍(B)三個分量來表示的,分量介于(0,255)。RGB圖像與索引圖像一樣都可以用來表示彩色圖像。與索引圖像一樣,它分別用紅(R)、綠(G)、藍(B)三原色的組合來表示每個像素的顏色。但與索引圖像不同的是,RGB圖像每一個像素的顏色值(由RGB三原色表示)直接存放在圖像矩陣中,由于每一像素的顏色需由R、G、B三個分量來表示,M、N分別表示圖像的行列數(shù),三個M x N的二維矩陣分別表示各個像素的R、G、B三個顏色分量。RGB圖像的數(shù)據(jù)類型一般為8位無符號整形,通常用于表示和存放真彩色圖像。
三、圖像處理能幫我們做什么
通常我們拍下的照片后,會受到相機性能的限制而不能滿足我們對照片的效果要求,這時就會通過圖像處理軟件來實現(xiàn)一些彌補照片缺陷的功能,那么圖像處理軟件能幫我們做什么呢,以下詳解。
方法/步驟
美化圖片,可以將圖片的光線、色澤調(diào)節(jié)到最好的樣子。
人像美容,可以美白、調(diào)節(jié)光線、修眉毛等。
拼圖,可以幫助我們將很多喜歡的圖片整合在一張圖片上,做成照片墻來使用。
動畫功能,可以增加多張圖片高速翻動形成的GIF動畫效果,或添加一些動畫效果在圖片上。
四、數(shù)字圖像處理的三個層次是什么?它們各自處理的對象和輸出的結(jié)果有什么不同
數(shù)字圖像處理分為三個層次:
低級圖像處理、
中級圖像處理和高級圖像處理。
(1)低級圖像處理內(nèi)容:主要對圖象進行各種加工以改善圖象的視覺效果、或突出有用信息,并為自動識別打基礎,或通過編碼以減少對其所需存儲空間、傳輸時間或傳輸帶寬的要求。
特點:輸入是圖像,輸出也是圖像,即圖像之間進行的變換。
(2)中級圖像處理
內(nèi)容:主要對圖像中感興趣的目標進行檢測(或分割)和測量,以獲得它們的客觀信息從而建立對圖像的描述。
特點:輸入是圖像,輸出是數(shù)據(jù)。
(3)高級圖像處理
內(nèi)容:在中級圖像處理的基礎上,進一步研究圖像中各目標的性質(zhì)和它們之間相互的聯(lián)系,并得出對圖像內(nèi)容含義的理解(對象識別)及對原來客觀場景的解釋(計算機視覺),從而指導和規(guī)劃行動。
特點:
以客觀世界為中心,借助知識、經(jīng)驗等來把握整個客觀世界。“輸入是數(shù)據(jù),輸出是理解
以上就是關(guān)于對圖像處理的認識相關(guān)問題的回答。希望能幫到你,如有更多相關(guān)問題,您也可以聯(lián)系我們的客服進行咨詢,客服也會為您講解更多精彩的知識和內(nèi)容。
推薦閱讀:
對圖形創(chuàng)意的理解(對圖形創(chuàng)意的理解300字)