-
當前位置:首頁 > 創(chuàng)意學院 > 技術(shù) > 專題列表 > 正文
快照用于以下哪些場景(快照用于以下哪些場景中)
大家好!今天讓創(chuàng)意嶺的小編來大家介紹下關(guān)于快照用于以下哪些場景的問題,以下是小編對此問題的歸納整理,讓我們一起來看看吧。
開始之前先推薦一個非常厲害的Ai人工智能工具,一鍵生成原創(chuàng)文章、方案、文案、工作計劃、工作報告、論文、代碼、作文、做題和對話答疑等等
只需要輸入關(guān)鍵詞,就能返回你想要的內(nèi)容,越精準,寫出的就越詳細,有微信小程序端、在線網(wǎng)頁版、PC客戶端
官網(wǎng):https://ai.de1919.com。
創(chuàng)意嶺作為行業(yè)內(nèi)優(yōu)秀的企業(yè),服務(wù)客戶遍布全球各地,如需了解SEO相關(guān)業(yè)務(wù)請撥打電話175-8598-2043,或添加微信:1454722008
本文目錄:
一、百度快照具體怎么運用?跪求具體答案,謝
如果無法打開某個搜索結(jié)果,或者打開速度特別慢,該怎么辦?“百度快照”能幫您解決問題。每個被收錄的網(wǎng)頁,在百度上都存有一個純文本的備份,稱為“百度快照”。百度速度較快,您可以通過“快照”快速瀏覽頁面內(nèi)容。 不過,百度只保留文本內(nèi)容,所以,那些圖片、音樂等非文本信息,快照頁面還是直接從原網(wǎng)頁調(diào)用。如果您無法連接原網(wǎng)頁,那么快照上的圖片等非文本內(nèi)容,會無法顯示。
二、百度快照的使用
1、使用多個詞語搜索:
輸入多個詞語搜索(不同字詞之間用一個空格隔開),可以獲得更精確的搜索結(jié)果。
例如:想了解上海人民公園的相關(guān)信息,在搜索框中輸入 [上海 人民公園] 獲得的搜索效果會比輸入 [人民公園] 得到的結(jié)果更好。
2、百度快照:
如果無法打開某個搜索結(jié)果,或者打開速度特別慢,該怎么辦?“百度快照”能幫您解決問題。每個被收錄的網(wǎng)頁,在百度上都存有一個純文本的備份,稱為“百度快照”。百度速度較快,您可以通過“快照”快速瀏覽頁面內(nèi)容。 不過,百度只保留文本內(nèi)容,所以,那些圖片、音樂等非文本信息,快照頁面還是直接從原網(wǎng)頁調(diào)用。如果您無法連接原網(wǎng)頁,那么快照上的圖片等非文本內(nèi)容,會無法顯示。
下面是搜索“金庸”的一個結(jié)果摘要,請點擊右下角的“百度快照”鏈接,感受一下百度快照帶來的便利!
其他的搜索引擎也有類似的功能,非常有幫助。
3、選擇適當?shù)牟樵冊~:
搜索技巧,最基本同時也是最有效的,就是選擇合適的查詢詞。選擇查詢詞是一種經(jīng)驗積累,在一定程度上也有章可循:
表述準確 百度會嚴格按照您提交的查詢詞去搜索,因此,查詢詞表述準確是獲得良好搜索結(jié)果的必要前提。
一類常見的表述不準確情況是,腦袋里想著一回事,搜索框里輸入的是另一回事。
例如,要查找2004年國內(nèi)十大新聞,查詢詞可以是“2004年國內(nèi)十大新聞”;但如果把查詢詞換成“2004年國內(nèi)十大事件”,搜索結(jié)果就沒有能滿足需求的了。
4、另一類典型的表述不準確,是查詢詞中包含錯別字。
例如,要查找林心如的寫真圖片,用“林心如寫真”,當然是沒什么問題;但如果寫錯了字,變成“林心茹寫真”,搜索結(jié)果質(zhì)量就差得遠了。
不過好在,百度對于用戶常見的錯別字輸入,有糾錯提示。您若輸入“林心茹寫真”,在搜索結(jié)果上方,會提示“您要找的是不是: 林心如寫真”。
查詢詞的主題關(guān)聯(lián)與簡練 目前的搜索引擎并不能很好的處理自然語言。因此,在提交搜索請求時,您最好把自己的想法,提煉成簡單的,而且與希望找到的信息內(nèi)容主題關(guān)聯(lián)的查詢詞。
還是用實際例子說明。某三年級小學生,想查一些關(guān)于時間的名人名言,他的查詢詞是“小學三年級關(guān)于時間的名人名言”。
這個查詢詞很完整的體現(xiàn)了搜索者的搜索意圖,但效果并不好。
絕大多數(shù)名人名言,并不規(guī)定是針對幾年級的,因此,“小學三年級”事實上和主題無關(guān),會使得搜索引擎丟掉大量不含“小學三年級”,但非常有價值的信息;“關(guān)于”也是一個與名人名言本身沒有關(guān)系的詞,多一個這樣的詞,又會減少很多有價值信息;“時間的名人名言”,其中的“的”也不是一個必要的詞,會對搜索結(jié)果產(chǎn)生干擾;“名人名言”,名言通常就是名人留下來的,在名言前加上名人,是一種不必要的重復(fù)。
因此,最好的查詢詞,應(yīng)該是“時間名言”。
5、試著找出下述查詢詞的問題,并想出更好的能滿足搜索需求的查詢詞:
所得稅會計處理問題探討
周星馳個人檔案和所拍的電影
根據(jù)網(wǎng)頁特征選擇查詢詞 很多類型的網(wǎng)頁都有某種相似的特征。例如,小說網(wǎng)頁,通常都有一個目錄頁,小說名稱一般出現(xiàn)在網(wǎng)頁標題中,而頁面上通常有“目錄”兩個字,點擊頁面上的鏈接,就進入具體的章節(jié)頁,章節(jié)頁的標題是小說章節(jié)名稱;軟件下載頁,通常軟件名稱在網(wǎng)頁標題中,網(wǎng)頁正文有下載鏈接,并且會出現(xiàn)“下載”這個詞。等等。
經(jīng)常的搜索,并且總結(jié)各類網(wǎng)頁的特征現(xiàn)象,并應(yīng)用查詢詞的選擇中,就會使得搜索變得準確而高效。
例如,找明星的個人資料頁。一般來說,明星資料頁的標題,通常是明星的名字,而在頁面上,會有“姓名”、“身高”等詞語出現(xiàn)。比如找林青霞的個人資料,就可以用“林青霞 姓名 身高”來查詢。而由于明星的名字一般在網(wǎng)頁標題中出現(xiàn),因此,更精確的查詢方式,可以是“姓名 身高 intitle:林青霞”。Intitle,表示后接的詞限制在網(wǎng)頁標題范圍內(nèi)。
這類主題詞加上特征詞的查詢構(gòu)造方法,適用于搜索具有某種共性的網(wǎng)頁。前提是,您必須了解這種共性(或者通過試驗性搜索預(yù)先發(fā)現(xiàn)共性)。
6、找軟件下載:
日常工作和娛樂需要用到大量的軟件,很多軟件屬于共享或者自由性質(zhì),可以在網(wǎng)上免費下載到。
直接找下載頁面 這是最直接的方式。軟件名稱,加上“下載”這個特征詞,通常可以很快找到下載點。
例:flashget 下載
在著名的軟件下載站找軟件 由于網(wǎng)站質(zhì)量參差不齊,下載速度也快慢不一。如果我們積累了一些好用的下載站(如天空網(wǎng),華軍網(wǎng),電腦之家等),就可以用site語法把搜索范圍局限在這些網(wǎng)站內(nèi),以提高搜索效率。
小提示:一旦搜索范圍局限在專業(yè)下載站中,“下載”這個特征詞就不必在查詢詞中出現(xiàn)了。
7、找問題解決辦法:
我們在工作和生活中,會遇到各種各樣的疑難問題,比如電腦中毒了,被開水燙傷了等等。很多問題其實都可以在網(wǎng)上找到解決辦法。因為某類問題發(fā)生的幾率是穩(wěn)定的,而網(wǎng)絡(luò)用戶有好幾千萬,于是幾千萬人中遇到同樣問題的人就會很多,其中一部分人會把問題貼在網(wǎng)絡(luò)上求助,而另一部分人,可能就會把問題解決辦法發(fā)布在網(wǎng)絡(luò)上。有了搜索引擎,我們就可以把這些信息找出來。
找這類信息,核心問題是如何構(gòu)建查詢關(guān)鍵詞。一個基本原則是,在構(gòu)建關(guān)鍵詞時,我們盡量不要用自然語言(所謂自然語言,就是我們平時說話的語言和口氣),而要從自然語言中提煉關(guān)鍵詞。這個提煉過程并不容易,但是我們可以用一種將心比心的方式思考:如果我知道問題的解決辦法,我會怎樣對此作出回答。也就是說,猜測信息的表達方式,然后根據(jù)這種表達方式,取其中的特征關(guān)鍵詞,從而達到搜索目的。
例如,我們上網(wǎng)時經(jīng)常會遇到陷阱,瀏覽器默認主頁被修改并鎖定。這樣一個問題的解決辦法,我們應(yīng)該怎樣搜索呢?首先要確定的是,不要用自然語言。比如,有的人可能會這樣搜索“我的瀏覽器主頁被修改了,誰能幫幫我呀”。這是典型的自然語言,但網(wǎng)上和這樣的話完全匹配的網(wǎng)頁,幾乎就是不存在的。因此這樣的搜索常常得不到想要的結(jié)果。我們來看這個問題中的核心詞匯。對象:瀏覽器(或者IE)的主頁。事件:被修改(鎖定)。“瀏覽器”、“主頁”和“被修改”,在這類信息中出現(xiàn)的概率會最大,IE可能會出現(xiàn),至于鎖定,用詞比較專業(yè)化,不見得能出現(xiàn)。于是關(guān)鍵詞中,至少應(yīng)該出現(xiàn)“瀏覽器”、“主頁”和“被修改”,這是問題現(xiàn)象描述。
一般情況下,只要對問題作出適當?shù)拿枋觯诰W(wǎng)上基本上就可以找到解決對策。
8、找產(chǎn)品使用教程:
我們裝了一個新軟件,或者家里買了新的產(chǎn)品(如數(shù)碼相機),往往會需要一個細致的教程。類似的教程在書店里??梢再I到,但在網(wǎng)上一樣也可以搜索到。教程的搜索,有兩個要點,第一個要點是,這個教程是針對什么產(chǎn)品做的。這點比較好確定。比如說,我們想找office2000的教程,這第一個要點就是“office2000”了。第二個要點是,這類教程,通常會有一些什么樣的特征關(guān)鍵詞。也就是說,如果某個網(wǎng)頁是某類產(chǎn)品的教程,這個頁面上,會有一些什么樣的詞匯,來表明這個網(wǎng)頁是個教程。
對這些特征關(guān)鍵詞的把握是搜索老手和新手的差別所在。其實只要平時做個有心人,對類似問題多總結(jié),多記憶,搜索技能就會慢慢熟練。對教程類網(wǎng)頁而言,常出現(xiàn)的特征關(guān)鍵詞有:教程、指南、使用指南、使用手冊、從入門到精通等等,而在URL鏈接中,通常會有漢語拼音的“jiqiao”來標注這個頁面是技巧幫助性頁面。通過一次搜索就達到目的通常會有些困難,但多次試驗,總會構(gòu)建出一個非常好的搜索關(guān)鍵詞。
三、存儲快照-COW和ROW
存儲快照主要解決數(shù)據(jù)丟失時的數(shù)據(jù)恢復(fù),這種技術(shù)可以保存當前存儲設(shè)備的狀態(tài),比如電腦的文件被誤刪除了,可以通過存儲快照恢復(fù)到文件丟失之前的狀態(tài)。
傳統(tǒng)地,人們一直采用數(shù)據(jù)復(fù)制、備份、恢復(fù)等技術(shù)來保護重要的數(shù)據(jù)信息,定期對數(shù)據(jù)進行備份或復(fù)制。由于數(shù)據(jù)備份過程會影響應(yīng)用性能,并且非常耗時,因此數(shù)據(jù)備份通常被安排在系統(tǒng)負載較輕時進行(如夜間)。另外,為了節(jié)省存儲空間,通常結(jié)合全量和增量備份技術(shù)。顯然,這種數(shù)據(jù)備份方式存在一個顯著的不足,即數(shù)據(jù)恢復(fù)時間長、需要備份窗口。信息系統(tǒng)要求 24*7 不間斷運行,一旦出現(xiàn)數(shù)據(jù)問題,需要依賴備份恢復(fù)時,需要做全量 + 增量的方式恢復(fù),一般來說耗時都會很長。數(shù)據(jù)快照就是為了滿足這樣的需求而出現(xiàn)的數(shù)據(jù)保護技術(shù)。
快照的定義: 關(guān)于指定數(shù)據(jù)集合的一個完全可用拷貝,該拷貝包括相應(yīng)數(shù)據(jù)在某個時間點(拷貝開始的時間點)的映像??煺湛梢允瞧渌硎镜臄?shù)據(jù)的一個副本,也可以是數(shù)據(jù)的一個復(fù)制品。從更具體的技術(shù)細節(jié)來講,快照是指向保存在存儲設(shè)備中的數(shù)據(jù)的引用標記或指針。我們可以這樣理解,快照有點像是詳細的數(shù)據(jù)地址目錄表,但在計算機中快照被作為完整的數(shù)據(jù)備份來對待。
快照技術(shù)的作用 :主要能夠進行在線數(shù)據(jù)恢復(fù),當存儲設(shè)備發(fā)生故障或損壞時能夠進行即時的數(shù)據(jù)恢復(fù),將存儲狀態(tài)恢復(fù)到快照時間點的狀態(tài)。另一個作用是能夠為存儲用戶提供另外一個數(shù)據(jù)訪問的通道,當源數(shù)據(jù)進行在線應(yīng)用處理時,用戶可以選擇訪問快照數(shù)據(jù),還能夠?qū)⒖煺諔?yīng)用到測試等工作。因此,所有存儲系統(tǒng),不論高中低端,只要應(yīng)用于在線系統(tǒng),那么快照就成為一個不可或缺的功能??煺赵趥浞?、數(shù)據(jù)保護過程中發(fā)揮著越來越大的作用。
快照的優(yōu)勢
快照的分類
COW(Copy-On-Write) ,也被稱之為「即寫即拷」快照技術(shù)或「寫時復(fù)制」快照技術(shù),這種方式通常也被稱為“元數(shù)據(jù)(源數(shù)據(jù)指針表)”拷貝。顧名思義,如果有人試圖改寫源數(shù)據(jù)塊上的原始數(shù)據(jù),首先將原始數(shù)據(jù)拷貝到新數(shù)據(jù)塊中,然后再進行改寫。當你還原快照需要引用原始數(shù)據(jù)時,快照軟件將原始數(shù)據(jù)原有的指針映射到新數(shù)據(jù)塊上。
再來深入的看看 COW 的過程,COW 在創(chuàng)建快照時,并不會發(fā)生物理的數(shù)據(jù)拷貝動作,僅是拷貝了原始數(shù)據(jù)所在的源數(shù)據(jù)塊的物理位置元數(shù)據(jù)。因此,COW 快照創(chuàng)建非???,可以瞬間完成。在創(chuàng)建了快照之后,快照軟件會監(jiān)控跟蹤原始數(shù)據(jù)的變化(即對源數(shù)據(jù)塊的寫操作),一旦源數(shù)據(jù)塊中的原始數(shù)據(jù)被改寫,則會將源數(shù)據(jù)塊上的數(shù)據(jù)拷貝到新數(shù)據(jù)塊中,然后將新數(shù)據(jù)寫入到源數(shù)據(jù)塊中覆蓋原始數(shù)據(jù)。其中所有的源數(shù)據(jù)塊就組成了所謂的源數(shù)據(jù)卷,而新數(shù)據(jù)塊組成了快照卷。你應(yīng)該能夠看出 COW 有一個很明顯的缺點,就是會降低源數(shù)據(jù)卷的寫性能,因為每次改寫新數(shù)據(jù),實際上都進行了兩次寫操作。
再再深入的看看 COW 的原理,在創(chuàng)建快照時,會同時創(chuàng)建快照卷,但只需分配相對少量的存儲空間,用于保存創(chuàng)建快照后源數(shù)據(jù)卷中被更新的數(shù)據(jù)。每個源數(shù)據(jù)卷都具有一張數(shù)據(jù)指針表(元數(shù)據(jù)),簡稱源數(shù)據(jù)指針表,表記錄就是指向相應(yīng)源數(shù)據(jù)塊的地址指針。在創(chuàng)建快照時,存儲子系統(tǒng)會建立源數(shù)據(jù)指針表的一個副本(元數(shù)據(jù)拷貝),作為快照卷的數(shù)據(jù)指針表,簡稱快照數(shù)據(jù)指針表。所以,在創(chuàng)建快照之后,這個快照就相當于一個可供上層應(yīng)用訪問的存儲邏輯副本,快照卷與源數(shù)據(jù)卷通過各自的指針表共享同一份物理數(shù)據(jù)。當源數(shù)據(jù)卷中任意數(shù)據(jù)將要被改寫時,COW 需要確保對原始數(shù)據(jù)的拷貝操作發(fā)生在原始數(shù)據(jù)的改寫操作之前,并且將原始數(shù)據(jù)在快照卷中的新地址更新到快照數(shù)據(jù)指針表記錄中,使快照時間點后更新的數(shù)據(jù)不會出現(xiàn)在快照卷中,快照卷中的數(shù)據(jù)都必須是快照時間點那一刻的數(shù)據(jù),以此保證了快照數(shù)據(jù)的完整性。
NOTE1 :在步驟 3 中使用了「首次」一詞,意思是說當源數(shù)據(jù)卷中同一位置上的數(shù)據(jù)被修改了多次也僅僅會在第一次修改時被拷貝,換句話說就是只有原始數(shù)據(jù)被更新時才會觸發(fā)拷貝操作,新數(shù)據(jù)被更新的數(shù)據(jù)更新并不會影響到快照數(shù)據(jù)的完整性。所以 COW 偶爾也會被表述為 COFW(Copy-On-First-Write)
NOTE2 :源數(shù)據(jù)指針表至此至終都不會發(fā)生變化,所以 COW 對源數(shù)據(jù)卷的讀操作和對源數(shù)據(jù)卷中單個位置的多次寫操作性能都不會有很大的影響。相對的,快照卷數(shù)據(jù)是非連續(xù)的,而且在執(zhí)行多次快照操作之后,數(shù)據(jù)會變得非常離散,所以快照卷數(shù)據(jù)的讀寫延時較大。
應(yīng)用場景 :這種實現(xiàn)方式在第一次寫入某個存儲位置時需要完成一個讀操作(讀原位置的數(shù)據(jù)),兩個寫操作(寫原位置與寫快照空間),如果寫入頻繁,那么這種方式將非常消耗IO時間。因此可推斷,如果預(yù)計某個卷上的I/O多數(shù)以讀操作為主,寫操作較少的場景,這種方式的快照實現(xiàn)技術(shù)是一個較理想的選擇,因為快照的完成需要較少的時間。除此之外,如果一個應(yīng)用易出現(xiàn)寫入熱點,即只針對某個有限范圍內(nèi)的數(shù)據(jù)進行寫操作,那么COW的快照實現(xiàn)方式也是較較理想的選擇。因為其數(shù)據(jù)更改都局限在一個范圍內(nèi),對同一份數(shù)據(jù)的多次寫操作只會出現(xiàn)一次寫時復(fù)制操作。但是這種方式的缺點也是非常明顯的。如果寫操作過于分散且頻繁,那么 COW造成的開銷則是不可忽略的,有時甚至是無法接受的。因此在應(yīng)用時,則需要綜合評估應(yīng)用系統(tǒng)的使用場景,以判斷這種方式的快照是否適用。
在了解了 COW 的實現(xiàn)原理之后再回頭對比一下 COW 與備份之間的區(qū)別,COW 技術(shù)在創(chuàng)建快照前,并不會占用任何的存儲資源,也不會影響系統(tǒng)性能。而且 COW 在使用上非常靈活,能夠在任意時間點為任意數(shù)據(jù)卷創(chuàng)建快照。在快照時間點產(chǎn)生的“備份窗口”的長度與源數(shù)據(jù)卷的容量成線性比例,一般為幾秒鐘,對應(yīng)用影響甚微,并且為快照卷分配的存儲空間也大大的減少??截惖牟僮髦辉谠磾?shù)據(jù)卷發(fā)生更新時才被觸發(fā),因此系統(tǒng)開銷很小。但是由于快照卷僅保存了源數(shù)據(jù)卷被更新的數(shù)據(jù),因此快照技術(shù)并不能夠得到數(shù)據(jù)的完整物理副本。
ROW(Redirect-On-Write),也被稱之為寫時重定向。ROW 的實現(xiàn)原理與 COW 非常相似,區(qū)別在于「ROW 對原始數(shù)據(jù)卷的首次寫操作,會將新數(shù)據(jù)重定向到預(yù)留的快照卷中」,而非 COW 一般會使用新數(shù)據(jù)將原始數(shù)據(jù)覆蓋。所以,ROW 快照中的原始數(shù)據(jù)依舊保留在源數(shù)據(jù)卷中,并且為了保證快照數(shù)據(jù)的完整性,在創(chuàng)建快照時,源數(shù)據(jù)卷狀態(tài)會由讀寫變成只讀的。如果對一個虛擬機做了多次快照,就產(chǎn)生了一個快照鏈,虛擬機的磁盤卷始終掛載在快照鏈的最末端,即虛擬機的寫操作全都會落盤到最末端的快照卷中。該特征導致了一個問題,就是如果一共做了 10 次快照,那么在恢復(fù)到最新的快照點時,則需要通過合并 10 個快照卷來得到一個完整的最新快照點數(shù)據(jù);如果是恢復(fù)到第 8 次快找時間點,那么就需要將前 8 次的快照卷合并成為一個完整的快照點數(shù)據(jù)。從這里可以看出 ROW 的主要缺點是沒有一個完整的快照卷,其快照之間的關(guān)系是鏈式的,如果快照層級越多,進行快照恢復(fù)時的系統(tǒng)開銷會比較大。但 ROW 的優(yōu)勢在于其解決了 COW 快照寫兩次的問題,所以就寫性能而言,ROW 無疑是優(yōu)于 COW 的。
再深入的來看看 ROW 的原理,創(chuàng)建快照時,ROW 也會 Copy 一份源數(shù)據(jù)指針表作為快照數(shù)據(jù)指針表,此時兩張表的指針記錄都相同的。在創(chuàng)建快照之后,也就是在快照時間點之后,發(fā)生了寫操作,那么新數(shù)據(jù)會直接被寫入到快照卷中,然后再更新源數(shù)據(jù)指針表的記錄,使其指向新數(shù)據(jù)所在的快照卷地址??梢钥闯?,ROW 與 COW 最大的不同就是: COW 的快照卷存放的是原始數(shù)據(jù),而 ROW 的快照卷存放的是新數(shù)據(jù) 。因為 ROW 這種設(shè)定,所以其多個快照之間的關(guān)系必定是鏈式的,因為最新一次快照的原始數(shù)據(jù)很可能就存放在了上一次快照時創(chuàng)建的快照卷中。
值得注意的是:ROW 在傳統(tǒng)存儲場景下最大的問題是對讀性能影響比較大。的確,ROW 的寫性能基本沒有損耗,只是修改指針,實現(xiàn)效率很高。但多次讀寫操作后,某時刻的源數(shù)據(jù)卷的數(shù)據(jù)會變得非常離散(源數(shù)據(jù)指針表記錄都被更新了),這是 ROW 的連續(xù)讀寫性能就不如 COW 了。所以,ROW 更適合應(yīng)用到 Write-Intensive(寫密集型)的存儲系統(tǒng)中。但是,但是,但是,在分布式存儲的情況下,ROW 的連續(xù)讀寫的性能卻會比 COW 更高。傳統(tǒng)存儲場景中讀寫性能的瓶頸一般是在磁盤上,但這種瓶頸在分布式存儲場景中是不存在的。用戶在業(yè)務(wù)層看到連續(xù)存儲,實際上是分布在不同的服務(wù)器的不同硬盤中,數(shù)據(jù)越是分散,系統(tǒng)性能越高。而 ROW 把源數(shù)據(jù)卷中的原始數(shù)據(jù)打散之后,對性能反而有好處。所以現(xiàn)階段而言,ROW + 分布式存儲的快照方式是業(yè)界發(fā)展的主要方向。
四、快照技術(shù)分為()類?
當前,快照技術(shù)已經(jīng)越來越多的被應(yīng)用于企業(yè)的備份恢復(fù)應(yīng)用,但是對于快照技術(shù)的原理,不同快照技術(shù)的區(qū)別以及優(yōu)缺點,卻很少有人詳細提及。面對市場中多樣的快照技術(shù),用戶應(yīng)該如果選擇呢?
什么是快照技術(shù)?
快照技術(shù)主要是在操作系統(tǒng)以及存儲技術(shù)上實現(xiàn)的一種記錄某一時間系統(tǒng)狀態(tài)的技術(shù)。近來,Oracle等數(shù)據(jù)庫廠家以及Vmware等虛擬化產(chǎn)品也把這種技術(shù)引入各自的數(shù)據(jù)保護當中。
存儲中使用快照技術(shù)由于其廣泛的實用性成為應(yīng)用最廣泛的。本文主要探討的是各種不同的存儲快照技術(shù)。
SINA對于快照的定義是:關(guān)于指定數(shù)據(jù)集合的一個完全可用拷貝,該拷貝包括相應(yīng)數(shù)據(jù)在某個時間點(拷貝開始的時間點)的映像??煺湛梢允瞧渌硎镜臄?shù)據(jù)的一個副本,也可以是數(shù)據(jù)的一個復(fù)制品。
由此我們可以看到快照的一些特性:
數(shù)學建模中通常包含指針技術(shù)快照一旦生成,一定是記錄了某一個時間點的系統(tǒng)的完全狀態(tài)。
為什么要使用快照技術(shù)
瞬時備份:在不產(chǎn)生備份窗口的情況下,可以幫助客戶創(chuàng)建一致性的磁盤快照,每個磁盤快照都可以認為是一次對數(shù)據(jù)的全備份。從而實現(xiàn)常規(guī)備份軟件無法實現(xiàn)的分鐘級別的 RPO。
快速恢復(fù):用戶可以依據(jù)存儲管理員的定制,定時自動創(chuàng)建快照,通過磁盤差異回退,快速回滾到指定的時間點上來。通過這種回滾在很短的時間內(nèi)可以完成。大大的提高了業(yè)務(wù)系統(tǒng)RTO的水平。
應(yīng)用測試:用戶可以使用快照產(chǎn)生的虛擬硬盤的數(shù)據(jù)對新的應(yīng)用或者新的操作系統(tǒng)版本進行測試,這樣可以避免對生產(chǎn)數(shù)據(jù)造成損害,也不會影響到目前正在運行的應(yīng)用。
報表打印等資源消耗較大的業(yè)務(wù)的分離:用戶可以將指定時間點的快照虛擬硬盤分配給一個新的服務(wù)器,從而實現(xiàn)將報表打印等對于服務(wù)器核心業(yè)務(wù)會產(chǎn)生較大影響的剝離。使核心業(yè)務(wù)服務(wù)器運行更加平穩(wěn)有效快速的運行。
降低數(shù)據(jù)備份對于系統(tǒng)性能的影響: 通常數(shù)據(jù)備份是在業(yè)務(wù)服務(wù)器上完成的。每次發(fā)起數(shù)據(jù)備份必然對當前業(yè)務(wù)系統(tǒng)運行性能造成影響。通過快照虛擬硬盤的提取后,備份工作可以轉(zhuǎn)移到其他服務(wù)器上。從而實現(xiàn)了零備份窗口(針對應(yīng)用主機),零影響的理想數(shù)據(jù)備份。
傳統(tǒng)的存儲快照技術(shù)(copy-on-write)
傳統(tǒng)的存儲快照技術(shù)以IBM Flashcopy/HDS Shadowimage等為代表,這類技術(shù)由于自動生成的能力不足,防御意外的能力比較弱,一般不用于自動備份,而是用于系統(tǒng)更新之前的一種計劃內(nèi)數(shù)據(jù)保存方式。
傳統(tǒng)存儲快照技術(shù)是基于時間點的復(fù)制,能夠在一個存儲單元中建立數(shù)據(jù)的完全卷拷貝。如果生產(chǎn)系統(tǒng)此時對某一個數(shù)據(jù)集合進行頻繁的修改,在這種情況下產(chǎn)生一個時間點一致拷貝是比較困難的。當進行快照時,快照的源卷將會被凍結(jié)幾秒鐘;當快照拷貝的位圖建立之后,源卷才可以繼續(xù)進行 I/O操作。當位圖建立后,后臺拷貝需要進行一段時間,但是在目標卷上看來,拷貝已經(jīng)完成了。
基于寫重定向的存儲快照技術(shù) (Redirect Write)
通過寫重定向來實現(xiàn)數(shù)據(jù)快照技術(shù)主要在NETAPP公司的存儲和NAS中使用,NETAPP 稱為Snapshot,由于Snapshot只能提供只讀的卷,如果需要對快照虛擬磁盤進行寫操作,還需要配合Flexclone技術(shù)實現(xiàn)。
SnapShot是WAFL文件系統(tǒng)"任意位置寫入"功能帶來的一項突出優(yōu)勢。 一份SnapShot是文件系統(tǒng)的在線只讀拷貝。創(chuàng)建文件系統(tǒng)的一份SnapShot僅僅需要幾秒種的時間,并且除非原始文件被刪除或者更改,數(shù)據(jù)快照并不占用額外的磁盤空間。只有修改活動文件系統(tǒng)中的數(shù)據(jù)塊并寫入磁盤中新的位置時,SnapShot才會占用額外的磁盤空間。
基于首次寫入變更的存儲快照技術(shù)(Copy-On-First Write)
基于首次寫入變更的存儲快照技術(shù)是由傳統(tǒng)的Copy on write發(fā)展而來的,通過整合不同時間的不同快照,使他們之間建立關(guān)聯(lián)性,從而回避了傳統(tǒng)快照技術(shù)的在多個快照時對于性能和個數(shù)的影響。
這類技術(shù)主要是以美國飛康公司為代表的。飛康公司稱之為Timemark。飛康Timemark 是一種基于時間點的和可定制策略的存儲數(shù)據(jù)快照保護技術(shù)。Timemark可以按照客戶要求定時的周期產(chǎn)生或者按照策略進行生成,每個數(shù)據(jù)卷可達到255 個快照。由于Delta增量空間只有在數(shù)據(jù)變更的時候才會被占用,255個快照(相當于255份數(shù)據(jù)版本)只需要非常有限的空間就可以實現(xiàn)。另外,飛康近來發(fā)明了"錄像"(Journal) 技術(shù),任何一秒鐘的數(shù)據(jù)可以迅速變成一個新的快照,使快照技術(shù)登上了一個新的高度。
快照技術(shù)的比較與選擇
傳統(tǒng)的快照技術(shù)主要是針對每個存儲資源時間點狀態(tài)的單一保護。雖然同一存儲資源也可以實現(xiàn)幾份乃至十幾份的快照,但是快照之間彼此是沒有關(guān)聯(lián)性的。正是由于這個缺陷,是當存儲管理員對同一存儲資源需要多個時間點的多份快照時,傳統(tǒng)的存儲快照技術(shù)遇到以下問題:
存儲容量問題:傳統(tǒng)快照技術(shù)通常是一份快照就需要一份磁盤空間,當客戶需要的快照數(shù)量上百個之后,產(chǎn)生數(shù)百倍的空間占用,顯然單一存儲的空間局限性問題將暴露的非常突出。同時,其價格也將變得非常昂貴。因而,一般并不用于多份數(shù)據(jù)快照。實際上,這類快照技術(shù)的快照數(shù)量本身就十分少(如8 個),也不會用于多個時間點的自動快照機制。
存儲性能問題:由于不同時間產(chǎn)生的傳統(tǒng)存儲快照之間沒有關(guān)聯(lián)性,假如需要生成多個快照,一個磁盤塊的寫入很可能向多個快照空間發(fā)出保存當前時間點原始數(shù)據(jù)的指令,例如產(chǎn)生10個快照的話,就要將一份原始數(shù)據(jù)同樣寫入10個快照區(qū)域,這樣產(chǎn)生的寫懲罰十分驚人,而且數(shù)據(jù)庫還需要產(chǎn)生短時凍結(jié),大大降低系統(tǒng)性能。舉例:一個系統(tǒng)中有12份快照,當一個數(shù)據(jù)需要寫入時,在存儲中將產(chǎn)生 13個寫操作和1個讀操作。其對存儲性能的影響根本無法被接受。
Redirect Write技術(shù)和Copy-On-First Write技術(shù)都可以在少量的空間內(nèi)實現(xiàn)高達255份快照。但是由于實現(xiàn)機理不同,所以呈現(xiàn)出不同的性能特性,有著不同的使用領(lǐng)域。
Redirect write的Snapshot技術(shù)在數(shù)據(jù)寫入是沒有任何性能影響,但是由于破壞了原有數(shù)據(jù)在磁盤上的連續(xù)分配,如果應(yīng)用程序在數(shù)據(jù)寫入后存在大量連續(xù)讀操作(如報表業(yè)務(wù)等),則會降低讀性能,導致業(yè)務(wù)相應(yīng)時間變長。此外,快照數(shù)據(jù)只能提供讀操作,不能寫入數(shù)據(jù)。對于大量業(yè)務(wù)環(huán)境并不符合要求。為了實現(xiàn)對虛擬快照磁盤的可讀寫訪問,必然要使用Flexclone技術(shù),因此每次寫都會變成兩次寫,產(chǎn)生對寫性能的影響,并且破壞了數(shù)據(jù)在磁盤上的連續(xù)分布。因此,我們認為Redirect Write技術(shù)比較適合寫入數(shù)據(jù)量遠遠大于讀數(shù)據(jù)量的應(yīng)用系統(tǒng),或者向NAS這種用來做歸檔和備份存儲產(chǎn)品。但是對于當前絕大多數(shù)讀寫比3:1到10:1 的數(shù)據(jù)中心級別的系統(tǒng)來講,可能對業(yè)務(wù)系統(tǒng)產(chǎn)生性能影響。
以上就是關(guān)于快照用于以下哪些場景相關(guān)問題的回答。希望能幫到你,如有更多相關(guān)問題,您也可以聯(lián)系我們的客服進行咨詢,客服也會為您講解更多精彩的知識和內(nèi)容。
推薦閱讀:
如何創(chuàng)建快照(如何創(chuàng)建快照照片)
開網(wǎng)店的寄快遞為什么那么便宜(開網(wǎng)店的快遞費為什么那么便宜)