云計算時代給大家帶了很多機遇,同時也帶來了很多挑戰,有人就認為隨著云的普及,運維人員將會最終消失。當然,這個論點不免有些偏激,但云時代的確給運維帶來了很多不同,也讓運維從業人員開始思考很多問題。在近日舉辦的中國運維和安全大會上,我們就欣喜地看到了很多樂意迎接挑戰的同學,也有很多大牛分享了自己的經驗與心得。
中國的第一代黑客,現任UCloud CEO的季昕華為大家分析了云計算時代為運維與安全帶來的挑戰和機會。首先,運維人員要有一些基本的素質要求,其中包括懂風水,在機房選址時是否處于地震帶,吹的什么風向,當地電價如何都是運維要考慮的;懂網絡,在國內特殊的網絡環境下,要理解南北差異;要有體力,必要時能去機房搬服務器;還要懂操作系統,懂網絡攻擊防御等等……
可是大多數運維人員在公司中的地位不高,而且在行業中的薪資相對偏低,究其原因還是因為運維的從業門檻低,大家對運維的認知度不高。因此,季昕華認為,除了上述基本知識,運維人員還因具備以下三方面的素質:
懂業務 ,例如要能理解產品的用戶是一線城市還是二線城市,是PC端還是移動端,在對業務有足夠的了解的情況下,才能讓你的工作成為領導關心的事。
運營化 ,將運維中的意外管理變為過程管理,并能持續改進、持續優化;運維要能做到四個“第一”,即第一時間發現問題,第一時間定位問題,第一時間解決問題和第一時間反饋問題。
系統化 ,要能通過各種系統來輔助運維工作,甚至要能自己開發運維系統。
目前擺在大家面前有幾個瓶頸,第一是成長空間有限,在公司的地位不高,行業內的知名度也不高;第二是云計算可能會革掉很多運維人員的名,很多小的初創企業甚至都不需要運維;第三是人員轉型困難大。
當然,機會也有不少,比如,互聯網正在快速地改變傳統行業,之前興起的O2O浪潮就是很好的例子,運維人員可以幫助那些傳統行業快速地成長;大數據的到來也為大家打開了一扇窗戶;另外就是云計算,當你能把一個行業做精做細,就能把它挖掘成一個產業,例如又拍云、DNSPod、監控寶和安全寶都是最好的例子。
季昕華建議大家在使用那些免費的運維服務時,如果可以,就更多地向他們付費,讓公司知道運維也是有價值的。當臺下有開發的同學問到該如何幫助運維同學時,幾位嘉賓都講到了如果能夠做到DevOps那是最好的,不要再出現這樣的情況:
產品不足,開發補,開發不足運維補,運維不足客服補
既然云是本次大會的一個重要主題,那自然少不了云存儲的內容。來自七牛的韓拓為大家介紹了七牛在建設云存儲方面的一些做法,他的分享分為兩部分——底層存儲和構建于前者之上的云存儲,兩者在設計上有著截然不同的地方。
底層存儲有以下難點:
元數據管理
對冗余度的控制(副本的數量與成本的平衡點)
修復速度(直接影響存儲系統的可靠性,在七牛恢復是集群任務,盤上數據的副本松散地保存在集群中,目前能做到在十幾分鐘到幾十分鐘內修復2到3T的數據)
應對容量的增長
可接受的訪問速度
合理、有效的緩存
七牛在網絡上采用了常規的千兆局域網,這是考慮到了它的成熟度和成本,在機柜之間無法保證任意兩點間隨時都是千兆,甚至無法保證全聯通,而機房之間的速度,帶寬成本很高,速度與連通性都無法保證。因此,數據存儲的位置需要有一定的平衡,副本在同一機柜和不同機柜各有利弊,機房亦是如此。
在故障方面,除了要將故障視為常態,更要能明確地知道要面對哪些故障,它們的成因、概率和影響范圍。
例如,常見的故障有:
機房內故障
網卡(斷線、降速)
網線(斷線、降速)
交換機(整體故障、單口故障、VLAN故障)
機柜級聯故障
機房間故障
區域性網絡故障(機房出口斷網)
DNS解析故障(服務器之間DNS)
對于機房內的故障,不需要投入太多的資源成本做額外的高可用方案。
在網絡安全上,除了必要的基礎防御之外,更重要的是業務層面的防護,公有云的基本原則是開放,任何服務可以無條件暴露于公網,機房間的交互與客戶無差別,不組VPN。
云存儲構建于基礎存儲之上,它要能提供極高的上傳、下載速度,有極高的可用性,有極高的可靠性,有豐富的附加功能(縮略圖、水印等等),方便的網絡訪問。
它的難點在于:
云存儲屬于終端網絡,它直接面對用戶,情況復雜;它是最外層的接入點,前端沒有機會做遮擋,對各種指標要求高。
廣域網基礎設施普遍質量不高,要基于99%可用的基礎設施來提供99.999%的服務。