大數(shù)據(jù)如何改變DBA工作模式
- 時(shí)間:2014-10-23
- 來(lái)源:
遠(yuǎn)光軟件(來(lái)源:CIO時(shí)代網(wǎng) 作者:佚名)
技術(shù)支持團(tuán)隊(duì)通常是支持熟悉的軟硬件配置。在操作系統(tǒng)和數(shù)據(jù)庫(kù)管理軟件上特定組合的專業(yè)化是很常見的,而且這也允許某些團(tuán)隊(duì)成員在一家企業(yè)的IT環(huán)境中獲得極為有價(jià)值的深層經(jīng)驗(yàn)。
大數(shù)據(jù)是如何改變這種模式的呢?
數(shù)據(jù)庫(kù)支持團(tuán)隊(duì)
技術(shù)支持團(tuán)隊(duì)的目標(biāo)之一就是要與管理層協(xié)作來(lái)把他們的工作區(qū)分出優(yōu)先次序。管理層提出戰(zhàn)略規(guī)劃,團(tuán)隊(duì)將之轉(zhuǎn)化為所需時(shí)間和資源的可估計(jì)任務(wù),然后他們共同協(xié)作來(lái)執(zhí)行這些任務(wù)。
這些任務(wù)分為三類:
1.“常規(guī)類型”
2.項(xiàng)目相關(guān)型
3.自行決定型
第一類通常是典型的被動(dòng)任務(wù),它們有一個(gè)標(biāo)準(zhǔn)的或固定的周期和操作。這些包括頻繁數(shù)據(jù)庫(kù)備份,軟件升級(jí),參加例會(huì),填寫狀態(tài)報(bào)表,完成文檔等等。
項(xiàng)目相關(guān)的任務(wù)也是典型的被動(dòng)類型,而且對(duì)應(yīng)的工作包括為一個(gè)已定義項(xiàng)目配套的技術(shù)規(guī)范。舉例如:設(shè)計(jì)并創(chuàng)建新的數(shù)據(jù)庫(kù)和表;從一個(gè)數(shù)據(jù)庫(kù)向另一個(gè)數(shù)據(jù)庫(kù)拷貝數(shù)據(jù);檢查程序邏輯和SQL;以及在應(yīng)用程序測(cè)試期間對(duì)性能進(jìn)行監(jiān)控。
最后一類通常是積極型的工作,包括磁盤和CPU容量規(guī)劃,設(shè)計(jì)和執(zhí)行顯示趨勢(shì)的異常報(bào)表,分析數(shù)據(jù)庫(kù)和SQL以發(fā)現(xiàn)性能調(diào)優(yōu)方面的問題。
用大數(shù)據(jù)來(lái)支持?jǐn)?shù)據(jù)庫(kù)
大數(shù)據(jù)應(yīng)用程序通常包括:
1.一個(gè)或更多的需要進(jìn)行存儲(chǔ)和分析的大型數(shù)據(jù)源;
2.一個(gè)針對(duì)數(shù)據(jù)存儲(chǔ)和高速訪問軟硬件混合的解決方案(設(shè)備);
3.專用數(shù)據(jù)分析軟件。
為了支持一個(gè)或更多的數(shù)據(jù)應(yīng)用程序,DBA團(tuán)隊(duì)需要技術(shù)環(huán)境的專業(yè)知識(shí),這包括:
1.大型數(shù)據(jù)源的業(yè)務(wù)應(yīng)用案例;
2.設(shè)備的安裝,配置和監(jiān)控;
3.支持對(duì)專業(yè)分析查詢進(jìn)行性能調(diào)優(yōu)的工具。
這對(duì)于DB支持團(tuán)隊(duì)來(lái)說(shuō)是新的專業(yè)知識(shí)。起初可能少數(shù)專家會(huì)了解這些知識(shí),或是必須參加專門的培訓(xùn)課程。最終,大多數(shù)團(tuán)隊(duì)必須接受培訓(xùn)并在管理和控制大數(shù)據(jù)環(huán)境上積累豐富的經(jīng)驗(yàn)。
大數(shù)據(jù)和DB團(tuán)隊(duì)操作
DBA經(jīng)理仍然對(duì)團(tuán)隊(duì)提出了戰(zhàn)略規(guī)劃,并且這些規(guī)劃現(xiàn)在包括設(shè)計(jì)和實(shí)施大數(shù)據(jù)解決方案。涉及這一支持的任務(wù)會(huì)跨越所有三個(gè)任務(wù)類別,盡管這在一開始可能并不明顯。
團(tuán)隊(duì)現(xiàn)在必須使用新知識(shí)通過他們當(dāng)前的軟硬件條件為新的大數(shù)據(jù)應(yīng)用程序制定戰(zhàn)術(shù)規(guī)劃和任務(wù)。這將會(huì)有多套與大數(shù)據(jù)相關(guān)的常規(guī)任務(wù),但是它們與標(biāo)準(zhǔn)比起來(lái)相差迥異。其中有些任務(wù)如下:
數(shù)據(jù)庫(kù)備份。一般來(lái)說(shuō),大數(shù)據(jù)文件是很大的!文件如此之大,執(zhí)行數(shù)據(jù)庫(kù)備份可能并不可行。可能沒有足夠的磁盤和磁帶存儲(chǔ)可以裝下這些備份,媒質(zhì)的成本可能會(huì)很高,而且執(zhí)行備份流程很可能會(huì)很耗時(shí)。
軟件升級(jí)。大多數(shù)軟件升級(jí)要求在升級(jí)期間不能運(yùn)行軟件。這對(duì)于一個(gè)大型應(yīng)用程序解決方案來(lái)說(shuō)可能困難重重,因?yàn)樗鼈儗?duì)企業(yè)來(lái)說(shuō)通常是非常重要的。大數(shù)據(jù)架構(gòu)(磁盤存儲(chǔ),專業(yè)軟硬件等等。)是昂貴的,而且企業(yè)只有在具有投資回報(bào)可能性的時(shí)候才會(huì)實(shí)施。
數(shù)據(jù)拷貝。典型的大數(shù)據(jù)設(shè)備通常會(huì)實(shí)施所有權(quán)數(shù)據(jù)存儲(chǔ)和訪問方法。出于性能和數(shù)據(jù)管理的原因,DBA團(tuán)隊(duì)會(huì)在數(shù)據(jù)庫(kù)管理系統(tǒng)和專業(yè)設(shè)備上實(shí)施大數(shù)據(jù)存儲(chǔ)。從戰(zhàn)術(shù)上講,這會(huì)轉(zhuǎn)換為同時(shí)加載進(jìn)DB2表和設(shè)備的數(shù)據(jù)。
容量規(guī)劃。大數(shù)據(jù)設(shè)備相對(duì)較新,而且包含存儲(chǔ)媒質(zhì),CPU,以及高級(jí)數(shù)據(jù)訪問通道。DBA團(tuán)隊(duì)現(xiàn)在必須意識(shí)到如何利用這些資源,監(jiān)控利用率,以及匯報(bào)資源利用趨勢(shì)。他們會(huì)負(fù)責(zé)選擇性能調(diào)優(yōu)和硬件升級(jí)的混合方案來(lái)取悅企業(yè)。
大數(shù)據(jù)管理的趨勢(shì)
管理層會(huì)看到這樣的情況,即隨時(shí)間的推移DBA團(tuán)隊(duì)的知識(shí)和技能在他們處理大數(shù)據(jù)支持的過程中進(jìn)行傳承。而大多數(shù)的傳承是在多面手和專家間進(jìn)行的。
多面手通常是新手,或者是尚未掌握專業(yè)技能的DBA.對(duì)于多面手來(lái)說(shuō),最適合他們的工作就是由標(biāo)準(zhǔn)流程定義好的那些工作。這主要包括:
1.開發(fā)并維護(hù)數(shù)據(jù)庫(kù)備份和恢復(fù)流程;
2.開發(fā)基于DBMS的程序以協(xié)助調(diào)優(yōu),例如用來(lái)收集數(shù)據(jù)分布統(tǒng)計(jì)信息的腳本;
3.實(shí)現(xiàn)正常和異常報(bào)表的自動(dòng)化,例如資源容量使用情況。
最后一項(xiàng)(自動(dòng)化)是值得進(jìn)一步探討的。自動(dòng)化的優(yōu)勢(shì)不僅僅是速度;將工作自動(dòng)化可以幫助DBA遠(yuǎn)離諸如報(bào)表和分析之類的被動(dòng)任務(wù)而專注于更加積極的工作。
以下是一個(gè)典型的流程列表,很多DBA仍然手工操作,而它其實(shí)是可以由一個(gè)自動(dòng)化報(bào)表或數(shù)據(jù)收集流程取代的:
1.為SQL訪問路徑分析執(zhí)行一個(gè)EXPLAIN流程
2.收集諸如System Management Facility(系統(tǒng)管理工具SMF)會(huì)計(jì)和統(tǒng)計(jì)報(bào)表質(zhì)量的性能報(bào)表
3.驗(yàn)證新表?yè)碛凶裱瓨?biāo)準(zhǔn)慣例并與企業(yè)數(shù)據(jù)模型和數(shù)據(jù)字典兼容的名字和屬性列
4.驗(yàn)證對(duì)生產(chǎn)數(shù)據(jù)的訪問是通過正確的授權(quán)GRANT予以妥善控制的
5.監(jiān)視應(yīng)用程序線程活動(dòng)以防止死鎖和超時(shí)
6.檢查控制臺(tái)日志和DB2地址空間日志以發(fā)現(xiàn)錯(cuò)誤消息和潛在問題
大數(shù)據(jù)專家
大數(shù)據(jù)為獲取和使用專業(yè)知識(shí)提供了充足的機(jī)會(huì)。如前所述,以下方面的技能為DBA團(tuán)隊(duì)提供了非常強(qiáng)大的支持足以對(duì)業(yè)務(wù)產(chǎn)生積極的影響:
業(yè)務(wù)用例。對(duì)于一個(gè)數(shù)據(jù)建模師來(lái)說(shuō),首要的是要理解如何使用數(shù)據(jù)。對(duì)大數(shù)據(jù)DBA來(lái)說(shuō)同樣如此。陳舊的數(shù)據(jù)會(huì)被存檔還是清除呢?最重要的數(shù)據(jù)訪問會(huì)被限制在特定時(shí)間段內(nèi)么?某些數(shù)據(jù)元素子集是注定被分析最多的么?這些問題的答案會(huì)幫助DBA決定數(shù)據(jù)分區(qū)方案,數(shù)據(jù)庫(kù)備份頻率,表和索引設(shè)計(jì)等等。
設(shè)備管理。雖然大多數(shù)設(shè)備供應(yīng)商會(huì)傾向于提供鑰匙解決方案,但DBA團(tuán)隊(duì)仍然有進(jìn)行監(jiān)控和調(diào)優(yōu)的責(zé)任。如果沒有什么可配置和調(diào)優(yōu),企業(yè)還會(huì)和供應(yīng)商繼續(xù)合作么?未來(lái)會(huì)看到可調(diào)優(yōu)設(shè)備,并且DBA必須時(shí)刻跟上行業(yè)趨勢(shì)。可以確定的是你所在的企業(yè)需要大數(shù)據(jù)解決方案在短期內(nèi)是不會(huì)消失的。
分析查詢調(diào)優(yōu)工具。大數(shù)據(jù)應(yīng)用程序的宣傳掩蓋了這樣一個(gè)基本事實(shí):如果一家企業(yè)不能及時(shí)獲得可用數(shù)據(jù),那么解決方案的成本會(huì)超出收益。大多數(shù)供應(yīng)商的解決方案包括承諾(或預(yù)測(cè))以極快的速度運(yùn)行查詢。雖然現(xiàn)在是這樣,但是將來(lái)也會(huì)如此么?如果你實(shí)施了多個(gè)非常大的額外數(shù)據(jù)存儲(chǔ)呢?如果你開始積累多年的歷史數(shù)據(jù)用于分析呢?如果數(shù)百(或數(shù)千)額外用戶開始運(yùn)行又新,有長(zhǎng)且復(fù)雜的查詢呢?DBA在這種環(huán)境下對(duì)查詢進(jìn)行調(diào)優(yōu)就是不可或缺的了。
總結(jié)
雖然在DBA團(tuán)隊(duì)中有很多類型和層次的專家,對(duì)大數(shù)據(jù)應(yīng)用程序的支持會(huì)改變他們的工作,優(yōu)先級(jí),以及管理方式。起初可能只是少數(shù)專家擁有必要的知識(shí)和技能;但是隨著企業(yè)實(shí)施更多的應(yīng)用程序并加入更多的用戶,那么整個(gè)團(tuán)隊(duì)就必然會(huì)參與到對(duì)大數(shù)據(jù)的支持中來(lái)。