編者按:
長(zhǎng)亮科技在大數(shù)據(jù)領(lǐng)域始終保持足夠的技術(shù)敏銳度,并積累了豐富的經(jīng)驗(yàn)與資產(chǎn)。為此,我們組織了一個(gè)系列專文,分期發(fā)表,與您一起探索更適合當(dāng)下行業(yè)發(fā)展的數(shù)據(jù)觀,歡迎大家持續(xù)關(guān)注。
在前一篇文章《數(shù)據(jù)架構(gòu)是管理數(shù)據(jù)的基礎(chǔ)》中,我們回顧了數(shù)據(jù)管理領(lǐng)域具體實(shí)踐歷程與反思、數(shù)據(jù)架構(gòu)的內(nèi)涵以及應(yīng)用架構(gòu)、技術(shù)架構(gòu)的關(guān)系,認(rèn)為應(yīng)該以企業(yè)級(jí)的架構(gòu)視角來管理與使用數(shù)據(jù)。本文將進(jìn)一步圍繞企業(yè)數(shù)據(jù)模型核心,探討如何實(shí)施有效的數(shù)據(jù)治理。
作者|長(zhǎng)亮科技大數(shù)據(jù)研究院
內(nèi)容|本篇共3427字,預(yù)計(jì)閱讀時(shí)間12分鐘
越來越多的企業(yè)認(rèn)識(shí)到數(shù)據(jù)要素對(duì)企業(yè)的意義,意圖從數(shù)據(jù)中挖掘出更多的業(yè)務(wù)價(jià)值,成百上千的數(shù)據(jù)庫,數(shù)十萬張表,就是企業(yè)的數(shù)字資產(chǎn)金礦。他們大量采購(gòu)?fù)獠繑?shù)據(jù),在WAP與WEB中大量埋點(diǎn)跟蹤用戶行為,應(yīng)采盡采,源源不斷流入數(shù)據(jù)湖中。他們?cè)谑褂脭?shù)據(jù)時(shí)才意識(shí)到自己不知道有什么數(shù)據(jù),該如何解讀與使用數(shù)據(jù),已知的數(shù)據(jù)大都存在需要治理的各種質(zhì)量問題。
數(shù)據(jù)治理的定義是對(duì)數(shù)據(jù)資產(chǎn)的管理行使權(quán)威與控制(規(guī)劃、監(jiān)控和執(zhí)行),對(duì)企業(yè)中使用的數(shù)據(jù)的可獲得性、可使用性、完整性、一致性、可審計(jì)性和安全性進(jìn)行全面管理。數(shù)據(jù)治理的目的是確保根據(jù)政策和最佳實(shí)踐對(duì)數(shù)據(jù)正確地進(jìn)行管理,數(shù)據(jù)治理的驅(qū)動(dòng)力通常集中在降低風(fēng)險(xiǎn)與改進(jìn)流程上(DAMA-DMBOK2)。
目前數(shù)據(jù)治理工作中的問題與誤區(qū)
金融行業(yè)已經(jīng)經(jīng)歷了比較久的數(shù)據(jù)治理歷程,一些企業(yè)積累了豐富的數(shù)據(jù)治理經(jīng)驗(yàn),無論實(shí)施路徑,解決方案,還是具體實(shí)施,如果沒有抓住重點(diǎn),治理工作很難取得實(shí)質(zhì)改進(jìn)效果。
目前數(shù)據(jù)治理工作或多或少存在一些問題,主要表現(xiàn)為:
重建章立制,而很少深入到實(shí)際業(yè)務(wù)與數(shù)據(jù)之中去發(fā)現(xiàn)與解決實(shí)際問題,脫離實(shí)際數(shù)據(jù)治理活動(dòng);
數(shù)據(jù)治理工作常被設(shè)計(jì)為一個(gè)或若干個(gè)項(xiàng)目,沒有作為一項(xiàng)日常工作來做。早期有些企業(yè)轟轟烈烈啟動(dòng)了項(xiàng)目,制定了激進(jìn)的計(jì)劃,一旦遭遇挫折便偃旗息鼓;
數(shù)據(jù)的開發(fā)、管理與使用,沒有章法,沒有協(xié)作。如,盤點(diǎn)數(shù)據(jù)資產(chǎn)時(shí),深度陷入字段級(jí)沼澤,遲遲得不到輸出,而業(yè)務(wù)系統(tǒng)、數(shù)據(jù)分析應(yīng)用一直在動(dòng)態(tài)變化中,與數(shù)據(jù)治理各行其是,因此輸出的數(shù)據(jù)資產(chǎn)清單新鮮度低,可用性差;
數(shù)據(jù)治理常常被當(dāng)作重要而不緊急甚至是不重要、不緊急的工作,在面臨緊急的業(yè)務(wù)需求時(shí),常受所謂的敏捷開發(fā)干擾,一邊治理問題,一邊制造問題。
有些企業(yè)雖經(jīng)過10多年的數(shù)據(jù)治理,但沒有取得實(shí)質(zhì)進(jìn)展,僅是低水平的重復(fù):數(shù)據(jù)資產(chǎn)快速膨脹,但高價(jià)值資產(chǎn)不多;日常工作效率不高,長(zhǎng)期見效緩慢;系統(tǒng)建設(shè)周期性推倒重來,沒有積累沉淀;數(shù)據(jù)建設(shè)、使用與治理的成本以及被監(jiān)管部門的處罰長(zhǎng)期居高不下。越來越多的數(shù)據(jù)管理部門認(rèn)識(shí)到數(shù)據(jù)治理工作陷入了困境,步履維艱。
主要原因可以歸納為以下幾個(gè)方面:
數(shù)據(jù)治理依據(jù)不充分:數(shù)據(jù)治理的立法與司法職能欠缺,數(shù)據(jù)治理者執(zhí)法依據(jù)不完善,沒有得到高層管理支持,沒有執(zhí)行力;
沒有達(dá)成一致的目標(biāo):咨詢可能提出了一個(gè)空洞的或不切實(shí)際的目標(biāo),開發(fā)部門以快速支持業(yè)務(wù)為目標(biāo),甚至有些部門以增加數(shù)據(jù)資產(chǎn)為目標(biāo),都不以定義與交付高質(zhì)量資產(chǎn)為前提,沒有認(rèn)識(shí)到高質(zhì)量的數(shù)據(jù)帶來的價(jià)值;
路徑不清晰:有些走過場(chǎng)的數(shù)據(jù)治理咨詢項(xiàng)目交付了一條沒有如何達(dá)到目標(biāo)、沒有實(shí)操的實(shí)施路徑,甚至可能數(shù)據(jù)治理走出的第一步就錯(cuò)了;
職責(zé)不明確:數(shù)據(jù)生產(chǎn)者、消費(fèi)者與管理者等干系人之間關(guān)于數(shù)據(jù)管理的認(rèn)知存在巨大的差異,職責(zé)不明確,生產(chǎn)者不對(duì)自己生產(chǎn)的數(shù)據(jù)負(fù)責(zé),治理部門對(duì)資產(chǎn)的膨脹缺少有效控制;
專業(yè)能力不足:受過數(shù)據(jù)管理專業(yè)培訓(xùn)的人員很少,合格數(shù)據(jù)治理專業(yè)人員更少,沒有形成數(shù)據(jù)治理文化與社區(qū);
缺乏有效的工具:缺少便于生產(chǎn)者、管理者和消費(fèi)者之間溝通協(xié)作的工具來支持日常數(shù)據(jù)管理工作,以提升工作質(zhì)量與效率。
充分利用企業(yè)數(shù)據(jù)模型驅(qū)動(dòng)數(shù)據(jù)治理工作
良好的數(shù)據(jù)治理工作除了設(shè)立組織機(jī)構(gòu)、建章立制之外,還需要設(shè)置和強(qiáng)制執(zhí)行數(shù)據(jù)質(zhì)量和數(shù)據(jù)架構(gòu)標(biāo)準(zhǔn),作為治理與行政的依據(jù),確保數(shù)據(jù)在全企業(yè)范圍內(nèi)被準(zhǔn)確、一致的定義、產(chǎn)生和使用。
許多企業(yè)的數(shù)據(jù)治理工作一般先制訂數(shù)據(jù)標(biāo)準(zhǔn),以數(shù)據(jù)標(biāo)準(zhǔn)為依據(jù)治理數(shù)據(jù)。數(shù)據(jù)標(biāo)準(zhǔn)僅是衡量數(shù)據(jù)質(zhì)量的參考依據(jù)之一。
很多數(shù)據(jù)標(biāo)準(zhǔn)沒有建立清晰的概念與邏輯關(guān)系,缺少理解標(biāo)準(zhǔn)目錄的詞匯與分類體系,使用者不清楚數(shù)據(jù)標(biāo)準(zhǔn)背后的邏輯,沒有公共理解的基礎(chǔ),數(shù)據(jù)治理工作大多僅限于治理孤立的數(shù)據(jù)類型與碼值;
以Excel、Word、PPT等文件形式展現(xiàn)的數(shù)據(jù)標(biāo)準(zhǔn),所能表達(dá)的內(nèi)容很有限,所能度量的數(shù)據(jù)質(zhì)量維度也有限,數(shù)據(jù)的完整性與一致性不是其追求的目標(biāo),不能直接轉(zhuǎn)化為可以實(shí)施的細(xì)節(jié)與執(zhí)行的依據(jù);
把實(shí)施寬泛的大而全的數(shù)據(jù)標(biāo)準(zhǔn)作為數(shù)據(jù)治理的切入點(diǎn)或啟動(dòng)項(xiàng)目不是一個(gè)好的選擇。大而全的數(shù)據(jù)標(biāo)準(zhǔn)可能還沒有實(shí)施就已經(jīng)過時(shí)。
企業(yè)數(shù)據(jù)模型使數(shù)據(jù)治理真正成為現(xiàn)實(shí)。企業(yè)數(shù)據(jù)模型作為業(yè)務(wù)元數(shù)據(jù),提供了數(shù)據(jù)的參考分類框架、關(guān)鍵實(shí)體與關(guān)系的定義,以及企業(yè)數(shù)據(jù)元素的標(biāo)準(zhǔn)定義,作為支持?jǐn)?shù)據(jù)治理利益相關(guān)者協(xié)作、自助服務(wù)和數(shù)據(jù)資產(chǎn)探索等核心基礎(chǔ)設(shè)施,為明確數(shù)據(jù)治理目標(biāo)形成全面的認(rèn)知與共識(shí),為如何成功實(shí)施達(dá)到目標(biāo)奠定基礎(chǔ)。
對(duì)數(shù)據(jù)進(jìn)行分類,是理解數(shù)據(jù)對(duì)數(shù)據(jù)進(jìn)行治理的第一步。數(shù)據(jù)模型是一種本體論模型,它首先定義數(shù)據(jù)類別,使用既定的規(guī)則收集、管理這些不同類別數(shù)據(jù)。企業(yè)數(shù)據(jù)模型主題域清單表達(dá)企業(yè)最關(guān)鍵的領(lǐng)域——是最重要的分類方法之一。銀行業(yè)數(shù)據(jù)標(biāo)準(zhǔn)的主題劃分一般參照成熟的行業(yè)數(shù)據(jù)模型,每個(gè)主題之下的劃分標(biāo)準(zhǔn),各家銀行有比較大的差異;
對(duì)數(shù)據(jù)有準(zhǔn)確的定義與一致的理解,是衡量數(shù)據(jù)是否符合要求,進(jìn)行數(shù)據(jù)管理活動(dòng)的基礎(chǔ)。許多數(shù)據(jù)問題是因?yàn)楦鞣N概念沒有清晰的定義造成的;
數(shù)據(jù)之間的關(guān)系表達(dá)了業(yè)務(wù)規(guī)則,是企業(yè)數(shù)據(jù)實(shí)現(xiàn)與使用需要遵循執(zhí)行的依據(jù),但這一點(diǎn)普遍被忽視;
企業(yè)數(shù)據(jù)模型可以幫助數(shù)據(jù)管理人員識(shí)別和定位敏感數(shù)據(jù),設(shè)計(jì)不同用戶訪問控制權(quán)限以強(qiáng)制執(zhí)行機(jī)密性、完整性與合規(guī),確保敏感數(shù)據(jù)得到保護(hù);
企業(yè)數(shù)據(jù)模型幫助干系人站在企業(yè)的視角而不是局限于某個(gè)特定的系統(tǒng)或特定的數(shù)據(jù)集,可以發(fā)現(xiàn)影響全局的系統(tǒng)性問題,而不是一個(gè)局部范圍,或者某個(gè)設(shè)計(jì)師的問題,可以有的放矢,重點(diǎn)解決系統(tǒng)性的問題,推動(dòng)高效治理。
數(shù)據(jù)的定義、分類與關(guān)系的表達(dá)形式是ER模型圖,模型的可視化帶來友好性,可以面向各類人員,因此企業(yè)數(shù)據(jù)模型是數(shù)據(jù)管理必不可少的基礎(chǔ)設(shè)施工具。
企業(yè)數(shù)據(jù)模型一般采用IDEF本體論建模圖形化方法,易于理解,便于不同的用戶討論、辨析與定義數(shù)據(jù)表達(dá)的本體,使各類用戶的認(rèn)知達(dá)成一致;
基于企業(yè)數(shù)據(jù)模型規(guī)劃數(shù)據(jù)治理工作,幫助制訂如何達(dá)到目標(biāo)的實(shí)施路徑與長(zhǎng)期漸進(jìn)的計(jì)劃。在模型體系指導(dǎo)下,自上而下從關(guān)鍵的主題開始(如跨各業(yè)務(wù)系統(tǒng)的參與人、機(jī)構(gòu)、員工等,高級(jí)管理人員不被細(xì)節(jié)所困擾,實(shí)施人員更容易理解和消化重點(diǎn))逐個(gè)主題、逐個(gè)關(guān)鍵實(shí)體穩(wěn)步推進(jìn),自下而上從關(guān)鍵的屬性開始治理(如證件類型、幣種代碼等);
基于企業(yè)數(shù)據(jù)模型安排責(zé)任分工與協(xié)作,支持日常數(shù)據(jù)管理工作。將明確的、透明的、正式的責(zé)任和行動(dòng)應(yīng)用于組織與流程實(shí)踐,建立相互協(xié)作信任,保證每項(xiàng)數(shù)據(jù)治理任務(wù)都有明確的治理內(nèi)容與RASCI責(zé)任人,確保它處于受控狀態(tài),提升數(shù)據(jù)治理實(shí)施的效率與績(jī)效;
基于企業(yè)數(shù)據(jù)模型體系有效管理數(shù)據(jù)資產(chǎn),指導(dǎo)、盤點(diǎn)數(shù)據(jù)資產(chǎn)。建立統(tǒng)一的數(shù)據(jù)資源目錄統(tǒng)一管理維護(hù),避免陷于治理沼澤,幫助數(shù)據(jù)治理人員獲得數(shù)據(jù)資產(chǎn)狀態(tài)信息,哪些方面存在問題以找出需要治理的有毒資產(chǎn),哪些得到了增強(qiáng)和改進(jìn),作為最終用戶跟蹤、控制、判斷是否符合數(shù)據(jù)治理要求的衡量參考標(biāo)準(zhǔn),提高交互效率,減少溝通成本。
企業(yè)數(shù)據(jù)模型是企業(yè)綿延數(shù)十年的積累,覆蓋業(yè)務(wù)經(jīng)營(yíng)、管理和決策數(shù)據(jù)需求,是數(shù)據(jù)領(lǐng)域長(zhǎng)期發(fā)展的穩(wěn)定基石,預(yù)防新數(shù)據(jù)問題的發(fā)生,支持可持續(xù)發(fā)展。
銀行的業(yè)務(wù)發(fā)展變化是相對(duì)穩(wěn)定的,業(yè)務(wù)邏輯很少發(fā)生顛覆性的改變,業(yè)務(wù)的變化同步更新到企業(yè)數(shù)據(jù)模型中。企業(yè)數(shù)據(jù)模型是新系統(tǒng)開發(fā)的關(guān)鍵輸入與數(shù)據(jù)需求和建模的基線,指導(dǎo)和規(guī)劃業(yè)務(wù)系統(tǒng)與分析系統(tǒng)的模型設(shè)計(jì),可以預(yù)防數(shù)據(jù)問題的發(fā)生;
由于技術(shù)的快速發(fā)展以及企業(yè)應(yīng)用架構(gòu)的優(yōu)化,許多銀行業(yè)務(wù)應(yīng)用系統(tǒng)每隔若干年都會(huì)大規(guī)模開發(fā)“新一代”。重用企業(yè)數(shù)據(jù)模型的組件,監(jiān)控新系統(tǒng)的數(shù)據(jù)模型設(shè)計(jì)與數(shù)據(jù)分布,可以減少大量數(shù)據(jù)重構(gòu)與遷移工作,提升數(shù)據(jù)的質(zhì)量,保護(hù)歷史投資,實(shí)現(xiàn)可持續(xù)發(fā)展;
數(shù)據(jù)治理不應(yīng)僅專注于數(shù)據(jù)的治理而忽視數(shù)據(jù)分布流轉(zhuǎn)的治理,不合理的應(yīng)用架構(gòu)與數(shù)據(jù)流轉(zhuǎn)造成的數(shù)據(jù)問題往往是成片成面的,甚至是災(zāi)難性的。如一些業(yè)務(wù)系統(tǒng)數(shù)據(jù)經(jīng)過數(shù)據(jù)中臺(tái)或ODS復(fù)雜的整合,作為數(shù)據(jù)倉庫模型的貼源區(qū),不但拉長(zhǎng)了加工路徑,大大降低了時(shí)效性,由于數(shù)據(jù)中臺(tái)或ODS的整合可能使源數(shù)據(jù)面目全非,導(dǎo)致數(shù)據(jù)倉庫在設(shè)計(jì)模型時(shí)很難還原出業(yè)務(wù)源模型,這樣混亂的數(shù)據(jù)流架構(gòu)在原本數(shù)據(jù)質(zhì)量不高的業(yè)務(wù)數(shù)據(jù)中制造了更多的垃圾。
寫在最后
做正確的事,正確地做事。只有站在企業(yè)架構(gòu)的高度,圍繞企業(yè)數(shù)據(jù)模型核心,關(guān)注技術(shù)架構(gòu)與應(yīng)用架構(gòu)對(duì)數(shù)據(jù)可能造成的負(fù)面影響,明確各自的職責(zé),達(dá)成一致的目標(biāo),提升專業(yè)能力,精心設(shè)計(jì)專業(yè)科學(xué)的方法與清晰的實(shí)施路徑,才能實(shí)施有效的數(shù)據(jù)治理,與應(yīng)用架構(gòu)、技術(shù)架構(gòu)協(xié)同支持業(yè)務(wù)目標(biāo)的實(shí)現(xiàn)!