當前,我國高(gāo)校(xiào)由數(shù)字化校(xiào)園向智慧校(xiào)園邁進 的進程中,盡管積累了大(dà)量教學、科研、運行(xíng)管理(lǐ) 等方面的業務數(shù)據,構建了數(shù)據中心與業務服務平 台,卻依然面臨着許多(duō)的困境。經歸納分析,制(zhì)約高(gāo)校(xiào)教育大(dà)數(shù)據發展的因素主要表現在以下六個(gè)方面,以教育大(dà)數(shù)據生(shēng)态體(tǐ)系鏈的形式呈現,如下圖所示。
1.高(gāo)校(xiào)信息化辦公室(信息化領導小(xiǎo)組)缺少(shǎo)全局性、統籌性的指導方案及信息化專業人(rén)員梯隊
智慧校(xiào)園的發展,離不開(kāi)全局性、統籌性的頂 層設計(jì)與規劃決策。衆多(duō)高(gāo)校(xiào)信息化的建設模式依 然是按照“被推着向前”“看一看,模仿别人(rén)建” 的發展模式,加上(shàng)信息化專業人(rén)員梯隊得(de)不到有(yǒu)效 補充,成為(wèi)制(zhì)約教育大(dà)數(shù)據發展的重要瓶頸。高(gāo)校(xiào) 因為(wèi)個(gè)體(tǐ)的差異,在管理(lǐ)模式、專業建設、經費保 障、應用需求、自身定位等方面不盡相同,需要規 劃好适合自身發展的指導方案,構建強有(yǒu)力的專業 技(jì)術(shù)團隊,才能保障智慧校(xiào)園的穩步推進。
2.高(gāo)校(xiào)缺少(shǎo)對各類數(shù)據源的有(yǒu)效整合數(shù)據的流轉是業務生(shēng)命周期的主心骨
數(shù)據源的産生(shēng),應由業務歸口部門(mén)産生(shēng),依托數(shù)據交換平 台向需要使用數(shù)據的應用進行(xíng)推送,實現教育數(shù)據 的實時(shí)交互。當前,由于高(gāo)校(xiào)業務及職能交叉管理(lǐ) 的需要,使得(de)數(shù)據來(lái)源的入口較多(duō),缺乏有(yǒu)效、統 一的整合,給業務帶來(lái)的必将是數(shù)據的不一緻,引 起數(shù)據中心數(shù)據管理(lǐ)的混亂,給教育大(dà)數(shù)據的分析 與挖掘埋下極大(dà)的隐患。
3.信息化建設過程中缺少(shǎo)統一的數(shù)據标準與規範
數(shù)據标準與數(shù)據規範是頂層設計(jì)階段的必要性 步驟。在全局規劃的環節中,應充分考慮各類業務 需求,制(zhì)定并規範合理(lǐ)化的數(shù)據标準,從而為(wèi)後期 流程化的業務建設奠定夯實的基礎。高(gāo)校(xiào)理(lǐ)應建立 公共代碼庫,構建代碼編碼規則,統一取值、規範 賦值;按照國标、部标、校(xiào)标逐級篩選,依托數(shù)據 共享平台,應用到各類業務系統;對公共代碼庫進 行(xíng)持續化的管理(lǐ),關注其對全校(xiào)範圍、所有(yǒu)數(shù)據的 影(yǐng)響。
4.很(hěn)多(duō)高(gāo)校(xiào)業務建設各自為(wèi)政,數(shù)據孤島林立,缺乏有(yǒu)效的數(shù)據管理(lǐ)與數(shù)據交互
智慧校(xiào)園的大(dà)數(shù)據生(shēng)态體(tǐ)系應以業務流轉過程 中産生(shēng)的過程化數(shù)據和(hé)結果化數(shù)據為(wèi)基礎。業務的 流轉離不開(kāi)業務系統間(jiān)的數(shù)據共享與交換,構建标 準的開(kāi)放性業務接口(例如: JSON、 WebService等 接口),利用中間(jiān)件、前置機實現基于标準接口的 多(duō)業務之間(jiān)的數(shù)據轉換與共享、同庫共享、異庫交 換,有(yǒu)利于深度解決數(shù)據孤島問題,業務系統的構 建應保證其具備一定的開(kāi)放性。
5.數(shù)據質量差、數(shù)據融合困難,存在壁壘且發展不均衡
由于長期對數(shù)據的重視(shì)程度不高(gāo)、對數(shù)據價值 的認識不夠,且受限于行(xíng)政管理(lǐ)架構影(yǐng)響,跨域實 施困難,加上(shàng)數(shù)據分析模型及工具的匮乏,高(gāo)校(xiào)的 數(shù)據利用與前期規劃、設計(jì)、開(kāi)發脫節,造成了積 累數(shù)據與實際應用需求存在嚴重的偏差。數(shù)據質量 差、數(shù)據融合困難,嚴重的制(zhì)約了高(gāo)校(xiào)數(shù)據的整合 與共享。構建智慧校(xiào)園的大(dà)數(shù)據生(shēng)态體(tǐ)系,第一步 應開(kāi)展數(shù)據治理(lǐ),實現包含不同業務系統、不同數(shù) 據庫、不同表格、不同字段、不同數(shù)據項的數(shù)據整 合;第二步進行(xíng)數(shù)據監控,實現數(shù)據質量的持續性 保障,構建數(shù)據監控規則,動态監測并報警提示數(shù) 據異常。
6.高(gāo)校(xiào)對不同業務産生(shēng)的曆史數(shù)據的保存不盡完整,過程化數(shù)據嚴重缺失
我國高(gāo)校(xiào)信息化發展了幾十年,很(hěn)多(duō)業務系統 都進行(xíng)了多(duō)輪的更新與重建。由于各個(gè)時(shí)期數(shù)據标準、數(shù)據規範不同,數(shù)據保護意識不夠,造成了大(dà) 量曆史數(shù)據的流失。“推翻重來(lái)” “升級換代”無 形加劇(jù)了數(shù)據的遺失。大(dà)數(shù)據生(shēng)态體(tǐ)系的構建,更 加強化了除結果化數(shù)據外的過程化數(shù)據的重要性。 結果化數(shù)據往往會(huì)以結構化數(shù)據的形式存入關系型 數(shù)據庫、或以非結構化數(shù)據的形式存入存儲系統、 文件系統、文本中進行(xíng)保存。相反,過程化數(shù)據因 其生(shēng)命周期短(duǎn)、體(tǐ)量大(dà)、源頭多(duō)、異構性強等“缺 陷”,往往被用戶忽略和(hé)丢棄(例如:各類機器(qì)在應用過程中産生(shēng)的日志(zhì)數(shù)據、用戶行(xíng)為(wèi)數(shù)據等)。 過程化數(shù)據是大(dà)數(shù)據分析的重要數(shù)據源,其生(shēng)成了 多(duō)維度的數(shù)據集,依托大(dà)數(shù)據分析平台,可(kě)實現教 育大(dà)數(shù)據的解析與關聯,并利用類似于SparkSQL工 具完成過程化數(shù)據的計(jì)算(suàn)與檢索,通(tōng)過對解析和(hé)關 聯結果進行(xíng)選擇、過濾、統計(jì)等,篩選數(shù)據價值, 并進行(xíng)可(kě)視(shì)化的數(shù)據輸出。
基于上(shàng)述因素制(zhì)約,在日積月累的過程中,信 息化應用之間(jiān)的數(shù)據孤島也不斷累加,業務數(shù)據無 法較好地完成數(shù)據流轉與共享,加上(shàng)高(gāo)校(xiào)本身存在 “重管理(lǐ)、輕服務,面向個(gè)性化服務缺少(shǎo)全局性考 慮”的諸多(duō)“先天不足”,加劇(jù)了跨部門(mén)或跨業務 交叉辦事困難、用戶遊離于數(shù)據産生(shēng)與數(shù)據交換過 程之外的種種不利局面。數(shù)據治理(lǐ)、數(shù)據服務,甚 至是更深層次的數(shù)據挖掘分析與決策應用工作(zuò)在高(gāo) 校(xiào)智慧校(xiào)園建設環節中的必要性亟待進一步加強。 構建教育大(dà)數(shù)據生(shēng)态體(tǐ)系的重要目标,是實現信息 化應用與教育數(shù)據治理(lǐ)的深入結合。,綜合運用信 息化技(jì)術(shù),将高(gāo)校(xiào)業務數(shù)據通(tōng)過采集、處理(lǐ)、利用 加以高(gāo)效地組織和(hé)科學化管理(lǐ),使其成果得(de)以有(yǒu)效 的應用到智慧校(xiào)園建設的方方面面,從而提升高(gāo)校(xiào) 的核心競争力。