隨著信息技術(shù)在高校管理中的應(yīng)用,日常使用中教學(xué)管理系統(tǒng)會(huì)遺留下海量的數(shù)據(jù),這些數(shù)據(jù)已經(jīng)形成一個(gè)關(guān)于教學(xué)信息的數(shù)據(jù)庫(kù)。在現(xiàn)代化建設(shè)的的條件下,如果對(duì)這些海量數(shù)據(jù)進(jìn)行分析和挖掘,就可以發(fā)現(xiàn)對(duì)教務(wù)管理、學(xué)生管理當(dāng)中有規(guī)律并具有指導(dǎo)意義的信息。
【摘要】利用數(shù)據(jù)挖掘技術(shù),針對(duì)現(xiàn)在學(xué)分制的高校教務(wù)管理系統(tǒng)進(jìn)行改革和創(chuàng)新,先將數(shù)據(jù)挖掘的概念引入到教務(wù)管理系統(tǒng)的使用中,分析了其實(shí)現(xiàn)的可行性。針對(duì)教務(wù)管理系統(tǒng)中的高校統(tǒng)考課程成績(jī)這一項(xiàng)數(shù)據(jù)進(jìn)行整理和建模。
【關(guān)鍵詞】教務(wù)管理,數(shù)據(jù)挖掘
一、引言
數(shù)據(jù)挖掘作為一種工具,將其應(yīng)用于高校的教學(xué)管理工作,可以幫助管理者從以往的數(shù)據(jù)中發(fā)現(xiàn)隱藏的規(guī)律或模式,為決策提供信息支持,從而不斷提高教學(xué)管理質(zhì)量,促進(jìn)教育管理的進(jìn)一步改革、完善和發(fā)展,從而提高管理的科學(xué)性、針對(duì)性和高效率。不管是國(guó)內(nèi)還是國(guó)外,越來(lái)越多的高校利用數(shù)據(jù)挖掘等等技術(shù)進(jìn)行決策系統(tǒng)的構(gòu)建,為更高的決策提供數(shù)據(jù)基礎(chǔ)。
二、數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘的定義
數(shù)據(jù)倉(cāng)庫(kù)是決策支持系統(tǒng)(dss)和聯(lián)機(jī)分析應(yīng)用數(shù)據(jù)源的結(jié)構(gòu)化數(shù)據(jù)環(huán)境。數(shù)據(jù)倉(cāng)庫(kù)研究和解決從數(shù)據(jù)庫(kù)中獲取信息的問(wèn)題。數(shù)據(jù)倉(cāng)庫(kù)的特征在于面向主題、集成性、穩(wěn)定性和時(shí)變性。數(shù)據(jù)倉(cāng)庫(kù)不僅僅是是一個(gè)簡(jiǎn)單的數(shù)據(jù)集合,還是一個(gè)決策系統(tǒng),它將相關(guān)聯(lián)的的數(shù)據(jù)重新組織,并且為其找出一定的規(guī)律,從而對(duì)以后的數(shù)據(jù)進(jìn)行預(yù)測(cè),以供最終用戶直接完成對(duì)數(shù)據(jù)的查詢、分析與決策[1][2]。這些元素被收集在模型下,例如:
預(yù)測(cè):估計(jì)銷售量、預(yù)測(cè)服務(wù)器負(fù)載或服務(wù)器停機(jī)時(shí)間;
風(fēng)險(xiǎn)和概率:選擇目標(biāo)郵遞的最佳客戶、確定風(fēng)險(xiǎn)方案的可能保本點(diǎn)、將概率分配給診斷或其他結(jié)果;
建議:確定哪些產(chǎn)品有可能一起銷售并生成建議;
查找序列:分析購(gòu)物車中的客戶選擇,并預(yù)測(cè)接下來(lái)可能發(fā)生的事件;
分組:將客戶或事件劃分到相關(guān)的項(xiàng)目分類,分析和預(yù)測(cè)相關(guān)性。
目前,常用的數(shù)據(jù)挖掘分析方法有:關(guān)聯(lián)規(guī)則分析、聚類分析、分類分析、特征、變化和偏差分析、web頁(yè)挖掘等幾種[3]。
三、數(shù)據(jù)挖掘在教務(wù)管理中的應(yīng)用
隨著時(shí)代的發(fā)展,對(duì)學(xué)生的要求也越來(lái)越趨向于個(gè)性化、多元化。學(xué)生可以自主選擇自己感興趣的課程,感興趣的老師。這樣就導(dǎo)致學(xué)校在定制人才培養(yǎng)方案的時(shí)候出現(xiàn)的盲區(qū)。或者我們可以通過(guò)調(diào)查問(wèn)卷的方式提取學(xué)生的個(gè)人特征、學(xué)習(xí)情況和興趣愛(ài)好。并對(duì)學(xué)校的教學(xué)計(jì)劃、課程設(shè)置以及資源分配進(jìn)行統(tǒng)籌。這樣的方式會(huì)耗費(fèi)大量的時(shí)間和精力,并有在這樣的過(guò)程中,也會(huì)因?yàn)槭照{(diào)查的人群不同而得到不一樣的結(jié)果。針對(duì)這種部分代表全部的方式,得到的結(jié)果也會(huì)有所誤差。利用信息化的教務(wù)管理系統(tǒng),我們?cè)谡J褂孟戮鸵呀?jīng)留下了學(xué)生信息、課程設(shè)置、成績(jī)等等的大量信息。
在教務(wù)管理中運(yùn)用不同的數(shù)據(jù)挖掘方法可以挖掘出相關(guān)的有價(jià)值的信息知識(shí)。按照不同的關(guān)聯(lián)規(guī)則,對(duì)數(shù)據(jù)的分類也是不一樣的,從而反應(yīng)出的映射類別也是不一樣的。選擇合適的方法能夠優(yōu)化速度,更準(zhǔn)確的預(yù)測(cè),為決策提供更為精確的數(shù)據(jù)。按照不同的關(guān)聯(lián)規(guī)則提取數(shù)據(jù),并用對(duì)提取數(shù)據(jù)進(jìn)行分析[4]。
例如存在A+B—C的規(guī)則。那么根據(jù)學(xué)生的A行為和B行為就可以推出可能要發(fā)生的C行為,這樣就可以及時(shí)制定策略去鼓勵(lì)或遏制C行為的產(chǎn)生。以A學(xué)生和B學(xué)生在一起的行為來(lái)說(shuō),推導(dǎo)出A和B在一起是起著積極作用還是負(fù)面的影響,進(jìn)而可以選定學(xué)生之間的關(guān)聯(lián),促進(jìn)學(xué)生之間的互助行為。通過(guò)這樣的規(guī)律就可以更好的在學(xué)校內(nèi)使用互幫互助的學(xué)生集合。并且利用分類規(guī)則對(duì)于學(xué)生的分類和判斷,可以對(duì)于不同的學(xué)生采用不同的教學(xué)方法和教學(xué)課程,可以進(jìn)一步實(shí)施分層次教學(xué),提高教學(xué)質(zhì)量。另外,利用數(shù)據(jù)挖掘技術(shù)挖掘教務(wù)管理系統(tǒng)中積累的有用信息,可以使學(xué)校的相關(guān)院系針對(duì)人才培養(yǎng)方案,進(jìn)行課程的調(diào)節(jié)。通過(guò)選課率、通過(guò)率及相關(guān)信息,鼓勵(lì)和引導(dǎo)學(xué)生選擇互補(bǔ)的課程,這有利于學(xué)生整體素質(zhì)的提高,也有利于教學(xué)資源的合理分配。
四、模型的建立
大部分的學(xué)校選用學(xué)分制的教務(wù)系統(tǒng),采取分專業(yè)、分班教學(xué)的方式來(lái)測(cè)量學(xué)生的學(xué)習(xí)情況,在繁雜的的教務(wù)系統(tǒng)中,以統(tǒng)考課程成績(jī)作為數(shù)據(jù)倉(cāng)庫(kù)的基礎(chǔ)數(shù)據(jù),利用數(shù)據(jù)挖掘的相關(guān)方法對(duì)學(xué)生的成績(jī)進(jìn)行分析和歸類,并對(duì)課程的選擇進(jìn)行預(yù)測(cè),更好的為學(xué)校制定人才培養(yǎng)方案提供基礎(chǔ)數(shù)據(jù)和預(yù)測(cè)數(shù)據(jù)。進(jìn)一步的為學(xué)校的管理者提供決策支持,更好的、更準(zhǔn)確的制定學(xué)校的發(fā)展方案。于此同時(shí)也可以為學(xué)校提高教學(xué)質(zhì)量、優(yōu)化教學(xué)資源提供可靠的數(shù)據(jù)依據(jù)。
首先,在基于B/S的三層體系結(jié)構(gòu)中,表示層、中間層、數(shù)據(jù)層被分割成三個(gè)相對(duì)獨(dú)立的單元。利用數(shù)據(jù)倉(cāng)庫(kù)的三層體系結(jié)構(gòu),搭建屬于高校統(tǒng)考課程成績(jī)數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用模型的體系[5]。
其中,這三層結(jié)構(gòu)由五部分組成,如圖4-1所示。
其中,五個(gè)部分分別是:
(1)數(shù)據(jù)源,包含著以后分析所需要的所有基礎(chǔ)數(shù)據(jù)。例如學(xué)生基本信息、試卷信息、題型信息、課程信息、教師信息等。
。2)ETL階段,即數(shù)據(jù)的抽取、轉(zhuǎn)換、裝載和刷新,數(shù)據(jù)的來(lái)自于不用的數(shù)據(jù)源,在不同的數(shù)據(jù)源中的信息表述也不盡相同,這些數(shù)據(jù)在抽取的過(guò)程中需要進(jìn)行過(guò)濾,得到質(zhì)量高的信息,并針對(duì)不同表述的數(shù)據(jù)轉(zhuǎn)換成同種的格式,方便后面數(shù)據(jù)的刷新,并裝載到另一層的數(shù)據(jù)倉(cāng)庫(kù)中。
(3)中心數(shù)據(jù)倉(cāng)庫(kù),即高校統(tǒng)考課程成績(jī)數(shù)據(jù)倉(cāng)庫(kù)。這個(gè)中心數(shù)據(jù)倉(cāng)庫(kù)內(nèi)存放的是經(jīng)過(guò)清洗和轉(zhuǎn)換以后的數(shù)據(jù),在經(jīng)過(guò)進(jìn)一步加工以后存儲(chǔ)于多維數(shù)據(jù)庫(kù)中,學(xué)生可以利用數(shù)據(jù)的分析進(jìn)行課程的選擇,從而達(dá)到?jīng)Q策支持的效果。
。4)OLAP服務(wù)層,利用OLAP技術(shù)或是DM技術(shù)對(duì)統(tǒng)考成績(jī)數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)進(jìn)行查詢?cè)L問(wèn),得到輔助決策信息。
。5)信息展示層,利用數(shù)據(jù)分析工具得到的知識(shí)通過(guò)各種可視化的信息展示技術(shù),比如有圖標(biāo)、文本、視頻、聲音等方法將分析結(jié)果更加直觀和全面的展示給用戶。
其中題型難度表,分?jǐn)?shù)表,考試狀態(tài)信息表作為表述的元素。
在教務(wù)系統(tǒng)中,針對(duì)課程成績(jī)某一功能,利用數(shù)據(jù)挖掘技術(shù),將其應(yīng)用于某個(gè)課程成績(jī)中,將學(xué)生成績(jī)數(shù)據(jù)進(jìn)行清洗、轉(zhuǎn)換、加載,完成數(shù)據(jù)的匯總。并使用OLAP技術(shù)對(duì)學(xué)生成績(jī)進(jìn)行全方位、多角度的分析,例如:學(xué)生的總結(jié)性評(píng)估、學(xué)生的個(gè)性特征等等,通過(guò)這些信息更好的完善學(xué)習(xí)方法,提高學(xué)習(xí)的成效。準(zhǔn)確判斷學(xué)生合作學(xué)習(xí)和解決問(wèn)題的能力,洞察學(xué)生的學(xué)習(xí)動(dòng)態(tài)。
五、結(jié)語(yǔ)
利用數(shù)據(jù)挖掘技術(shù),能幫助大學(xué)管理人員更好地分析數(shù)據(jù),從而將潛藏的、有用的信息和知識(shí),從大量的數(shù)據(jù)中提取出來(lái)。為后面的決策優(yōu)化速度和準(zhǔn)確性等。數(shù)據(jù)挖掘在教務(wù)系統(tǒng)中的運(yùn)用,也需要通過(guò)慢慢的研究來(lái)進(jìn)行進(jìn)一步的提高。
參考文獻(xiàn)
[1]JiaweiHAN,MiehelineKamber.數(shù)據(jù)挖掘慨念與技術(shù)[J].范明,孟小峰,譯.北京:機(jī)械工業(yè)出版社,2004:l-160.
[2]DavidHand,HeikkiMannila,PadhraicSmvth.數(shù)據(jù)挖掘原理[J].張銀奎,廖麗,宋俊等,譯.北京:機(jī)械工業(yè)出版社,2003.
[3]劉紅巖,陳劍,陳國(guó)青著.數(shù)據(jù)挖掘中的數(shù)據(jù)分類算法綜述[J].清華大學(xué)學(xué)報(bào)汨然科學(xué)版,2002,1.
[4][美]融chardJ.Roeger.數(shù)據(jù)挖掘教程[M].北京:清華大學(xué)出版社,2003.
[5]余英澤.一種新型數(shù)據(jù)分析技術(shù)——數(shù)據(jù)挖掘口].計(jì)算機(jī)與現(xiàn)代化,2000(1).
轉(zhuǎn)載請(qǐng)注明來(lái)自:http://www.jinnzone.com/xinxianqlw/32008.html