一種多維多層的關(guān)聯(lián)規(guī)則挖掘算法在教育數(shù)據(jù)上的應(yīng)用
發(fā)布時間:2020-12-22 02:26
科技日新月異,各大高校作為技術(shù)人才孕育的搖籃,許多未來社會的改變正由此處悄然誕生。大部分高校都已經(jīng)擁有了自己的教育平臺,在這樣的平臺里,每天都有大量數(shù)據(jù)產(chǎn)生,合理地挖掘利用這些數(shù)據(jù)會為師生甚至教育指導(dǎo)帶來很重要的意義。教學(xué)成績作為教育數(shù)據(jù)中很重要的一個部分,它能在一定程度上直觀地反應(yīng)學(xué)生學(xué)習(xí)情況和教學(xué)質(zhì)量。本文應(yīng)用數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則技術(shù)來對教學(xué)成績數(shù)據(jù)進行分析提取,并將得到的有意義的成果用作教學(xué)指導(dǎo),學(xué)生培養(yǎng)方面的依據(jù)。關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘技術(shù)中不可獲取的一類算法,主要目的是分析發(fā)現(xiàn)數(shù)據(jù)之間存在的關(guān)聯(lián)。本文的研究目的正是通過挖掘教學(xué)成績來發(fā)現(xiàn)課程之間存在的關(guān)聯(lián),因此采用了關(guān)聯(lián)規(guī)則作為本文實驗的主要方法。本文對關(guān)聯(lián)規(guī)則進行了深入的研究分析,梳理了關(guān)聯(lián)規(guī)則的發(fā)展歷史,并且結(jié)合其他學(xué)者的研究內(nèi)容,提出了一種多維多層的關(guān)聯(lián)規(guī)則挖掘算法MMSP。本文結(jié)合實際數(shù)據(jù),對學(xué)生成績進行關(guān)聯(lián)分析。遵循數(shù)據(jù)挖掘流程,收集實驗所需數(shù)據(jù),對數(shù)據(jù)進行了相關(guān)的預(yù)處理,獲得可以適合算法的數(shù)據(jù)模型;接下來使用相關(guān)算法對數(shù)據(jù)進行挖掘:首先是使用FP-growth算法對無時序關(guān)聯(lián)的課程維度進行處理;然后使用MMSP算法只針...
【文章來源】:吉林大學(xué)吉林省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:64 頁
【學(xué)位級別】:碩士
【部分圖文】:
數(shù)據(jù)挖掘主要任務(wù)
睦┱。举?得鰨?ü齕A]={C,D,T,W}可以得到[AC]={D,T,W},[AD]={T,W},[AT]={W}。垂直方法像 Eclat 算法[62]就是使用這種類的獨立性進行頻繁模式枚舉。圖3.1.2 展示出了典型的垂直挖掘過程。例如,可以相交 A(t(A)= 1345)和 D(t(D)= 2456)的 tidset 以獲得不頻繁的 AD(t(AD)= 45)的 tidset。由此可以看出,在密集的數(shù)據(jù)中,t 頭的大小可能變得非常大。Diffset 策略是使用差異概念來解決這個問題的。
圖 3.2 tidsets 的模式計算set 策略的目的是避免存儲每一個類成員的完整 tidset。個類成員和類前綴項集之間 tidsets 中有差異的軌跡,補充說明,這些差異是由根幾點開始,遍歷所有路徑向其孩成員可以使用完整的 tidsets。進制來增強垂直挖掘有兩種方法,可以選擇從頻繁項目的開始就將 tidset 表示轉(zhuǎn)換為 di 集合表示。如果從 tidse集如 AD,d(AD)=t(A)-T(D)=13(當不會產(chǎn)生混亂時,使用省略繁的,我們檢查σ( ) d( D) 4 2 2,因此 AD 不是sets 開始,將會發(fā)現(xiàn) d(AD)=d(D)-d(A)=13-26=13,可以看雖然簡單,但是也可以清楚地觀察到,對于如圖中所示的ffset 策略實現(xiàn)了數(shù)據(jù)庫大小的大幅減少。
【參考文獻】:
期刊論文
[1]基于關(guān)聯(lián)規(guī)則挖掘的元器件可靠性數(shù)據(jù)分析模型[J]. 劉啟越,劉曉宇. 環(huán)境技術(shù). 2019(S2)
[2]關(guān)聯(lián)規(guī)則及Apriori算法的大學(xué)生行為分析研究[J]. 張華霞,李秋生,蒲蓬勃. 贛南師范大學(xué)學(xué)報. 2018(03)
本文編號:2930964
【文章來源】:吉林大學(xué)吉林省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:64 頁
【學(xué)位級別】:碩士
【部分圖文】:
數(shù)據(jù)挖掘主要任務(wù)
睦┱。举?得鰨?ü齕A]={C,D,T,W}可以得到[AC]={D,T,W},[AD]={T,W},[AT]={W}。垂直方法像 Eclat 算法[62]就是使用這種類的獨立性進行頻繁模式枚舉。圖3.1.2 展示出了典型的垂直挖掘過程。例如,可以相交 A(t(A)= 1345)和 D(t(D)= 2456)的 tidset 以獲得不頻繁的 AD(t(AD)= 45)的 tidset。由此可以看出,在密集的數(shù)據(jù)中,t 頭的大小可能變得非常大。Diffset 策略是使用差異概念來解決這個問題的。
圖 3.2 tidsets 的模式計算set 策略的目的是避免存儲每一個類成員的完整 tidset。個類成員和類前綴項集之間 tidsets 中有差異的軌跡,補充說明,這些差異是由根幾點開始,遍歷所有路徑向其孩成員可以使用完整的 tidsets。進制來增強垂直挖掘有兩種方法,可以選擇從頻繁項目的開始就將 tidset 表示轉(zhuǎn)換為 di 集合表示。如果從 tidse集如 AD,d(AD)=t(A)-T(D)=13(當不會產(chǎn)生混亂時,使用省略繁的,我們檢查σ( ) d( D) 4 2 2,因此 AD 不是sets 開始,將會發(fā)現(xiàn) d(AD)=d(D)-d(A)=13-26=13,可以看雖然簡單,但是也可以清楚地觀察到,對于如圖中所示的ffset 策略實現(xiàn)了數(shù)據(jù)庫大小的大幅減少。
【參考文獻】:
期刊論文
[1]基于關(guān)聯(lián)規(guī)則挖掘的元器件可靠性數(shù)據(jù)分析模型[J]. 劉啟越,劉曉宇. 環(huán)境技術(shù). 2019(S2)
[2]關(guān)聯(lián)規(guī)則及Apriori算法的大學(xué)生行為分析研究[J]. 張華霞,李秋生,蒲蓬勃. 贛南師范大學(xué)學(xué)報. 2018(03)
本文編號:2930964
本文鏈接:http://www.sikaile.net/jiaoyulunwen/jiaoyutizhilunwen/2930964.html
最近更新
教材專著