两个人做人爱视频免费,97久久精品人人搡人妻人人玩,欧洲精品码一区二区三区,999zyz玖玖资源站永久

我要投稿 投訴建議

高職計算機網絡專業畢業生就業競爭力分析論文

時間:2021-03-28 16:32:14 求職指南 我要投稿

高職計算機網絡專業畢業生就業競爭力分析論文

  在高職教育逐漸普及的背景下,學院計算機網絡專業畢業生就業競爭力研究對專業發展意義重大,數據挖掘中的分類算法為此項研究提供了現實可能。本文對數據挖掘的技術路線包括數據挖掘、分類算法、算法的選取和優化進行了闡述;針對所收集到的數據特點,提出選擇分類算法中的決策樹算法更加適宜研究該專業畢業生就業競爭力情況。應用決策樹算法原理對數據進行實例分析,依據C4.5算法構造決策樹,分析實驗結果,將與人交往能力、社會工作經歷、專業知識等七個維度依次排序,推導出高職計算機網絡專業畢業生非專業因素和綜合素質對于提升就業競爭力影響深刻的結論。

高職計算機網絡專業畢業生就業競爭力分析論文

  當前,迅速擴大的高等教育規模逐漸從精英教育轉向普及教育,在校畢業生數量逐年增加,在就業“沒有最難、只有更難”的大背景下,如何提升高職學生的就業競爭力對每所院校都具有非常現實的意義。

  一 高職學生就業競爭力研究的意義和背景

  高等職業教育作為我國高等教育的重要組成部分,具有高等教育和職業教育的雙重功能,以市場需求為導向設置培養計劃,以培養相關崗位技能為重點,強調專業理論和實際操作相結合,兼顧地方特色和行業優勢。高職學生就業競爭力是指高職學生整合知識、技能和個人綜合素質等因素,在人力資源市場上獲得適合才能發揮和實現自身價值的工作崗位的能力。一般來說,學生就業競爭力越強,與社會、行業、企業對人才需求的匹配程度越高。

  1.高職學生就業競爭力研究的意義

  在我國高等教育逐漸實現普及和經濟結構調整的時期,學生就業問題不僅涉及學生個人發展,也涉及社會對學校的評價認可,更是一個民生關注的熱點問題。對高職學生而言,就業競爭力的構成因素至少包括三個方面:一是高職學院的品牌因素,如社會知名度、影響力、專業特色等;二是學生主觀因素,如專業知識、職業能力、個性氣質、道德素養、先天條件等;三是社會因素,如對相關專業的人才需求、人才標準、用人單位特殊考量等外在因素。因此,能否提升學生就業競爭力并不完全取決于高職學院自身的培養水平和學生自身的素質。但作為高職院校,不斷優化人才培養方案,努力提升學生的職業能力和社會就業競爭力,卻是學院生存發展和創建品牌、進行內涵建設的必由之路。

  2.高職學生就業競爭力研究的背景

  因材施教是任何一種層次的教育都必須充分尊重的教學規律,如何以市場為導向,以就業為目標,實現以人為本的個性化教育是高職教育面臨的一個重要課題。本文擬利用學院現有的資源,采用現代信息技術的方法和研究成果研究學生情況、分析學生特點,關注學生成長,通過對已有的學生信息的分析,探求其中隱藏的規律,并把研究結果運用于學生身上,為學生的發展提供參考建議。這對于進一步合理利用、優化教學資源,促進教與學的理解和溝通,最終讓教和學更好地結合,實現有效學習,達到預期的專業培養目標,從而促進學生就業競爭力提升,具有極大的意義。

  近年來,隨著信息技術的發展,學院各部門根據學生的專業分類,有針對性地積累了一定的學生信息。就學院計算機網絡專業而言,受學生規模等因素影響,所收集的各類數據相對有限,但依然可以通過數據挖掘技術對該專業學生的就業競爭力進行研究分析。分類是數據挖掘的一種常見的分析手段,旨在構造一個分類函數或分類模型,該模型能把數據庫中的數據項映射到定類別中的某一個,以此來達到分類并用分類模型對未知分類情況進行預測的目的,這將為我們研究前述高職教育的現狀問題提供有力的技術支持。

  我院計算機網絡專業自2001年開設以來,累計培養了畢業生600多名,已經成為計算機類常設專業之一,并受到社會考生一定的關注。因此,通過數據挖掘技術分析研究計算機網絡專業畢業生的就業競爭力對于該專業的發展具有十分現實的意義。

  二 應用于高職畢業生就業競爭力分析的數據挖掘技術路線

  數據可以理解為通過實驗、統計等手段獲得用于不同社會實踐的眾多數值,通過全面、系統、準確地測量、收集、分類存儲各類數據,再經過嚴格分析、檢驗這些數據往往就能獲得能夠揭示某種事物內在屬性的認識。而這個從眾多數據中分析、把握隱藏在事物內部某種規律性的過程就是數據挖掘。

  1.數據挖掘的概念

  數據挖掘(Data Mining)又稱數據庫中的知識發現(Knowledge Discovery in Database),是指從大型數據庫或數據倉庫中提取隱含的、未知的,具有潛在應用價值和規律性認識的信息,融合了數據庫、統計學、人工智能、機器學習等多個領域的理論知識,一般要經過數據采集、數據預處理、數據分析、結果表示等一系列過程,最后將分析結果呈現在用戶面前。

  在數據挖掘過程中,數據為信息處理者提取新的認知和有用規則,揭示隱含在眾多數據中的內在屬性,并能通過對已有的數據分析來對實際未發生行為的結果作了預測。根據所采用的挖掘技術分類,可以將數據挖掘技術分為決策樹算法、粗糙集分類算法、遺傳算法、最近鄰分類算法、神經網絡分類算法等眾多分支,實際應用也逐步普及,在實際運用中每種算法各有所長,每種相對較優的算法都有它具體的應用環境。在分類規則挖掘中,常用的`方法是決策樹算法和神經網絡算法。本文擬采用決策樹算法對采集的學院計算機網絡專業畢業生就業競爭力數據進行分析研究。

  2.數據挖掘中的分類算法

  在數據挖掘的各種方法中,分類是一種重要的分析手段。數據分類通過分析已知類別的數據對象訓練數據集,建立描述并區分數據對象類別的分類模型,再利用該模型對未知類別的數據進行分類。分類的目的是根據數據集的特點構造一個分類函數或分類模型(也稱作分類器),該模型能把未知類別的樣本映射到給定類別中的某一個。

  構造模型的過程分為訓練和測試兩個階段:第一階段是訓練階段,將數據集隨機地分為訓練數據集和測試數據集,然后使用訓練數據集通過分析由屬性描述的數據庫元組來構造模型。如每個元組屬于一個預定義的類,由一個稱作類標號屬性的屬性來確定;訓練數據集中的單元組也稱作訓練樣本,可以表示為:(u1,u2,…un;c);其中u表示屬性值,c表示類別;在確定每個訓練樣本的類標號基礎上,所建立的模型通過分類規則、判定樹或數學公式表示。

  第二階段為測試階段,使用測試數據集來評估模型的分類準確率,如果認為模型的準確率可以接受,就可以用該模型對其他數據元組進行分類。一般來說,測試階段的工作量低于訓練階段。

  為達到分類的準確、有效和可解釋,在進行分類之前,通常要對數據進行預處理,提高數據挖掘的效益和質量。具體方法包括:(1)數據清理,包括消除數據不完整、數據噪聲、數據不一致、數據冗余、數據分散的狀況,處理空缺值;(2)數據集成,主要手段是把多個數據源中的數據集中存放于某個數據存儲中,并統籌解決數據冗余、重復的問題,盡可能減少數據的不一致性;(3)數據變換,通過最小—最大規格化、零一均值規格化等規格化數據手段,將數據轉換到適合于分析、處理的程度,同時數據也可以規范化,將給定屬性的值按比例縮放,落入較小的區間比如[0,1]等;(4)數據歸約,通過屬性規約、記錄規約等方式,獲得較小同時保持完整性的原數據,使對數據集的挖掘更加有效。

  目前,數據挖掘分類已提出了很多算法,主要包括:決策樹、關聯規則、神經網絡、貝葉斯、規則學習、K-臨近法、遺傳算法、粗糙集以及模糊邏輯技術等。本文擬通過對學院計算機網絡專業畢業生跟蹤收集到的各類數據如專業知識、專業技能、通用技能、求職能力、社會工作能力、與人溝通能力等多組數據,應用分類算法中的決策樹進行數據挖掘,探索計算機網絡專業畢業生就業競爭力影響因素的大小排序。

  3.算法的選取和優化的思路

  在學生信息庫的數據挖掘中,旨在分析學院計算機網絡專業學生的相關情況與就業之間的關系,并期望以就業為分類屬性建立分類模型,來達到對未畢業學生的就業情況進行預測的目的,進而能對未畢業學生的進一步發展提出一定的建議。

  從學生信息庫的角度而言,由于該專業學生規模不大,而且受各方條件限制,所收集到的數據類型復雜,來源并不集中,如成績是連續型數據,而學生在學校的各項表現又是離散型數據,最為重要的是考慮到學生信息是一種動態的信息并且考慮到下一步能否從分類結果為學生提出進一步的發展建議,而決策樹算法就比較適合于此類的數據建模。

  在實際的應用過程中,由于數據本身的特點,所以數據的預處理是一項重要的工作,直接影響到實驗的效果。因此,在對高職計算機網絡專業畢業生就業競爭力研究的課題中,將對數據進行泛化、規格化和歸約,并完成對連續數據離散化等預處理。

  三 基于決策樹分類技術的高職計算機網絡專業畢業生就業競爭力分析

  1.決策樹算法的概念

  決策樹是一個類似于流程圖的樹結構,通過決策樹采用分級形式,可以將多類別的復雜分類問題轉化為若干簡單分類問題加以解決。通常一個決策樹由根節點、內部節點、葉節點三個層次構成,其中根節點是決策樹結構中最高級、最頂層的構成因素,可以包容其他層次的內容;內部節點表示在一個屬性上的測試,每個分枝代表一個測試輸出;而葉節點表示一個類,不同的節點可以表示相同的類。通過設定,可以實現在決策樹從根節點到葉節點的不同路徑之間轉化分類的規則。決策樹算法采用信息論中的概念,用信息增益作為決策屬性分類判別能力的度量,進行決策節點屬性的選擇。

  決策樹分類算法通過分析訓練數據集遞歸地建立決策樹,通過設定根節點S,在S中的記錄屬于同一類別的前提下,則將S作為葉節點并采用相關類標號標示;具體包括以下步驟:(1)設定訓練數據集A,描述屬性集合B。(2)創建對應A的節點A1。(3)當A的記錄屬于同一類別C,以C標示A1,A1 作為葉節點;當B為空,以A中占優的記錄類別C標示A1,A1作為葉節點。(4)從B中選擇相對A信息增量最大的描述屬性B1,作為C的測試屬性。(5)B1的每個取值b1(1≤j≤v),并設定B1的取值范圍為b1b2b3……bn。

  在算法中,使用信息增益來選擇測試屬性,尋找數據庫中具有最大信息量的字段,建立決策樹的根節點,按照字段的取值差異建立決策樹的各個分支,各分支子集中重復建立樹的下層結點(內部節點和葉節點),從而形成決策樹。

  2.決策樹算法的原理和算法描述

  決策樹算法是數據挖掘的常見算法之一,其原理是將大量數據按照設定的標準分類,在不同類別的數據中尋找某種對決策有價值的信息,在預測模型中使用得更加廣泛。目前,最具影響的決策樹方法是由J.R.Quinlan提出的ID3算法,算法可以概括為使用信息論中的信息增益尋找數據庫中具有最大信息增益的屬性字段,建立決策樹的一個節點,再根據該屬性字段的不同取值建立樹的分支。C4.5算法是在ID3算法基礎上的發展,其工作流程與ID3算法基本相同。

  在C4.5算法中,獲得決策屬性信息增益的計算方法是:

  設定S是訓練樣本數據集,S中類別標識屬性有m個獨立的取值,也就是說定義了m個類ci,I=1,2,…,m;Ri為數據集S中屬于ci類的子集,用ci表示子集Ri中元組的數量。

  集合S在分類中的期望信息量可以由以下公式給出:

  式中:pi表示任意樣本屬于ci類的概率;pi=ci / |S|,|S|為訓練樣本數據集中的元組數量。

  假設屬性A共有u個不同的取值{a1,a2,…,an},則通過屬性A的取值可將數據集S劃分為Sj個子集,其中,Sj表示在數據集S中屬性A的取值為aj的子集,j=1,2,…,u。

  如果A被選為決策屬性,則這些子集將對應該節點的不同分枝。

  如果Sij表示Sj子集中屬于ci類的元組的數量,則屬性A對于分類ci(i=1,2,…,m)的熵可由下式計算:

  屬性A的每個取值對分類cj的期望信息量I(Sij,…,Smj),可由下式給出:

  式中:ij=Sij / |Sj|,它表示在Sj子集中屬于ci類的比重。

  由此可得到對屬性A作為決策分類屬性的度量值,即信息增益為

  Gain(A)=I(r1,r2,…,rm)-E(A)

  因此,信息增益率為Ratio(A)=Gain(A)/E(A)。

  該算法需要計算每個決策屬性的信息增益率,其中具有最大信息增益率的屬性就是給定數據集S的決策屬性節點,并通過屬性的每一個取值建立由節點引出的分枝。

  3.基于決策樹算法的高職學生就業競爭力分析

  第一,數據預處理。數據建模及泛化:這里首先把學生的就業情況作為類標號屬性,按其就業情況分為以下三個級別:就業情況好(能很快就業、就業情況好,業績較為突出、評價好);就業情況中(能順利就業,就業情況較好);就業情況差(多次推薦仍未就業)。

  數據樣本用一個7維度X={X1,X2,…,X7}表示,分別描述以下7個變量因素(7個維度:專業課平均成績、基礎課平均成績、性別、社會工作經歷、獲獎情況、承擔班委經歷、溝通能力)對學生就業情況的影響。(1)對專業課平均成績(average1)進行泛化: [average1<60時,為1(差);60=  4.依據C4.5算法構造決策樹

  首先選取訓練樣本數據集,如右表所示。

  取屬性“就業情況”作為類別標識屬性,“專業平均”“基礎平均”“性別”“是否班委”“獲獎情況”“參加活動情況”“與人交往”等屬性作為決策屬性集。其中,專業平均、基礎平均屬于學生知識能力結構,其他則可視為綜合素質和非專業因素。

  訓練樣本數據集S中,共有18個元組,其中好、中、差類所對應的子集中元組個數分別為:r1=4、r2=13、r3=1。

  為了計算每一個決策屬性的信息增益,首先利用公式計算集合S分類的期望信息量:

  I(r1,r2,r3)=I(4,13,1)=

  =1.0529

  然后計算每一個決策屬性的期望信息量(即熵值)。

  在對屬性“專業平均”,專業平均=“優”時:

  I(S11,S21,S31)= =0.8453

  當專業平均=“良”時:

  I(S12,S22,S32)= =0.7219

  當專業平均=“中”時:

  I(S13,S23,S33)= =1

  當專業平均=“差”時,樣本數為0。

  由此得出“專業平均”的熵值:

  E(專業平均)= I(S11,S21,S31)+ I(S12,

  S22,S32)+ I(S13,S23,S33)=0.8282

  因此屬性“專業平均”的信息增益為:

  Gain(專業平均)=I(r1,r2,r3)-E(專業平均)=1.0529-0.8282=0.2247

  因此屬性“專業平均”的信息增益率為:

  Ratio(專業平均)=Gain(專業平均)/E(專業平均)=0.2713

  同理計算得到屬性“基礎平均”“性別”“是否擔任班委”“獲獎情況”“參加活動”“與人交往”的信息增益率分別為:Ratio(基礎平均)=0.2982、Ratio(性別)=0.1893、Ratio(是否擔任班委)=0.4935、Ratio(獲獎情況)=0.1542、 Ratio(參加活動)=0.7999、Ratio(與人交往)=1.1549。由于“與人交往”具有最大信息增益率值,故而選擇該屬性作為決策樹的根節點。

  對于每一個分枝,重復上述步驟,即可生成決策樹。

  5.實驗及分析

  第一,生成決策樹。

  選取460個樣本運用于該算法,則得到如下所示的決策樹:

  圖1 決策樹

  第二,剪枝。

  圖2 決策樹剪枝示意圖

  決策樹算法將數據集中的數據信息轉化為樹的形式,在一定程度上可以提高計算效率,樹表示的信息也較容易理解。但是當遇到數據量很大的數據庫,根據其數據集建立的決策樹規模龐大時,就不易被人理解,而且樹的空間與時間復雜性均很大,決策樹的效率很低。在這種情況下,就要進行剪枝,使決策樹在保持正確率的情況下盡可能地減小規模,起到信息約減的作用。

  如圖2所示的決策樹中,很明顯可以剪去第八層的分枝。

  經過處理,最后可得圖3所示的決策樹。

  圖3 C4.5算法構造就業決策樹圖

  6.實驗結果分析

  把115個測試數據集用上述決策樹進行分類后,其分類準確率為82.61%,該決策樹分類模型可用于今后我院計算機網絡專業畢業生的就業情況預測。預測就業情況屬于“差”或“中”的學生,可根據分類規則給出相應的個人發展建議。就業情況差的,則可建議這一類學生多參加集體活動和社會活動,創造機會讓這類學生與更多的人交往,并盡可能地在班上安排一些合適的職務給他們,使之培養出良好的協作觀念、團隊精神。

  7個維度的決策樹算法顯示,影響高職計算機網絡專業學生就業情況的第一因素是與人交往能力,其次依次為在學校期間擔任班委情況(或從事社會工作的經歷)、個人獲獎情況、專業平均成績、基礎平均成績、參加集體活動的情況,而對就業影響最弱的因素是性別。因此,筆者認為,在高職教育這個層次,學生在學院就讀期間,溝通能力、社會活動經歷等非專業因素對高職學生就業競爭力的影響非常深刻。這些結論對學院今后的教學安排、教學評價、學生評價、教學觀念、課外活動安排將有一定的指導意義。

  四 小結

  高職學生就業競爭力的培養需要從學校、學生和社會三方入手,形成聯動機制。作為人才培養主體的高職院校,除了要圍繞市場需求辦學、加強專業建設、創新人才培養模式外,還應重視學生綜合素質的培養和非專業因素的影響。而作為就業主體的學生,除掌握課程知識,形成盡可能豐富的知識結構之外,還要自覺克服性格、個性方面的缺陷,以一種開放的心態主動參與各類社會事務和社會活動,促進個人綜合素質的提升,不斷增強自身的就業競爭力。

【高職計算機網絡專業畢業生就業競爭力分析論文】相關文章:

提升高職院校文秘專業就業競爭力的思考論文12-02

高職旅游管理專業學生就業因素分析論文03-30

高職旅游管理專業學生就業傾向分析論文08-05

漢語言專業畢業生就業狀況分析論文04-03

信息管理與信息系統專業就業競爭力分析研究論文03-30

外語專業的就業形勢分析論文02-11

工商管理專業就業分析論文08-02

從就業形勢看高職文秘專業就業指導論文12-01

淺析高職音樂專業畢業生就業難的成因與對策論文07-31

主站蜘蛛池模板: 闽清县| 桐庐县| 麟游县| 定陶县| 城固县| 隆尧县| 青州市| 章丘市| 平舆县| 鞍山市| 金华市| 宜川县| 石渠县| 景德镇市| 海门市| 寿光市| 顺义区| 普格县| 定襄县| 东方市| 新巴尔虎右旗| 天峨县| 亚东县| 岢岚县| 肥东县| 余江县| 麻江县| 城市| 淅川县| 嘉峪关市| 息烽县| 遂川县| 泰和县| 黄浦区| 邵武市| 琼海市| 涟水县| 西宁市| 彭泽县| 大宁县| 青神县|