前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的大數(shù)據(jù)時(shí)代的缺點(diǎn)主題范文,僅供參考,歡迎閱讀并收藏。
關(guān)鍵詞:“互聯(lián)網(wǎng)+”;大數(shù)據(jù);高校學(xué)生;黨建
一、“互聯(lián)網(wǎng)+”時(shí)代和大數(shù)據(jù)思維的基本概念
2015年的政府工作報(bào)告中提出:政府將制定“互聯(lián)網(wǎng)+”行動(dòng)。“互聯(lián)網(wǎng)+”,不是簡(jiǎn)單的互聯(lián)網(wǎng)相加傳統(tǒng)行業(yè),而是互聯(lián)網(wǎng)與傳統(tǒng)行業(yè)創(chuàng)新融合,指的是互聯(lián)網(wǎng)借助于其信息透明化、低成本、深化分工和提升效率等功能特點(diǎn),推動(dòng)各行各業(yè)轉(zhuǎn)型升級(jí)?!盎ヂ?lián)網(wǎng)+”時(shí)代將互聯(lián)網(wǎng)與社會(huì)各領(lǐng)域建立有效連接,疊加云計(jì)算、物聯(lián)網(wǎng)和大數(shù)據(jù)等信息技術(shù),打破信息的不對(duì)稱,將各個(gè)領(lǐng)域的數(shù)據(jù)信息、科學(xué)資源整合優(yōu)化,并結(jié)合各自優(yōu)勢(shì),實(shí)現(xiàn)融合發(fā)展,改變了人的工作、生活和思維方式。隨著“互聯(lián)網(wǎng)+”時(shí)代大數(shù)據(jù)技術(shù)的發(fā)展,我國(guó)教育數(shù)據(jù)不斷豐富,現(xiàn)代教育信息技術(shù)不斷發(fā)展,使得教育領(lǐng)域的大數(shù)據(jù)應(yīng)用成為可能。
大數(shù)據(jù)是由多種數(shù)據(jù)類型組成,體量巨大,并以高速巨量的特點(diǎn)增加的具有潛在價(jià)值的信息資產(chǎn)。大數(shù)據(jù)時(shí)代的主要特點(diǎn):一是數(shù)據(jù)量十分龐大,傳統(tǒng)的計(jì)算機(jī)一般無(wú)法進(jìn)行有效的深度處理,并呈幾何指數(shù)增長(zhǎng)。二是數(shù)據(jù)類型多種多樣,除傳統(tǒng)的數(shù)字、文字、符號(hào)等結(jié)構(gòu)化數(shù)據(jù)外,音頻、視頻、圖片、郵件、GPS數(shù)據(jù)及各種傳感器產(chǎn)生的非結(jié)構(gòu)化數(shù)據(jù)增長(zhǎng)速度十分驚人。《大數(shù)據(jù)時(shí)代》作者維克托?邁爾-舍恩伯格認(rèn)為:大數(shù)據(jù)是一種價(jià)值觀、方法論,我們面臨的大數(shù)據(jù)不是隨機(jī)樣本,而是全體數(shù)據(jù);不是精確性,而是混雜性;不是因果關(guān)系,而是相關(guān)關(guān)系。從中可以得到啟示,大數(shù)據(jù)時(shí)代需要樹立全局性思維、個(gè)性化思維、相關(guān)性思維和智能化思維。
二、“互聯(lián)網(wǎng)+”時(shí)代高校學(xué)生黨建領(lǐng)域的大數(shù)據(jù)思維
(一)傳統(tǒng)互聯(lián)網(wǎng)與高校學(xué)生黨建結(jié)合的缺點(diǎn)和不足
高校黨建管理部門在傳統(tǒng)的互聯(lián)網(wǎng)與高校學(xué)生黨建相結(jié)合曾做了一些嘗試與努力,如建立黨員信息管理庫(kù)、建立紅色陣地專題網(wǎng)站、開設(shè)黨校培訓(xùn)學(xué)習(xí)園地等形式,在一段時(shí)期內(nèi)一定程度上激發(fā)了學(xué)生的熱情,但還有不少缺點(diǎn)和不足。傳統(tǒng)的互聯(lián)網(wǎng)與高校學(xué)生黨建的簡(jiǎn)單結(jié)合存在功能單一,吸引力不足,宣傳內(nèi)容偏教條化,可讀性不強(qiáng)等情況。近年來(lái),雖有利用博客、微博、微信公眾號(hào)與高校學(xué)生黨建相結(jié)合的嘗試,也存在用戶持久關(guān)注不夠,活躍度不夠,互動(dòng)交流少,傳播力、影響力不足等現(xiàn)象,與傳統(tǒng)的黨建工作存在同質(zhì)化趨向,出現(xiàn)內(nèi)容與形式單調(diào)、功能單一等問(wèn)題,沒(méi)有充分考慮到大學(xué)生黨員在價(jià)值實(shí)現(xiàn)、社交、情緒表達(dá)等方面的需求,亦沒(méi)有考慮到大學(xué)生黨員的多樣化和個(gè)性化需求。
(二)“互聯(lián)網(wǎng)+”時(shí)代大數(shù)據(jù)思維在高校學(xué)生黨建領(lǐng)域的應(yīng)用
“互聯(lián)網(wǎng)+”時(shí)代,隨著大數(shù)據(jù)技術(shù)和思維的不斷發(fā)展,通過(guò)數(shù)據(jù)挖掘技術(shù),人們可以獲得與分析高校學(xué)生黨建領(lǐng)域更多的數(shù)據(jù),甚至是與之相關(guān)的所有數(shù)據(jù),從而可以帶來(lái)更全面的認(rèn)識(shí),可以及時(shí)發(fā)現(xiàn)高校學(xué)生黨建領(lǐng)域所包含樣本無(wú)法揭示的細(xì)節(jié)信息,相應(yīng)的,思維方式也可由樣本思維轉(zhuǎn)向全局性思維。大數(shù)據(jù)時(shí)代,人們可以通過(guò)大數(shù)據(jù)技術(shù)挖掘出高校學(xué)生黨建各子領(lǐng)域存在的相關(guān)關(guān)系,運(yùn)用這些認(rèn)知與洞見(jiàn)就可以幫助人們直觀現(xiàn)在和預(yù)測(cè)未來(lái),而建立在相關(guān)關(guān)系分析基礎(chǔ)上的預(yù)測(cè)正是大數(shù)據(jù)的核心議題,思維方式應(yīng)向個(gè)性化教育思維和相關(guān)性思維轉(zhuǎn)變。大數(shù)據(jù)時(shí)代也將不斷提升系統(tǒng)的社會(huì)計(jì)算能力和智能化水平,從而獲得具有洞察力和新價(jià)值的東西,甚至類似于人類的“智慧”,這將推進(jìn)思維方式由自然思維轉(zhuǎn)向智能化思維。
1.高校學(xué)生黨建須關(guān)注全體學(xué)生的全體數(shù)據(jù),樹立全局性思維
“互聯(lián)網(wǎng)+”時(shí)代,高校學(xué)生黨建須關(guān)注全體學(xué)生樣本的全部數(shù)據(jù)信息,而不是一個(gè)學(xué)生的單一數(shù)據(jù)信息。在“互聯(lián)網(wǎng)+”時(shí)代,采用大數(shù)據(jù)分析方法,了解學(xué)生最自然、最真實(shí)狀態(tài)下相對(duì)準(zhǔn)確的全部思想動(dòng)態(tài)和行為走向?qū)⒊蔀榭赡?,高校學(xué)生黨建工作者需要樹立全局性思維。高校學(xué)生黨建載體需要多元并進(jìn),建立多層次全方位的綜合平臺(tái),在做好黨員信息管理庫(kù)、建立紅色陣地專題網(wǎng)站、開設(shè)黨校培訓(xùn)學(xué)習(xí)園地的同時(shí),開通課程微信公眾號(hào)平臺(tái)、微博平臺(tái)、QQ群、APP應(yīng)用平臺(tái),利用互聯(lián)網(wǎng)資源,嘗試開發(fā)慕課教程,為學(xué)生提供多種選擇,并允許多環(huán)節(jié)使用手機(jī)或便攜式筆記本作為工具參與學(xué)習(xí),跟蹤了解全體學(xué)生的學(xué)習(xí)與思想動(dòng)態(tài),保留全體學(xué)生的相關(guān)平臺(tái)數(shù)據(jù),通過(guò)大數(shù)據(jù)技術(shù)對(duì)這些數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)相應(yīng)問(wèn)題,并進(jìn)行改革和更新。大數(shù)據(jù)技術(shù)使得高校學(xué)生黨建數(shù)據(jù)來(lái)源覆蓋范圍更加廣泛,可以獲取學(xué)生參與過(guò)程中所有數(shù)據(jù),大數(shù)據(jù)發(fā)展到一定程度后,甚至復(fù)雜的非結(jié)構(gòu)化數(shù)據(jù)如連學(xué)生在應(yīng)用端訪問(wèn)的停留時(shí)間、鼠標(biāo)或指頭滑行軌跡、是否有效地學(xué)習(xí)規(guī)定內(nèi)容等數(shù)據(jù)信息都將可能獲得,數(shù)據(jù)覆蓋面可以非常廣,數(shù)據(jù)源更寬泛,數(shù)據(jù)層次更豐富,只要產(chǎn)生數(shù)據(jù)活動(dòng)的記錄都可被獲取,并進(jìn)行數(shù)據(jù)挖掘和分析,得出有效結(jié)果。
2.高校學(xué)生黨建須關(guān)注的內(nèi)容可從混雜的數(shù)據(jù)中提取潛在價(jià)值,樹立個(gè)性化教育思維
“互聯(lián)網(wǎng)+”時(shí)代,采用大數(shù)據(jù)技術(shù)獲取大學(xué)生的所有數(shù)據(jù)時(shí),會(huì)得到一些混雜的數(shù)據(jù)。但紛繁復(fù)雜的數(shù)據(jù)并非一無(wú)是處,而是有其潛在的可挖掘的價(jià)值。尤其是新時(shí)代大學(xué)生個(gè)性鮮明,想法各異,從混雜的數(shù)據(jù)中提取有潛在價(jià)值的信息,能更有針對(duì)性地開展好黨建育人工作。因此,高校學(xué)生黨建工作者應(yīng)樹立個(gè)性化教育思維。由于黨建工作對(duì)象的個(gè)人經(jīng)歷、知識(shí)儲(chǔ)備各異,為了使高校學(xué)生黨建工作更具針對(duì)性,應(yīng)該為黨建工作對(duì)象提供個(gè)性化的“自助式”選擇菜單。高校學(xué)生黨建網(wǎng)站、微博、微信、QQ群、APP應(yīng)用等新平臺(tái)可根據(jù)工作對(duì)象的不同情況開設(shè)“自助式”菜單,學(xué)生可根據(jù)自身實(shí)際情況、優(yōu)缺點(diǎn)、興趣愛(ài)好等選擇自己需要的內(nèi)容。高校學(xué)生黨建通過(guò)大數(shù)據(jù)挖掘技術(shù)和信息反饋,在資源推送時(shí)把學(xué)生的個(gè)性需求擺在首位,將內(nèi)容有針對(duì)性地傳遞給每位學(xué)生,促進(jìn)學(xué)生均衡發(fā)展。
3.高校學(xué)生黨建的內(nèi)容具有數(shù)據(jù)相關(guān)關(guān)系,須樹立相關(guān)性思維和智能化思維
在“互聯(lián)網(wǎng)+”和大數(shù)據(jù)時(shí)代,了解數(shù)據(jù)之間的相關(guān)關(guān)系可以促進(jìn)我們更好地開展教育工作。學(xué)生思想動(dòng)態(tài)出現(xiàn)大的變化不會(huì)是瞬間的,通過(guò)收集分析學(xué)生的所有數(shù)據(jù)我們可以預(yù)先捕捉到學(xué)生的相關(guān)信號(hào),預(yù)測(cè)可能發(fā)生的事件,早發(fā)現(xiàn)、早化解、早處理。大數(shù)據(jù)時(shí)代提升智能化水平后,使得獲得具有洞察力和新價(jià)值的東西更為容易,這就需要高校學(xué)生黨建工作者將推進(jìn)思維方式由注重因果關(guān)系轉(zhuǎn)向相關(guān)性思維,由自然思維轉(zhuǎn)向智能化思維。傳統(tǒng)的高校學(xué)生黨建模式主要是關(guān)注和分析學(xué)生的歷史信息,數(shù)據(jù)少,時(shí)效性差。而在“互聯(lián)網(wǎng)+”時(shí)代,借助大數(shù)據(jù)技術(shù),高校學(xué)生黨建可積極關(guān)注數(shù)據(jù)的相關(guān)性,實(shí)現(xiàn)數(shù)據(jù)之間實(shí)時(shí)互動(dòng),收集整理海量數(shù)據(jù)。大數(shù)據(jù)的真正價(jià)值在于將海量數(shù)據(jù)和全樣本數(shù)據(jù)進(jìn)行相關(guān)性分析,通過(guò)精準(zhǔn)分析后能夠更準(zhǔn)確地將結(jié)果進(jìn)行量化,從數(shù)據(jù)中獲取價(jià)值,實(shí)現(xiàn)智能化結(jié)果,得到的結(jié)果也將更全面、更準(zhǔn)確。高校學(xué)生黨建領(lǐng)域通過(guò)把握數(shù)據(jù)相關(guān)關(guān)系實(shí)現(xiàn)智能化的分析、預(yù)測(cè)和判斷在今后一段時(shí)間里將成為可能。
三、“互聯(lián)網(wǎng)+”時(shí)代大數(shù)據(jù)思維在高校學(xué)生黨建領(lǐng)域應(yīng)用面臨的主要問(wèn)題
(一)高校學(xué)生黨建參與者運(yùn)用“互聯(lián)網(wǎng)+”和大數(shù)據(jù)思維的觀念淡薄
一些高校學(xué)生黨建參與者對(duì)運(yùn)用互聯(lián)網(wǎng)和大數(shù)據(jù)技術(shù)開展黨建工作的必要性和緊迫性認(rèn)識(shí)不足,往往擔(dān)心互聯(lián)網(wǎng)和大數(shù)據(jù)等新形式的應(yīng)用會(huì)給黨建工作帶來(lái)問(wèn)題和不便,對(duì)運(yùn)用網(wǎng)絡(luò)和大數(shù)據(jù)技術(shù)開展黨建工作持十分謹(jǐn)慎的態(tài)度。更有甚者,有些高校學(xué)生黨建工作者對(duì)網(wǎng)絡(luò)信息和模式等新形式采取回避態(tài)度,忽略了互聯(lián)網(wǎng)和大數(shù)據(jù)技術(shù)對(duì)人們生活方式產(chǎn)生的重要影響。另一方面,目前高校學(xué)生黨建領(lǐng)域信息化建設(shè)還停留“+互聯(lián)網(wǎng)”模式上,“互聯(lián)網(wǎng)+”平臺(tái)的融合創(chuàng)新基本沒(méi)有涉及,大數(shù)據(jù)技術(shù)的建設(shè)還未啟動(dòng)或者提及。傳統(tǒng)管理模式還占主導(dǎo)地位,憑經(jīng)驗(yàn)和感覺(jué)辦事占比較高,高校學(xué)生黨建參與者缺乏“互聯(lián)網(wǎng)+”的融合應(yīng)用意識(shí)和大數(shù)據(jù)思維,覺(jué)得大數(shù)據(jù)復(fù)雜,不注重?cái)?shù)據(jù)采集和儲(chǔ)存,不會(huì)數(shù)據(jù)分析和處理,也不愿意學(xué)習(xí)或者培養(yǎng)專門人才。
(二)高校學(xué)生黨建參與者對(duì)“互聯(lián)網(wǎng)+”和大數(shù)據(jù)思維的運(yùn)用存在較大的難度
高校學(xué)生黨建參與者雖然也使用了一些互聯(lián)網(wǎng)形式,如建立專用的黨建網(wǎng)站,但實(shí)際功能發(fā)揮不足,吸引力不強(qiáng),在線平臺(tái)或反饋平臺(tái)通常處于休眠狀態(tài),信息化建設(shè)水平相對(duì)低下,更難提“互聯(lián)網(wǎng)+”各領(lǐng)域各平臺(tái)的大數(shù)據(jù)技術(shù)應(yīng)用。高校學(xué)生黨建使用大數(shù)據(jù)技術(shù)的統(tǒng)一平臺(tái)尚難以創(chuàng)建,缺乏統(tǒng)一規(guī)范,各系統(tǒng)和平臺(tái)之間的兼容存在問(wèn)題,數(shù)據(jù)存儲(chǔ)、挖掘和分析技術(shù)水平較低,大數(shù)據(jù)信息的內(nèi)在關(guān)聯(lián)隱蔽,有用數(shù)據(jù)的挖掘存在困難,大數(shù)據(jù)建設(shè)發(fā)展受限。另一方面,高校學(xué)生黨建領(lǐng)域缺乏專業(yè)從事大數(shù)據(jù)分析專門人才,數(shù)據(jù)信息使用、收集、存儲(chǔ)沒(méi)有統(tǒng)一標(biāo)準(zhǔn),影響大數(shù)據(jù)技術(shù)的精準(zhǔn)性;面對(duì)海量信息資源,缺乏有效篩選、挖掘、分析和處理的能力。
(三)高校學(xué)生黨建參與部門各自為戰(zhàn),數(shù)據(jù)信息共享存在壁壘
在“互聯(lián)網(wǎng)+”時(shí)代,高校學(xué)生黨建的數(shù)據(jù)和信息需要通過(guò)云計(jì)算、大數(shù)據(jù)技術(shù)在云端進(jìn)行充分融合,但因與高校學(xué)生黨建存在密切關(guān)聯(lián)的部門多,信息分布廣,數(shù)據(jù)信息共享尚存在壁壘,更難提云端共享。黨建工作過(guò)程中產(chǎn)生的大量數(shù)據(jù),各領(lǐng)域各部門應(yīng)用平臺(tái)不一,數(shù)據(jù)信息存儲(chǔ)和管理模式不一,數(shù)據(jù)規(guī)模不等,格式各異,對(duì)數(shù)據(jù)采集的重視程度不一,沒(méi)有共享平臺(tái),各部門各自為戰(zhàn),難以實(shí)現(xiàn)互聯(lián)互通,數(shù)據(jù)共享難度大。再加上受目前的體制機(jī)制影響,各領(lǐng)域各部門之間的信息壁壘難以根除,相互之間非但存在數(shù)據(jù)共享的困難,甚至還互相抵觸,造成數(shù)據(jù)質(zhì)和量的不均衡,嚴(yán)重制約高校學(xué)生黨建領(lǐng)域大數(shù)據(jù)技術(shù)的發(fā)展。
(四)高校學(xué)生黨建網(wǎng)絡(luò)信息泄密隱患大,安全防范力量不強(qiáng)
目前,高校雖然在信息技術(shù)和管理上得到了一定的加強(qiáng),但在信息安全領(lǐng)域還存在極大的安全挑戰(zhàn)。因缺乏信息安全專業(yè)技術(shù)人才,再加上信息安全核心技術(shù)受制于人,通常依賴外界廠商提供,給信息安全埋下隱患。同時(shí),現(xiàn)階段亦缺乏有針對(duì)性的信息安全保護(hù)制度,比如黨建工作云端信息和各領(lǐng)域各部門信息歸屬誰(shuí)管轄,誰(shuí)有權(quán)限收集和使用大數(shù)據(jù),大數(shù)據(jù)銷毀的時(shí)限和準(zhǔn)則,大數(shù)據(jù)信息的轉(zhuǎn)讓和共享范圍等沒(méi)有清晰和明確的規(guī)范制度和法律。如近幾年社會(huì)上頻頻出現(xiàn)因信息泄露造成的電信詐騙問(wèn)題,尚難以處理和解決。
四、“互聯(lián)網(wǎng)+”時(shí)代大數(shù)據(jù)思維在高校學(xué)生黨建領(lǐng)域應(yīng)用的對(duì)策與建議
(一)加強(qiáng)高校學(xué)生黨建育人模式改革,做好“互聯(lián)網(wǎng)+”時(shí)代基于大數(shù)據(jù)思維的高校學(xué)生黨建模式頂層設(shè)計(jì)
“互聯(lián)網(wǎng)+”時(shí)代基于大數(shù)據(jù)思維的高校學(xué)生黨建模式創(chuàng)新重在數(shù)據(jù)化上,量化一切信息是數(shù)據(jù)化的核心,包括文字、方位、社交信息等的數(shù)據(jù)化,提高大數(shù)據(jù)意識(shí),主動(dòng)學(xué)習(xí)新媒體和大數(shù)據(jù)思維。以蘇州大學(xué)為例,可以建立以黨委組織部、黨校和黨委辦公室作為聯(lián)合牽頭單位,從戰(zhàn)略上將“互聯(lián)網(wǎng)+”與大數(shù)據(jù)思維納入高校學(xué)生黨建工作,總體謀劃,整體推進(jìn)。同時(shí),學(xué)校黨建育人相關(guān)單位將作為支撐單位,研究和部署大數(shù)據(jù)的數(shù)據(jù)化管理機(jī)制,各學(xué)院(部)及輔導(dǎo)員具體落實(shí)的一套運(yùn)行機(jī)制。讓“互聯(lián)網(wǎng)+”時(shí)代大數(shù)據(jù)決策成為一種新的決策方式,依據(jù)大數(shù)據(jù)進(jìn)行決策,讓數(shù)據(jù)主導(dǎo)決策。大數(shù)據(jù)時(shí)代的高校學(xué)生黨建需要各部門、各組織、黨建工作隊(duì)伍之間相互協(xié)同才能完成,在樹立數(shù)據(jù)意識(shí)的基礎(chǔ)上做出科學(xué)決策。通過(guò)頂層設(shè)計(jì),建立通用標(biāo)準(zhǔn),明確職責(zé)劃分,打破部門限制,使得“互聯(lián)網(wǎng)+”時(shí)代基于大數(shù)據(jù)思維的高校學(xué)生黨建能以科學(xué)、高效的模式運(yùn)行。
(二)加強(qiáng)“互聯(lián)網(wǎng)+”和大數(shù)據(jù)領(lǐng)域?qū)I(yè)技術(shù)人才培養(yǎng),提高大數(shù)據(jù)思維素養(yǎng)
大數(shù)據(jù)建設(shè)的每個(gè)環(huán)節(jié)都需要依靠專業(yè)人員完成,高校學(xué)生黨建需要加緊制定大數(shù)據(jù)相關(guān)人才培養(yǎng)計(jì)劃和方案,把培養(yǎng)數(shù)據(jù)骨干力量作為重中之重建設(shè)來(lái)抓,努力培養(yǎng)和造就一支懂管理的大數(shù)據(jù)建設(shè)專業(yè)隊(duì)伍。數(shù)據(jù)是“互聯(lián)網(wǎng)+”時(shí)代高校學(xué)生黨建工作創(chuàng)新的基礎(chǔ),高校內(nèi)部要進(jìn)行數(shù)據(jù)資源整合,搭建校級(jí)大數(shù)據(jù)基礎(chǔ)平臺(tái)。高校也要積極走出校外,尋求與相關(guān)教育部門和網(wǎng)絡(luò)媒體合作,獲取數(shù)據(jù)充實(shí)到大數(shù)據(jù)庫(kù)中。同時(shí),高校學(xué)生黨建育人也要順應(yīng)“互聯(lián)網(wǎng)+”時(shí)代的發(fā)展需要,充分利用內(nèi)部資源,拓寬人才培養(yǎng)渠道,培養(yǎng)一批具有較強(qiáng)數(shù)據(jù)抓取、數(shù)據(jù)篩選、數(shù)據(jù)分析、數(shù)據(jù)綜合等能力的黨建工作隊(duì)伍,打造一支復(fù)合型的專業(yè)化團(tuán)隊(duì)。
(三)著手建立數(shù)據(jù)共享平臺(tái),整合“互聯(lián)網(wǎng)+”時(shí)代高校學(xué)生黨建數(shù)據(jù)資源
“互聯(lián)網(wǎng)+”和大數(shù)據(jù)技術(shù)是高校學(xué)生黨建未來(lái)的發(fā)展方向,需要整合發(fā)展過(guò)程中的分散資源,建立統(tǒng)一應(yīng)用平臺(tái)和應(yīng)用系統(tǒng),在各專用數(shù)據(jù)庫(kù)建設(shè)的基礎(chǔ)上,實(shí)現(xiàn)各級(jí)各類信息系統(tǒng)的數(shù)據(jù)交換和數(shù)據(jù)共享。在建設(shè)過(guò)程中,建立信息共享交換機(jī)制,打破部門壁壘,統(tǒng)一高校學(xué)生黨建相關(guān)的數(shù)據(jù)標(biāo)準(zhǔn)和數(shù)據(jù)格式,消除部門間的信息“孤島”,提升各領(lǐng)域各部門的數(shù)據(jù)整合能力。將可以公開的數(shù)據(jù)統(tǒng)一共享到專用云平臺(tái),避免數(shù)據(jù)割據(jù),做到數(shù)據(jù)互通,使得各領(lǐng)域各部門的數(shù)據(jù)在統(tǒng)一的云平臺(tái)內(nèi)交換暢通。
(四)加強(qiáng)信息安全管理,增強(qiáng)高校學(xué)生黨建信息的風(fēng)險(xiǎn)防御能力
大數(shù)據(jù)技術(shù)在高校學(xué)生黨建領(lǐng)域的應(yīng)用是一把雙刃劍,管理不善可能帶來(lái)不良后果。高校學(xué)生黨建參與者在實(shí)施大數(shù)據(jù)技術(shù)過(guò)程中一定要樹立安全觀念,制定安全規(guī)范規(guī)章制度,防止數(shù)據(jù)泄露,明確大數(shù)據(jù)使用渠道和范圍,提高網(wǎng)絡(luò)安全防范能力,保障“互聯(lián)網(wǎng)+”時(shí)代大數(shù)據(jù)思維在高校學(xué)生黨建領(lǐng)域應(yīng)用的有序發(fā)展。“互聯(lián)網(wǎng)+”時(shí)代在數(shù)據(jù)收集時(shí)亦可能會(huì)侵犯學(xué)生的隱私權(quán),這就對(duì)數(shù)據(jù)使用者提出了更高的要求,在數(shù)據(jù)使用時(shí)需要保障學(xué)生的合法權(quán)益。高校學(xué)生黨建管理部門也要提高風(fēng)險(xiǎn)預(yù)判能力,通過(guò)大數(shù)據(jù)技術(shù)來(lái)加強(qiáng)應(yīng)用平臺(tái)的風(fēng)險(xiǎn)防控水平,建立風(fēng)險(xiǎn)控制機(jī)制,嚴(yán)格監(jiān)管,維護(hù)信息安全。另外,大數(shù)據(jù)也可能沒(méi)有那么可靠,數(shù)據(jù)的質(zhì)量可能很差,數(shù)據(jù)分析可能存在錯(cuò)誤或者具有誤導(dǎo)性,需要制定詳細(xì)、縝密的數(shù)據(jù)質(zhì)量管理制度。
參考文獻(xiàn):
[1]陳麗珊.“互聯(lián)網(wǎng)+大數(shù)據(jù)”與創(chuàng)新?tīng)I(yíng)銷[J].通信企業(yè)管理,2015,06:18-19.
[2]俞立平.大數(shù)據(jù)與大數(shù)據(jù)經(jīng)濟(jì)學(xué)[J].中國(guó)軟科學(xué),2013,07:177-183.
[3]張巖.“互聯(lián)網(wǎng)+教育”理念及模式探析[J].中國(guó)高教研究,2016,02:70-73.
作者簡(jiǎn)介:
關(guān)鍵詞:大數(shù)據(jù);大數(shù)據(jù)時(shí)代;云計(jì)算
一、什么是大數(shù)據(jù)
1980年,著名未來(lái)學(xué)家阿爾文?托夫勒便在《第三次浪潮》一書中,將大數(shù)據(jù)熱情地贊頌為“第三次浪潮的華彩樂(lè)章”。自2009年開始,“大數(shù)據(jù)”成為互聯(lián)網(wǎng)信息技術(shù)行業(yè)的流行詞匯。那么何謂“大數(shù)據(jù)”呢?“大數(shù)據(jù)”(big data),或稱巨量數(shù)據(jù)、海量數(shù)據(jù),是由數(shù)量巨大、結(jié)構(gòu)復(fù)雜、類型眾多數(shù)據(jù)構(gòu)成的數(shù)據(jù)集合,是基于云計(jì)算的數(shù)據(jù)處理與應(yīng)用模式通過(guò)數(shù)據(jù)的集成共享、交叉復(fù)用形成的智力資源和知識(shí)服務(wù)能力。還有研究機(jī)構(gòu)如此定義“大數(shù)據(jù)”:“大數(shù)據(jù)”是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。從某種程度上說(shuō),“大數(shù)據(jù)”是數(shù)據(jù)分析的前沿技術(shù),是從各種各樣類型的數(shù)據(jù)中,快速獲得有價(jià)值信息的能力。
在我國(guó),“大數(shù)據(jù)”作為一個(gè)較新的概念,目前尚未直接以專有名詞被政府提出來(lái)給予政策支持。不過(guò),在2011年12月8日工信部的物聯(lián)網(wǎng)“十二五”規(guī)劃上,把信息處理技術(shù)作為4項(xiàng)關(guān)鍵技術(shù)創(chuàng)新工程之一被提出來(lái),其中包括了海量數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)挖掘、圖像視頻智能分析,這都是大數(shù)據(jù)的重要組成部分。而另外3項(xiàng)關(guān)鍵技術(shù)創(chuàng)新工程,包括信息感知技術(shù)、信息傳輸技術(shù)、信息安全技術(shù),也都與“大數(shù)據(jù)”密切相關(guān)。2013年5月10日,阿里巴巴集團(tuán)董事局主席馬云在淘寶十周年晚會(huì)演講時(shí)說(shuō),大家還沒(méi)搞清PC時(shí)代的時(shí)候,移動(dòng)互聯(lián)網(wǎng)來(lái)了,還沒(méi)搞清移動(dòng)互聯(lián)網(wǎng)的時(shí)候,大數(shù)據(jù)時(shí)代來(lái)了。是的,大數(shù)據(jù)時(shí)代真的來(lái)了。
二、大數(shù)據(jù)的特點(diǎn)
1.數(shù)據(jù)體量巨大。以互聯(lián)網(wǎng)為例,一天之中,互聯(lián)網(wǎng)產(chǎn)生的全部?jī)?nèi)容可以刻滿1.68億張DVD;發(fā)出的郵件有2940億封之多;發(fā)出的社區(qū)帖子達(dá)200萬(wàn)個(gè),相當(dāng)于《時(shí)代》雜志770年的文字量。截止到2012年,全球數(shù)據(jù)量已經(jīng)從TB(1024GB=1TB)級(jí)別躍升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)級(jí)別。國(guó)際數(shù)據(jù)公司(IDC)的研究結(jié)果表明,2008年全球產(chǎn)生的數(shù)據(jù)量高達(dá)1.82ZB,相當(dāng)于全球每人產(chǎn)生200GB以上的數(shù)據(jù)。而到2012年為止,人類生產(chǎn)的所有印刷材料的數(shù)據(jù)量是200PB,全人類歷史上說(shuō)過(guò)的所有話的數(shù)據(jù)量大約是5EB。IBM的研究稱,整個(gè)人類文明所獲得的全部數(shù)據(jù)中,有90%是過(guò)去兩年內(nèi)產(chǎn)生的。而到了2020年,全世界所產(chǎn)生的數(shù)據(jù)規(guī)模將達(dá)到今天的44倍。
2.數(shù)據(jù)類型繁多。大數(shù)據(jù)時(shí)代來(lái)臨首先由數(shù)據(jù)豐富程度決定的,大數(shù)據(jù)來(lái)源于各種各樣的渠道?;ヂ?lián)網(wǎng)、社交網(wǎng)絡(luò)的全球化普及,大量的UGC(互聯(lián)網(wǎng)術(shù)語(yǔ),全稱為User Generated Content,即用戶生成內(nèi)容的意思)內(nèi)容、音頻、文本信息、視頻、圖片等非結(jié)構(gòu)化數(shù)據(jù)出現(xiàn)了。云計(jì)算、移動(dòng)互聯(lián)網(wǎng)、車聯(lián)網(wǎng)、手機(jī)、平板電腦、PC以及各種各樣的傳感器,無(wú)一不是數(shù)據(jù)來(lái)源或者承載的方式。
3.數(shù)據(jù)允許不精確。在越來(lái)越多的情況下,使用所有可能獲取的數(shù)據(jù)變得更為可能,但為此也要付出一定的代價(jià)。以視頻為例,連續(xù)不間斷監(jiān)控過(guò)程中,可能有用的數(shù)據(jù)僅僅有一兩秒。然而,在不斷涌現(xiàn)的新情況里,允許不精確的出現(xiàn)已經(jīng)成為一個(gè)新的亮點(diǎn),而非缺點(diǎn)。大數(shù)據(jù)時(shí)代要求我們重新審視精確性的優(yōu)劣,不僅讓我們不再期待精確性,也讓我們無(wú)法實(shí)現(xiàn)精確性。
4.數(shù)據(jù)要求處理速度快。速度要求是大數(shù)據(jù)處理技術(shù)和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)最大的區(qū)別。大數(shù)據(jù)是繼云計(jì)算、物聯(lián)網(wǎng)之后IT產(chǎn)業(yè)又一次顛覆性的技術(shù)變革。云計(jì)算主要為數(shù)據(jù)資產(chǎn)提供了保管、訪問(wèn)的場(chǎng)所和渠道,而數(shù)據(jù)才是真正有價(jià)值的資產(chǎn)。企業(yè)內(nèi)部的經(jīng)營(yíng)交易信息、物聯(lián)網(wǎng)世界中的商品物流信息,互聯(lián)網(wǎng)世界中的人與人交互信息、位置信息等,其數(shù)量將遠(yuǎn)遠(yuǎn)超越現(xiàn)有企業(yè)IT架構(gòu)和基礎(chǔ)設(shè)施的承載能力,實(shí)時(shí)性要求也將大大超越現(xiàn)有的計(jì)算能力。
三、大數(shù)據(jù)時(shí)代下的變革
“這是一場(chǎng)革命,龐大的數(shù)據(jù)資源使得各個(gè)領(lǐng)域開始了量化進(jìn)程,無(wú)論學(xué)術(shù)界、商界還是政府,所有領(lǐng)域都將開始這種進(jìn)程?!报D―哈佛大學(xué) 社會(huì)學(xué)教授加里?金如是說(shuō)。大數(shù)據(jù)時(shí)代下網(wǎng)民和消費(fèi)者的界限正在消弭,政府、企業(yè)或社會(huì)的疆界變得模糊,數(shù)據(jù)成為核心的資產(chǎn),并將深刻影響政府的管理模式、企業(yè)的業(yè)務(wù)模式。大數(shù)據(jù)對(duì)國(guó)家治理模式,對(duì)企業(yè)的決策、組織和業(yè)務(wù)流程,對(duì)個(gè)人生活方式都將產(chǎn)生巨大的影響。未來(lái)大數(shù)據(jù)將會(huì)如基礎(chǔ)設(shè)施一樣,有數(shù)據(jù)提供方、管理者、監(jiān)管者,數(shù)據(jù)的交叉復(fù)用將大數(shù)據(jù)變成一大產(chǎn)業(yè)。2012年3月22日,奧巴馬政府宣布投資2億美元拉動(dòng)大數(shù)據(jù)相關(guān)產(chǎn)業(yè)發(fā)展,將“大數(shù)據(jù)戰(zhàn)略”上升為國(guó)家戰(zhàn)略,甚至將大數(shù)據(jù)定義為“未來(lái)的新石油”。
關(guān)鍵詞:云計(jì)算 數(shù)據(jù)模型 云數(shù)據(jù)庫(kù) NoSQL數(shù)據(jù)庫(kù)
0 引言
從2006年Google提出“云計(jì)算”的概念至今,云計(jì)算正以史無(wú)前例的速度發(fā)展,國(guó)內(nèi)外各大IT企業(yè)都在開署各自的云計(jì)算平臺(tái),云計(jì)算的應(yīng)用更趨多樣化,目前在互聯(lián)網(wǎng)上我們看到的很多應(yīng)用都可以看到“云”的身影,諸如“云存儲(chǔ)”、“云安全”、“云物聯(lián)”、“云郵件”、“云輸入法”等等。總的來(lái)說(shuō)云計(jì)算包括三個(gè)層次的服務(wù):基礎(chǔ)設(shè)施即服務(wù)(IaaS),平臺(tái)即服務(wù)(PaaS)和軟件即服務(wù)(SaaS)。云服務(wù)模式實(shí)現(xiàn)了資源集中配置和管理,實(shí)現(xiàn)按需采購(gòu)、配置,避免資源浪費(fèi),能夠更好滿足用戶不斷變化的需求。同時(shí)降低管理維護(hù)成本,隨著云計(jì)算技術(shù)的不斷發(fā)展,系統(tǒng)的可靠性、擴(kuò)展性、穩(wěn)定性也會(huì)更好,云計(jì)算將影響傳統(tǒng)數(shù)據(jù)庫(kù)的發(fā)展趨勢(shì),云服務(wù)模式將逐步得到市場(chǎng)認(rèn)可,反過(guò)來(lái)講,傳統(tǒng)數(shù)據(jù)庫(kù)必須能更好適應(yīng)云計(jì)算環(huán)境的需求。傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)由于其天生的限制,已經(jīng)越來(lái)越無(wú)法滿足目前時(shí)代的要求,云計(jì)算時(shí)代對(duì)數(shù)據(jù)庫(kù)技術(shù)提出了新的需求,主要表現(xiàn)在海量數(shù)據(jù)處理,大規(guī)模集群管理,低延遲讀寫速度,建設(shè)及運(yùn)營(yíng)成本。雖然它在數(shù)據(jù)存儲(chǔ)方面占據(jù)了不可動(dòng)搖的地位,但對(duì)數(shù)據(jù)擴(kuò)展、讀寫速度、支撐容量以及建設(shè)和運(yùn)營(yíng)成本的要求方面,就稍顯遜色。下面我們來(lái)探討適應(yīng)于云計(jì)算的數(shù)據(jù)庫(kù)所支持的數(shù)據(jù)模型。
1 云數(shù)據(jù)模型的類型
無(wú)論是關(guān)系型數(shù)據(jù)庫(kù)還是非關(guān)系型數(shù)據(jù)庫(kù),都是某種數(shù)據(jù)模型的實(shí)現(xiàn),不同的數(shù)據(jù)模型可以滿足不同的應(yīng)用需求。數(shù)據(jù)模型會(huì)影響客戶端通過(guò)API對(duì)數(shù)據(jù)的操作,決定了客戶端如何對(duì)數(shù)據(jù)進(jìn)行編碼存儲(chǔ)。云數(shù)據(jù)庫(kù)的設(shè)計(jì)可以采用不同的數(shù)據(jù)模型,目前適應(yīng)于云計(jì)算平臺(tái)的數(shù)據(jù)模型有以下幾類:
1.1 基于云計(jì)算的關(guān)系模型。關(guān)系型云數(shù)據(jù)庫(kù)的數(shù)據(jù)模型涉及行組和表組等相關(guān)概念。此模型的數(shù)據(jù)結(jié)構(gòu)為一個(gè)表是一個(gè)邏輯關(guān)系,它包含一個(gè)分區(qū)鍵,用來(lái)對(duì)表進(jìn)行分區(qū)。具有相同分區(qū)鍵的多個(gè)表的集合稱為表組。在表組中,具有相同分區(qū)鍵值的多個(gè)行的集合稱為行組。一個(gè)行組中包含的行總是被分配到同一個(gè)數(shù)據(jù)節(jié)點(diǎn)上。每個(gè)表組會(huì)包含多個(gè)行組,這些行組會(huì)被分配到不同的數(shù)據(jù)節(jié)點(diǎn)上。一個(gè)數(shù)據(jù)分區(qū)包含了多個(gè)行組。因此,每個(gè)數(shù)據(jù)節(jié)點(diǎn)都存儲(chǔ)了位于某個(gè)分區(qū)鍵值區(qū)間內(nèi)的所有行。微軟的SQL Azure云數(shù)據(jù)庫(kù)就是基于此模型的。
1.2 NoSQL數(shù)據(jù)庫(kù)數(shù)據(jù)模型。由于在設(shè)計(jì)上和傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)相比有很大的不同,故稱此類數(shù)據(jù)庫(kù)為“NoSQL(Not only SQL)”系列數(shù)據(jù)庫(kù),即非關(guān)系型的數(shù)據(jù)庫(kù)。與關(guān)系型數(shù)據(jù)庫(kù)相比,此類數(shù)據(jù)庫(kù)非常關(guān)注對(duì)數(shù)據(jù)高并發(fā)讀寫和海量數(shù)據(jù)的存儲(chǔ),在架構(gòu)和數(shù)據(jù)模型方面做了簡(jiǎn)化,而在擴(kuò)展和并發(fā)等方面做了增強(qiáng)。此類數(shù)據(jù)庫(kù)種類繁多,且各有優(yōu)缺點(diǎn),其數(shù)據(jù)模型有如下四類:①鍵值(key-value)存儲(chǔ)模型。使用一個(gè)哈希表,這個(gè)表中有一個(gè)特定的鍵和一個(gè)指針指向特定的數(shù)據(jù)。其數(shù)據(jù)模型為一系列的鍵值對(duì)。它能提供非??斓牟樵兯俣取⒋蟮臄?shù)據(jù)存放量和高并發(fā)操作,非常適合通過(guò)主鍵對(duì)數(shù)據(jù)進(jìn)行查詢和修改等操作,缺點(diǎn)是存儲(chǔ)的數(shù)據(jù)缺少結(jié)構(gòu)化,不支持復(fù)雜的操作。運(yùn)用此模型的數(shù)據(jù)庫(kù)有BigTable、Tokyo cabinet/Tyrant、Redis、Voldmort、Berkeley DB等。②列式存儲(chǔ)模型。列式存儲(chǔ)和關(guān)系模型相似,與關(guān)系模型存儲(chǔ)記錄不同,列式存儲(chǔ)以流的方式在列中存儲(chǔ)所有的數(shù)據(jù)。其數(shù)據(jù)模型為以列簇式存儲(chǔ),將同一列數(shù)據(jù)存放在一起。屬于同一列的數(shù)據(jù)會(huì)盡可能地存儲(chǔ)在硬盤同一個(gè)頁(yè)中,而不是將屬于同一個(gè)行的數(shù)據(jù)存放在一起。使用列式數(shù)據(jù)庫(kù),將會(huì)節(jié)省大量I/O,并且大多數(shù)列式數(shù)據(jù)庫(kù)都支持Column Family這個(gè)特性,能將多個(gè)列并為一個(gè)小組。總體而言,這種數(shù)據(jù)模型的優(yōu)點(diǎn)是查找速度快,可擴(kuò)展性強(qiáng),更容易進(jìn)行分布式擴(kuò)展,缺點(diǎn)是功能相對(duì)局限。運(yùn)用此模型的數(shù)據(jù)庫(kù)有Cassandra、HBase、Riak等。③文檔模型。在數(shù)據(jù)結(jié)構(gòu)上,文檔型和鍵值型很相似,也是一個(gè)key對(duì)應(yīng)一個(gè)value,但是這個(gè)Value主要以JSON或者XML等格式的文檔來(lái)進(jìn)行存儲(chǔ),是有語(yǔ)義的,并且文檔數(shù)據(jù)庫(kù)一般可以對(duì)Value來(lái)創(chuàng)建Secondary Index來(lái)方便上層的應(yīng)用,而這點(diǎn)是普通鍵值數(shù)據(jù)庫(kù)所無(wú)法支持的。這種數(shù)據(jù)模型的優(yōu)點(diǎn)是對(duì)數(shù)據(jù)結(jié)構(gòu)要求不嚴(yán)格,缺點(diǎn)是對(duì)查詢性能不高,而且缺乏統(tǒng)一的查詢語(yǔ)法。運(yùn)用此類模型的數(shù)據(jù)庫(kù)有MongoDB、CouchDB等。④圖形模型。圖形結(jié)構(gòu)的數(shù)據(jù)庫(kù)同其他行列以及剛性結(jié)構(gòu)的SQL數(shù)據(jù)庫(kù)不同,它是使用靈活的圖形模型,并且能夠擴(kuò)展到多個(gè)服務(wù)器上。其數(shù)據(jù)模型為圖結(jié)構(gòu),其優(yōu)點(diǎn)是可以很方便地利用圖的相關(guān)算法,缺點(diǎn)是需要對(duì)整個(gè)圖做計(jì)算才能得出結(jié)果,不容易做分布式的集群方案。運(yùn)用此類模型的數(shù)據(jù)庫(kù)有Neo4J、InfoGrid、Infinite Graph等。數(shù)據(jù)模型有著各自的優(yōu)缺點(diǎn),它們適用于不同的領(lǐng)域。不管選擇關(guān)系模型,還是非關(guān)系模型,都要根據(jù)實(shí)際應(yīng)用的場(chǎng)景做出選擇。有時(shí)候單一的數(shù)據(jù)模型并不能滿足我們的需求,對(duì)于許多大型的應(yīng)用可能需要集成多種數(shù)據(jù)模型。
[關(guān)鍵詞]:大數(shù)據(jù) 高校學(xué)困生 立體精準(zhǔn) 幫扶模式
伴隨著移動(dòng)互聯(lián)技術(shù)普及、社交網(wǎng)絡(luò)快速興起、電子商務(wù)井噴式發(fā)展等信息技術(shù)的迅猛推進(jìn),人類社會(huì)正悄然步入大數(shù)據(jù)時(shí)代――以數(shù)據(jù)為核心的全新信息時(shí)代。面對(duì)大數(shù)據(jù)浪潮全面來(lái)襲,傳統(tǒng)的學(xué)業(yè)指導(dǎo)理念、方式和方法勢(shì)必受到數(shù)據(jù)革命的挑戰(zhàn),特別是針對(duì)高校學(xué)習(xí)困難學(xué)生(以下簡(jiǎn)稱“學(xué)困生”)的幫扶工作也將迎來(lái)新的機(jī)遇與挑戰(zhàn)。因此,高校教育工作者(以下簡(jiǎn)稱“教育者”)應(yīng)該基于大數(shù)據(jù)的背景下,認(rèn)真思考如何依靠分析數(shù)據(jù)構(gòu)建立體精準(zhǔn)的學(xué)困生幫扶模式,幫助他們盡早走出學(xué)業(yè)困境,促使其自覺(jué)完成從“后進(jìn)”到“先進(jìn)”的轉(zhuǎn)化。
1大數(shù)據(jù)概述
《大數(shù)據(jù)時(shí)代》的作者維克托?邁爾?舍恩伯――“大數(shù)據(jù)時(shí)代預(yù)言家”從價(jià)值的角度生動(dòng)的闡述了大數(shù)據(jù)的概念,人們通過(guò)掌握海量數(shù)據(jù),從而發(fā)現(xiàn)和挖掘隱藏在數(shù)據(jù)背后的規(guī)律和價(jià)值,證明了大數(shù)據(jù)不僅是一種新技術(shù),更為重要的是一種全新的思維方式和認(rèn)知能力,我們將其生動(dòng)的稱之為“大數(shù)據(jù)思維”和“大數(shù)據(jù)能力”。
2大數(shù)據(jù)視角下高校學(xué)困生幫扶工作面臨的現(xiàn)狀與挑戰(zhàn)
2.1 高校學(xué)困生幫扶工作的現(xiàn)狀
學(xué)困生問(wèn)題在國(guó)內(nèi)高校中普遍存在,這個(gè)困難學(xué)生群體的存在是一個(gè)不容忽視的問(wèn)題,也成為了高校教育工作的重點(diǎn)與難點(diǎn)。筆者通過(guò)學(xué)困生案例研究發(fā)現(xiàn),學(xué)困現(xiàn)狀的形成是一個(gè)動(dòng)態(tài)的復(fù)雜過(guò)程,前期成因識(shí)別和后期幫扶應(yīng)該是基于科學(xué)的分類和“社會(huì)化支持”而開展相應(yīng)的工作,但是傳統(tǒng)的學(xué)困幫扶工作大多數(shù)獨(dú)立了前期和后期的聯(lián)系,還存在以下弊端。
2.1.1 成因識(shí)別精準(zhǔn)度低
傳統(tǒng)學(xué)困成因識(shí)別僅限于“課堂表現(xiàn)”和“考試成績(jī)”兩項(xiàng)指標(biāo),沒(méi)有深挖學(xué)生學(xué)困現(xiàn)狀背后的因素,未建立科學(xué)系統(tǒng)的學(xué)困篩選體系,突出存在靜態(tài)識(shí)別、考量指標(biāo)過(guò)少、缺乏數(shù)據(jù)分析等缺點(diǎn)。
2.1.2 缺乏精準(zhǔn)個(gè)性化幫扶
在開展學(xué)困生幫扶工作時(shí),往往采取“一刀切”的方式,缺乏精確的分類指導(dǎo)、分層幫扶和動(dòng)態(tài)管理的實(shí)施原則,沒(méi)有遵循學(xué)生特點(diǎn),導(dǎo)致了幫扶效果不佳。
2.1.3 助困群體單一
以往的學(xué)困生幫扶工作一直依賴帶班輔導(dǎo)員(班主任)開展,而輔導(dǎo)員個(gè)體的時(shí)間、精力和幫扶手段受限,導(dǎo)致了“花大力氣,收小效果”的工作成效,間接形成了學(xué)困生教育工作難點(diǎn)。
2.2 大數(shù)據(jù)視角下高校學(xué)困生幫扶工作面臨的挑戰(zhàn)
2.2.1 數(shù)據(jù)的非結(jié)構(gòu)化類別增多,幫扶信息篩選難度增大、精確度更高
傳統(tǒng)學(xué)困生信息的采集來(lái)自于小規(guī)模結(jié)構(gòu)性數(shù)據(jù)樣本的收集,不僅數(shù)據(jù)精確度高,而且采集過(guò)程也要求零失誤,其工作量和干擾因素較小,但最大不足就是取得的信息寬度十分有限。而大數(shù)據(jù)時(shí)代涌現(xiàn)了大量的非結(jié)構(gòu)化數(shù)據(jù),包括學(xué)生的心理特征、行為習(xí)慣、個(gè)人性格偏好等類型數(shù)據(jù),使得教育者掌握的數(shù)據(jù)總量無(wú)限的接近學(xué)生個(gè)體,其采集過(guò)程的精確度也有較大差別,所以其中必然包含了很多不準(zhǔn)確、甚至是錯(cuò)誤的信息,容易對(duì)我們的信息篩選工作產(chǎn)生誤導(dǎo)和增大難度,這就要求學(xué)生管理工作者處理海量的非結(jié)構(gòu)化數(shù)據(jù),更加全面精準(zhǔn)的掌握學(xué)生的個(gè)體信息,更加客觀的分析和研判學(xué)生的個(gè)體化差異,接納學(xué)生個(gè)體的復(fù)雜性。
2.2.2 數(shù)據(jù)的整體性增強(qiáng),精準(zhǔn)、清晰的個(gè)性化幫扶趨勢(shì)更為明顯
以往我們開展學(xué)困生幫扶工作時(shí),往往采用小規(guī)模的數(shù)據(jù)抽樣調(diào)查的方式作為方案制定依據(jù),比如單純根據(jù)學(xué)生成績(jī)開展學(xué)業(yè)指導(dǎo)工作,而忽略學(xué)生個(gè)體在學(xué)習(xí)上真正的困難原因和根本訴求,不符合教育規(guī)律和學(xué)生個(gè)人發(fā)展。隨著信息化教育管理體系的推進(jìn),趨于完整的學(xué)生信息數(shù)據(jù)采集和分析也即將成為新常態(tài),所以必然會(huì)強(qiáng)調(diào)教育者重視數(shù)據(jù)的整體性,在此基礎(chǔ)上運(yùn)用先進(jìn)的數(shù)據(jù)挖據(jù)技術(shù)分析學(xué)生個(gè)體差異,才能制定加符合學(xué)生的身心發(fā)展規(guī)律的個(gè)性化幫扶計(jì)劃。
3大數(shù)據(jù)視角下構(gòu)建高校學(xué)困生立體精準(zhǔn)幫扶模式
學(xué)困生幫扶工作從本質(zhì)而言是遵從“為了一切學(xué)生”的工作理念,是踐行尊重教育規(guī)律和學(xué)生身心發(fā)展規(guī)律的實(shí)際行動(dòng),應(yīng)該接納不同的學(xué)生個(gè)體特點(diǎn),推行學(xué)業(yè)、心理、生活的全方位輔導(dǎo)。那么整個(gè)幫扶工作的模式應(yīng)該定位為:基于學(xué)困生數(shù)據(jù)的全面采集和精確分析,并且依托幫扶方式、助困群體、幫扶角度三個(gè)維度建的“立體精準(zhǔn)幫扶體”。
3.1 搭建科學(xué)動(dòng)態(tài)的學(xué)困生數(shù)據(jù)平臺(tái),精準(zhǔn)識(shí)別學(xué)困成因
大數(shù)據(jù)技術(shù)的應(yīng)用基礎(chǔ)必須依靠數(shù)據(jù)平臺(tái)的搭建,而開展學(xué)困生幫扶工作的第一步就是要全面、準(zhǔn)確的掌握學(xué)生個(gè)人信息,分析、判斷學(xué)困成因和根源。教育者應(yīng)實(shí)時(shí)采集校內(nèi)各信息平臺(tái)的共享數(shù)據(jù),并進(jìn)行研究整理,提取課堂出勤情況、學(xué)期GPA成績(jī)等數(shù)據(jù),籍此建立科學(xué)動(dòng)態(tài)的數(shù)據(jù)平臺(tái),掌握學(xué)困生的學(xué)習(xí)特征,精準(zhǔn)分析學(xué)困成因,并進(jìn)一步對(duì)成因進(jìn)行分類和歸納,制定個(gè)性化的學(xué)業(yè)指導(dǎo)。
3.2 引入融合多樣幫扶元素,構(gòu)建“立體幫扶網(wǎng)絡(luò)”
教育者擁有大數(shù)據(jù)思維模式,改變教育者 “單兵作戰(zhàn)”的慣性思維模式,加深對(duì)大量非結(jié)構(gòu)化數(shù)據(jù)的分析挖掘,在堅(jiān)持“個(gè)體為單位、一幫一助、控制助困規(guī)模、分類指導(dǎo)、分層幫扶”的實(shí)施原則,引入多樣化的幫扶元素應(yīng)對(duì)多元化的學(xué)困成因,進(jìn)一步組建“學(xué)業(yè)幫扶團(tuán)”和“學(xué)業(yè)指導(dǎo)團(tuán)”、開展“兩輔”(線上輔導(dǎo)和線下輔導(dǎo))、保持“三聯(lián)”(聯(lián)系學(xué)困生、聯(lián)系學(xué)生家長(zhǎng)、聯(lián)系教師),構(gòu)建教師、學(xué)生、家長(zhǎng)組成“全員育人網(wǎng)絡(luò)”,推行學(xué)業(yè)、心理、生活的“全方位立體幫扶網(wǎng)絡(luò)”。
3.3 建立學(xué)習(xí)評(píng)價(jià)體系,動(dòng)態(tài)跟蹤管理和前置學(xué)困幫扶工作
筆者通過(guò)調(diào)查研究發(fā)現(xiàn),教育者一般都依據(jù)學(xué)習(xí)效果對(duì)學(xué)生進(jìn)行評(píng)價(jià),忽略了學(xué)習(xí)這個(gè)動(dòng)態(tài)的結(jié)果,而大數(shù)據(jù)則是將結(jié)果性指標(biāo)轉(zhuǎn)變?yōu)榘l(fā)展性指標(biāo),有利于教育者動(dòng)態(tài)跟蹤學(xué)困生的學(xué)習(xí)過(guò)程,及時(shí)發(fā)現(xiàn)問(wèn)題、解決問(wèn)題,從而更好地對(duì)教育進(jìn)行調(diào)控,修改和制定更加切合實(shí)際情況的決策。
參考文獻(xiàn):
[1]卞友江.“大數(shù)據(jù)”概念考辨[J]. 新聞研究導(dǎo)刊,2013(05).
[2]孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J].計(jì)算機(jī)研究與發(fā)展,2013,50(1):146-169.
事實(shí)可能不是這樣。道高一尺,魔高一丈。在商業(yè)企業(yè)利用大數(shù)據(jù)提高自己營(yíng)銷能力的同時(shí),消費(fèi)者也在進(jìn)步,甚至聰明進(jìn)化的速度還可能超過(guò)商家,因此而形成新的買賣能力平衡。大數(shù)據(jù)只是工具,商家可以用,消費(fèi)者也可以用,而且,很可能消費(fèi)者的利用程度更高,能力也更強(qiáng)。
借助互聯(lián)網(wǎng),消費(fèi)信息的獲取更加容易,信息越來(lái)越透明
信息不對(duì)稱是商業(yè)得以發(fā)展的本質(zhì)。傳統(tǒng)的商業(yè)時(shí)代,買賣之間的信息獲取能力差異非常大,地域分隔、時(shí)空隔絕、傳播困難,消費(fèi)者獲取信息的成本非常高,在這種情況下,只要稍有頭腦的商家都可以借助信息差異獲取利益。
在互聯(lián)網(wǎng)時(shí)代,信息呈現(xiàn)爆炸性發(fā)展和蔓延,購(gòu)物的時(shí)間差和區(qū)域差已經(jīng)在互聯(lián)網(wǎng)以秒計(jì)時(shí)的全球化傳播沖擊下不再成為壁壘。每個(gè)消費(fèi)者都可以上網(wǎng)查詢資料、比較價(jià)格甚至可以借助一些信息化技術(shù)進(jìn)行虛擬試用,信息透明化讓商家徹底曝露在消費(fèi)者面前。
即便是大數(shù)據(jù)本身,不僅僅能服務(wù)商家企業(yè),也能夠服務(wù)消費(fèi)者,成為消費(fèi)者購(gòu)物時(shí)的重要參謀和助手。有經(jīng)驗(yàn)的消費(fèi)者,日積月累就會(huì)形成自己的大數(shù)據(jù),還有一些專業(yè)機(jī)構(gòu)綜合匯總各種數(shù)據(jù)提供更加專業(yè)化的建議和參考服務(wù),與一些商家孤立和割裂的數(shù)據(jù)相比,社會(huì)化的大數(shù)據(jù)更具有優(yōu)勢(shì),也成為對(duì)抗商家大數(shù)據(jù)“忽悠”的利器。
商家銷售行為的傳播速度極快,很容易形成效仿和其他競(jìng)爭(zhēng)者的及時(shí)應(yīng)對(duì),脫穎而出更難
與消費(fèi)者博弈大數(shù)據(jù)的使用還只是一個(gè)側(cè)面,更嚴(yán)重的威脅來(lái)自與直接競(jìng)爭(zhēng)對(duì)手或者潛在進(jìn)入者的面對(duì)面對(duì)抗。
在世界各地?fù)碛?200家酒店的喜達(dá)屋酒店及度假村集團(tuán)系統(tǒng)分析當(dāng)?shù)丶笆澜缃?jīng)濟(jì)因素、活動(dòng)和天氣預(yù)報(bào),以此優(yōu)化房?jī)r(jià)。由于知道了北美核心客戶群的本國(guó)天氣如何影響那些客戶在陽(yáng)光燦爛的加勒比海度假一周愿意花的錢,他們知道了什么時(shí)候降低房?jī)r(jià)或開展?fàn)I銷促銷活動(dòng)最合適,其每間客房的收入增長(zhǎng)了近5%。這樣的策略當(dāng)然有效,可會(huì)是其一家獨(dú)享的方案嗎?
大數(shù)據(jù)時(shí)代,信息傳播的速度極快,大數(shù)據(jù)也成為信息搜集和分析的重要方式。在這種情況下,一家企業(yè)開展的營(yíng)銷活動(dòng),很可能在發(fā)起的初期甚至還沒(méi)有正式上線的時(shí)候就被對(duì)手獲知,針對(duì)性的營(yíng)銷方案已經(jīng)在制定中,商家已經(jīng)很難建立起差異化的營(yíng)銷優(yōu)勢(shì)。
一種新產(chǎn)品上市,即便有專利的壁壘,但通過(guò)大數(shù)據(jù)的方式很可能被競(jìng)爭(zhēng)對(duì)手反向工程,或者通過(guò)大數(shù)據(jù)分析出產(chǎn)品的優(yōu)缺點(diǎn)與消費(fèi)者的痛點(diǎn),在競(jìng)爭(zhēng)對(duì)手刻意的模仿與微創(chuàng)新之下,產(chǎn)品的優(yōu)勢(shì)也很難長(zhǎng)期保持。
還有潛在的競(jìng)爭(zhēng)對(duì)手在蠢蠢欲動(dòng),以往行業(yè)的門檻在大數(shù)據(jù)時(shí)代越來(lái)越低,一些跨界的巨頭借助自身掌握的大數(shù)據(jù)能力切入新領(lǐng)域更加容易,也給不同的行業(yè)帶來(lái)了格局上的變化,新老企業(yè)都面臨巨大的挑戰(zhàn)和壓力。
信息爆炸造成信息風(fēng)暴,一招可以制勝,反過(guò)來(lái),一個(gè)爛招就可能變得一敗涂地
大數(shù)據(jù)也不會(huì)是百戰(zhàn)百勝的。事實(shí)上已經(jīng)有過(guò)很多大數(shù)據(jù)營(yíng)銷失敗的教訓(xùn),有平臺(tái)預(yù)測(cè)過(guò)的某電影的票房會(huì)很高,可結(jié)果卻以慘淡收?qǐng)觯劣谀切┨?hào)稱用大數(shù)據(jù)預(yù)測(cè)球賽結(jié)果與競(jìng)選獲勝的,更是屢屢失算。
在有些時(shí)候,大數(shù)據(jù)真有點(diǎn)向算命先生,即便很多次預(yù)測(cè)準(zhǔn)確,但只要一次失手,就有可能前功盡棄,一世英名付于流水。2008年,Google第一次開始預(yù)測(cè)流感就取得了很好的效果,比美國(guó)疾病預(yù)防控制中心(Centers for Disease Control and Prevention)提前兩禮拜預(yù)測(cè)到了流感的爆發(fā)。但是,幾年之后,Google的預(yù)測(cè)比實(shí)際情況(由防控中心根據(jù)全美就診數(shù)據(jù)推算得出)高出了50%。媒體過(guò)于渲染了Google的成功,出于好奇目的而搜索相關(guān)關(guān)鍵詞的人越來(lái)越多,從而導(dǎo)致了數(shù)據(jù)的扭曲。
借助大數(shù)據(jù)的研究成果和大數(shù)據(jù)的手段,可以使用一個(gè)妙招或開發(fā)一個(gè)產(chǎn)品實(shí)現(xiàn)爆款,但也有很大的風(fēng)險(xiǎn)因?yàn)橐粋€(gè)失誤而馬失前蹄功敗垂成。
如今,大數(shù)據(jù)的基礎(chǔ)是信息大爆炸,同時(shí)伴隨的也是信息的傳播風(fēng)暴,風(fēng)暴口上站著,有可能被吹得飛將起來(lái),也有可能被吹到大海里變得杳無(wú)音信。
消費(fèi)者的信息太多,選擇太多,大數(shù)據(jù)分析結(jié)果的適用性在下降
信息多是好的,但信息太多也有可能呈現(xiàn)負(fù)面結(jié)果。大數(shù)據(jù)需要大量的全面的數(shù)據(jù)資料,可越大的數(shù)據(jù)越全面的數(shù)據(jù),就越容易受到噪聲的影響,分析結(jié)論的可靠性反而會(huì)下降,錯(cuò)誤的使用大數(shù)據(jù),還不如沒(méi)有大數(shù)據(jù)。
一家保險(xiǎn)公司想了解日常習(xí)慣和購(gòu)買生命保險(xiǎn)意愿之間的關(guān)聯(lián)性。由于隨后覺(jué)得習(xí)慣太過(guò)于寬泛,該公司將調(diào)查范疇限定到是否吸煙上。但是,工作仍然沒(méi)有實(shí)質(zhì)進(jìn)展。不到半年,他們就終止了整個(gè)項(xiàng)目,因?yàn)橐恢蔽茨馨l(fā)現(xiàn)任何有價(jià)值的信息。
就消費(fèi)者行為分析來(lái)說(shuō),商家借助各種手段來(lái)研究消費(fèi)者,包括消費(fèi)者的個(gè)人資料、家庭信息、收入情況、歷史消費(fèi)行為、愛(ài)好,甚至開什么車、吃什么飯、經(jīng)常與怎樣的異性約會(huì),但這些信息太多太雜以后,也會(huì)讓分析者無(wú)所適從。
一、就業(yè)形勢(shì)分析
現(xiàn)階段,高校學(xué)生就業(yè)率與就業(yè)質(zhì)量正逐漸成為衡量各高校辦學(xué)水平及教學(xué)質(zhì)量的重要指標(biāo),已經(jīng)引起了各高校的強(qiáng)烈關(guān)注并為此出臺(tái)了各種幫助學(xué)生就業(yè)的計(jì)劃。根據(jù)教育部官網(wǎng)畢業(yè)生數(shù)據(jù)統(tǒng)計(jì),預(yù)計(jì)2021年高校畢業(yè)生人數(shù)將達(dá)到909萬(wàn)人,各高校畢業(yè)生依舊呈快速上升趨勢(shì),同時(shí),部分行業(yè)高校人才需求逐漸飽和、高校人才培養(yǎng)跟不上行業(yè)結(jié)構(gòu)性調(diào)整需要和企業(yè)招聘時(shí)效性低的情況仍然存在,極大影響了高校畢業(yè)生的高質(zhì)量就業(yè)。目前,大數(shù)據(jù)技術(shù)早已加入國(guó)家發(fā)展戰(zhàn)略計(jì)劃中,社會(huì)就業(yè)情況也加入政府工作報(bào)告中,大數(shù)據(jù)技術(shù)在高校學(xué)生就業(yè)方面的運(yùn)用更是為高校提升學(xué)生就業(yè)與人才培養(yǎng)質(zhì)量提供了新的機(jī)遇與方向,為高校精準(zhǔn)就業(yè)服務(wù)提供了更加科學(xué)的技術(shù)指導(dǎo)。近年來(lái),部分高校已經(jīng)開始運(yùn)用大數(shù)據(jù)技術(shù)分析社會(huì)行業(yè)發(fā)展?fàn)顩r,完善人才培養(yǎng)方案與實(shí)現(xiàn)學(xué)生和企業(yè)精準(zhǔn)對(duì)接以提高學(xué)生就業(yè)質(zhì)量。運(yùn)用互聯(lián)網(wǎng)、云計(jì)算和大數(shù)據(jù)等技術(shù),搭建學(xué)生與企業(yè)線上“智能配對(duì)”線下“精準(zhǔn)就業(yè)”的高校智能就業(yè)平臺(tái),探索培養(yǎng)更符合行業(yè)所需的個(gè)性化高校人才培養(yǎng)方案與適應(yīng)新時(shí)代行業(yè)發(fā)展的精準(zhǔn)就業(yè)服務(wù)新模式,為各高校學(xué)子提供更高質(zhì)量的就業(yè)信息,已成為新時(shí)代各高校學(xué)生就業(yè)服務(wù)的目標(biāo)。對(duì)此,高校應(yīng)該基于大數(shù)據(jù)技術(shù)精準(zhǔn)把握行業(yè)發(fā)展?fàn)顩r,以大學(xué)生高質(zhì)量就業(yè)為目標(biāo),進(jìn)行高校人才培養(yǎng)戰(zhàn)略的制定。因此,高校智能就業(yè)服務(wù)平臺(tái)的出現(xiàn),不僅可以解決社會(huì)上企業(yè)招不到所需人才和學(xué)生所學(xué)知識(shí)已被淘汰的問(wèn)題,而且對(duì)提升高校人才培養(yǎng)質(zhì)量與辦學(xué)水平具有顯著作用。
二、大數(shù)據(jù)在高校就業(yè)工作中的定位
現(xiàn)如今,人工智能、大數(shù)據(jù)和區(qū)塊鏈技術(shù)正在教育領(lǐng)域引發(fā)一場(chǎng)全新的革命浪潮,為提升高校培養(yǎng)人才質(zhì)量和辦學(xué)水平,使學(xué)生更加快樂(lè)、高效、智能地學(xué)習(xí)知識(shí)提供了重要的技術(shù)支撐。大數(shù)據(jù)作為互聯(lián)網(wǎng)時(shí)代“萬(wàn)物互聯(lián)”階段的推動(dòng)力也推動(dòng)著教育的發(fā)展,其數(shù)據(jù)科學(xué)思維和技術(shù)促進(jìn)了教育決策的科學(xué)化、高校發(fā)展的智能化、人才培養(yǎng)的個(gè)性化。大數(shù)據(jù)技術(shù)將重新定義高校就業(yè)生態(tài)系統(tǒng),高校知識(shí)將更加滿足行業(yè)需求,學(xué)生在校就能接觸行業(yè)發(fā)展的最新消息,學(xué)生都將找到最適合自己的工作。大數(shù)據(jù)技術(shù)在高校就業(yè)中的應(yīng)用,將突破傳統(tǒng)高校就業(yè)推薦方式的次元壁,為高校大學(xué)生高質(zhì)量的就業(yè)帶來(lái)新的機(jī)遇。
三、大數(shù)據(jù)在高校就業(yè)工作中的應(yīng)用
將大數(shù)據(jù)應(yīng)用于高校就業(yè)的實(shí)際問(wèn)題,將突破傳統(tǒng)的就業(yè)方式,為廣大學(xué)生和用人單位提供便利,最終實(shí)現(xiàn)既定的雙贏目標(biāo)。在以往的就業(yè)模式中,對(duì)于應(yīng)屆大學(xué)生的就業(yè),通常是由學(xué)校建立關(guān)系,然后由用人單位和學(xué)生本人進(jìn)行雙向選擇,最后簽訂三方協(xié)議。但這種就業(yè)模式也存在“學(xué)生所學(xué)”與“企業(yè)所需”不匹配的問(wèn)題。為更好地服務(wù)社會(huì),協(xié)調(diào)好學(xué)生、高校和企業(yè)的關(guān)系,應(yīng)全面實(shí)現(xiàn)高校學(xué)生培養(yǎng)至企業(yè)人才供給的流程化信息服務(wù),從而滿足大學(xué)生對(duì)行業(yè)就業(yè)信息了解和個(gè)性化咨詢服務(wù)的需求,提高學(xué)生就業(yè)教育的精準(zhǔn)性,從根本上解決師資匱乏、與行業(yè)把握不精準(zhǔn)的問(wèn)題。同時(shí),利用大數(shù)據(jù)技術(shù)對(duì)社會(huì)上海量就業(yè)創(chuàng)業(yè)信息數(shù)據(jù)進(jìn)行挖掘和分析,獲取精準(zhǔn)、有效的信息,并根據(jù)學(xué)生個(gè)性化需求完善高校人才培養(yǎng)方案,提升學(xué)生就業(yè)能力,從而解決人才培養(yǎng)與市場(chǎng)就業(yè)需求不匹配的結(jié)構(gòu)性矛盾。為了滿足上述業(yè)務(wù)需求,建立采用分層結(jié)構(gòu)的智能就業(yè)平臺(tái),其通過(guò)不同的主題庫(kù),以滿足學(xué)生不同的業(yè)務(wù)需求。
(一)為學(xué)生檢測(cè)學(xué)習(xí)服務(wù)
大學(xué)生首次注冊(cè)登錄時(shí),平臺(tái)將收集他們的興趣、專業(yè)、特長(zhǎng)、愛(ài)好等基本信息,為每個(gè)用戶進(jìn)行個(gè)性化定制職業(yè)生涯規(guī)劃,然后幫助用戶設(shè)定學(xué)習(xí)目標(biāo),包括短期目標(biāo)和長(zhǎng)期目標(biāo)。目標(biāo)的內(nèi)容主要來(lái)源于企業(yè)招聘服務(wù)信息庫(kù)中的招聘需求,從而實(shí)現(xiàn)學(xué)生的學(xué)習(xí)目標(biāo),學(xué)會(huì)應(yīng)用,學(xué)以致用。同時(shí),學(xué)生的學(xué)習(xí)情況也會(huì)隨時(shí)更新,根據(jù)自己的學(xué)習(xí)能力來(lái)提升目前適合企業(yè)的能力。
(二)為企業(yè)招聘服務(wù)
企業(yè)用戶通過(guò)企業(yè)賬號(hào)登錄,不定期向智能平臺(tái)企業(yè)對(duì)人才的需求。后臺(tái)通過(guò)企業(yè)需求分析,將其招聘需求更新為學(xué)生私人定制的學(xué)習(xí)目標(biāo),相當(dāng)于企業(yè)直接培養(yǎng)他們所需要的人才。同時(shí),將學(xué)生的學(xué)習(xí)數(shù)據(jù)通過(guò)后臺(tái)大數(shù)據(jù)推送到企業(yè)分析行業(yè),供企業(yè)選擇,從而減少招聘過(guò)程中人力資源效率低下的問(wèn)題。
(三)為高校教育理念提升服務(wù)
高??梢愿鶕?jù)自己的賬號(hào)登錄,關(guān)注本校學(xué)生和留學(xué)生的學(xué)習(xí)能力,以及企業(yè)招聘的需求信息,使高校能夠根據(jù)企業(yè)的需求和本校學(xué)生的學(xué)習(xí)情況進(jìn)行準(zhǔn)確地教育學(xué)生。同時(shí),學(xué)校還可以分析自身的優(yōu)缺點(diǎn),提高競(jìng)爭(zhēng)力、知名度、就業(yè)率。
四、大數(shù)據(jù)時(shí)代大學(xué)生就業(yè)趨勢(shì)展望
【關(guān)鍵詞】大數(shù)據(jù);數(shù)據(jù)分析;應(yīng)用領(lǐng)域
1.大數(shù)據(jù)的定義
美國(guó)國(guó)家標(biāo)準(zhǔn)和技術(shù)研究院對(duì)大數(shù)據(jù)做出了定義:“大數(shù)據(jù)是指其數(shù)據(jù)量、采集速度,或數(shù)據(jù)表示限制了使用傳統(tǒng)關(guān)系型方法進(jìn)行有效分析的能力,或需要使用重要的水平縮放技術(shù)來(lái)實(shí)現(xiàn)高效處理的數(shù)據(jù)?!蔽覀冋J(rèn)為大數(shù)據(jù)價(jià)值鏈可分為:數(shù)據(jù)生成、數(shù)據(jù)采集、數(shù)據(jù)儲(chǔ)存以及數(shù)據(jù)分析。數(shù)據(jù)分析是大數(shù)據(jù)價(jià)值鏈的最后也是最重要的階段,是大數(shù)據(jù)價(jià)值的實(shí)現(xiàn),是大數(shù)據(jù)應(yīng)用的基礎(chǔ),其目的在于提取有用的值,提供論斷建議或支持決策,通過(guò)對(duì)不同領(lǐng)域數(shù)據(jù)集的分析可能會(huì)產(chǎn)生不同級(jí)別的潛在價(jià)值。
可用于大數(shù)據(jù)分析的傳統(tǒng)數(shù)據(jù)分析方法:(1)聚類分析。聚類分析是劃分對(duì)象的統(tǒng)計(jì)學(xué)方法,指把具有某種相似特征的物體或者事物歸為一類。聚類分析的目的在于辨別在某些特性上相似(但是預(yù)先未知)的事物,并按這些特性將樣本劃分成若干類(群),使在同一類內(nèi)的事物具有高度的同質(zhì)性,而不同類的事物則有高度的異質(zhì)性。聚類分析是一種沒(méi)有使用訓(xùn)練數(shù)據(jù)的無(wú)監(jiān)督式學(xué)習(xí)。(2)因子分析。因子分析的基本目的就是用少數(shù)幾個(gè)因子去描述許多指標(biāo)或因素之間的聯(lián)系,即將相互比較密切的幾個(gè)變量歸在同一類中,每一類變量就成為一個(gè)因子(之所以稱其為因子,是因?yàn)樗遣豢捎^測(cè)的,即不是具體的變量),以較少的幾個(gè)因子反映原數(shù)據(jù)的大部分信息。(3)相關(guān)分析。相關(guān)分析法是測(cè)定事物之間相關(guān)關(guān)系的規(guī)律性,并據(jù)以進(jìn)行預(yù)測(cè)和控制的分析方法。社會(huì)經(jīng)濟(jì)形象之間存在著大量的相互聯(lián)系、相互依賴、相互制約的數(shù)量關(guān)系。這種關(guān)系可分為兩種類型。一類是函數(shù)關(guān)系,它反映著現(xiàn)象之間嚴(yán)格的依存關(guān)系,也稱確定性的依存關(guān)系。在這種關(guān)系中,對(duì)于變量的每一個(gè)數(shù)值,都有一個(gè)或幾個(gè)確定的值與之對(duì)應(yīng)。另一類為相關(guān)關(guān)系,在這種關(guān)系中,變量之間存在著不確定、不嚴(yán)格的依存關(guān)系,對(duì)于變量的某個(gè)數(shù)值,可以有另一變量的若干數(shù)值與之相對(duì)應(yīng),這若干個(gè)數(shù)值圍繞著它們的平均數(shù)呈現(xiàn)出有規(guī)律的波動(dòng)。(4)回歸分析。回歸分析是研究一個(gè)變量與其他若干變量之間相關(guān)關(guān)系的一種數(shù)學(xué)工具,它是在一組實(shí)驗(yàn)或觀測(cè)數(shù)據(jù)的基礎(chǔ)上,尋找被隨機(jī)性掩蓋了的變量之間的依存關(guān)系。通過(guò)回歸分析,可以把變量間的復(fù)雜的、不確定的關(guān)系變得簡(jiǎn)單化、有規(guī)律化。
雖然這些傳統(tǒng)的分析方法已經(jīng)被應(yīng)用于大數(shù)據(jù)領(lǐng)域,但是它們?cè)谔幚硪?guī)模較大的數(shù)據(jù)集合時(shí),效率無(wú)法達(dá)到用戶預(yù)期,且難以處理復(fù)雜的數(shù)據(jù),如非結(jié)構(gòu)化數(shù)據(jù)。因此,出現(xiàn)了許多專門針對(duì)大數(shù)據(jù)的集成、管理及分析的技術(shù)和方法。
2.大數(shù)據(jù)分析方法
布隆過(guò)濾器:其實(shí)質(zhì)是一個(gè)位數(shù)組和一系列HASH函數(shù)。布隆過(guò)濾器的原理是利用位數(shù)組存儲(chǔ)數(shù)據(jù)的HASH值而不是數(shù)據(jù)本身,其本質(zhì)是利用HASH函數(shù)對(duì)數(shù)據(jù)進(jìn)行有損壓縮存儲(chǔ)的位圖索引。其優(yōu)點(diǎn)是具有較高的空間效率和查詢速率,缺點(diǎn)是有一定的誤識(shí)別率和刪除困難。布隆過(guò)濾器適用于允許低誤識(shí)別率的大數(shù)據(jù)場(chǎng)合。
HASH法,其本質(zhì)是將數(shù)據(jù)轉(zhuǎn)化為長(zhǎng)度更短的定長(zhǎng)的數(shù)值或索引值的方法。這種方法的優(yōu)點(diǎn)是具有快速的讀寫和查詢速度,缺點(diǎn)是難以找到一個(gè)良好的HASH函數(shù)。
索引:無(wú)論是在管理結(jié)構(gòu)化數(shù)據(jù)的傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù),還是管理半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的技術(shù)中,索引都是一個(gè)減少磁盤讀寫開銷、提高增刪改查速率的有效方法。索引的缺陷在于需要額外的開銷存儲(chǔ)索引文件,且需要根據(jù)數(shù)據(jù)的更新而動(dòng)態(tài)維護(hù)。
TRIE樹:又稱為字典樹,是HASH樹的變種形式,多被用于快速檢索,和詞頻統(tǒng)計(jì)。TRIE樹的思想是利用字符串的公共前綴,最大限度地減少字符串的比較,提高查詢效率。
并行計(jì)算:相對(duì)于傳統(tǒng)的串行計(jì)算,并行計(jì)算是指同時(shí)使用多個(gè)計(jì)算資源完成運(yùn)算。其基本思想是將問(wèn)題進(jìn)行分解,由若干個(gè)獨(dú)立的處理器完成各自的任務(wù),以達(dá)到協(xié)同處理的目的。
傳統(tǒng)數(shù)據(jù)分析方法,大多數(shù)都是通過(guò)對(duì)原始數(shù)據(jù)集進(jìn)行抽樣或者過(guò)濾,然后對(duì)數(shù)據(jù)樣本進(jìn)行分析,尋找特征和規(guī)律,其最大的特點(diǎn)是通過(guò)復(fù)雜的算法從有限的樣本空間中獲取盡可能多的信息。隨著計(jì)算能力和存儲(chǔ)能力的提升,大數(shù)據(jù)分析方法與傳統(tǒng)分析方法的最大區(qū)別在于分析的對(duì)象是全體數(shù)據(jù),而不是數(shù)據(jù)樣本,其最大的特點(diǎn)在于不追求算法的復(fù)雜性和精確性,而追求可以高效地對(duì)整個(gè)數(shù)據(jù)集的分析??傊?,傳統(tǒng)數(shù)據(jù)方法力求通過(guò)復(fù)雜算法從有限的數(shù)據(jù)集中獲取信息,其更加追求準(zhǔn)確性;大數(shù)據(jù)分析方法則是通過(guò)高效的算法、模式,對(duì)全體數(shù)據(jù)進(jìn)行分析。
3.大數(shù)據(jù)應(yīng)用領(lǐng)域
目前根據(jù)數(shù)據(jù)的生成方式和結(jié)構(gòu)特點(diǎn)不同,可以將數(shù)據(jù)分析劃分為6個(gè)關(guān)鍵技術(shù)領(lǐng)域:(1)結(jié)構(gòu)化數(shù)據(jù)。一直是傳統(tǒng)數(shù)據(jù)分析的重要研究對(duì)象,目前主流的結(jié)構(gòu)化數(shù)據(jù)管理工具,如關(guān)系型數(shù)據(jù)庫(kù)等,都提供了數(shù)據(jù)分析功能。(2)文本。是常用的存儲(chǔ)文字、傳遞信息的方式,也是最常見(jiàn)的非結(jié)構(gòu)化數(shù)據(jù)。一直演化到21世紀(jì)初新興的在線社交網(wǎng)絡(luò)分析。(3)WEB數(shù)據(jù)。WEB技術(shù)的發(fā)展,極大地豐富了獲取和交換數(shù)據(jù)的方式,WEB數(shù)據(jù)高速的增長(zhǎng),使其成為大數(shù)據(jù)的主要來(lái)源。(4)多媒體數(shù)據(jù)。隨著通訊技術(shù)的發(fā)展,圖片、音頻、視頻等體積較大的數(shù)據(jù),也可以被快速地傳播,由于缺少文字信息,其分析方法與其他數(shù)據(jù)相比,具有顯著的特點(diǎn)。(5)社交網(wǎng)絡(luò)數(shù)據(jù)。從一定程度上反映了人類社會(huì)活動(dòng)的特征,具有重要的價(jià)值。(6)移動(dòng)數(shù)據(jù)。與傳統(tǒng)的互聯(lián)網(wǎng)數(shù)據(jù)不同,具有明顯的地理位置信息、用戶個(gè)體特征等其他信息。
大數(shù)據(jù)未來(lái)的應(yīng)用領(lǐng)域和方向還包括以下幾個(gè)方面:(1)大數(shù)據(jù)可視化。在許多人機(jī)交互場(chǎng)景中,都遵循所見(jiàn)即所得的原則,例如文本和圖像編輯器等。在大數(shù)據(jù)應(yīng)用中,混雜的數(shù)據(jù)本身是難以輔助決策的,只有將分析后的結(jié)果以友好的形式展現(xiàn),才會(huì)被用戶接受并加以利用。報(bào)表、直方圖、餅狀圖、回歸曲線等經(jīng)常被用于表現(xiàn)數(shù)據(jù)分析的結(jié)果,以后肯定會(huì)出現(xiàn)更多的新穎的表現(xiàn)形式,例如微軟的“人立方”社交搜索引擎使用關(guān)系圖來(lái)表現(xiàn)人際關(guān)系。(2)面向數(shù)據(jù)。程序是數(shù)據(jù)結(jié)構(gòu)和算法,而數(shù)據(jù)結(jié)構(gòu)就是存儲(chǔ)數(shù)據(jù)的。在程序設(shè)計(jì)的發(fā)展歷程中,也可以看出數(shù)據(jù)的地位越來(lái)越重要。在邏輯比數(shù)據(jù)復(fù)雜的小規(guī)模數(shù)據(jù)時(shí)代,程序設(shè)計(jì)以面向過(guò)程為主;隨著業(yè)務(wù)數(shù)據(jù)的復(fù)雜化,催生了面向?qū)ο蟮脑O(shè)計(jì)方法。如今,業(yè)務(wù)數(shù)據(jù)的復(fù)雜度已經(jīng)遠(yuǎn)遠(yuǎn)超過(guò)業(yè)務(wù)邏輯,程序也逐漸從算法密集型轉(zhuǎn)向數(shù)據(jù)密集型??梢灶A(yù)見(jiàn),一定會(huì)出現(xiàn)面向數(shù)據(jù)的程序設(shè)計(jì)方法,如同面向?qū)ο笠粯?,在軟件工程、體系結(jié)構(gòu)、模式設(shè)計(jì)等方面對(duì)IT技術(shù)的發(fā)展產(chǎn)生深遠(yuǎn)的影響。
4.結(jié)束語(yǔ)
大數(shù)據(jù)引發(fā)思維變革。在大數(shù)據(jù)時(shí)代,數(shù)據(jù)的收集、獲取和分析都更加快捷,這些海量的數(shù)據(jù)將對(duì)我們的思考方式產(chǎn)生深遠(yuǎn)的影響。分析數(shù)據(jù)時(shí)要盡可能地利用所有數(shù)據(jù),而不只是分析少量的樣本數(shù)據(jù)。相比于精確的數(shù)據(jù),我們更樂(lè)于接受紛繁復(fù)雜的數(shù)據(jù)。我們應(yīng)該更為關(guān)注事物之間的相關(guān)關(guān)系,而不是探索因果關(guān)系。大數(shù)據(jù)的簡(jiǎn)單算法比小數(shù)據(jù)的復(fù)雜算法更為有效。大數(shù)據(jù)的分析結(jié)果將減少?zèng)Q策中的草率和主觀因素,數(shù)據(jù)科學(xué)家將取代“專家”。 [科]
【參考文獻(xiàn)】
大數(shù)據(jù)對(duì)傳媒業(yè)產(chǎn)生了革命性的影響,其實(shí),不僅傳媒行業(yè)會(huì)受到大數(shù)據(jù)帶來(lái)的影響,大數(shù)據(jù)也對(duì)傳媒學(xué)術(shù)研究產(chǎn)生巨大的沖擊和挑戰(zhàn)。目前已經(jīng)有學(xué)者開始就大數(shù)據(jù)對(duì)傳媒研究的影響進(jìn)行了初步分析,但總體而言,新聞傳播學(xué)界對(duì)大數(shù)據(jù)的研究偏重于現(xiàn)象描述和情況介紹,對(duì)大數(shù)據(jù)給學(xué)術(shù)研究帶來(lái)的挑戰(zhàn)和學(xué)術(shù)創(chuàng)新問(wèn)題的研究卻較少。基于此,本文以傳媒經(jīng)濟(jì)研究為對(duì)象,考察大數(shù)據(jù)對(duì)傳媒經(jīng)濟(jì)研究帶來(lái)的挑戰(zhàn),為大數(shù)據(jù)背景下傳媒經(jīng)濟(jì)研究的發(fā)展提供行動(dòng)路線圖。
大數(shù)據(jù)對(duì)傳媒經(jīng)濟(jì)研究帶來(lái)的挑戰(zhàn)
傳媒經(jīng)濟(jì)學(xué)的理論背景來(lái)自經(jīng)濟(jì)學(xué),包括微觀經(jīng)濟(jì)學(xué)理論、產(chǎn)業(yè)經(jīng)濟(jì)學(xué)理論、制度經(jīng)濟(jì)學(xué)理論等。有學(xué)者認(rèn)為,大數(shù)據(jù)在研究對(duì)象、研究工具、研究理論和研究方法等方面對(duì)傳統(tǒng)經(jīng)濟(jì)學(xué)形成了沖擊,由此提出大數(shù)據(jù)經(jīng)濟(jì)學(xué)(Big Data Economics)概念,認(rèn)為應(yīng)該運(yùn)用大數(shù)據(jù)思想對(duì)傳統(tǒng)經(jīng)濟(jì)學(xué)進(jìn)行深化研究。在傳媒經(jīng)濟(jì)學(xué)研究方面,大數(shù)據(jù)在研究范式、研究理論、研究方法、研究工具以及研究對(duì)象等方面都會(huì)對(duì)既有研究產(chǎn)生沖擊,傳媒經(jīng)濟(jì)學(xué)研究面臨著理論創(chuàng)新的挑戰(zhàn)。
1.研究范式
按照庫(kù)恩的界定,范式是一個(gè)學(xué)術(shù)群體中大部分成員共同認(rèn)可的一整套前提假設(shè),是學(xué)術(shù)共同體公認(rèn)并共享的世界觀。傳媒經(jīng)濟(jì)學(xué)基本遵循著新古典主義經(jīng)濟(jì)學(xué)的研究范式,新古典主義經(jīng)濟(jì)學(xué)的核心是理性人假設(shè)。理性人假設(shè)認(rèn)為人是追求自身效用最大化的理性個(gè)體,在制定每一項(xiàng)決策時(shí)都會(huì)嚴(yán)格按照成本收益比進(jìn)行考量和計(jì)算。但批評(píng)者指出,完全理性假設(shè)在現(xiàn)實(shí)中并不存在。在現(xiàn)實(shí)中,一方面,搜索信息需要花費(fèi)巨大的時(shí)間成本和精力;另一方面,人們?nèi)狈Ψ治龊吞幚砭蘖啃畔⒌墓ぞ吆头椒?。因此,人們只?huì)搜索有限信息,以此作為決策的依據(jù),這就是有限理性假設(shè)。
有限理性假設(shè)比完全理性假設(shè)更加接近現(xiàn)實(shí),但這兩種假設(shè)有著共同的前提,即個(gè)體對(duì)信息的搜索和處理需要巨大的成本。因而,決定采用完全理性假設(shè)還是有限理性假設(shè)時(shí),主要是比較獲取信息的成本和從信息中得到的收益:當(dāng)信息收益大于信息成本時(shí),繼續(xù)搜尋信息,逼近完全理性假設(shè);當(dāng)信息成本等于或大于信息收益時(shí),停止信息搜索,按照有限理性假設(shè)采取決策。
在大數(shù)據(jù)環(huán)境下,理性假設(shè)的前提遇到了挑戰(zhàn),大數(shù)據(jù)技術(shù)極大地減少了受眾搜索信息的成本,受眾可以輕而易舉地獲取決策所需的各種信息,并利用數(shù)據(jù)處理技術(shù)對(duì)信息的收益進(jìn)行計(jì)算,在此基礎(chǔ)上作出決策,這使得有限理性范式失去了解釋力。同時(shí),信息成本和交易成本的大幅下降,使網(wǎng)絡(luò)空間出現(xiàn)了許多新的組織形態(tài)和交易形式,如以分享、合作為主題的維基百科、開放源代碼、網(wǎng)絡(luò)共享等,這些新的組織形式無(wú)法用理性范式進(jìn)行解釋,如果從理性的角度計(jì)算成本收益關(guān)系,那么人們沒(méi)有動(dòng)力進(jìn)行網(wǎng)絡(luò)分享與合作。然而,這種“無(wú)組織的組織力量”在今天的互聯(lián)網(wǎng)世界越來(lái)越常見(jiàn)。這些大數(shù)據(jù)時(shí)代的新現(xiàn)象很難用理性范式進(jìn)行解釋,我們需要用新的傳媒經(jīng)濟(jì)學(xué)研究范式解釋這些行為和現(xiàn)象。
2.研究理論
在研究理論上,大數(shù)據(jù)時(shí)代的傳媒經(jīng)濟(jì)研究不僅需要經(jīng)濟(jì)學(xué)理論,也需要社會(huì)學(xué)理論、網(wǎng)絡(luò)科學(xué)理論等其他學(xué)科理論。傳統(tǒng)的經(jīng)濟(jì)學(xué)理論中,個(gè)體脫離了所屬的社會(huì)結(jié)構(gòu)和社會(huì)群體,研究者忽視了社會(huì)關(guān)系、人際傳播、社會(huì)結(jié)構(gòu)因素對(duì)個(gè)體的影響,脫離個(gè)體所鑲嵌的社會(huì)情境因素來(lái)考察個(gè)體,犯了“低度社會(huì)化”的錯(cuò)誤。在傳媒經(jīng)濟(jì)理論中,無(wú)論是生產(chǎn)者還是消費(fèi)者,他們的生產(chǎn)行為和消費(fèi)行為都是黑箱,我們不知道生產(chǎn)者和消費(fèi)者是如何做出生產(chǎn)和消費(fèi)決策的,哪些因素產(chǎn)生影響、如何影響等一系列問(wèn)題都處在黑箱中。
在大數(shù)據(jù)的幫助下,研究者可以借助于社會(huì)學(xué)理論和社會(huì)網(wǎng)絡(luò)研究理論,把個(gè)體納入到一定的社會(huì)結(jié)構(gòu)和社會(huì)情境中,考察個(gè)體鑲嵌其中的社會(huì)關(guān)系因素如何影響個(gè)體的媒介接觸和媒介消費(fèi)行為,研究影響個(gè)體行為的各種因素及其影響機(jī)制,揭開人們媒介接觸和媒介消費(fèi)行為的黑箱,從而發(fā)展出能夠揭示傳媒經(jīng)濟(jì)行為一般規(guī)律的理論。
3.研究工具和方法
傳媒經(jīng)濟(jì)學(xué)主要的研究方法包括抽樣調(diào)查、內(nèi)容分析、假設(shè)檢驗(yàn)、實(shí)驗(yàn)研究等,盡管這些方法有其優(yōu)點(diǎn),但它們的缺點(diǎn)也是顯而易見(jiàn)的,這些傳統(tǒng)方法都無(wú)法對(duì)海量數(shù)據(jù)進(jìn)行分析,在大數(shù)據(jù)面前,這些傳統(tǒng)方法基本是無(wú)能為力的。
以抽樣調(diào)查方法來(lái)說(shuō),在大數(shù)據(jù)來(lái)臨之前,受制于研究條件和數(shù)據(jù)可得性,研究者只能對(duì)有限的數(shù)據(jù)進(jìn)行抽樣,通過(guò)對(duì)有限樣本的分析推斷總體的狀況。抽樣分析的前提是所抽取的樣本能夠代表總體,但在研究中很難使樣本能夠完全代表總體,樣本與總體總會(huì)存在一定的誤差,抽樣調(diào)查的價(jià)值也因此打折扣。在大數(shù)據(jù)時(shí)代,可以直接對(duì)總體數(shù)據(jù)進(jìn)行分析,而無(wú)需通過(guò)抽樣調(diào)查來(lái)估計(jì)總體狀況。同樣,內(nèi)容分析法也是基于抽樣分析,通過(guò)抽取樣本對(duì)媒介內(nèi)容進(jìn)行研究。實(shí)驗(yàn)法也是對(duì)少數(shù)受試者施加試驗(yàn)刺激,通過(guò)與對(duì)照組進(jìn)行比較研究,觀察實(shí)驗(yàn)刺激產(chǎn)生的效果。這些傳統(tǒng)方法都是小數(shù)據(jù)時(shí)代處理信息所采用的方法,并不適用于大數(shù)據(jù)環(huán)境,大數(shù)據(jù)需要學(xué)者設(shè)計(jì)運(yùn)用新的研究方法與研究工具。
4.研究對(duì)象
在微觀經(jīng)濟(jì)學(xué)研究中,研究對(duì)象是個(gè)體的企業(yè)、家庭或個(gè)人,研究者通過(guò)對(duì)單個(gè)企業(yè)或個(gè)人的生產(chǎn)、消費(fèi)等行為的分析,考察影響他們決策的各種因素。在傳媒經(jīng)濟(jì)學(xué)研究中,媒體、受眾也是作為個(gè)體存在的。這種研究有兩方面缺陷,一是個(gè)體的消費(fèi)行為始終處在黑箱中,我們不知道個(gè)體是如何做出消費(fèi)行為決策的。二是研究只見(jiàn)樹木不見(jiàn)森林,無(wú)法從對(duì)個(gè)體的研究中獲知關(guān)于總體的狀況,而總體狀況具有極大的研究?jī)r(jià)值和應(yīng)用價(jià)值。
大數(shù)據(jù)可以在這兩方面做出改進(jìn),首先,借助于大數(shù)據(jù)技術(shù),研究者可以對(duì)受眾的媒介接觸行為和媒介消費(fèi)行為進(jìn)行準(zhǔn)確的追蹤分析,掌握受眾在每時(shí)每刻的媒介接觸和消費(fèi)行為。另外,大數(shù)據(jù)可以使研究者獲知受眾整體的媒介接觸和消費(fèi)情況,進(jìn)而對(duì)受眾的媒介接觸和消費(fèi)趨勢(shì)做出預(yù)測(cè)。
5.研究主體
大數(shù)據(jù)對(duì)傳媒經(jīng)濟(jì)研究者也提出了挑戰(zhàn),在大數(shù)據(jù)時(shí)代,研究者需要對(duì)大數(shù)據(jù)有深刻的理解和把握,充分認(rèn)識(shí)大數(shù)據(jù)對(duì)傳媒經(jīng)濟(jì)研究帶來(lái)的深遠(yuǎn)影響,學(xué)會(huì)從大數(shù)據(jù)的研究范式出發(fā)思考問(wèn)題。另外,研究者也需要掌握數(shù)據(jù)分析的方法和工具,學(xué)會(huì)利用大數(shù)據(jù)分析工具對(duì)傳媒經(jīng)濟(jì)學(xué)的各類問(wèn)題進(jìn)行研究。同時(shí),跨學(xué)科的學(xué)術(shù)合作與學(xué)術(shù)交流也變得更加重要,任何單一學(xué)科的視角和方法都難以對(duì)大數(shù)據(jù)環(huán)境下的傳媒經(jīng)濟(jì)現(xiàn)象做出充分的解釋。只有從傳播學(xué)、經(jīng)濟(jì)學(xué)、社會(huì)學(xué)等多種理論視角進(jìn)行跨學(xué)科考察,才能對(duì)大數(shù)據(jù)環(huán)境下的傳媒經(jīng)濟(jì)問(wèn)題做出深入的研究。
大數(shù)據(jù)時(shí)代傳媒經(jīng)濟(jì)研究的創(chuàng)新
大數(shù)據(jù)對(duì)傳媒經(jīng)濟(jì)學(xué)研究提出了相當(dāng)大的挑戰(zhàn),在大數(shù)據(jù)環(huán)境下,傳媒經(jīng)濟(jì)研究至少可以在以下四個(gè)方面進(jìn)行創(chuàng)新:
1.受眾行為分析
受眾的媒介接觸和媒介消費(fèi)行為,始終是傳媒經(jīng)濟(jì)研究的核心問(wèn)題。在小數(shù)據(jù)時(shí)代,很難準(zhǔn)確全面地了解受眾的媒介接觸和媒介消費(fèi)行為,無(wú)論是傳統(tǒng)的入戶調(diào)查,還是受眾的自我報(bào)告,都存在兩方面問(wèn)題:一是樣本量太小,從樣本中得出的結(jié)論不具有推廣性;二是受眾在接受調(diào)查時(shí)經(jīng)常會(huì)給出有偏向的答案,由于第三者效應(yīng)的存在,受眾總會(huì)有美化自身行為的可能性。這使得對(duì)受眾媒介接觸和媒介消費(fèi)行為的研究變得非常困難。
大數(shù)據(jù)技術(shù)能夠?qū)κ鼙姷拿浇榻佑|和媒介消費(fèi)行為進(jìn)行實(shí)時(shí)分析,比如受眾在網(wǎng)絡(luò)上點(diǎn)擊了哪些頁(yè)面、停留了多長(zhǎng)時(shí)間、鏈接到哪些網(wǎng)站、購(gòu)買了什么商品、發(fā)表了怎樣的評(píng)論等信息都可以被后臺(tái)服務(wù)器保留,通過(guò)分析受眾的個(gè)人接觸信息,可以準(zhǔn)確把握受眾媒介接觸行為的特點(diǎn)和模式,進(jìn)而對(duì)受眾進(jìn)行有針對(duì)性的營(yíng)銷。
2.市場(chǎng)趨勢(shì)預(yù)測(cè)
大數(shù)據(jù)技術(shù)可以對(duì)市場(chǎng)趨勢(shì)做出準(zhǔn)確預(yù)測(cè),舍恩伯格認(rèn)為,大數(shù)據(jù)的核心就是預(yù)測(cè),它是把數(shù)學(xué)算法運(yùn)用到海量數(shù)據(jù)上來(lái)預(yù)測(cè)事情發(fā)生的可能性。一個(gè)著名的例子是Farecast票價(jià)預(yù)測(cè)工具,這個(gè)工具通過(guò)對(duì)近十萬(wàn)億條機(jī)票價(jià)格數(shù)據(jù)進(jìn)行分析,預(yù)測(cè)美國(guó)國(guó)內(nèi)航班機(jī)票價(jià)格,其預(yù)測(cè)的精準(zhǔn)程度達(dá)到75%,每位使用該系統(tǒng)的消費(fèi)者每張機(jī)票可節(jié)約50美元。
3.廣告及營(yíng)銷精準(zhǔn)度研究
在小數(shù)據(jù)時(shí)代,廣告投放呈現(xiàn)出撒胡椒面式的粗放形態(tài),廣告的投資回報(bào)率很低,商品的營(yíng)銷手段也較為粗糙,難以對(duì)受眾進(jìn)行一對(duì)一的精準(zhǔn)營(yíng)銷。大數(shù)據(jù)環(huán)境下,通過(guò)對(duì)每位消費(fèi)者的消費(fèi)習(xí)慣和消費(fèi)模式數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,可以進(jìn)行精準(zhǔn)的廣告投放和商品營(yíng)銷,提高廣告和營(yíng)銷的精準(zhǔn)度。
比如,亞馬遜運(yùn)用數(shù)據(jù)挖掘技術(shù),通過(guò)分析用戶的瀏覽、收藏、購(gòu)買、評(píng)論及其他用戶的反饋等數(shù)據(jù),預(yù)測(cè)每位消費(fèi)者可能感興趣的內(nèi)容,將其推薦給消費(fèi)者。亞馬遜提出,在最理想的情況下,亞馬遜只會(huì)推薦一本書,而這本書就是消費(fèi)者將要購(gòu)買的那本書。
4.盈利模式創(chuàng)新研究
大數(shù)據(jù)環(huán)境下,媒體的盈利模式也需要做出調(diào)整。在讀者量不斷下滑、廣告市場(chǎng)被新興媒體分流的現(xiàn)實(shí)背景下,傳統(tǒng)的二次售賣模式難以為繼。傳統(tǒng)媒體必須創(chuàng)新盈利模式,利用大數(shù)據(jù)技術(shù)帶來(lái)的機(jī)會(huì),整合數(shù)據(jù)資源,尋找新的盈利增長(zhǎng)點(diǎn),實(shí)現(xiàn)自身的逆轉(zhuǎn)。傳媒盈利模式的創(chuàng)新也是傳媒經(jīng)濟(jì)研究的重要問(wèn)題之一。
參考文獻(xiàn):
關(guān)鍵詞:非概率抽樣 社會(huì)網(wǎng)絡(luò) 大數(shù)據(jù)
中圖分類號(hào):F626.5
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1004-4914(2016)03-030-02
一、研究意義
傳統(tǒng)的社會(huì)網(wǎng)絡(luò)主要存在于人群中的血緣關(guān)系、地緣關(guān)系、政治關(guān)系、經(jīng)濟(jì)關(guān)系、宗教關(guān)系以及其他社會(huì)性的聯(lián)系,這些或強(qiáng)或弱的人際關(guān)系形成了各種各樣的社會(huì)網(wǎng)絡(luò)。有些社會(huì)網(wǎng)絡(luò)是開放的,可以通過(guò)多種方法進(jìn)行調(diào)查研究,比如對(duì)于親緣關(guān)系和同伴關(guān)系的研究,這些研究甚至可以通過(guò)直接的問(wèn)卷調(diào)查進(jìn)行;但有些網(wǎng)絡(luò)是封閉的,從外部很難進(jìn)入,對(duì)這些網(wǎng)絡(luò)的調(diào)查研究和深入分析比較困難,比如一些特殊人群的圈子、宗教網(wǎng)絡(luò)或者政治性群體。
隨著互聯(lián)網(wǎng)的蓬勃發(fā)展,社交型網(wǎng)絡(luò)帶來(lái)了社會(huì)網(wǎng)絡(luò)的極度膨脹和蔓延,大量虛擬的社會(huì)網(wǎng)絡(luò)呈現(xiàn)在人們面前,這個(gè)被稱為“網(wǎng)友”的社會(huì)群體逐漸成為新的社會(huì)網(wǎng)絡(luò)研究對(duì)象。人們的群體認(rèn)知和社會(huì)交往都發(fā)生了極大的改變,社會(huì)群體的規(guī)模、結(jié)構(gòu)、關(guān)聯(lián)和復(fù)雜性都大大加強(qiáng)。
同時(shí),2012年以來(lái),人們對(duì)于大數(shù)據(jù)時(shí)代的探討和研究越來(lái)越多,其中一個(gè)重要的問(wèn)題就是大數(shù)據(jù)時(shí)代是否還需要抽樣。有學(xué)者建議使用行政記錄或相關(guān)的基礎(chǔ)數(shù)據(jù)的完全統(tǒng)計(jì)分析來(lái)取代抽樣調(diào)查。就社會(huì)群體而言,群體大數(shù)據(jù)的記錄和分析同樣具有很大的困難,這是由于社會(huì)網(wǎng)絡(luò)的邊界屬性和區(qū)隔特征所決定的,大多數(shù)社會(huì)網(wǎng)絡(luò)的成員之間有著相似的群體特征,而與外部個(gè)體有著顯著的區(qū)隔。比如宗教團(tuán)體成員之間的互信關(guān)系、艾滋病患者之間的“同病相憐”關(guān)系等,都無(wú)法通過(guò)簡(jiǎn)單的大數(shù)據(jù)關(guān)系實(shí)現(xiàn)統(tǒng)計(jì)分析和推斷。因此,抽樣調(diào)查就顯得比較重要。
由于社會(huì)網(wǎng)絡(luò)的現(xiàn)實(shí)性及其成員之間的特殊關(guān)聯(lián),利用現(xiàn)有的隨機(jī)抽樣的方法幾乎無(wú)法完成調(diào)查和統(tǒng)計(jì)分析,一是因?yàn)闊o(wú)法得到一個(gè)社會(huì)網(wǎng)絡(luò)成員的抽樣框,其成員的花名冊(cè)通常是保密的或者不可知的;二是因?yàn)榧词褂谐闃涌?,?duì)這些特殊群體的訪問(wèn)也是無(wú)法實(shí)現(xiàn)的;三是一些社會(huì)網(wǎng)絡(luò)人群對(duì)面向社會(huì)現(xiàn)實(shí)的抽樣調(diào)查有著天然的抗拒和排斥心理。
然而由于研究或?qū)嵺`的需要,有時(shí)需要對(duì)網(wǎng)絡(luò)人群的相關(guān)情況進(jìn)行估計(jì),通過(guò)相關(guān)理論和實(shí)踐研究發(fā)現(xiàn),一些非概率抽樣方法可以應(yīng)用于上述情況中。
本文回顧了可應(yīng)用于網(wǎng)絡(luò)人群抽樣的非概率抽樣方法。
二、利用非概率抽樣方法對(duì)社會(huì)網(wǎng)絡(luò)人群抽樣的研究現(xiàn)狀
目前來(lái)看,國(guó)內(nèi)學(xué)者對(duì)非概率抽樣方法對(duì)隱藏人群抽樣的研究還比較少,無(wú)論研究的程度和寬度均與國(guó)外學(xué)者有較大差距。
國(guó)外學(xué)者對(duì)社交網(wǎng)絡(luò)人群的的抽樣研究做了許多細(xì)致而有效的工作,其成果大體可以分為以下四類:
1.對(duì)抽樣方法的理論研究。Goodman(1961){1}詳細(xì)地介紹了S階段K推薦滾雪球抽樣的定義,并討論了如何通過(guò)抽樣樣本對(duì)總體的一些特征做出推斷,例如以S=K=1的情形為例,對(duì)如何表示總體中相互推薦的關(guān)系數(shù)目進(jìn)行了詳細(xì)論證,他指出,在對(duì)隱藏人群進(jìn)行抽樣時(shí),滾雪球抽樣比簡(jiǎn)單隨機(jī)抽樣更具效率。Salganik(2006){2}對(duì)同伴驅(qū)動(dòng)抽樣的設(shè)計(jì)效應(yīng)和抽樣規(guī)模進(jìn)行了深入討論,并發(fā)現(xiàn)在使用同伴驅(qū)動(dòng)抽樣時(shí),所需要的樣本容量是簡(jiǎn)單隨機(jī)抽樣下的2倍。Heckathorn(2007){3}提出在假設(shè)合理的情況下,同伴驅(qū)動(dòng)抽樣能夠?qū)傮w作出漸進(jìn)無(wú)偏估計(jì)。
2.結(jié)合具體案例,對(duì)抽樣方法理論進(jìn)行驗(yàn)證性研究。Malekinejad等人(2008){4}通過(guò)實(shí)際調(diào)查發(fā)現(xiàn),如果設(shè)計(jì)合理,同伴驅(qū)動(dòng)抽樣在被應(yīng)用到高危人群抽樣時(shí),是一種有效的方法。Wejnert(2009){5}論證了在使用真實(shí)數(shù)據(jù)的情況下,利用同伴驅(qū)動(dòng)抽樣是能夠給出有效的估計(jì)的。Sadler等(2010){6}討論了滾雪球抽樣在招募隱藏人群時(shí)的優(yōu)缺點(diǎn),認(rèn)為在使用滾雪球抽樣時(shí),應(yīng)當(dāng)十分慎重。Johnston等(2010){7}討論了在實(shí)際應(yīng)用同伴驅(qū)動(dòng)抽樣時(shí)所面對(duì)的優(yōu)缺點(diǎn)。Perez等(2011){8}利用實(shí)際數(shù)據(jù)證明了,在恰當(dāng)?shù)氖褂脻L雪球抽樣方法后,對(duì)少數(shù)人群的抽樣節(jié)省而高效。Korf(2012){9}利用數(shù)據(jù)再次驗(yàn)證了同伴驅(qū)動(dòng)抽樣比隨機(jī)抽樣在面對(duì)隱藏人群時(shí)更為有效。
3.對(duì)不同抽樣方法的比較研究。Heckathorn(1997){10}比較了滾雪球抽樣和同伴推動(dòng)抽樣的不同點(diǎn),他指出,同伴推動(dòng)抽樣利用二次激勵(lì)提高了抽樣者推動(dòng)和控制的效率并減少了花費(fèi)。Salganik和Heckathorn(2004){11}在比較了目標(biāo)抽樣和時(shí)間空間抽樣在對(duì)隱藏人群的估計(jì)偏差方面的不足后,提出了同伴驅(qū)動(dòng)抽樣通過(guò)充分利用社會(huì)網(wǎng)絡(luò)結(jié)構(gòu)的信息,能夠更好的對(duì)總體作出相應(yīng)估計(jì),并給出了相應(yīng)數(shù)學(xué)推導(dǎo)。Magnani等(2005){12}在研究如何對(duì)隱藏人群抽樣時(shí),比較了滾雪球抽樣、目標(biāo)抽樣、時(shí)間空間抽樣以及同伴驅(qū)動(dòng)抽樣等抽樣方法的優(yōu)劣。Semaan(2010){13}從目的、應(yīng)用、調(diào)查過(guò)程以及優(yōu)缺點(diǎn)等方面對(duì)時(shí)間空間抽樣和同伴推動(dòng)抽樣做了對(duì)比。Kral等(2010){14}以招募美國(guó)舊金山的吸毒者為例,比較了同伴驅(qū)動(dòng)抽樣和目標(biāo)抽樣的效果。他發(fā)現(xiàn),兩種方法各具優(yōu)勢(shì),綜合兩種方法也許是更好的抽樣方法。
4.將抽樣方法應(yīng)用于各種領(lǐng)域中的橫向研究。Baltar等(2011){15}在利用臉譜來(lái)研究移民時(shí),借助了滾雪球抽樣。Illenberger(2013){16}利用滾雪球抽樣設(shè)計(jì)來(lái)從已有數(shù)據(jù)中估計(jì)拓普網(wǎng)絡(luò)的特性。
三、應(yīng)用到社交網(wǎng)絡(luò)平臺(tái)的思考
從已有的研究看,由于隱藏人群的比例較小且常常難以接觸,常規(guī)的抽樣方法難以有效實(shí)施,學(xué)者們普遍認(rèn)為滾雪球抽樣以及同伴驅(qū)動(dòng)抽樣是較好的抽樣方法,這是因?yàn)樯鲜龇椒ń柚巳穗H網(wǎng)絡(luò),提高了調(diào)查效率。
對(duì)網(wǎng)絡(luò)人群的抽樣方法研究集中在滾雪球抽樣和同伴驅(qū)動(dòng)抽樣上,二者的區(qū)別在于同伴驅(qū)動(dòng)抽樣加入了二次激勵(lì)機(jī)制。已有學(xué)者借助滾雪球抽樣在虛擬網(wǎng)絡(luò)中實(shí)現(xiàn)對(duì)目標(biāo)群體的抽樣。結(jié)合上述兩種抽樣方法的特點(diǎn),當(dāng)需要在線上發(fā)起一項(xiàng)調(diào)查時(shí),同伴驅(qū)動(dòng)抽樣可能將是一種較好的調(diào)查方式,而如果想要對(duì)社交網(wǎng)絡(luò)中某一群體的特征做研究,考慮到網(wǎng)友之間的推薦關(guān)系可由已存在的“好友”關(guān)系所替代,借助網(wǎng)絡(luò)技術(shù)就能達(dá)到搜集數(shù)據(jù)的目的,滾雪球抽樣和同伴驅(qū)動(dòng)抽樣的效果是基本相同的。
四、小結(jié)
處于大數(shù)據(jù)時(shí)代,大數(shù)據(jù)的一個(gè)重要特征就是體量巨大。在這個(gè)時(shí)代,人們能夠從幾乎任何數(shù)據(jù)中獲得可轉(zhuǎn)換為推動(dòng)人們生活方式變化的有價(jià)值的知識(shí)。在大數(shù)據(jù)時(shí)代,信息會(huì)展現(xiàn)出其前所未有的能量,因此,獲取信息尤其是有價(jià)值的信息是很重要的。對(duì)于處于社會(huì)網(wǎng)絡(luò)結(jié)構(gòu)的人們(尤其是特殊群體)而言,他們身上也蘊(yùn)含著豐富的信息,如何有效的從他們身上獲取信息至關(guān)重要。
對(duì)于處于社會(huì)網(wǎng)絡(luò)中的人們而言,由于無(wú)法獲取抽樣框等原因,在利用傳統(tǒng)的概率抽樣方法時(shí),很難有效地獲取所需信息。解決這一問(wèn)題的重要途徑就是利用滾雪球抽樣、同伴驅(qū)動(dòng)抽樣等非概率抽樣方法,即在充分利用社會(huì)網(wǎng)絡(luò)結(jié)構(gòu)的特點(diǎn)之上,完成對(duì)目標(biāo)群體的抽樣,特別的,在面對(duì)社交網(wǎng)絡(luò)時(shí),應(yīng)當(dāng)注意利用其已存在并可被識(shí)別的“網(wǎng)友”關(guān)系。
本文詳細(xì)介紹了利用非概率抽樣方法對(duì)社會(huì)網(wǎng)絡(luò)人群抽樣的研究現(xiàn)狀,并在此基礎(chǔ)上給出了今后應(yīng)用的思考,當(dāng)然,就如何使用非概率抽樣方法在社會(huì)網(wǎng)絡(luò)上實(shí)現(xiàn)目標(biāo)群體的抽樣還有待進(jìn)一步的研究。
[課題支持:1.2013年山西省普通高校特色重點(diǎn)學(xué)科項(xiàng)目《山西綜改實(shí)驗(yàn)區(qū)建設(shè)統(tǒng)計(jì)調(diào)查與評(píng)價(jià)方法設(shè)計(jì)和應(yīng)用》;2.2015年山西省研究生創(chuàng)新項(xiàng)目《轉(zhuǎn)型期社會(huì)網(wǎng)絡(luò)非概率抽樣研究》編號(hào)2015SY47]
注釋:
{1}Goodman Leo A. Snowball Sampling. Annals of Mathematical Statistics. 1961;32:148 170.
{2}Salganik Matthew J. Variance Estimation, Design Effects, and Sample Size Calculations for Respondent-Driven sampling. Journal of Urban Health. 2006;83:i98 i112.
{3}Heckathorn Douglas D. Extensions of Respondent-Driven Sampling: Analyzing Continuous Variables and Controlling for Differential Recruitment. In: Xie Yu., editor. Sociological Methodology. vol. 37. Boston, MA: Blackwell Publishing; 2007. pp. 151 207.
{4}Malekinejad M, Johnston LG, Kendall C, Kerr LR, Rifkin MR, Rutherford GW. Using Respondent-Driven Sampling Methodology for HIV Biological and Behavioral Surveillance in International Settings: A Systematic Review. AIDS and Behavior. 2008;12:105 130.
{5}Wejnert Cyprian. An Empirical Test of Respondent-Driven Sampling: Point Estimates, Variance, Degree Measures, and Out-of-Equilibrium Data. In: Xie Yu., editor. Sociological Methodology. vol. 39. Hoboken, NJ: Wiley-Blackwell; 2009. pp. 73 116.
{6}Sadler, Hau-Chen Lee, Lim, Fullerton. Recruitment of hard-to-rearch population subgroups via adaptations of the snowball sampling strategy. Nursing and Health Sciences. 2010:12:369-374.
{7}Lisa G. Johnston and Keith Sabin. Sampling hard-to-reach populations with respondent driven sampling. Methodological Innovations Oline. 2010.pp.38-48.
{8}Daniel F.Perez, Jason X.Nie, Cheis I.Ardern, Natasha Radhu, Paul Ritvo. Impact of Participant Incentives and Direct and Snowball Sampling on Survey Response Rate in an Ethnically Diverse Community:Results from a Pilot Study of Physical Activity and the Built Environment. J Immigrant Minority Health. 2011.
{9}Korf. Differential Profiles of Crack Users in Respondent-Driven and Institutional Samples:A Three-Site Comparison. European Addicition Research,2012:18,192.
{10}Heckathorn Douglas D. Respondent-Driven Sampling: A New Approach to The Study of Hidden Populations. Social Problems. 1997;44:174 0199.
{11}Salganik Matthew J, Heckathorn Douglas D. Sampling and Estimation in Hidden Populations Using Respondent-Driven Sampling. In: Stolzenberg Ross M., editor. Sociological Methodology. vol 34. Boston, MA: Blackwell Publishing; 2004. pp. 193 239.
{12}Magnani Robert, Sabin Keith, Saidel Tobi, Heckathorn Douglas D. Review of Sampling Hard-to-Reach and Hidden Populations for HIV Surveillance. AIDS 2005. 2005;19 Suppl2:S67 S72.
{13}Salaam Semaan. Time-Space Samping and Respondent-Driven Sampling with Hard-To-Reach Populations. Methodological Innovations Online. 2010:5:60-75.
{14}Kral, Malekinejad, Vaudrey, Martinez, Lorvick, McFarland, Raymond. Comparing Respondent-Driven Sampling and Targeted Sampling Methods of Recruiting Injection Drug Users in San Francisco. Bulletin of the New York Academy of medicine. 2010.
{15}Fabiola Baltar, Ignasi Brunet. Social research 2.0:virtual snowball samling method using Facebook. Internet Research. 2012:pp.57-74.
{16}Johannes Illenberger, Gunnar Fl?tter?d. Estimating network properties from snowball sampled data Working Paper 11-01. Preprint submitted to Social Networks. 2013
(作者單位:山西財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院 山西太原 030006)
級(jí)別:統(tǒng)計(jì)源期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:省級(jí)期刊
榮譽(yù):中國(guó)期刊全文數(shù)據(jù)庫(kù)(CJFD)
級(jí)別:省級(jí)期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:統(tǒng)計(jì)源期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:省級(jí)期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)