時(shí)間:2023-08-20 14:59:52
序論:好文章的創(chuàng)作是一個(gè)不斷探索和完善的過(guò)程,我們?yōu)槟扑]十篇云計(jì)算的相關(guān)技術(shù)范例,希望它們能助您一臂之力,提升您的閱讀品質(zhì),帶來(lái)更深刻的閱讀感受。
中圖分類號(hào):G251 文獻(xiàn)標(biāo)識(shí)碼:A
1 云計(jì)算與圖書館
1.1 云計(jì)算4
云計(jì)算是由分布式計(jì)算、虛擬化、網(wǎng)絡(luò)存儲(chǔ)、負(fù)載均衡等新興的信息技術(shù)融合而成的技術(shù)集合,是互聯(lián)網(wǎng)技術(shù)向多元化、高效化、服務(wù)化發(fā)展的產(chǎn)物。云計(jì)算的核心是應(yīng)用服務(wù),從商業(yè)角度來(lái)說(shuō),云計(jì)算是一種和新技術(shù)有關(guān)的新的商業(yè)模式,這種模式并不要求人們自己去建設(shè)與之相關(guān)的設(shè)施、平臺(tái)和應(yīng)用,人們所要做的只是購(gòu)買相關(guān)服務(wù)的使用權(quán)。具體來(lái)講,云計(jì)算具有以下特點(diǎn):
(1)節(jié)約成本。云計(jì)算的核心是應(yīng)用服務(wù),業(yè)界普遍描述了云計(jì)算的使用模式,即像水電和煤氣一樣,按照人們的需求去購(gòu)買云服務(wù),企業(yè)可以靈活地根據(jù)自己的需求來(lái)購(gòu)買計(jì)算能力、存儲(chǔ)空間、帶寬等。當(dāng)企業(yè)需求發(fā)生變化時(shí),其只須考慮增加或減少自己購(gòu)買的基礎(chǔ)設(shè)施服務(wù)。通過(guò)這種模式,企業(yè)不用投入到基礎(chǔ)設(shè)施和系統(tǒng)的建設(shè)中去,大大節(jié)約了成本的投入。
(2)使用方式靈活多樣。由于數(shù)據(jù)存儲(chǔ)在云上,在能聯(lián)接到云服務(wù)器的前提下,云服務(wù)不拘泥于人們的使用地點(diǎn)和時(shí)間。由于云計(jì)算能輕松實(shí)現(xiàn)各種終端的互聯(lián)互通,未來(lái)隨著“三網(wǎng)融合”的推進(jìn),人們可以利用云計(jì)算技術(shù),通過(guò)PC、移動(dòng)設(shè)備或電視機(jī)等智能家電來(lái)享受云服務(wù)。
(3)便利的資源共享方式。由于信息資源存儲(chǔ)在云上,用戶只需連接網(wǎng)絡(luò)就可以上傳相關(guān)數(shù)據(jù)即可,不拘泥于時(shí)空的限制,具有下載權(quán)限的其他用戶無(wú)須和數(shù)據(jù)提供者碰見或同時(shí)在線,只用登錄云平臺(tái)就可以隨時(shí)隨地地獲取這些數(shù)據(jù)。
(4)數(shù)據(jù)的安全性得到提高。分布式數(shù)據(jù)中心提供了數(shù)據(jù)存儲(chǔ)在地理意義上的隔離,提高了容災(zāi)能力。同時(shí),虛擬化技術(shù)可以保證集群服務(wù)器上的多個(gè)虛擬服務(wù)器均有云服務(wù)器鏡像,單個(gè)服務(wù)器出現(xiàn)問(wèn)題不會(huì)影響到數(shù)據(jù)的存儲(chǔ)與利用。
(5)定制式應(yīng)用服務(wù)。用戶可以根據(jù)自身所在組織的特點(diǎn),通過(guò)云計(jì)算提供的包括應(yīng)用程序的設(shè)計(jì)、開發(fā)、部署所需的一整套開發(fā)組件來(lái)開發(fā)符合組織特征的應(yīng)用服務(wù),并快速部署到云服務(wù)器。同時(shí),云上有可供選擇的多樣化的應(yīng)用程序,這些應(yīng)用均以服務(wù)的形式呈現(xiàn)在用戶面前,用戶可根據(jù)自身的需求來(lái)選擇應(yīng)用。
1.2 云服務(wù)與圖書館工作
云計(jì)算為人們提供了三個(gè)層面的服務(wù),即IaaS(基礎(chǔ)設(shè)施即服務(wù))、PaaS(平臺(tái)即服務(wù))、SaaS(軟件即服務(wù))。具體到圖書館領(lǐng)域,其內(nèi)容如下:
1.2.1 基礎(chǔ)設(shè)施即服務(wù)(IaaS)
基礎(chǔ)設(shè)施即服務(wù)也稱IaaS,其特點(diǎn)在于用戶無(wú)須購(gòu)買、安裝和維護(hù)計(jì)算機(jī)基礎(chǔ)設(shè)施,而是通過(guò)付費(fèi)的方式獲取基于以上設(shè)施的網(wǎng)絡(luò)存儲(chǔ)和數(shù)據(jù)庫(kù)等內(nèi)容的使用權(quán)限。對(duì)于圖書館來(lái)說(shuō),基礎(chǔ)設(shè)施建設(shè)會(huì)消耗大量資金,長(zhǎng)期的維護(hù)和更新要求持續(xù)投入人力物力, IaaS則解決了這個(gè)問(wèn)題,并大大降低了圖書館信息化建設(shè)的成本。
1.2.2 平臺(tái)即服務(wù)(PaaS)
對(duì)于PaaS來(lái)說(shuō),用戶購(gòu)買的是應(yīng)用平臺(tái)服務(wù),如互聯(lián)網(wǎng)應(yīng)用編程接口、運(yùn)行平臺(tái)等。PaaS提供商將開發(fā)平臺(tái)作為一種服務(wù)出售給用戶,用戶利用已有的平臺(tái)服務(wù)按照自身需求來(lái)實(shí)現(xiàn)應(yīng)用程序的開發(fā)、部署和運(yùn)營(yíng)。
面向圖書館,PaaS可以提供相對(duì)更自由一些的開發(fā)環(huán)境,它把開發(fā)平臺(tái)作為一種服務(wù)提供給人們,人們可以開發(fā)一些與其他圖書館區(qū)別開來(lái)、有針對(duì)性的、能凸顯自身特色的、符合本館需求的應(yīng)用服務(wù)。
1.2.3 軟件即服務(wù)(SaaS)
SaaS即應(yīng)用軟件以服務(wù)的方式提供給用戶。面向圖書館的訪問(wèn)者,SaaS提供一個(gè)統(tǒng)一的門戶,用戶可以通過(guò)多種終端如PC、移動(dòng)設(shè)備等隨時(shí)登錄門戶。門戶通過(guò)用戶登錄來(lái)識(shí)別用戶的不同身份,并提供相應(yīng)權(quán)限的應(yīng)用服務(wù);通過(guò)門戶,不同應(yīng)用程序中的各類數(shù)據(jù)可以有機(jī)結(jié)合在一起,按照用戶的需求形成個(gè)性化、靈活方便的應(yīng)用服務(wù)集合。
2 圖書館建設(shè)中云計(jì)算技術(shù)運(yùn)用的考量
對(duì)于圖書館來(lái)說(shuō),云計(jì)算技術(shù)將帶來(lái)新的體驗(yàn)、新的服務(wù);但是,新技術(shù)的出現(xiàn)必然對(duì)圖書館原有的組織結(jié)構(gòu)、運(yùn)作模式以及資源建設(shè)產(chǎn)生一定的沖擊。我們必須清醒地認(rèn)識(shí)到,新技術(shù)的利用必須與圖書館的現(xiàn)實(shí)發(fā)展情況相結(jié)合,必須圍繞著圖書館的建設(shè)來(lái)進(jìn)行,不能為了利用新技術(shù)而盲目建設(shè)。綜合來(lái)講,應(yīng)當(dāng)具有以下幾點(diǎn)考慮:
(1)是否必要。云計(jì)算技術(shù)雖然是當(dāng)今技術(shù)發(fā)展的一大熱潮,為人們提供了新的選擇;然而云服務(wù)也還處于一個(gè)發(fā)展和完善的過(guò)程中,圖書館的建設(shè)不能為了趕潮流盲目地向新技術(shù)靠攏,應(yīng)當(dāng)考慮在當(dāng)前的情況下,自身是否有必要引入云計(jì)算技術(shù)。
目前,一些大型的公共圖書館和高校圖書館已建成全新的數(shù)字圖書館及相關(guān)系統(tǒng),在很短的周期內(nèi)立刻構(gòu)建云平臺(tái),追求新的模式是沒(méi)有必要的,不但浪費(fèi)時(shí)間精力,還易形成重復(fù)建設(shè)。對(duì)于一些地方圖書館和大專院校來(lái)說(shuō),在已經(jīng)形成自身特色,具有一定優(yōu)質(zhì)資源和服務(wù)模式的情況下,應(yīng)當(dāng)判斷新技術(shù)的采用是否能夠和自身已有的優(yōu)勢(shì)結(jié)合,形成一加一大于二的良好局面。如果對(duì)于對(duì)于新技術(shù)和本館建設(shè)的結(jié)合前景沒(méi)有科學(xué)的依據(jù)和判斷結(jié)論,那么對(duì)于云技術(shù)的應(yīng)用不應(yīng)操之過(guò)急。
(2)是否有助于服務(wù)品質(zhì)的提升。從目前云計(jì)算在國(guó)內(nèi)的發(fā)展來(lái)看,國(guó)內(nèi)互聯(lián)網(wǎng)公司提供的云服務(wù)多是以基于IaaS的云存儲(chǔ)為主,這些云存儲(chǔ)產(chǎn)品多是由網(wǎng)盤服務(wù)升級(jí)而成,營(yíng)銷宣傳強(qiáng)大,業(yè)務(wù)形態(tài)簡(jiǎn)單,尚未形成完善的云服務(wù)。
圖書館是為人們提供閱讀服務(wù)的知識(shí)中心和學(xué)習(xí)中心,無(wú)論信息技術(shù)如何發(fā)展,閱讀的主體始終是人,我們考量是否運(yùn)用云計(jì)算技術(shù),應(yīng)當(dāng)緊緊圍繞著提高圖書館的服務(wù)品質(zhì)這一中心,不能為了技術(shù)而技術(shù)。
(3)對(duì)現(xiàn)有圖書館業(yè)務(wù)流程的影響。對(duì)大型圖書館而言,完善的業(yè)務(wù)流程是組織運(yùn)行的具體行為表現(xiàn),如果打亂了管理和工作的流程,圖書館工作將會(huì)成為一盤散沙。我們應(yīng)當(dāng)考慮構(gòu)建符合日常業(yè)務(wù)流程的云服務(wù),云服務(wù)的架構(gòu)不能給業(yè)務(wù)流程帶來(lái)混亂,云服務(wù)應(yīng)當(dāng)去貼合這些業(yè)務(wù)。在云上,數(shù)據(jù)存儲(chǔ)、圖書外借、圖書分類與編目等業(yè)務(wù)都被無(wú)縫連接到云平臺(tái)。云平臺(tái)應(yīng)當(dāng)在滿足計(jì)算資源和存儲(chǔ)資源按需調(diào)用的同時(shí)兼顧用戶的個(gè)性化需求。按照用戶權(quán)限形成統(tǒng)一的、連貫的、流程化的云服務(wù),并在前端通過(guò)虛擬桌面為用戶調(diào)用各項(xiàng)應(yīng)用服務(wù)。
(4)信息安全的考慮。云計(jì)算技術(shù)催生了大數(shù)據(jù)時(shí)代的到來(lái),一切數(shù)據(jù),包括半結(jié)構(gòu)化的數(shù)據(jù)都具有一定的商業(yè)價(jià)值,云服務(wù)的提供商一般都是來(lái)自商業(yè)性質(zhì)的機(jī)構(gòu),雖然云服務(wù)器的容災(zāi)性良好,但是在云上存儲(chǔ)的數(shù)據(jù)以及用戶的一切行為都是可以被獲取的。我們不能排除云計(jì)算提供商出于商業(yè)目的對(duì)用戶資料的覬覦。這也是圖書館信息安全應(yīng)當(dāng)考量的問(wèn)題。
3 結(jié)語(yǔ)
在圖書館的發(fā)展過(guò)程中,歷史上每一次信息技術(shù)的變革都給圖書館帶來(lái)了新的發(fā)展機(jī)遇,伴隨著云計(jì)算技術(shù)的誕生和不斷進(jìn)步,在圖書館建設(shè)中如何去利用云計(jì)算技術(shù),如何用云計(jì)算技術(shù)使圖書館的建設(shè)能跟上時(shí)展的步伐,是值得我們長(zhǎng)久探討的課題。
參考文獻(xiàn)
[1] 王長(zhǎng)宇.云計(jì)算環(huán)境下的數(shù)字圖書館信息資源建設(shè)的理性思考[J].中國(guó)科技信,2010(17):163-165.
所謂的云計(jì)算這屬于一種商業(yè)計(jì)算模型,這也就是在大量計(jì)算機(jī)所組成的資源地上分布計(jì)算任務(wù),以便能夠?qū)⒏黜?xiàng)應(yīng)用系統(tǒng)按照需求獲得信息服務(wù)、計(jì)算力以及存儲(chǔ)空間,從而實(shí)現(xiàn)發(fā)展網(wǎng)格計(jì)算、分布式計(jì)算以及并行計(jì)算。通常來(lái)說(shuō),云安全所包含的關(guān)鍵技術(shù)與風(fēng)險(xiǎn)應(yīng)對(duì)策略主要應(yīng)該從以下三個(gè)方面進(jìn)行詳細(xì)闡述:
首先是數(shù)據(jù)安全。一是數(shù)據(jù)傳輸安全。在云用戶或者企業(yè)借助于網(wǎng)絡(luò)將數(shù)據(jù)傳輸?shù)焦苍频倪^(guò)程當(dāng)中,黑客隨時(shí)都可以篡改與竊取數(shù)據(jù),嚴(yán)重威脅數(shù)據(jù)的真實(shí)性、保密性、可用性、完整性,這就給予云用戶造成嚴(yán)重的商業(yè)損失。而該階段所采取的保護(hù)策略就是加密傳輸數(shù)據(jù),在數(shù)據(jù)傳輸過(guò)程中使用安全傳輸協(xié)議;二是數(shù)據(jù)存儲(chǔ)安全。云用戶數(shù)據(jù)在對(duì)數(shù)據(jù)存儲(chǔ)的過(guò)程當(dāng)中,所存在的安全風(fēng)險(xiǎn)由數(shù)據(jù)審計(jì)、災(zāi)難恢復(fù)、隔離、數(shù)據(jù)濫用以后即存儲(chǔ)位置等。為有效防范被云服務(wù)提供商、惡意鄰居租戶或者部分應(yīng)用濫用,那么采取的做法是在應(yīng)用IaaS加密靜止數(shù)據(jù),可是針對(duì)PaaS與SaaS這類的應(yīng)用過(guò)程當(dāng)中,由于不能加密數(shù)據(jù),密文數(shù)據(jù)對(duì)于搜索與索引的應(yīng)用造成妨礙,可是從目前的情況來(lái)看,尚未發(fā)明能夠用于商用的算法來(lái)對(duì)數(shù)據(jù)同態(tài)加密實(shí)現(xiàn),云用戶并且應(yīng)該把握對(duì)數(shù)據(jù)具置維持的基本原則,另外還應(yīng)該使用數(shù)據(jù)標(biāo)記,數(shù)據(jù)隔離在單租戶專用數(shù)據(jù)平臺(tái)當(dāng)中實(shí)現(xiàn),從而做到對(duì)數(shù)據(jù)非法訪問(wèn)的防止,而災(zāi)難恢復(fù)實(shí)現(xiàn)則是使用數(shù)據(jù)多備份;三是數(shù)據(jù)殘留安全。所謂的數(shù)據(jù)殘留安全就是說(shuō)數(shù)據(jù)在被以某種形式擦除之后殘留的物理表現(xiàn),黨擦除存儲(chǔ)介質(zhì)之后,存在著一定的可能借助于某些物理特性來(lái)重建數(shù)據(jù),數(shù)據(jù)殘留在云計(jì)算背景下,存在著一定的可能對(duì)敏感信息無(wú)意當(dāng)中流露,這就使得云服務(wù)提供商為做到有效保證數(shù)據(jù)完整清除,往往使用內(nèi)容發(fā)現(xiàn)、加密數(shù)據(jù)相關(guān)介質(zhì)銷毀、擦拭磁盤以及銷毀存儲(chǔ)介質(zhì)等方法與技術(shù)。
其次是應(yīng)用安全。一是終端客戶安全。云客戶端為對(duì)應(yīng)用安全進(jìn)行保證,則應(yīng)該做到對(duì)各項(xiàng)防御功能開啟,并且對(duì)于IPS類型安全控件、反惡意軟件、個(gè)人防火墻以及防病毒軟件在云客戶端進(jìn)行部署,并且為做到避免瀏覽器遭受攻擊,還應(yīng)該積極使用各種必要保護(hù)措施,從而做到端到端的安全在云環(huán)境當(dāng)中實(shí)現(xiàn),這就要讓云用戶通過(guò)對(duì)自動(dòng)更新功能的使用,從而對(duì)于瀏覽器更新與打補(bǔ)丁等定期完成,而其中的企業(yè)客戶必須從制度上做出嚴(yán)格的規(guī)定連接云計(jì)算應(yīng)用的PC機(jī)就嚴(yán)格禁止安裝虛擬機(jī),定期檢查PC機(jī);二是SaaS應(yīng)用安全。在安全評(píng)估選擇SaaS提供商的過(guò)程當(dāng)中,應(yīng)該按照相關(guān)保密協(xié)議要求,在一定情況下存在著一定的必要聘請(qǐng)第三方安全廠商做好黑盒安全測(cè)試這樣的滲透測(cè)試,從而能夠做到對(duì)詳實(shí)安全信息的獲得,并且對(duì)于SaaS提供商所供的訪問(wèn)控制與身份驗(yàn)證功能,這屬于唯一性的安全控制措施在客戶管理信息風(fēng)險(xiǎn)當(dāng)中,對(duì)于云特定訪問(wèn)控制機(jī)制用戶應(yīng)該盡最大可能了解,通過(guò)采用必要步驟來(lái)對(duì)運(yùn)載的數(shù)據(jù)進(jìn)行保護(hù);三是PaaS應(yīng)用安全?;谠苹A(chǔ)知識(shí)對(duì)用戶采購(gòu)或者創(chuàng)建的應(yīng)用進(jìn)行部署這屬于PssS云提供給用戶的能力,對(duì)于引擎在內(nèi)的平臺(tái)軟件與地層安全由PssS提供商負(fù)責(zé),當(dāng)如果有Web服務(wù)、組件以及第三方應(yīng)用在PssS應(yīng)用使用,而那些部署在PaaS平臺(tái)上面的應(yīng)用的安全則是由客戶負(fù)責(zé),云用戶部署的應(yīng)用安全還應(yīng)該得到PaaS應(yīng)用開發(fā)商的積極配合,開發(fā)人員必須對(duì)平臺(tái)被封裝成安全對(duì)象與Web服務(wù)的安全特性熟悉。
再次是虛擬化安全。從一方面來(lái)看是虛擬化軟件安全,這種軟件層在裸機(jī)上進(jìn)行直接部署,這樣所能夠提供的能力是對(duì)虛擬服務(wù)器進(jìn)行創(chuàng)建、運(yùn)行以及銷毀。保持著可用性與完整性的虛擬化層這有著極其重要與關(guān)鍵的保持創(chuàng)建可用性與完整性的公有云;從另外一方面來(lái)看則是虛擬服務(wù)器安全,通常來(lái)說(shuō),在虛擬機(jī)軟件之上的虛擬服務(wù)器,這就是在虛擬服務(wù)器上面運(yùn)用物理服務(wù)器的安全原理和實(shí)踐,并且要做到對(duì)虛擬服務(wù)器所具備的特點(diǎn)兼顧,所采取的措施對(duì)具備TPM安全模塊的物理服務(wù)器進(jìn)行選擇,在對(duì)服務(wù)器進(jìn)行構(gòu)建當(dāng)中,必須在所有的虛擬服務(wù)器分別分配出一個(gè)獨(dú)立的硬盤分區(qū),還應(yīng)該嚴(yán)密監(jiān)視虛擬服務(wù)器的運(yùn)行狀態(tài),以便做到對(duì)各個(gè)虛擬器當(dāng)中的防火墻日志與系統(tǒng)日志進(jìn)行實(shí)時(shí)監(jiān)控,從而能夠做到對(duì)所存在的安全隱患及時(shí)發(fā)現(xiàn),及時(shí)關(guān)閉不需要運(yùn)行的虛擬機(jī)。
云計(jì)算對(duì)圖書館的影響
由于云計(jì)算的海量存貯和超計(jì)算能力,其已顛覆了傳統(tǒng)的應(yīng)用模式,在云時(shí)代,圖書館對(duì)讀者的信息服務(wù)重點(diǎn)也將從最早的以硬件為中心轉(zhuǎn)向以軟件為中心、以服務(wù)為中心的時(shí)代,從根本上改變圖書館信息獲取、保存及服務(wù)的現(xiàn)存理念與方式。
1便利的軟件服務(wù)。云計(jì)算環(huán)境下,圖書館將不必購(gòu)買本地安裝形式的自動(dòng)化系統(tǒng)、辦公自動(dòng)化系統(tǒng)以及各種類型的操作系統(tǒng)及開發(fā)軟件,所使用的軟件都是以網(wǎng)絡(luò)服務(wù)的形式由云服務(wù)商直接提供。
2實(shí)現(xiàn)更大程度信息資源的“整合”與“共享”。云計(jì)算的優(yōu)勢(shì)功能之一就是海量存貯,因而為圖書館之間的信息服務(wù)資源“整合”與“共享”提供了很大的可能和基礎(chǔ),為眾多圖書館特別是有館藏建設(shè)特色的專業(yè)圖書館消除了因規(guī)格、建設(shè)特色等所導(dǎo)致的優(yōu)劣差異。在“云”這種信息統(tǒng)一存貯提取的高速服務(wù)模式下,全國(guó)及至全世界的圖書館可以共同構(gòu)筑一朵“圖書館信息資源云”,各個(gè)圖書館的信息資源憑借這朵“云”實(shí)現(xiàn)資源的整合和共享。
3降低相關(guān)的維護(hù)費(fèi)用。為了確保圖書館工作正常平穩(wěn)的運(yùn)行,圖書館人員需要經(jīng)常對(duì)計(jì)算機(jī)、服務(wù)器等終端進(jìn)行維護(hù)、升級(jí)和硬件更新。而云計(jì)算模式中,服務(wù)器的日常維護(hù)由更加專業(yè)的云服務(wù)商來(lái)提供,用戶的工作強(qiáng)度和維護(hù)成本會(huì)大大降低。另外,由專業(yè)IT人員進(jìn)行系統(tǒng)維護(hù),能夠減少系統(tǒng)故障,減少故障恢復(fù)時(shí)間,提高IT服務(wù)水平和效率。
4革新圖書館的服務(wù)理念。利用云進(jìn)行信息服務(wù),圖書館傳統(tǒng)的信息服務(wù)業(yè)務(wù)流程將被逐一拆解,重新進(jìn)行組合,呈現(xiàn)出一定的業(yè)務(wù)外包、虛擬化、技術(shù)化發(fā)展傾向,服務(wù)理念與方式將發(fā)生很大的轉(zhuǎn)變與革新。原來(lái)的服務(wù)提供者逐漸向服務(wù)提供者和服務(wù)利用者的雙重身份轉(zhuǎn)換。一方面,作為信息提供者,信息資源服務(wù)的業(yè)務(wù)外包給云計(jì)算服務(wù)商,通過(guò)虛擬化的“云”技術(shù),面向讀者的信息服務(wù)手段與方式將多樣化、全面化;另一方面,作為信息使用者,圖書館的工作人員也和讀者一樣,可以使用手機(jī)、電腦等設(shè)備在任何時(shí)間、任何地點(diǎn)獲得相關(guān)的“云”上任何信息服務(wù)。
5最大限度地發(fā)揮圖書館的作用。在傳統(tǒng)的圖書館服務(wù)模式下,用戶必須使用計(jì)算機(jī)才能利用圖書館的電子資源。由于云計(jì)算模式提供了強(qiáng)大的無(wú)線接入功能。因此,用戶可以通過(guò)使用手機(jī)、個(gè)人掌上電腦等各種類型的終端設(shè)備利用圖書館的電子資源,從而使圖書館資源中心的作用得到最大限度地發(fā)揮。
6改變圖書館的建設(shè)方向。真正實(shí)現(xiàn)云計(jì)算化的圖書館,硬件即信息資源的稀缺可通過(guò)云計(jì)算高度的共享特性來(lái)解決,硬件對(duì)一個(gè)圖書館的影響將變小,讀者真正看中的可能是對(duì)這些硬件的軟件服務(wù),如對(duì)資源的檢索介紹、對(duì)信息的挖掘組織、知識(shí)的管理分析、館舍的人文氣氛等,這樣,圖書館必然改變目前的重藏輕用、重硬件輕服務(wù)的現(xiàn)狀。
運(yùn)用云計(jì)算進(jìn)行圖書館的資源建設(shè)應(yīng)注意的問(wèn)題
1如何建設(shè)圖書館的“云”。圖書館利用“云”進(jìn)行服務(wù),需要中圖學(xué)會(huì),各地區(qū)省級(jí)圖書館學(xué)會(huì)、圖工委等機(jī)構(gòu)的聯(lián)絡(luò)、協(xié)調(diào)、組織,成立相關(guān)聯(lián)盟組織,與IT企業(yè)、云計(jì)算商協(xié)商合作,共同構(gòu)建發(fā)球圖書館的“云”。
2“云”能給圖書館帶來(lái)什么。云計(jì)算給圖書館帶來(lái)信息挖掘、整理、共享、高速存取等多方面的優(yōu)勢(shì),同時(shí),圖書館也要思考如何在“云”上把圖書館服務(wù)工作做的更好。
3云時(shí)代的版權(quán)保護(hù)。
1建立健全圖書館保密資源保護(hù)的相關(guān)制度。
2加強(qiáng)信息機(jī)構(gòu)網(wǎng)絡(luò)監(jiān)管和行業(yè)自律。
3加強(qiáng)網(wǎng)絡(luò)道德建設(shè),強(qiáng)化網(wǎng)民法律意識(shí)。
中圖分類號(hào):TP309.2
云計(jì)算就是在網(wǎng)絡(luò)環(huán)境下,以服務(wù)的形式向用戶提供海量IT資源,滿足用戶使對(duì)數(shù)據(jù)使用的需求。在供應(yīng)方向用戶提供用云計(jì)算服務(wù)時(shí),用戶將數(shù)據(jù)與應(yīng)用托管至云端。以用戶的角度來(lái)看,選擇相信服務(wù)方是必然的,雙方達(dá)成戰(zhàn)略合作關(guān)系后,共同參與安全機(jī)制的擬定,為數(shù)據(jù)安全提供有力保障。以服務(wù)方的角度來(lái)看,一旦信譽(yù)瓦解,則很難立足于市場(chǎng)。在這樣的市場(chǎng)背景下,云服務(wù)供應(yīng)商應(yīng)結(jié)合用戶需求,研制數(shù)據(jù)安全保護(hù)技術(shù),既不會(huì)影響到數(shù)據(jù)的正常使用,又最大化降低數(shù)據(jù)安全事故的發(fā)生。
1 云計(jì)算模式下數(shù)據(jù)安全的現(xiàn)狀
眾所周知,云計(jì)算服務(wù)的提供商并不是唯一的,各提供商的性質(zhì)與規(guī)模均存在一定差異,尤其是安全防范能力與風(fēng)險(xiǎn)處理能力。綜合實(shí)力不強(qiáng)的服務(wù)商會(huì)逐漸被淘汰,此時(shí),用戶交予服務(wù)商管理的數(shù)據(jù)將何去何從還是未知數(shù)。所以一般情況下,用戶會(huì)格外留意數(shù)據(jù)的提供者以及保存者。
用戶在云計(jì)算模式下執(zhí)行各項(xiàng)操作時(shí),會(huì)非常重視服務(wù)的安全性。用戶認(rèn)為,云服務(wù)的供應(yīng)商有義務(wù)引進(jìn)先進(jìn)技術(shù),提高監(jiān)管力度,為服務(wù)的安全提供良好保障。然而,就筆者調(diào)查獲悉,目前市場(chǎng)上并未出現(xiàn)任何能夠?qū)υ朴?jì)算供應(yīng)商進(jìn)行安全性能監(jiān)管且具有公信力的服務(wù)方。另外,相關(guān)法律法規(guī)的嚴(yán)重匱乏,也導(dǎo)致云計(jì)算服務(wù)商在安全保護(hù)工作上不知該如何下手。
在云計(jì)算模式中,云端環(huán)境可突破地域的約束。所以,數(shù)據(jù)的儲(chǔ)存并不存在任何明確的位置或步驟,任何地方均有可能成為數(shù)據(jù)儲(chǔ)存的中心。也正因如此,數(shù)據(jù)的風(fēng)險(xiǎn)就此增加,數(shù)據(jù)安全性將會(huì)面臨嚴(yán)峻考驗(yàn)。從法律的角度出發(fā),數(shù)據(jù)安全的管轄機(jī)制上不明確,倘若直接將數(shù)據(jù)存放于其他國(guó)家,則非常有可能被他國(guó)人員或機(jī)構(gòu)肆意濫用。而且,在用戶的重要數(shù)據(jù)無(wú)法正常使用時(shí),根本無(wú)法利用法律武器捍衛(wèi)自己的合法權(quán)益。倘若被盜取的是商業(yè)機(jī)密,將會(huì)給用戶帶來(lái)不可預(yù)計(jì)的嚴(yán)重?fù)p失。
2 云計(jì)算中數(shù)據(jù)安全的關(guān)鍵技術(shù)
隨著云計(jì)算的服務(wù)計(jì)算模式逐漸升級(jí),動(dòng)態(tài)虛擬化管理日趨成熟,租戶共享運(yùn)營(yíng)模式日益普及,數(shù)據(jù)安全與隱私保護(hù)工作面臨著嚴(yán)峻考驗(yàn)。云計(jì)算的安全問(wèn)題是云計(jì)算發(fā)展道路上最為突出的一大障礙,為使云計(jì)算突破發(fā)展瓶頸,務(wù)必結(jié)合實(shí)際需求,利用先進(jìn)技術(shù)為數(shù)據(jù)安全提供可靠保障,為用戶提供更加優(yōu)質(zhì)的數(shù)據(jù)服務(wù)。
2.1 數(shù)據(jù)傳輸安全
在云計(jì)算模式中,用戶利用網(wǎng)絡(luò),將數(shù)據(jù)輸送至云計(jì)算服務(wù)方,對(duì)其提出處理要求時(shí),數(shù)據(jù)傳輸?shù)陌踩珕?wèn)題至關(guān)重要。所以,云計(jì)算的安全關(guān)鍵技術(shù)可從以下幾方面著手:當(dāng)用戶數(shù)據(jù)在網(wǎng)絡(luò)環(huán)境中傳輸時(shí),對(duì)其進(jìn)行加密處理,預(yù)防失竊;對(duì)云計(jì)算服務(wù)商進(jìn)行監(jiān)控,確保云計(jì)算服務(wù)商在獲得用戶數(shù)據(jù)后,規(guī)范執(zhí)行正常操作,對(duì)數(shù)據(jù)進(jìn)行妥善處理與保存,最大化降低數(shù)據(jù)泄露的可能性;云計(jì)算服務(wù)商在儲(chǔ)存數(shù)據(jù)的過(guò)程中,務(wù)必確保用戶經(jīng)權(quán)限認(rèn)證后,即可獲得訪問(wèn)權(quán)限,同時(shí)訪問(wèn)對(duì)象僅限于自身數(shù)據(jù)。
2.2 數(shù)據(jù)儲(chǔ)存安全
在云計(jì)算模式中,資源共享是數(shù)據(jù)儲(chǔ)存的重要前提。所以,云計(jì)算服務(wù)商應(yīng)采取有效措施,對(duì)不同數(shù)據(jù)進(jìn)行有效隔離,避免各類數(shù)據(jù)雜糅在一起,出現(xiàn)運(yùn)輸錯(cuò)誤或泄露情況;另外,就算用戶已完全掌握數(shù)據(jù)存放的服務(wù)器位置,云計(jì)算服務(wù)商仍有義務(wù),對(duì)用戶交付的數(shù)據(jù)進(jìn)行備份,避免重大安全事故的發(fā)生。即使發(fā)生意外情況,用戶也不會(huì)失去所有數(shù)據(jù),用戶可在自身數(shù)據(jù)受損的情況下,向供應(yīng)商索取備份數(shù)據(jù)。在云計(jì)算環(huán)境中,數(shù)據(jù)殘留問(wèn)題十分嚴(yán)重,它是導(dǎo)致信息泄露的常見原因。為此,云計(jì)算提供商有必要在這一方面加強(qiáng)監(jiān)管力度,及時(shí)妥善處理數(shù)據(jù)殘留問(wèn)題,為數(shù)據(jù)的安全使用提供可靠保障。
2.3 數(shù)據(jù)審計(jì)安全
在云計(jì)算模式中,云計(jì)算服務(wù)商務(wù)必確保,在滿足用戶信息數(shù)據(jù)服務(wù)需求時(shí),不會(huì)為其他用戶的數(shù)據(jù)使用帶來(lái)不利影響。另外,筆者建議,云計(jì)算提供商可聯(lián)合第三方機(jī)構(gòu),對(duì)數(shù)據(jù)的安全性與準(zhǔn)確性進(jìn)行審計(jì)。數(shù)據(jù)審計(jì)工作不但能有效保障用戶數(shù)據(jù)安全,還會(huì)對(duì)云計(jì)算服務(wù)的穩(wěn)定發(fā)展產(chǎn)生積極影響。
3 云計(jì)算環(huán)境下的數(shù)據(jù)安全技術(shù)的應(yīng)用
3.1 數(shù)據(jù)加密中的應(yīng)用
數(shù)據(jù)的加密處理工作,需要在對(duì)稱加密算法密碼生成器的幫助下才能完成。具體流程為:隨機(jī)生成一個(gè)包含校驗(yàn)信息的密鑰,利用非對(duì)稱加密算法對(duì)該密鑰進(jìn)行加密。對(duì)經(jīng)加密算法處理后的數(shù)據(jù)信息以及密鑰密文進(jìn)行處理,最終將其作為一個(gè)數(shù)據(jù)包保存至云端。在這一加密過(guò)程中,系統(tǒng)需對(duì)規(guī)模龐大的用戶數(shù)據(jù)進(jìn)行對(duì)稱算法處理,將加密鑰與密文數(shù)據(jù)同時(shí)保存至云端。相較之下,用戶只需保存非對(duì)稱加密算法以及解密秘鑰即可,十分便捷。
3.2 在數(shù)據(jù)解密中的應(yīng)用
當(dāng)用戶需要解密數(shù)據(jù)時(shí),首先要利用對(duì)稱加密算法的密鑰,在非對(duì)稱加密算法解密鑰的幫助下完成解密。隨后,結(jié)合密鑰通過(guò)對(duì)稱加密算法,對(duì)數(shù)據(jù)包進(jìn)行解密,實(shí)現(xiàn)對(duì)原文的還原。反復(fù)進(jìn)行上述操作,直到所有數(shù)據(jù)包均成功解密,最終獲得原始數(shù)據(jù)。在這一操作過(guò)程中,對(duì)稱加密算法密鑰管理問(wèn)題獲得妥善解決,就算是運(yùn)算規(guī)模十分龐大,也不會(huì)對(duì)該工作的正常運(yùn)行造成任何困擾。
3.3 在數(shù)據(jù)認(rèn)證中的應(yīng)用
就目前情況來(lái)看,認(rèn)證技術(shù)被廣泛應(yīng)用于數(shù)據(jù)訪問(wèn)與控制工作中。通常情況下,認(rèn)證技術(shù)會(huì)通過(guò)身份認(rèn)證,對(duì)用戶的權(quán)限加以界定,同時(shí)對(duì)身份、權(quán)限認(rèn)真進(jìn)行動(dòng)態(tài)監(jiān)控,從根源上杜絕用戶間非法越權(quán)訪問(wèn)行為的出現(xiàn)。PIK技術(shù)、動(dòng)態(tài)口令技術(shù)、一次性密碼技術(shù)等,均為使用頻率較高的認(rèn)證技術(shù)。
4 結(jié)束語(yǔ)
綜上所述,為有效避免數(shù)據(jù)安全與個(gè)人隱私遭到侵犯,大部分用戶均堅(jiān)持使用現(xiàn)有內(nèi)部系統(tǒng),如此一來(lái),云計(jì)算的應(yīng)用與推廣受到一定局限性。引進(jìn)科學(xué)、合理的云計(jì)算數(shù)據(jù)安全保護(hù)技術(shù),才是推動(dòng)云計(jì)算健康發(fā)展的關(guān)鍵。在本文中,筆者通過(guò)對(duì)相關(guān)技術(shù)的研究,為云計(jì)算環(huán)境中的數(shù)據(jù)安全保護(hù)機(jī)制提供理論基礎(chǔ)與實(shí)踐依據(jù),為促進(jìn)云計(jì)算的穩(wěn)定發(fā)展奠定了良好基石。
參考文獻(xiàn):
[1]劉新華,胡純?nèi)?云計(jì)算中數(shù)據(jù)安全關(guān)鍵技術(shù)和解決方案[J].全國(guó)商情(理論研究),2011(04):103-104.
在各種信息、網(wǎng)絡(luò)技術(shù)飛速創(chuàng)新發(fā)展的現(xiàn)代社會(huì),項(xiàng)目管理中的多數(shù)項(xiàng)目都已應(yīng)用了先進(jìn)的計(jì)算機(jī)運(yùn)用技術(shù)。正是因?yàn)橛?jì)算機(jī)技術(shù)的運(yùn)用,使得項(xiàng)目管理的操作流程得以快速優(yōu)化和集成實(shí)現(xiàn)。因此,項(xiàng)目管理領(lǐng)域的業(yè)內(nèi)人士十分注重探究計(jì)算機(jī)相關(guān)技術(shù)的實(shí)際運(yùn)用。
1項(xiàng)目管理的含義及相關(guān)內(nèi)容概析
1.1內(nèi)涵解析
項(xiàng)目管理的實(shí)際操作中涉及到很多方面的數(shù)據(jù)、信息,管理工作的重點(diǎn)在于匯集、整合、處理、保存及傳輸、運(yùn)用這些信息資源,將一系列有關(guān)項(xiàng)目運(yùn)行的信息資源進(jìn)行系統(tǒng)整合管理,直接影響到整個(gè)項(xiàng)目的運(yùn)作效率與管理成效?;诖?,項(xiàng)目信息就為項(xiàng)目管理當(dāng)中的關(guān)鍵內(nèi)容,由于項(xiàng)目信息的種類繁多、交流方式較多,管理的過(guò)程中會(huì)牽涉到很多實(shí)際問(wèn)題,引入計(jì)算機(jī)的相關(guān)運(yùn)用技術(shù)可極大地簡(jiǎn)化管理程序,使管理項(xiàng)目得以更好地規(guī)劃及開展。項(xiàng)目信息囊括了和項(xiàng)目相關(guān)的所有數(shù)據(jù)與資料,例如,項(xiàng)目組織、日常管理、技術(shù)信息、經(jīng)濟(jì)管理、法規(guī)及條例等多方面內(nèi)容。
1.2項(xiàng)目管理建設(shè)的具體目標(biāo)
項(xiàng)目信息的實(shí)際管理流程為:匯集各類數(shù)據(jù)-轉(zhuǎn)換為相應(yīng)信息-憑信息做出決策-得到最終結(jié)果。由此得出,項(xiàng)目實(shí)踐中要出現(xiàn)大規(guī)模數(shù)據(jù)及有關(guān)的材料,管理這些數(shù)據(jù)、材料的實(shí)現(xiàn)步驟為:獲取-收集-保存-整合-傳輸。信息整合及傳輸?shù)倪^(guò)程正是各類信息相互整合、交流的過(guò)程,因此,管理人員在施行項(xiàng)目管理之前,要弄清楚各種項(xiàng)目間的信息互承聯(lián)系,避免信息交接時(shí)出現(xiàn)誤差乃至錯(cuò)誤。目前,制作信息管理的運(yùn)作體系圖是實(shí)現(xiàn)快速、有效管理的關(guān)鍵點(diǎn)。制定一個(gè)項(xiàng)目管理的總體操作流程,首先要分解各個(gè)項(xiàng)目的運(yùn)作結(jié)構(gòu),獲取系統(tǒng)信息之后,運(yùn)用規(guī)范化、科學(xué)化的技術(shù)手段對(duì)其進(jìn)行統(tǒng)籌規(guī)劃,以確保各類信息得以正常傳遞,并維護(hù)傳輸?shù)牧鲿承?、穩(wěn)定性。
2項(xiàng)目管理當(dāng)中運(yùn)用計(jì)算機(jī)技術(shù)的效果探究
2.1計(jì)算機(jī)相關(guān)技術(shù)用于提升管理效率
項(xiàng)目工程在策劃、啟動(dòng)和實(shí)踐的全過(guò)程當(dāng)中必然要形成多種多樣的項(xiàng)目信息,例如,合同簽訂文書、規(guī)劃圖紙、各類報(bào)告、圖像信息等,對(duì)以上信息展開綜合、系統(tǒng)管理時(shí),需要一個(gè)科學(xué)而規(guī)范的體系作為重要保障。建立這樣的管理運(yùn)行體系,應(yīng)借助先進(jìn)的計(jì)算機(jī)相關(guān)技術(shù)開展信息管理建設(shè),進(jìn)而構(gòu)建出可供更多人員進(jìn)行信息交流的操作平臺(tái)。運(yùn)用先進(jìn)網(wǎng)絡(luò)技術(shù)建設(shè)信息管理操作平臺(tái)前,要把相關(guān)信息分成質(zhì)量控制信息、策劃管理信息、安全防護(hù)信息等幾個(gè)專項(xiàng)板塊,進(jìn)而把相關(guān)信息系統(tǒng)地整合到相應(yīng)板塊當(dāng)中,并采取超文本的格式編寫出各類項(xiàng)目信息,進(jìn)而將這些經(jīng)過(guò)處理的信息放于網(wǎng)絡(luò)上推廣、傳播,既可以提升項(xiàng)目工作的實(shí)踐效率,又可以降低信息工作的管理難度。
2.2計(jì)算機(jī)相關(guān)技術(shù)用于實(shí)現(xiàn)全面控制
網(wǎng)絡(luò)技術(shù)在項(xiàng)目工程中運(yùn)用計(jì)算機(jī)相關(guān)技術(shù),能夠形成全程跟蹤式的管理模式。經(jīng)技術(shù)處理的各類編碼具有更強(qiáng)的可信性與精確性,項(xiàng)目工作中運(yùn)用此類信息可進(jìn)一步提高運(yùn)行效率。例如,項(xiàng)目管理中涉及到許多子項(xiàng)目的評(píng)估工作,為做出最優(yōu)的操作決策,管理者需借助網(wǎng)絡(luò)技術(shù)改進(jìn)項(xiàng)目評(píng)估的流程和方式,通過(guò)簡(jiǎn)化復(fù)雜的子項(xiàng)目信息加快數(shù)據(jù)整合速度,可以顯著提升管理效率和增加經(jīng)濟(jì)收益。網(wǎng)絡(luò)技術(shù)引入到項(xiàng)目信息的管理當(dāng)中,會(huì)按每個(gè)項(xiàng)目的具體情況實(shí)施進(jìn)度管理、系統(tǒng)策劃、造價(jià)評(píng)估、質(zhì)量監(jiān)控、機(jī)械和材料檢測(cè)等多方面工作的全面控制,如此可在保證質(zhì)量的條件下,將管理成本降低到最低水平,大大節(jié)省項(xiàng)目管理的經(jīng)濟(jì)支出。此外,運(yùn)用相關(guān)網(wǎng)絡(luò)技術(shù)的同時(shí),項(xiàng)目管理能夠借助十分便捷的信息交流工具實(shí)現(xiàn)跨空間的快速溝通,使各種信息交流工作得以順利進(jìn)行。例如,計(jì)算機(jī)介入項(xiàng)目信息的綜合管理后,每位工作人員都能在信息操作平臺(tái)中獲取到所需的相關(guān)信息,實(shí)現(xiàn)了工作信息的全面共享。
2.3計(jì)算機(jī)相關(guān)技術(shù)用于完善管理機(jī)制
項(xiàng)目管理當(dāng)中采用各種網(wǎng)絡(luò)技術(shù),可將總系統(tǒng)中包含的各個(gè)子系統(tǒng)及下屬板塊內(nèi)包含的全部信息進(jìn)行綜合處理,經(jīng)處理后的信息能夠充分滿足管理者的操作需求,大幅度地提升了管理效率。項(xiàng)目工作者憑借這些信息可以開展決策評(píng)估,為負(fù)責(zé)人的重要工作提供有用信息。處理項(xiàng)目工程實(shí)踐過(guò)程中的各種問(wèn)題時(shí),計(jì)算機(jī)技術(shù)能按照資源情況開展實(shí)時(shí)控制,結(jié)合工程進(jìn)度調(diào)度、配置項(xiàng)目信息,管理軟件在其中起到“合理分配”、“高效服務(wù)”的作用。若資源服務(wù)時(shí)間超出設(shè)定標(biāo)準(zhǔn),系統(tǒng)將自行開啟警示裝置,使各類資源得到充分、合理地運(yùn)用。
2.4計(jì)算機(jī)相關(guān)技術(shù)用于管理項(xiàng)目物資
項(xiàng)目信息的流通性、變化性決定了項(xiàng)目管理的工作性質(zhì),物資管理作為項(xiàng)目管理當(dāng)中的重要內(nèi)容,會(huì)對(duì)工程造價(jià)形成很大影響。尤其是比較大型的項(xiàng)目需要用到許多物資,但市場(chǎng)中的物資價(jià)格變化較快,想要很好地管理項(xiàng)目的各類物資,應(yīng)借助計(jì)算機(jī)技術(shù)構(gòu)建一個(gè)規(guī)范的物資規(guī)劃系統(tǒng),把規(guī)劃、審批、購(gòu)置、保存、發(fā)放、維護(hù)等各類信息納入這一系統(tǒng)中,以增強(qiáng)物資供應(yīng)的平衡性,使項(xiàng)目物資的管理水平得到顯著提高。
3結(jié)束語(yǔ)
項(xiàng)目管理作為一個(gè)動(dòng)態(tài)化的工作過(guò)程,當(dāng)中涉及的各類項(xiàng)目信息需要計(jì)算機(jī)技術(shù)進(jìn)行科學(xué)、規(guī)范管理。將計(jì)算機(jī)相關(guān)技術(shù)引入到項(xiàng)目信息管理工作中,既能夠改善項(xiàng)目信息管理的效率,又能夠提高實(shí)際管理工作的質(zhì)量,有效地提升了項(xiàng)目工程的總體質(zhì)量。值得提出的是,項(xiàng)目管理中遇到各種問(wèn)題時(shí),管理者要結(jié)合實(shí)際情況應(yīng)用計(jì)算機(jī)技術(shù),使先進(jìn)技術(shù)能夠更好地服務(wù)于項(xiàng)目信息管理及其相關(guān)工作。
參考文獻(xiàn)
[1]李躍輝.淺談?dòng)?jì)算機(jī)信息系統(tǒng)集成項(xiàng)目管理--基于需求變更與范圍管理[J].技術(shù)與市場(chǎng),2013,20(5):249-252.
隨著經(jīng)濟(jì)技術(shù)的不斷發(fā)展,計(jì)算機(jī)科學(xué)的應(yīng)用逐漸普及,各種工程項(xiàng)目在實(shí)施時(shí)都離不開計(jì)算機(jī)的協(xié)同幫助。所以,針對(duì)目前大型項(xiàng)目工程建設(shè)的需要,當(dāng)下應(yīng)改變傳統(tǒng)的項(xiàng)目管理理念,融入新技術(shù)的管理理論和手段,促進(jìn)項(xiàng)目的成功。計(jì)算機(jī)協(xié)同技術(shù)的出現(xiàn)能為工程項(xiàng)目完美收工奠定基礎(chǔ)。
1協(xié)同技術(shù)
協(xié)同科學(xué)的研究多基于計(jì)算機(jī)信息技術(shù)的研究,即建立計(jì)算機(jī)信息共享平臺(tái),這就是基于計(jì)算機(jī)系統(tǒng)支持的協(xié)同技術(shù)。計(jì)算機(jī)協(xié)同技術(shù)是指在地域分散的群體間,所有的群體借助計(jì)算機(jī)、互聯(lián)網(wǎng)的聯(lián)系以及相關(guān)技術(shù),通過(guò)共同的協(xié)作來(lái)完成手中的任務(wù)。具體而言,計(jì)算機(jī)協(xié)同技術(shù)主要包括群組通信技術(shù)、協(xié)作控制機(jī)制、應(yīng)用共享技術(shù)以及多媒體技術(shù)等。作為用于人類完成協(xié)同工作的重要工具,計(jì)算機(jī)協(xié)同技術(shù)具有極其重要的現(xiàn)實(shí)意義。
2協(xié)同技術(shù)與項(xiàng)目管理的聯(lián)系
一項(xiàng)工程之中的項(xiàng)目管理涉及范圍廣,包括很多方面,主要有項(xiàng)目主體、進(jìn)度、合同、資源、采購(gòu)、成本、質(zhì)量、風(fēng)險(xiǎn)、信息與溝通等,所以,在項(xiàng)目管理的具體實(shí)施過(guò)程中,多數(shù)的方式、方法是圍繞這些進(jìn)行的。在當(dāng)前的技術(shù)研究程度上,計(jì)算機(jī)的普及為項(xiàng)目管理研究技術(shù)提供了巨大的幫助,很多有計(jì)劃性的實(shí)施方法也建立在計(jì)算機(jī)科學(xué)技術(shù)發(fā)展的基礎(chǔ)之上,所以,計(jì)算機(jī)協(xié)同技術(shù)與項(xiàng)目管理的聯(lián)系是具有必然性的。
3計(jì)算機(jī)協(xié)同技術(shù)在管理中的作用形式
計(jì)算機(jī)在當(dāng)前人們的生活中已經(jīng)不再陌生,隨著經(jīng)濟(jì)的發(fā)展人們,日常生活中已經(jīng)離不開計(jì)算機(jī)。在管理工作中,采用計(jì)算機(jī)的管理模式更是便捷、簡(jiǎn)單的代表。
3.1計(jì)算機(jī)的映像處理模式
在項(xiàng)目管理中,信息的傳遞需要靠書面材料來(lái)進(jìn)行。此時(shí),計(jì)算機(jī)的圖像儲(chǔ)存作用展現(xiàn)了出來(lái),當(dāng)需要的業(yè)務(wù)材料需要被存儲(chǔ)到計(jì)算機(jī)中進(jìn)一步應(yīng)用時(shí),即協(xié)同技術(shù)對(duì)項(xiàng)目管理反應(yīng)的過(guò)程。人們需要將所有的紙質(zhì)業(yè)務(wù)資料和數(shù)據(jù)轉(zhuǎn)化成電子格式,并錄入計(jì)算機(jī)中,由計(jì)算機(jī)統(tǒng)一完成業(yè)務(wù)資料的處理和傳遞。特別是在協(xié)同技術(shù)中的多媒體技術(shù)可以對(duì)數(shù)量龐大的業(yè)務(wù)資料進(jìn)行壓縮處理,將平面的文字信息轉(zhuǎn)化成動(dòng)態(tài)的音頻、視頻格式。該模式大大減少了工作人員的任務(wù)量,并能有效提升項(xiàng)目管理的質(zhì)量和管理效率。
3.2文檔管理
文檔管理是人們利用計(jì)算機(jī)進(jìn)行的基礎(chǔ)性管理。在當(dāng)前的項(xiàng)目工程中,文件數(shù)量非常多,完全依靠人工處理,比如手寫起草文件等已經(jīng)無(wú)法滿足龐大的文檔管理需求。此時(shí),需要利用專門的計(jì)算機(jī)軟件以提升管理效率。比如,可以利用專業(yè)的書寫軟件(Word文檔等)進(jìn)行各種內(nèi)容的記錄。文檔也是當(dāng)前信息管理的基本功能,比如重要事務(wù)文檔的儲(chǔ)存、某些需要修改的文檔處理、文檔的分發(fā)等,均可利用計(jì)算機(jī)技術(shù)大大提高工作效率。
3.3電子郵件
項(xiàng)目工程內(nèi)容復(fù)雜繁多,涉及人員較多,導(dǎo)致人與人之間的交流、探討需要跨時(shí)間、跨空間、跨地域進(jìn)行,這就要求應(yīng)充分利用計(jì)算機(jī)的協(xié)同技術(shù),促進(jìn)項(xiàng)目管理人員之間的溝通交流。電子郵件的使用可以很好地滿足當(dāng)前項(xiàng)目工程的管理需要,在各部門交流時(shí)可以通過(guò)計(jì)算機(jī)郵件進(jìn)行,不僅能徹底打破以往時(shí)間和空間上的限制,電子郵件的高效性和便捷性還能以最快的速度和最簡(jiǎn)便的方式來(lái)解決問(wèn)題,幫助人們實(shí)現(xiàn)隨時(shí)隨地交流和溝通的目的。
3.4業(yè)務(wù)過(guò)程重構(gòu)結(jié)構(gòu)化系統(tǒng)設(shè)計(jì)工具
業(yè)務(wù)過(guò)程重構(gòu)工具是指利用計(jì)算機(jī)技術(shù)分析、建模、重定義組織內(nèi)的核心業(yè)務(wù)或業(yè)務(wù)核心的相關(guān)角色改變?cè)斐傻挠绊懙男畔⒓夹g(shù)手段。
3.5工作流管理系統(tǒng)
項(xiàng)目管理就是對(duì)任務(wù)的各個(gè)人員和任務(wù)的支配性工作,每一項(xiàng)工程項(xiàng)目都包含眾多的人員和任務(wù),這樣利用計(jì)算機(jī)技術(shù)建立起的工作流管理系統(tǒng)可以清晰、便捷地安排各項(xiàng)工作。比如,在建筑工程項(xiàng)目中,需要就各方面(業(yè)主、承包商、設(shè)計(jì)公司等)的需求考慮合同的變更問(wèn)題。當(dāng)項(xiàng)目合同中明確規(guī)定的內(nèi)容需要變更時(shí),可以將各方同意的變更處理流程輸入工作流程管理系統(tǒng)中,由該系統(tǒng)進(jìn)行科學(xué)、合理的分析,進(jìn)而分配人員和資源,并對(duì)各項(xiàng)工作按規(guī)定時(shí)間通知工作人員。如果直接負(fù)責(zé)人沒(méi)有回復(fù)通知,則系統(tǒng)會(huì)對(duì)相關(guān)人員進(jìn)行通知,保證工作流程銜接到位。
4結(jié)束語(yǔ)
目前,人們注重對(duì)計(jì)算機(jī)協(xié)同技術(shù)的研究和各種工作軟件的研發(fā),新興的互聯(lián)網(wǎng)技術(shù)為項(xiàng)目管理工作帶來(lái)了便捷,促進(jìn)了項(xiàng)目管理工作的順利進(jìn)行。這對(duì)很多行業(yè)的項(xiàng)目管理工作有巨大的幫助。本文對(duì)計(jì)算機(jī)協(xié)同技術(shù)的內(nèi)容進(jìn)行了簡(jiǎn)要介紹,立足于協(xié)同技術(shù)與項(xiàng)目管理系統(tǒng)之間的緊密聯(lián)系,分別從計(jì)算機(jī)的映像處理模式、電子郵件、文檔管理、工作流管理系統(tǒng)等方面對(duì)計(jì)算機(jī)協(xié)同技術(shù)在項(xiàng)目管理中的應(yīng)用進(jìn)行了簡(jiǎn)要闡述,驗(yàn)證了計(jì)算機(jī)協(xié)同技術(shù)能有效提升項(xiàng)目管理質(zhì)量和管理效率的結(jié)論。在未來(lái),各個(gè)行業(yè)應(yīng)積極引進(jìn)以計(jì)算機(jī)協(xié)同技術(shù)為主導(dǎo)的項(xiàng)目管理方式,從而將項(xiàng)目管理水平提升至一個(gè)全新的高度。
作者:徐鑒 單位:重慶市西南計(jì)算機(jī)有限責(zé)任公司
中圖分類號(hào):TP393文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2012)13-3209-03
Data Management Technology for Cloud Computing
WANG Cheng1, ZHAO Bi-fang2
(1.Wells Fargo Bank, West Des Moines, 50266,USA; 2.ASDI Inc, West Des Moines, 50266,USA)
Abstract: Firstly, the definition of cloud computing and cloud computing, data management techniques were introduced, the depth of analysis of current Internet mainstream cloud the basic principles of data management systems, and concluded that the main research directions of the cloud the field of data management. And the existing problems and future research focus are discussed to provide a basis for further research.
Key words: cloud computing; resource management; cloud storage; distributed computing
云計(jì)算(Cloud Computing)是網(wǎng)格計(jì)算(Grid Computing)、分布式計(jì)算(Distributed Computing)、效用計(jì)算(Utility Computing)、并行計(jì)算(Parallel Computing)、負(fù)載均衡(Load Balance)、虛擬化(Virtualization)、網(wǎng)絡(luò)存儲(chǔ)(Network Storage Technologies)等傳統(tǒng)技術(shù)發(fā)展融合的產(chǎn)物,是目前比較流行的名詞[1-2]。廣義上的云計(jì)算指通過(guò)計(jì)算機(jī)網(wǎng)絡(luò)以易擴(kuò)展、按需的方式獲得所需服務(wù),主要是指服務(wù)的使用與交付模式[4],服務(wù)可以是其他服務(wù)。通過(guò)以上陳述,筆者認(rèn)為,狹義云計(jì)算是指以網(wǎng)絡(luò)為媒介,通過(guò)按需、易擴(kuò)展的方式從而能獲得所需要的資源,即IT基礎(chǔ)設(shè)施的交付和使用模式[3]。
云計(jì)算主要包括以下三個(gè)層次服務(wù):(1)軟件即服務(wù)(SaaS);(2)平臺(tái)即服務(wù)(PaaS);(3)基礎(chǔ)設(shè)施即服務(wù)(IaaS)[5]。由于云技術(shù)需要有大量的用戶參與其中,這就會(huì)造成諸多隱私問(wèn)題。譬如用戶參與涉及到收集部分用戶數(shù)據(jù),勢(shì)必會(huì)引發(fā)用戶數(shù)據(jù)安全問(wèn)題,很多使用者會(huì)擔(dān)心自身的隱私會(huì)被云技術(shù)收集從而暴露。因此,很多廠商都在加入云計(jì)劃的同時(shí)均會(huì)表示盡量避免收集用戶的安全隱私,若不慎收集到也不將此泄露甚至使用,給他人造成不便。但在實(shí)際情況中仍有不少人質(zhì)疑廠商的承諾,這是因?yàn)槿杂胁簧僦麖S商在此期間都被指責(zé)有可能泄露用戶隱私,且泄露事件也確有其事。
1云數(shù)據(jù)管理研究現(xiàn)狀
1.1 Google File System文件系統(tǒng)(GFS)
Google有一套自身專屬的云計(jì)算平臺(tái),該平臺(tái)是為Google提供最重要的搜索應(yīng)用提供服務(wù),目前已擴(kuò)展到其他應(yīng)用程序[6-7]。Google的云計(jì)算基礎(chǔ)架構(gòu)模式包括4個(gè)相互獨(dú)立又緊密結(jié)合在一起的系統(tǒng): Google File System分布式文件系統(tǒng),針對(duì)Google應(yīng)用程序的特點(diǎn)提出的MapReduce編程模式,分布式的鎖機(jī)制Chubby以及Google開發(fā)的模型簡(jiǎn)化的大規(guī)模分布式數(shù)據(jù)庫(kù)BigTable。除了性能,可伸縮性、可靠性以及可用性以外,GFS設(shè)計(jì)還受到Google應(yīng)用負(fù)載和技術(shù)環(huán)境的影響。圖1給出了Google File System的系統(tǒng)架構(gòu)[8]。
1.2 MapReduce分布式編程環(huán)境
Google簡(jiǎn)化分布式系統(tǒng)的編程是通過(guò)構(gòu)造MapReduce編程規(guī)范來(lái)實(shí)現(xiàn)的。程序員只需將注意力放在應(yīng)用程序本身,由平臺(tái)來(lái)處理關(guān)于集群的處理問(wèn)題(包括可擴(kuò)展性與可靠性)[9-10]。MapReduce運(yùn)算基本單元通過(guò)“映射”和“化簡(jiǎn)”來(lái)構(gòu)成,用戶只需提供自己的Map函數(shù)以及Reduce函數(shù)即可并行處理海量數(shù)據(jù)。圖2給出了MapReduce執(zhí)行過(guò)程,該過(guò)程分為Map和Reduce兩個(gè)階段,在兩個(gè)階段之間還有一個(gè)中間的分類階段,即將中間結(jié)果包含相同的key的中間結(jié)果交給同一個(gè)Reduce函數(shù)去執(zhí)行,另外兩個(gè)階段都使用了集群中的所有節(jié)點(diǎn)[11-12]。
圖1 Google File System的系統(tǒng)架構(gòu)
圖2 MapReduce處理程序的執(zhí)行過(guò)程
1.3分布式的大規(guī)模數(shù)據(jù)庫(kù)管理系統(tǒng)BigTable
由于有部分的Google應(yīng)用程序需要對(duì)大量的格式化或半格式的化數(shù)據(jù)進(jìn)行有效處理, Google構(gòu)建了大規(guī)模數(shù)據(jù)庫(kù)系統(tǒng)Big? Table,該系統(tǒng)有弱一致性要求。BigTable的應(yīng)用包括Maps,Orkut,Search History,RSS閱讀器等。BigTable數(shù)據(jù)庫(kù)系統(tǒng)的數(shù)據(jù)模型如圖3[13]。數(shù)據(jù)模型所有的數(shù)據(jù)都存放在表格單元中,包括行列以及相應(yīng)的時(shí)間戳。BigTable的內(nèi)容按照行來(lái)劃分,將多個(gè)行組成一個(gè)小表(這個(gè)小表稱為Table),保存到某一個(gè)服務(wù)器節(jié)點(diǎn)中。
圖3 Google BigTable的數(shù)據(jù)模型
2存在的問(wèn)題與未來(lái)研究熱點(diǎn)
云計(jì)算是一種處理大規(guī)模密集型數(shù)據(jù)的并行分布式計(jì)算技術(shù),目前已有的云計(jì)算編程模型以MapReduce典型為代表,其他的大體上是這種方式的變種。谷歌公司開發(fā)的編程架構(gòu)MapReduce簡(jiǎn)化了編程人員的工作,并且使數(shù)據(jù)的處理效率提高,因此MapReduce受到了較多的關(guān)注,獲得了較大的發(fā)展,但還沒(méi)有形成成熟的、系統(tǒng)化的理論體系,并且在面對(duì)計(jì)算過(guò)程相對(duì)復(fù)雜的計(jì)算任務(wù)時(shí),這種簡(jiǎn)單的編程模型將可能效率低下,甚至有些復(fù)雜的計(jì)算任務(wù)會(huì)因?yàn)檫@種分解方式而不能收斂[14-16]。
一般來(lái)說(shuō)云計(jì)算的終端用戶應(yīng)該不用考慮分布式并行處理系統(tǒng)方面的細(xì)節(jié)問(wèn)題,就可以享受云計(jì)算所帶來(lái)的的各種服務(wù)。但是隨著企業(yè)數(shù)據(jù)密集型大規(guī)模計(jì)算需求的出現(xiàn),現(xiàn)有編程模型還面臨著更多的新挑戰(zhàn)。一方面石化企業(yè)遺留了大量歷史數(shù)據(jù),并且石化企業(yè)每年產(chǎn)生的數(shù)據(jù)已達(dá)到PB(拍字節(jié),1015B)數(shù)量級(jí),其總量不僅成幾何級(jí)數(shù)增長(zhǎng),其結(jié)構(gòu)也呈現(xiàn)連續(xù)的高維時(shí)空特性,較傳統(tǒng)的二維關(guān)系表和結(jié)構(gòu)的萬(wàn)維網(wǎng)數(shù)據(jù)更復(fù)雜多變。隨著數(shù)據(jù)總量和復(fù)雜性的增加,用戶的查詢需求越來(lái)越多,也越來(lái)越復(fù)雜?!皵?shù)據(jù)在,找不到”的問(wèn)題日益嚴(yán)重,如何有效地在云計(jì)算平臺(tái)中存儲(chǔ)和管理海量數(shù)據(jù),成為其中的新的難題。另一方面在數(shù)據(jù)密集型大規(guī)模計(jì)算系統(tǒng)中,影響性能的重要因素包括了大規(guī)模數(shù)據(jù)的移動(dòng)、復(fù)雜計(jì)算的局部性、多任務(wù)的調(diào)度等操作,為了兼顧簡(jiǎn)單性及性能優(yōu)化,編程模型需要對(duì)上述影響因素提供適當(dāng)?shù)耐该餍浴?/p>
云計(jì)算需要對(duì)大量分散的數(shù)據(jù)進(jìn)行集中處理和分析,這就要求數(shù)據(jù)管理技術(shù)需能對(duì)大量數(shù)據(jù)進(jìn)行高效管理。如何在規(guī)模龐大的分布式數(shù)據(jù)中快速準(zhǔn)確的找到目標(biāo)數(shù)據(jù),也是云計(jì)算數(shù)據(jù)管理技術(shù)所必須解決的問(wèn)題。同時(shí),由于管理形式的不同造成傳統(tǒng)的SQL數(shù)據(jù)庫(kù)接口無(wú)法直接移植到云管理系統(tǒng)中來(lái)。另外,在云數(shù)據(jù)管理方面,如何保證數(shù)據(jù)安全性和數(shù)據(jù)訪問(wèn)高效性也是研究關(guān)注的重點(diǎn)問(wèn)題之一。
3結(jié)束語(yǔ)
本文首先對(duì)云計(jì)算的定義及云計(jì)算中數(shù)據(jù)管理技術(shù)進(jìn)行了介紹,之后詳細(xì)闡述云計(jì)算數(shù)據(jù)管理技術(shù)的研究現(xiàn)狀,并對(duì)目前存在的問(wèn)題與未來(lái)研究熱點(diǎn)進(jìn)行了探討,為進(jìn)一步的研究提供依據(jù)。
參考文獻(xiàn):
[1]徐志偉,廖華明,余海燕.網(wǎng)絡(luò)計(jì)算系統(tǒng)的分類研究[J].計(jì)算機(jī)學(xué)報(bào),2008,31(9):1509-1515.
[2]鐘偉彬,周梁月,潘軍彪,等.云計(jì)算終端的現(xiàn)狀和發(fā)展趨勢(shì)[J].電信科學(xué),2010,26(3):22-26.
[3] Armbrust M,Fox A,Griffith R,etc.A view of cloud computing[J].Communication of the ACM,2010,53(4):50-58.
[4]陳康.云計(jì)算后臺(tái)大規(guī)模數(shù)據(jù)處理技術(shù)探討[J].電信工程技術(shù)與標(biāo)準(zhǔn)化,2009,22(11):12-16.
[5]陳康,鄭緯民.云計(jì)算:系統(tǒng)實(shí)例與研究現(xiàn)狀[J].軟件學(xué)報(bào),2009,20(5):1337-1348.
[6]李曉偉,沈艷秋.云計(jì)算及其發(fā)展進(jìn)程[J].科技信息,2011,15(2):1-3.
[7] Rodrigo N,Calheiros,Rajiv Ranjan,Anton Beloglazov,etc.CloudSim: a toolkit for modeling and simulation of cloud computing environments and evaluation of resource provisioning algorithms [J].Software-Practice & Experience,2011,41(1):23-50.
[8] Mark Stillwell,David Schanzenbach,Frederic Vivien,etc.Resource allocation algorithms for virtualized service hosting platforms[J].Journal of Parallel and Distributed Computing,2010,70(9):962-974.
[9]柳敬.云計(jì)算平臺(tái)的成本效用研究[D].北京:北京郵電大學(xué),2010.
[10]劉少偉,孔令梅,任開軍,等.云環(huán)境下優(yōu)化科學(xué)工作流執(zhí)行性能的兩階段數(shù)據(jù)放置與任務(wù)調(diào)度策略[J].計(jì)算機(jī)學(xué)報(bào),2011,34(11):2121-2130.
[11]白蛟,全春來(lái),郭鎮(zhèn).基于物聯(lián)網(wǎng)的公共安全云計(jì)算平臺(tái)[J].計(jì)算機(jī)工程與設(shè)計(jì),2011,32(11):3696-3700.
[12] Daniel Warneke,Odej Kao.Exploiting Dynamic Resource Allocation for Efficient Parallel Data Processing in the Cloud[J].IEEE Transac tions on Parallel and Distributed Systems,2011,22(6):1045-9219.
[13]劉曉茜.云計(jì)算數(shù)據(jù)中心結(jié)構(gòu)及其調(diào)度機(jī)制研究[D].合肥:中國(guó)科學(xué)技術(shù)大學(xué),2011.
1.1云計(jì)算數(shù)據(jù)庫(kù)的簡(jiǎn)述
云計(jì)算在本質(zhì)上可以理解為顯示的基礎(chǔ)構(gòu)架和服務(wù)器虛擬化的技術(shù)的相互結(jié)合所形成的一種技術(shù)。這種技術(shù)的核心就是把其中的某些數(shù)據(jù)根據(jù)所建立的數(shù)據(jù)中心庫(kù)虛擬化之后,然后提供給用戶使用,這是一種很重要的運(yùn)作形式,這種提供計(jì)算服務(wù)和資源的已經(jīng)很常見了,并不是一項(xiàng)新型的技術(shù),但是這是新的創(chuàng)新模式。云計(jì)算具有其特有的特征:1)云計(jì)算的數(shù)據(jù)是存在網(wǎng)絡(luò)云端上的,同時(shí)這些應(yīng)用也是存儲(chǔ)在網(wǎng)絡(luò)云端的,這些對(duì)于企業(yè)和個(gè)人用戶來(lái)說(shuō)是開放透明的,往往這種數(shù)據(jù)和資源是由第三方所支持和提供的;2)云計(jì)算特別注重服務(wù),強(qiáng)調(diào)服務(wù),往往在現(xiàn)有的商業(yè)模式上根據(jù)用戶的使用需求,來(lái)進(jìn)行計(jì)費(fèi)的。這種模式可以達(dá)到互惠互利的目的實(shí)行共贏;3)云計(jì)算是可以把互聯(lián)網(wǎng)當(dāng)做發(fā)揮的舞臺(tái),同時(shí)把互聯(lián)網(wǎng)的瀏覽系統(tǒng)當(dāng)做計(jì)算的新型模式。數(shù)據(jù)庫(kù)指的是一種服務(wù)形式,這一般的使用者可以獲得自己然后通過(guò)接口的模式進(jìn)行連接,這在以前是一種特別的計(jì)算服務(wù),同時(shí)這些用戶是有著巨大的計(jì)算需求。
1.2 云計(jì)算數(shù)據(jù)庫(kù)的現(xiàn)狀
現(xiàn)在互聯(lián)網(wǎng)技術(shù)正在飛速的發(fā)展,云計(jì)算數(shù)據(jù)庫(kù)已經(jīng)悄悄的出現(xiàn)在我們的生活中了。云計(jì)算進(jìn)行大規(guī)模的計(jì)算需要大量的,性能良好的硬件設(shè)備,這些硬件設(shè)備往往是由大量的服務(wù)器所組成的。通過(guò)這種互聯(lián)網(wǎng)的強(qiáng)大的計(jì)算能力,企業(yè)和我們的個(gè)人用戶就可以從中獲得自己所需要的計(jì)算結(jié)果,在未來(lái)的發(fā)展中,云計(jì)算數(shù)據(jù)庫(kù)很可能實(shí)現(xiàn)一種通過(guò)廣域網(wǎng)的途徑來(lái)為一些大型或者超大型的企業(yè)提供計(jì)算能力的服務(wù)模式。這種模式的優(yōu)點(diǎn)就是一方面不需要投資大量的硬件設(shè)備,方便快捷。現(xiàn)在的云計(jì)算書籍庫(kù)的市場(chǎng)基本是由谷歌的Bigtable,甲骨文開源的BerkeyDB,亞馬遜的simpleDB,APPJet的APPJet所占據(jù)。這些都是最近幾年內(nèi)發(fā)展起來(lái)的,其中亞馬遜和谷歌占據(jù)了半壁江山。在管理機(jī)構(gòu)上是數(shù)據(jù)結(jié)構(gòu)分布式的存儲(chǔ)是谷歌Bigtable的一個(gè)重要特點(diǎn),最初的設(shè)計(jì)目的也是為了實(shí)現(xiàn)是數(shù)據(jù)存儲(chǔ)的單元系統(tǒng)能夠進(jìn)一步的擴(kuò)展。這可以通過(guò)成千上萬(wàn)的網(wǎng)絡(luò)服務(wù)器完成PB級(jí)的網(wǎng)絡(luò)儲(chǔ)存數(shù)據(jù),而亞馬遜的simpleDB則是一種高效率,高靈活性,高擴(kuò)展性和可容性的存儲(chǔ)模式,這種數(shù)據(jù)查詢和數(shù)據(jù)存儲(chǔ)方式是由公司的開發(fā)和技術(shù)人員開發(fā)的,他們通過(guò)向網(wǎng)絡(luò)的數(shù)據(jù)服務(wù)器發(fā)出請(qǐng)求,這些都是可以通過(guò)亞馬遜的這個(gè)云計(jì)算數(shù)據(jù)平臺(tái)來(lái)完成。
1.3 云計(jì)算數(shù)據(jù)庫(kù)存在的問(wèn)題
1.3.1 沒(méi)有足夠的安全性
現(xiàn)在的云計(jì)算數(shù)據(jù)庫(kù)也是剛剛被應(yīng)用,技術(shù)還沒(méi)有足夠的成熟,在數(shù)據(jù)的傳輸和存儲(chǔ)過(guò)程中很容易丟失,被惡意的程序刪除,篡改,這使得企業(yè)和用戶的數(shù)據(jù)得到泄露,影響用戶的正常使用。同時(shí),這種用戶數(shù)據(jù)泄露,往往云計(jì)算運(yùn)行商也是有很大的責(zé)任的。而且,在數(shù)據(jù)上沒(méi)有辦法沒(méi)有達(dá)到一定的統(tǒng)一性,在使用云計(jì)算的數(shù)據(jù)庫(kù)的時(shí)候我們應(yīng)該考慮數(shù)據(jù)庫(kù)的可靠性,一致性,可用性等方面。
1.3.2 某些傳統(tǒng)的功能無(wú)法實(shí)現(xiàn)
在傳統(tǒng)的數(shù)據(jù)庫(kù)中,這些數(shù)據(jù)的邊界和使用設(shè)備的用戶都是可以很好的被定義,這種是通過(guò)邏輯和安全方面來(lái)定義的。在云計(jì)算的數(shù)據(jù)庫(kù)中這種功能是沒(méi)有得到開發(fā)和應(yīng)用的。同時(shí),現(xiàn)在的企業(yè)和個(gè)人用戶,沒(méi)有權(quán)限訪問(wèn)這種數(shù)據(jù)資源,往往被提示非授權(quán)訪問(wèn),沒(méi)有被事先授權(quán),得到這份系統(tǒng)的權(quán)利,但是可以訪問(wèn)計(jì)算機(jī)和互聯(lián)網(wǎng)上的某些資源。在這個(gè)計(jì)算系統(tǒng)中,有著優(yōu)先訪問(wèn)資格的往往的云計(jì)算中的數(shù)據(jù)庫(kù)服務(wù)商,而不是個(gè)人和企業(yè)。
2 云計(jì)算數(shù)據(jù)庫(kù)在智能電網(wǎng)中的廣泛運(yùn)用
由于云計(jì)算數(shù)據(jù)庫(kù)在智能電網(wǎng)的運(yùn)用,現(xiàn)在的智能電網(wǎng)可以用來(lái)數(shù)據(jù)更多的電網(wǎng)云。這種方式構(gòu)建的電網(wǎng)可以為人們提供更加高效、安全、可靠、環(huán)保的電力安全系統(tǒng),這可以實(shí)現(xiàn)多種能源的發(fā)電方式協(xié)調(diào)運(yùn)轉(zhuǎn),同時(shí)滿足高度市場(chǎng)化的電力的商業(yè)需求。
電網(wǎng)的信息種類繁多,人戶請(qǐng)求次數(shù)不斷的增加,大量的數(shù)據(jù)同時(shí)請(qǐng)求,傳統(tǒng)的電網(wǎng)計(jì)算模式已經(jīng)很難滿足這種數(shù)據(jù)請(qǐng)求的需要。而智能電網(wǎng)在云技術(shù)的支持下,對(duì)大規(guī)模的數(shù)據(jù)進(jìn)行分析和處理,對(duì)海量的請(qǐng)求數(shù)據(jù)進(jìn)行分析,優(yōu)化和設(shè)計(jì),決策,快速的進(jìn)行回應(yīng)。采用云計(jì)算數(shù)據(jù)庫(kù)技術(shù)的電網(wǎng)可以分為四個(gè)層次,從上到下依次為:1)物理存儲(chǔ)層。物理存儲(chǔ)層指的是在智能電網(wǎng)中的一些物理網(wǎng)絡(luò)設(shè)備,這是網(wǎng)絡(luò)存儲(chǔ)的基礎(chǔ)。2)基礎(chǔ)管理層,基礎(chǔ)管理層指的就是為達(dá)到智能電網(wǎng)中所有程序和設(shè)備的協(xié)調(diào)一致的運(yùn)行,所用的方法就是通過(guò)分布和集群式的系統(tǒng)來(lái)完成的。3)應(yīng)用接口層,應(yīng)用接口層的使用,可以使得管理機(jī)構(gòu)和權(quán)限使用根據(jù)這自己的需求和所擁有的權(quán)限,選用不同的接口,提供不同的服務(wù)。運(yùn)用這種形式的智能電網(wǎng)云,可以使各級(jí)電網(wǎng)通過(guò)公共的接口進(jìn)行接入和登陸,從而獲得相應(yīng)的數(shù)據(jù),信息和服務(wù)。4)高級(jí)訪問(wèn)層,這種系統(tǒng)也是運(yùn)用云計(jì)算數(shù)據(jù)庫(kù)的形式,這種感覺高級(jí)訪問(wèn)層,可以為提供電力系數(shù)的電力軟件提供強(qiáng)大的運(yùn)行平臺(tái)和軟件平臺(tái)。這樣智能電網(wǎng)中的海量數(shù)據(jù)便可以很輕松的處理。
3 云計(jì)算數(shù)據(jù)庫(kù)在遠(yuǎn)程教學(xué)中的運(yùn)用
現(xiàn)在在網(wǎng)絡(luò)教學(xué)中,最重要的是資源的共享和利用,這是不受時(shí)間和空間限制的。而且最重要的是學(xué)習(xí)者可以根據(jù)自身的學(xué)習(xí)進(jìn)度和自己的學(xué)習(xí)能力去安排這些時(shí)間和資源。這些是傳統(tǒng)的網(wǎng)上教學(xué)所不具備的特點(diǎn)。但客觀上講,運(yùn)用云計(jì)算的數(shù)據(jù)庫(kù)是可以實(shí)現(xiàn)的利用云計(jì)算的優(yōu)勢(shì)我們可以很好的解決現(xiàn)實(shí)學(xué)習(xí)中的一些問(wèn)題,比如機(jī)械設(shè)計(jì),自動(dòng)化專業(yè)和數(shù)控技術(shù)這些要求的學(xué)習(xí)設(shè)備和學(xué)習(xí)軟件都特別昂貴,這方面的學(xué)員又是比較少的,為很少的學(xué)員提供一整套的學(xué)習(xí)設(shè)備是很浪費(fèi)的,而運(yùn)用這種云計(jì)算數(shù)據(jù)庫(kù)在教學(xué)方面可以很好的向?qū)W員提供優(yōu)質(zhì)的、方便的、全方位的服務(wù)。
4 云計(jì)算數(shù)據(jù)庫(kù)系統(tǒng)未來(lái)的發(fā)展前景和方向
云技術(shù)在現(xiàn)在的電腦技術(shù)中不斷的被創(chuàng)新發(fā)現(xiàn)。這種技術(shù)可以使得多個(gè)計(jì)算機(jī)使用同一個(gè)系統(tǒng),同一個(gè)數(shù)據(jù)庫(kù)資源,儲(chǔ)存所有的客戶的使用數(shù)據(jù)。在現(xiàn)在的云數(shù)據(jù)庫(kù)中,其本身就有很好的擴(kuò)展性,在應(yīng)用中和join操作相互配合,這樣可以使得不易被兼并操作進(jìn)行的join操作所取代。根據(jù)云計(jì)算數(shù)據(jù)庫(kù)市場(chǎng)的發(fā)展特點(diǎn)和需求,現(xiàn)在的NoS QL數(shù)據(jù)庫(kù)將會(huì)是最好的計(jì)算方法。這種推測(cè)的根源是NoSQL數(shù)據(jù)庫(kù)具有分布式,水平可擴(kuò)展性,非關(guān)系性等特點(diǎn),非常適合云計(jì)算的海量數(shù)據(jù)的計(jì)算。NoSQL,是一種非關(guān)系型的數(shù)據(jù)庫(kù)。在互聯(lián)網(wǎng)網(wǎng)站的大量出現(xiàn)中,傳統(tǒng)的web2.0網(wǎng)站已經(jīng)滿足不了市場(chǎng)的需求,出現(xiàn)了很多無(wú)法克服的問(wèn)題,在這種背景下,非關(guān)系型數(shù)據(jù)庫(kù)卻得到了很好的發(fā)展。同時(shí),另外的一項(xiàng)云技術(shù)的發(fā)展方向就是共享磁盤數(shù)據(jù)庫(kù)構(gòu)架,這項(xiàng)技術(shù)也將會(huì)成為一項(xiàng)理想的云計(jì)算技術(shù),這種技術(shù)可以使低成本的服務(wù)器和設(shè)備進(jìn)行單一的數(shù)據(jù)采集,這樣可以為用戶提供區(qū)域網(wǎng)絡(luò)和附加存儲(chǔ)網(wǎng)絡(luò)。
這些運(yùn)行模式和技術(shù)的使用將會(huì)節(jié)省大量的硬件設(shè)備資源,同時(shí)也會(huì)大量的節(jié)省運(yùn)營(yíng)成本。
5 結(jié)束語(yǔ)
在現(xiàn)實(shí)的生活中,云計(jì)算數(shù)據(jù)庫(kù)的運(yùn)用十分廣泛。云計(jì)算數(shù)據(jù)庫(kù)處理給人們的生活帶來(lái)了極大的便利,個(gè)人和企業(yè)可以對(duì)大型的數(shù)據(jù)進(jìn)行處理和運(yùn)算。相信在未來(lái)的發(fā)展中,云計(jì)算數(shù)據(jù)庫(kù)也會(huì)發(fā)展的更加的迅速,更大范圍的應(yīng)用在人類的生活中。
中圖分類號(hào):TP39 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2015)12-0000-00
1前言
隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展進(jìn)步,計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)也得到了迅速的發(fā)展,人們的生產(chǎn)生活越來(lái)越依賴于計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)。利用計(jì)算機(jī)網(wǎng)絡(luò)對(duì)項(xiàng)目信息進(jìn)行管理,不但可以減少管理人員的工作量,提高工作效率,而且可以提高項(xiàng)目管理人員的管理水平,進(jìn)而提高相關(guān)項(xiàng)目的經(jīng)濟(jì)效益。因此,項(xiàng)目信息管理人員應(yīng)該與時(shí)俱進(jìn),深入研究計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)對(duì)項(xiàng)目信息管理的重要影響,并合理利用計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)進(jìn)行項(xiàng)目信息管理,提高項(xiàng)目管理的質(zhì)量,提高項(xiàng)目的經(jīng)濟(jì)效益,進(jìn)而增強(qiáng)相關(guān)企業(yè)在市場(chǎng)中的競(jìng)爭(zhēng)力。
2計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)對(duì)項(xiàng)目信息管理的影響分析
2.1有利于提高項(xiàng)目信息管理的效率
在某個(gè)項(xiàng)目的啟動(dòng)和實(shí)施中,往往會(huì)有很多信息需要管理,比如合同、報(bào)告、設(shè)計(jì)的圖紙,只有管理好這些信息,才能保證項(xiàng)目的正常運(yùn)行。因此,項(xiàng)目信息管理人員可以利用計(jì)算機(jī)網(wǎng)絡(luò)技術(shù),構(gòu)建一個(gè)公共的信息交流平臺(tái),按照相關(guān)標(biāo)準(zhǔn)處理信息,然后把處理好的信息公布到信息交流平臺(tái)上,讓項(xiàng)目參與人員能夠自主獲取信息。這樣一來(lái),有利于加快信息的交流速度,減少項(xiàng)目信息管理人員的工作量,進(jìn)而提高項(xiàng)目信息管理的效率。
2.2有利于實(shí)現(xiàn)信息的全方位控制
利用計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)進(jìn)行項(xiàng)目信息管理時(shí),管理人員不僅可以全過(guò)程地對(duì)項(xiàng)目信息進(jìn)行管理,而且可以在信息的編碼、分類、篩選等工作中利用計(jì)算機(jī)網(wǎng)絡(luò)技術(shù),從而確保項(xiàng)目信息的可靠性和精確性[1]。
2.3有利于加強(qiáng)項(xiàng)目信息的交流
在項(xiàng)目信息管理中運(yùn)用計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)可以讓項(xiàng)目相關(guān)工作人員之間的交流更加便捷,實(shí)現(xiàn)項(xiàng)目信息管理人員與項(xiàng)目工作人員之間的無(wú)障礙、快速交流,提高各工作人員之間的配合度,進(jìn)而保證項(xiàng)目的順利實(shí)施。
2.4有利于實(shí)現(xiàn)項(xiàng)目信息管理系統(tǒng)的創(chuàng)建
在項(xiàng)目信息管理中,管理人員可以利用計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)建立一個(gè)信息管理系統(tǒng),這個(gè)管理系統(tǒng)應(yīng)該包括該項(xiàng)目實(shí)施中需要的各類信息,不僅有利于參與人員自主獲取信息,提高項(xiàng)目實(shí)施的效率,[2]而且信息管理系統(tǒng)中的各類信息能夠?yàn)轫?xiàng)目決策提高可靠的依據(jù)。此外,管理人員還可以建立項(xiàng)目的決策系統(tǒng)和專家系統(tǒng),為項(xiàng)目參與人員提供更多便利,提高項(xiàng)目實(shí)施的質(zhì)量。
2.5有利于優(yōu)化配置項(xiàng)目資源
計(jì)算機(jī)技術(shù)可以有效控制項(xiàng)目信息資源,在項(xiàng)目信息管理的過(guò)程中,管理人員根據(jù)項(xiàng)目的實(shí)際情況和進(jìn)度的需要,利用相關(guān)軟件計(jì)算出各類信息資源提供服務(wù)的時(shí)間,保證信息資源使用的規(guī)范性和有序性,進(jìn)而實(shí)現(xiàn)各類信息資源的優(yōu)化配置。
2.6有利于控制項(xiàng)造價(jià)
項(xiàng)目信息管理與項(xiàng)目造價(jià)有很強(qiáng)的聯(lián)系性,在項(xiàng)目實(shí)施的過(guò)程中,往往需要大量的物資,而市場(chǎng)上的物資價(jià)格經(jīng)常會(huì)發(fā)生變化。為了有效控制項(xiàng)目的造價(jià),項(xiàng)目信息管理人員可以利用計(jì)算機(jī)技術(shù)開發(fā)相關(guān)的物資計(jì)劃軟件,并利用該軟件計(jì)劃、審核、采購(gòu)、保管、使用物資,規(guī)范物資的采購(gòu)和使用流程,減少不必要的浪費(fèi),進(jìn)而有效控制工程造價(jià)。
3計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)于項(xiàng)目信息管理中的具體措施
3.1更新管理觀念
當(dāng)今社會(huì),項(xiàng)目規(guī)模不斷擴(kuò)大,項(xiàng)目信息管理的復(fù)雜性日趨增加,為了增強(qiáng)企業(yè)在發(fā)展中的競(jìng)爭(zhēng)力、推動(dòng)企業(yè)的可持續(xù)發(fā)展,企業(yè)項(xiàng)目信息管理人員需要不斷提高自己的管理水平。在信息技術(shù)飛速發(fā)展的今天,項(xiàng)目信息管理人員應(yīng)該與時(shí)俱進(jìn),不斷更新管理觀念,認(rèn)真學(xué)習(xí)計(jì)算機(jī)網(wǎng)絡(luò)技術(shù),并充分利用計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)進(jìn)行項(xiàng)目信息管理。此外,企業(yè)的管理人員也應(yīng)該更新管理觀念,積極借鑒其他企業(yè)的項(xiàng)目信息管理經(jīng)驗(yàn),為本企業(yè)的項(xiàng)目信息管理人員提供更多培訓(xùn)和學(xué)習(xí)的機(jī)會(huì),提高項(xiàng)目信息管理人員的業(yè)務(wù)能力,真正實(shí)現(xiàn)“人崗相配”,進(jìn)而提高企業(yè)項(xiàng)目信息管理的質(zhì)量,保證項(xiàng)目的順利實(shí)施,提高企業(yè)的經(jīng)濟(jì)效益。
3.2引進(jìn)先進(jìn)的計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)
在信息時(shí)代,計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)在項(xiàng)目管理中的作用越來(lái)越重要,因此,企業(yè)應(yīng)該重視計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)在項(xiàng)目信息管理中的運(yùn)用,提高信息管理工作的效率。比如,項(xiàng)目管理人員可以利用計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)構(gòu)建一個(gè)信息交流的平臺(tái),把各類與項(xiàng)目有關(guān)的信息集聚在一起,并利用網(wǎng)頁(yè)的形式把這些信息展示給項(xiàng)目參與人員,讓項(xiàng)目參與人員能夠隨時(shí)隨地查詢所需要的信息。其中,展示信息的網(wǎng)頁(yè)格式是超文本,網(wǎng)頁(yè)能夠在Internet網(wǎng)絡(luò)中傳播,當(dāng)此網(wǎng)頁(yè)用鏈接的方式連接后,項(xiàng)目參與人員只用單擊鏈接點(diǎn),就可以進(jìn)入網(wǎng)站,自主查詢信息[3]。這樣,不僅加快了項(xiàng)目信息的交流速度,而且可以讓項(xiàng)目參與人員的的信息查詢更加便捷,減少了很多信息管理和信息獲取中的麻煩,從而提高項(xiàng)目實(shí)施的效率。
3.3不斷優(yōu)化項(xiàng)目管理中的計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)
當(dāng)前,信息技術(shù)飛速發(fā)展,計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)日新月異,因此,企業(yè)要不斷優(yōu)化項(xiàng)目信息管理中的計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)。比如,企業(yè)可以利用計(jì)算機(jī)網(wǎng)絡(luò)建設(shè)ASP交互式平臺(tái),這是一種在Internet上的電子信息服務(wù)系統(tǒng),給用戶提供公共的電子白板,用戶可以在上面信息、發(fā)表自己的看法、參與討論,這樣,可是實(shí)現(xiàn)資源的共享,方面項(xiàng)目參與人員的交流。此外,企業(yè)還需要引進(jìn)先進(jìn)的計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)人才和項(xiàng)目信息管理人才,建設(shè)一支高素質(zhì)、高技能的項(xiàng)目信息管理隊(duì)伍。
4結(jié)語(yǔ)
隨著社會(huì)經(jīng)濟(jì)的不斷發(fā)展進(jìn)步,項(xiàng)目信息管理的工作量越來(lái)越大,管理流程越來(lái)越復(fù)雜,管理人員的工作難度不斷加大。因此,項(xiàng)目信息的管理人員應(yīng)該認(rèn)識(shí)到計(jì)算機(jī)網(wǎng)絡(luò)在項(xiàng)目信息管理中的重要作用,并合理利用計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)對(duì)項(xiàng)目信息進(jìn)行管理,不斷優(yōu)化項(xiàng)目信息管理模式,提高項(xiàng)目信息管理的效率和質(zhì)量,增強(qiáng)企業(yè)的競(jìng)爭(zhēng)力。
參考文獻(xiàn)
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2016)15-0023-03
Abstract:The public opinion information data with massive, show data sources of unpredictability, article on the HTML page for noise reduction, sub tree construction, and then through the similarity calculation, combined with public opinion simple ontology library, the realization of the data block identification and record the data extract, finally to Hadoop platform for experimental environment and pumping out the algorithm experiment. Experimental results show that the algorithm in the public opinion data mining, automatic extraction of extraction rules has a certain reference value.
Key words:Data extraction; Hadoop; public opinions
1 概述
網(wǎng)絡(luò)輿情是某些社會(huì)事件發(fā)生后,在互聯(lián)網(wǎng)的平臺(tái)上,民眾針對(duì)其發(fā)展和變化過(guò)程的不同階段逐漸產(chǎn)生和發(fā)酵的社會(huì)態(tài)度,并借助于諸如論壇、博客、微博、微信、新聞跟帖等此類便捷的網(wǎng)絡(luò)媒體進(jìn)行關(guān)注、表達(dá)或宣泄。由于網(wǎng)絡(luò)媒體的自由性和實(shí)時(shí)性,互聯(lián)網(wǎng)的便捷性和隨意性,網(wǎng)民針對(duì)社會(huì)過(guò)程中的各種問(wèn)題,越來(lái)越多的傾向于借助網(wǎng)絡(luò)媒體跟帖、轉(zhuǎn)發(fā)、投票等方式暢所欲言,淋漓盡致地發(fā)表觀點(diǎn),在極短時(shí)間造成內(nèi)凝聚共識(shí),并誘發(fā)行動(dòng),直接影響社會(huì)。[1]同時(shí)由于閱歷和思想認(rèn)識(shí)水平的局限性,網(wǎng)民們往往會(huì)在短時(shí)間內(nèi)難以認(rèn)識(shí)事情背后復(fù)雜的社會(huì),并認(rèn)清其心理動(dòng)因,從而造成非理性和過(guò)于主觀的聲音占據(jù)上風(fēng)。從目前各領(lǐng)域內(nèi)的一系列突發(fā)事件來(lái)分析,人們通過(guò)網(wǎng)絡(luò)媒體進(jìn)行傳播爆發(fā)出的輿論能量不容小覷。各級(jí)行政機(jī)關(guān)、企事業(yè)部門都越來(lái)越重視互聯(lián)網(wǎng)輿情的監(jiān)測(cè),各專家學(xué)者也從不同方面對(duì)輿情進(jìn)行分析研究,如從政策機(jī)制、評(píng)估體系策略[2]、用戶行為特征、網(wǎng)絡(luò)輿情傳播模式的研究和引導(dǎo);技術(shù)上主要集中在網(wǎng)頁(yè)抓取、內(nèi)容分析、語(yǔ)義識(shí)別、數(shù)據(jù)挖掘、主題識(shí)別與跟蹤等算法的研究等。在這在互聯(lián)網(wǎng)技術(shù)飛速發(fā)展,影響力日益巨大的時(shí)下,網(wǎng)絡(luò)已化身為思想文化的集散地和社會(huì)輿論的增強(qiáng)器,我們應(yīng)充分認(rèn)識(shí)以其為載體的新媒體的社會(huì)影響力。因此,對(duì)于如何快速、準(zhǔn)確的發(fā)現(xiàn)互聯(lián)網(wǎng)上潛在輿情信息并對(duì)其進(jìn)行有效監(jiān)測(cè)、監(jiān)控及正確引導(dǎo)勢(shì)在必行,本文通過(guò)對(duì)已有技術(shù)和知識(shí)進(jìn)行分析總結(jié)的基礎(chǔ)上,引入了云計(jì)算技術(shù),對(duì)以面對(duì)與高校相關(guān)的網(wǎng)絡(luò)輿情信息的數(shù)據(jù)抽取的關(guān)鍵技術(shù)進(jìn)行了研究。
2 研究現(xiàn)狀
隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,特別是互聯(lián)網(wǎng)的普及應(yīng)用,我國(guó)的網(wǎng)民數(shù)量、網(wǎng)站數(shù)量以及網(wǎng)絡(luò)信息資源的容量以爆炸性的趨勢(shì)增長(zhǎng)。據(jù)中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心2016年1月的《第37次中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》[3]顯示:網(wǎng)民通過(guò)各類移動(dòng)設(shè)備進(jìn)行網(wǎng)絡(luò)行為的用戶占全體網(wǎng)民總量的90.8%,規(guī)模達(dá)到了6.06億,其中手機(jī)占移動(dòng)類網(wǎng)民的91%。同時(shí),以互聯(lián)網(wǎng)為工具進(jìn)行新聞獲取閱讀的用戶規(guī)模為5.55億,手機(jī)網(wǎng)絡(luò)新聞?dòng)脩粢?guī)模為4.60億,相較于去年年底將近增長(zhǎng)11%。如作為網(wǎng)絡(luò)環(huán)境下對(duì)新聞快速傳播形成熱點(diǎn)話題的微博、微信、來(lái)往等App應(yīng)用借助于手機(jī)等無(wú)線設(shè)備,極大促進(jìn)了網(wǎng)民對(duì)網(wǎng)絡(luò)輿情的接觸度和傳播速度,從而使Web成為一個(gè)以大數(shù)據(jù)為基本特征的全球化信息中心。這些在許多領(lǐng)域具有重要價(jià)值的海量數(shù)據(jù)具有多樣性、異構(gòu)性且動(dòng)態(tài)變化等特征,單純地依賴人工的方法難以及時(shí)、迅速地完成海量web信息的收集、 web輿情的發(fā)現(xiàn)及進(jìn)一步的跟蹤。
針對(duì)網(wǎng)絡(luò)輿情監(jiān)測(cè)迫切需要分析挖掘的這些海量數(shù)據(jù),按其信息蘊(yùn)藏的深度,可分為SurFace Web和Deep Web兩大類[4][5]。Surface Web是將各個(gè)獨(dú)立的HTML靜態(tài)網(wǎng)頁(yè)通過(guò)超鏈接進(jìn)行連接,其內(nèi)容能夠?yàn)楫?dāng)前的通用搜索引擎直接索引和檢索而無(wú)需與網(wǎng)絡(luò)數(shù)據(jù)庫(kù)進(jìn)行交互;而Deep Web面向的是網(wǎng)絡(luò)服務(wù)器中的網(wǎng)絡(luò)數(shù)據(jù)庫(kù),Deep Web的內(nèi)容頁(yè)面在被查詢時(shí)才由Web服務(wù)器主動(dòng)與數(shù)據(jù)庫(kù)服務(wù)器進(jìn)行交互而動(dòng)態(tài)按照某一特定的HTML布局生成后返回給提交查詢請(qǐng)求的訪問(wèn)者。隨著信息化的不斷跨躍推進(jìn)和互聯(lián)網(wǎng)技術(shù)的持續(xù)快速發(fā)展,以網(wǎng)絡(luò)數(shù)據(jù)庫(kù)形式存儲(chǔ)的資源成指數(shù)級(jí)增長(zhǎng),如今人們也已訪問(wèn)網(wǎng)絡(luò)數(shù)據(jù)庫(kù)成為信息獲取的主要方式和方法。[6] Deep Web形式的數(shù)據(jù)內(nèi)容分布于商業(yè)、經(jīng)濟(jì)、計(jì)算機(jī)、教育、新聞媒體、娛樂(lè)等不同的領(lǐng)域;網(wǎng)絡(luò)媒體以BBS論壇、微博、微信、來(lái)往、博客、播客、新聞、跟帖等各種形式載體和展現(xiàn),此類海量存儲(chǔ)在Deep Web背后的網(wǎng)絡(luò)數(shù)據(jù)庫(kù)數(shù)據(jù)已成為了供政府及企事業(yè)單位進(jìn)行輔助決策的來(lái)源。但由于網(wǎng)絡(luò)數(shù)據(jù)庫(kù)隱藏在Web服務(wù)后端的隱蔽性,及各個(gè)Deep Web站點(diǎn)在網(wǎng)頁(yè)展現(xiàn)形式和表述質(zhì)量的差異性,使得當(dāng)前存儲(chǔ)DeepWeb數(shù)據(jù)的網(wǎng)絡(luò)數(shù)據(jù)庫(kù)搜索引擎只能實(shí)現(xiàn)大約33%左右覆蓋搜索,因此如何有效的、快速的且準(zhǔn)確地在浩瀚的網(wǎng)絡(luò)數(shù)據(jù)庫(kù)中抽取信息資源成為當(dāng)前輿情研究中首當(dāng)解決的問(wèn)題。
3 基于大數(shù)據(jù)的數(shù)據(jù)抽取的相關(guān)技術(shù)
3.1 數(shù)據(jù)抽取
數(shù)據(jù)抽取,也稱之為網(wǎng)頁(yè)信息提取,主要是從HTML源碼中去除一些如廣告、標(biāo)語(yǔ)等噪聲信息,提取出標(biāo)題、作者、正文等有用的信息。及時(shí)準(zhǔn)確的信息提取為輿情系統(tǒng)提供可靠的數(shù)據(jù)源,數(shù)據(jù)抽取在web 輿情發(fā)現(xiàn)中至關(guān)重要,,它為輿情系統(tǒng)準(zhǔn)確地發(fā)現(xiàn)相關(guān)信息提供基礎(chǔ)。信息的抽取過(guò)程按自動(dòng)化程度一般可分為人工、半自動(dòng)化及全自動(dòng)化三種方式。網(wǎng)頁(yè)信息抽取是一種針對(duì)網(wǎng)絡(luò)數(shù)據(jù)庫(kù)中的數(shù)據(jù)通過(guò)分析、加工網(wǎng)頁(yè)的結(jié)構(gòu)實(shí)現(xiàn)信息數(shù)據(jù)的提取的過(guò)程。由于網(wǎng)頁(yè)的復(fù)雜性、多樣性以及程序員構(gòu)建過(guò)程的隨意性和習(xí)慣性,使得信息展現(xiàn)的模版不確定性和多樣性,針對(duì)不同的網(wǎng)頁(yè)模版抽取規(guī)則也不盡相同,信息抽取的方法也越來(lái)越多,按其實(shí)現(xiàn)原理大致可分為基于HTML結(jié)構(gòu)、基于自然語(yǔ)言處理和基于本體幾類方式[7]。
3.2 Hadoop
Hadoop是由Apache基金會(huì)開發(fā)的一個(gè)開源的分布式系統(tǒng)基礎(chǔ)架構(gòu),其核心為實(shí)現(xiàn)為海量數(shù)據(jù)提供了存儲(chǔ)的分布式文件系統(tǒng) (Hadoop Distributed File System,HDFS)和為海量數(shù)據(jù)提供了計(jì)算能力的分布式計(jì)算MapReduce。Hadoop為程序開發(fā)者提供了簡(jiǎn)單易用的接口,用戶只需編寫 Map函數(shù)和Reduce函數(shù)即可實(shí)現(xiàn)分布式計(jì)算,而無(wú)需考慮諸如由Hadoop負(fù)責(zé)處理的任務(wù)調(diào)度,負(fù)載平衡和通信等問(wèn)題[8]。
HDFS是能部署在廉價(jià)的機(jī)器上的分布式文件系統(tǒng),用戶不需知道文件的實(shí)際存儲(chǔ)位置就能夠訪問(wèn)分布在不同機(jī)器上的文件,具有高容錯(cuò)性、高吞吐量、能自動(dòng)處理失效節(jié)點(diǎn)的特點(diǎn)。HDFS包含三種類型的角色:用以實(shí)現(xiàn)系統(tǒng)命名空間的管理和客戶端文件訪問(wèn)管理的Name Node,用以實(shí)現(xiàn)管理節(jié)點(diǎn)文件存儲(chǔ)的Data Node 和用于需要操作分布式文件系統(tǒng)文件應(yīng)用程序的Client。MapReduce是包含一個(gè)主服務(wù)器Job Tracker和多個(gè)從服務(wù)器Task Tracker的主從式架構(gòu),Job Tracker是一個(gè)master服務(wù),負(fù)責(zé)調(diào)度、監(jiān)控和管理Task Tracker,并給空閑的Task Tracker分配Map任務(wù)和Reduce任務(wù)。
4 抽取框架
實(shí)現(xiàn)上主要對(duì)查詢結(jié)果列表頁(yè)和內(nèi)容頁(yè)進(jìn)行信息提取,提取過(guò)程中使用自建的簡(jiǎn)單本地體庫(kù)抽取方法來(lái)實(shí)現(xiàn)抽取,主要過(guò)程為:數(shù)據(jù)清洗、數(shù)據(jù)塊識(shí)別,結(jié)果集抽取,抽取規(guī)則構(gòu)建。
4.1 數(shù)據(jù)清洗
一般情況下,一個(gè)查詢結(jié)果頁(yè)面可能包含多個(gè)數(shù)據(jù)塊,如宣傳數(shù)據(jù)塊、數(shù)據(jù)信息數(shù)據(jù)塊、位置數(shù)據(jù)塊、導(dǎo)航數(shù)據(jù)塊等。其文檔中含有一些對(duì)抽取沒(méi)有價(jià)值的信息,如樣式表標(biāo)簽、圖片標(biāo)簽、命名空間標(biāo)簽、內(nèi)容標(biāo)簽、表單標(biāo)簽、媒體標(biāo)簽、表格標(biāo)簽等,直接對(duì)此類有大量無(wú)用節(jié)點(diǎn)的HTML代碼進(jìn)行解析而生成的網(wǎng)頁(yè)標(biāo)簽樹會(huì)十分臃腫,因此首先將列表結(jié)果頁(yè)和內(nèi)容結(jié)果頁(yè)文件進(jìn)行“瘦身”解析成標(biāo)簽樹,并采用廣度優(yōu)先遍歷方法對(duì)標(biāo)簽樹中所有節(jié)點(diǎn)進(jìn)行降噪處理,其過(guò)程如下:從根節(jié)點(diǎn)開始出發(fā),直至發(fā)現(xiàn)表示正文開始的body標(biāo)簽節(jié)點(diǎn),將當(dāng)前節(jié)點(diǎn)及其子樹提取后向下遍歷,判斷讀入節(jié)點(diǎn)是否是噪音節(jié)點(diǎn),如果是則將該節(jié)點(diǎn)及其子樹刪除,循環(huán)直至到達(dá)樹末尾。經(jīng)過(guò)上述過(guò)程的降噪處理,可以將網(wǎng)頁(yè)標(biāo)簽樹中明顯的以上所提及的無(wú)用信息標(biāo)簽及其間的內(nèi)容刪除,從而降低了計(jì)算量,并極大簡(jiǎn)化了后續(xù)算法的輸入。
4.2數(shù)據(jù)塊識(shí)別和數(shù)據(jù)記錄集抽取
一般情況下,每個(gè)查詢結(jié)果頁(yè)面一般只有一塊區(qū)域是用戶所關(guān)心并希望可以獲取的,這部分即為該頁(yè)面的數(shù)據(jù)信息部分,而其他的模塊則認(rèn)為是對(duì)用戶數(shù)據(jù)塊信息順利的獲取的干擾因素,因此如何準(zhǔn)確的識(shí)別出數(shù)據(jù)塊在HTML頁(yè)面的位置的至關(guān)重要。在完成對(duì)標(biāo)簽樹清洗處理之后,我們需要發(fā)現(xiàn)并定位標(biāo)簽樹中的數(shù)據(jù)塊,此數(shù)據(jù)塊包含查詢結(jié)果。分析比較多個(gè)經(jīng)過(guò)清洗生成的查詢結(jié)果的標(biāo)簽樹后發(fā)現(xiàn):對(duì)于標(biāo)簽樹中,某一父親節(jié)點(diǎn)T具有越多的結(jié)構(gòu)相似的子樹越多,當(dāng)比重超過(guò)一定的閥值,則該節(jié)點(diǎn)將越會(huì)是我們所關(guān)注的數(shù)據(jù)塊,針對(duì)這一思想實(shí)現(xiàn)如何快遞自動(dòng)識(shí)別出的興趣數(shù)據(jù)塊,算法描述如下:
輸入:節(jié)點(diǎn)T下的兩顆子樹T1、T2
輸出:子樹T1、T2的相似度Sim(T1,T2)
算法:
1)初始化SumT1、SumT2、DisumT12;
2) 循環(huán)T節(jié)點(diǎn)直至遍歷所有的子節(jié)點(diǎn){
3) 如果兩個(gè)節(jié)點(diǎn)的標(biāo)簽相同{
4) Sum T1++; Sum T2++;
5) }
6) 如果兩個(gè)節(jié)點(diǎn)的有節(jié)點(diǎn)但標(biāo)簽相同{
7) Sum T1++; Sum T2++; Disum T12++;
8) }
9) 如果T1節(jié)點(diǎn)樹有節(jié)點(diǎn)而 T2節(jié)點(diǎn)樹無(wú)節(jié)點(diǎn){
10) Sum T1++; Sum T2++;Disum T12++;
11) }
12) 否則{
13) Sum T2++; Disum T12++;
14) }
15) Sim(T1,T2)=(SumT1+ SumT2- DisumT12)/( SumT1+ SumT2)