標(biāo)簽:
21世紀(jì)人們的生活與生硬刻板的數(shù)據(jù)中心、產(chǎn)品和硬件不同,人們的現(xiàn)實(shí)生活充滿活力,而這些活力主要體現(xiàn)在數(shù)據(jù)給予生活的改變。近日,IDC發(fā)布了一份對(duì)于未來數(shù)字星球增長(zhǎng)的新預(yù)期,數(shù)字顯示,中國(guó)只占整個(gè)數(shù)據(jù)產(chǎn)生總量的3%,未來的8年這個(gè)數(shù)據(jù)將占到全球數(shù)據(jù)數(shù)量的22%,中國(guó)迎來了大數(shù)據(jù)的時(shí)代。
數(shù)據(jù)的堆積離不開大數(shù)據(jù)的分析,而學(xué)術(shù)界和產(chǎn)業(yè)界對(duì)于大數(shù)據(jù)已經(jīng)過了討論概念的階段,現(xiàn)在人們更加關(guān)注于用什么樣的技術(shù)和方法來進(jìn)行大數(shù)據(jù)價(jià)值挖掘,以及如何真正為企業(yè)和客戶帶來價(jià)值。
而事實(shí)上,大數(shù)據(jù)的分析和大數(shù)據(jù)的挖掘是一個(gè)非常難的技術(shù),不管是產(chǎn)品需要上,還是從技術(shù)創(chuàng)新上,新的方法論和新的算法都需要不斷培養(yǎng)大數(shù)據(jù)的人才,以及靈活運(yùn)用大數(shù)據(jù)的技術(shù)。
現(xiàn)階段,很多公司的數(shù)據(jù)的增長(zhǎng)超過了預(yù)期,大規(guī)模的數(shù)據(jù)量和高速度的數(shù)據(jù)增長(zhǎng)讓企業(yè)措手不及。面對(duì)大數(shù)據(jù)的問題,很多業(yè)內(nèi)廠商都在尋找新的商機(jī)來不斷的擴(kuò)充自己的市場(chǎng)。而很多企業(yè)開始想方設(shè)法的把大數(shù)據(jù)存儲(chǔ)起來,不斷的嘗試新的大數(shù)據(jù)存儲(chǔ)架構(gòu)。找到了存儲(chǔ)數(shù)據(jù)的方法,企業(yè)下一步動(dòng)作就是進(jìn)行大數(shù)據(jù)分析。
提到大數(shù)據(jù)分析,很多人會(huì)想到Hadoop的大數(shù)據(jù)的解決方案。其實(shí)遠(yuǎn)遠(yuǎn)不止這些,Hadoop的特點(diǎn)明顯,具有擴(kuò)展性、糾錯(cuò)能力、方便使用等等。但是真正處理大企業(yè)的數(shù)據(jù)的時(shí)候,不僅僅有非結(jié)構(gòu)化的數(shù)據(jù),還有結(jié)構(gòu)化的數(shù)據(jù)。這樣不同的數(shù)據(jù)的種類和新的應(yīng)用的需求,使得簡(jiǎn)單的只靠Hadoop處理大數(shù)據(jù)是不適合的,最理想的方式是怎么能夠把原有的傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)、或者在生態(tài)領(lǐng)域的先進(jìn)的技術(shù)和成型的數(shù)據(jù)分析的方法和流程能夠和Hadoop生態(tài)環(huán)境的可擴(kuò)展性有機(jī)的結(jié)合,這才是大數(shù)據(jù)分析最理想的解決方案。
通過傳統(tǒng)的生態(tài)系統(tǒng)和Hadoop系統(tǒng)的結(jié)合,可以不斷的提高大數(shù)據(jù)的存儲(chǔ)能力和分析能力,還能把大數(shù)據(jù)的分析工具使用到具體的企業(yè)業(yè)務(wù)中去。近年來,大數(shù)據(jù)的分析工作不斷的嵌入到客戶的應(yīng)用中去,在應(yīng)用當(dāng)中實(shí)現(xiàn)大數(shù)據(jù)的價(jià)值,獲得巨大的商機(jī)。
|