隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,數(shù)據(jù)庫(kù)呈現(xiàn)井噴式發(fā)展,出現(xiàn)了各式各樣的產(chǎn)品,如文件存儲(chǔ)數(shù)據(jù)庫(kù)、列存儲(chǔ)數(shù)據(jù)庫(kù)、NewSQL 數(shù)據(jù)庫(kù)。之所有如此,歸結(jié)于數(shù)據(jù)量不斷快速膨脹,傳統(tǒng)數(shù)據(jù)庫(kù)在大數(shù)據(jù)上的處理性能不能滿足需求等。企業(yè)和開發(fā)者趨于去針對(duì)不同應(yīng)用類型開發(fā)不同的數(shù)據(jù)庫(kù),來(lái)滿足對(duì)特定數(shù)據(jù)處理的需求。以下是小編為你整理的大數(shù)據(jù)分析的學(xué)習(xí)方法 ?
阿里巴巴在多種場(chǎng)景下同樣有不同的數(shù)據(jù)存儲(chǔ)技術(shù)實(shí)踐,比如: ?
海量數(shù)據(jù)場(chǎng)景下的 OLAP 列式數(shù)據(jù)庫(kù) —— HiStore
?
HiStore 是一款基于獨(dú)特的知識(shí)網(wǎng)格技術(shù)的列式數(shù)據(jù)庫(kù),定位于海量數(shù)據(jù)高壓縮比列式存儲(chǔ),是低存儲(chǔ)成本,低維護(hù)成本,海量數(shù)據(jù) OLAP 存儲(chǔ)引擎;有效的解決了海量數(shù)據(jù)存儲(chǔ)的成本問(wèn)題,以及在百億數(shù)據(jù)場(chǎng)景下支持實(shí)時(shí)高效的多維度自由組合的檢索。適用場(chǎng)景: ?
日志/事件管理系統(tǒng):調(diào)用鏈路日志跟蹤,消息軌跡分析,系統(tǒng)/網(wǎng)絡(luò)安全審計(jì)記錄; ?
通信行業(yè):話單分析,用戶行為分析等; ?
大數(shù)據(jù)量的分析應(yīng)用:網(wǎng)頁(yè)/在線分析,移動(dòng)分析,客戶行為分析,營(yíng)銷和廣告數(shù)據(jù);《linux就該這么學(xué)》中有相關(guān)知識(shí) ?
數(shù)據(jù)倉(cāng)庫(kù)/數(shù)據(jù)集市:實(shí)時(shí)展示統(tǒng)計(jì)分析后數(shù)據(jù),便于用戶根據(jù)統(tǒng)計(jì)結(jié)果做決策; ?
對(duì)數(shù)據(jù)存儲(chǔ)成本敏感,查詢有實(shí)時(shí)性要求的場(chǎng)景應(yīng)考慮HiStore; ?
物聯(lián)網(wǎng):保存大量物理節(jié)點(diǎn)的采集上報(bào),狀態(tài)等信息,用于后期統(tǒng)計(jì)處理; ?
歷史評(píng)價(jià)數(shù)據(jù),歷史訂單數(shù)據(jù)等。 ?
應(yīng)用層面 ?
人類所有的知識(shí)可以分為三個(gè)大類:自然科學(xué)、社會(huì)科學(xué)和人文科學(xué)。一直以來(lái),營(yíng)銷的科學(xué)性正是因?yàn)檫\(yùn)用了自然科學(xué)中的數(shù)據(jù)收集手段,嚴(yán)謹(jǐn)?shù)挠涗洝⑺鸭头治鱿M(fèi)者的各項(xiàng)數(shù)據(jù)和行為軌跡;同時(shí)又采用了社會(huì)心理學(xué)的方法,通過(guò)現(xiàn)象去解釋人的內(nèi)心世界。這種主客觀的結(jié)合,讓營(yíng)銷能夠推測(cè)與接近市場(chǎng)需求的方向,讓生產(chǎn)者與消費(fèi)者達(dá)到和諧交換。因此,數(shù)據(jù)與營(yíng)銷之間存在著密不可分的關(guān)系。 ?
我們對(duì)于數(shù)據(jù)的計(jì)量單位已經(jīng)從位(bit)、字節(jié)(B)、千字節(jié)(KB)、兆字節(jié)(MB)、吉字節(jié)(GB)、太子節(jié)(TB)等走向了澤字節(jié)(ZB),甚至堯字節(jié)(YB)。大數(shù)據(jù)帶來(lái)的影響不僅是數(shù)據(jù)量幾何級(jí)的增長(zhǎng),還有從量變到質(zhì)變的顛覆性變革。另一方面,互聯(lián)網(wǎng)的發(fā)展使得消費(fèi)者個(gè)性化需求的日益凸顯,也讓營(yíng)銷領(lǐng)域發(fā)生了從“以產(chǎn)品為中心”到“以客戶為中心”的轉(zhuǎn)變?;诖髷?shù)據(jù)的精準(zhǔn)營(yíng)銷對(duì)企業(yè)的營(yíng)銷戰(zhàn)略帶來(lái)了挑戰(zhàn)也賦予了新的可能。 ?
何為精準(zhǔn)營(yíng)銷 ?
精準(zhǔn)營(yíng)銷(Precision marketing)的概念是由營(yíng)銷專家菲利普·科特勒在2005年底提出,他認(rèn)為企業(yè)需要更精準(zhǔn)、可衡量和高投資回報(bào)的營(yíng)銷溝通,需要制定更注重結(jié)果和行動(dòng)的營(yíng)銷傳播計(jì)劃,還有越來(lái)越注重對(duì)直接銷售溝通的投資。簡(jiǎn)單來(lái)說(shuō)就是5個(gè)合適,在合適的時(shí)間、合適的地點(diǎn)、將合適的產(chǎn)品以合適的方式提供給合適的人。像戀愛(ài)一樣,讓消費(fèi)者能夠一見鐘情、二見傾心、三定終生,實(shí)現(xiàn)產(chǎn)品與用戶多維度的契合。 ?
數(shù)據(jù)貫穿營(yíng)銷過(guò)程的始末 ?
從啤酒和尿布這個(gè)古老的故事說(shuō)起,沃爾瑪通過(guò)對(duì)超市一段時(shí)間的原始交易數(shù)據(jù)的詳細(xì)分析,發(fā)現(xiàn)了這對(duì)神奇的組合,將它們放在一起銷售,提升了兩種商品的銷量,這是傳統(tǒng)零售的一個(gè)經(jīng)典故事。 ?
大數(shù)據(jù)的作用 ?
一旦手機(jī)丟失,*時(shí)間掛失sim卡,并趕緊凍結(jié)賬戶。記住一個(gè)公式:手機(jī)丟+身份證丟=錢丟!因?yàn)橛辛诉@兩大“神器”,你的支付寶、微信支付、手機(jī)銀行等賬戶很容易被不法分子更換密碼,前面說(shuō)了驗(yàn)證碼是改密碼中很重要的一步,所以要*時(shí)間致電客服掛失sim卡,并且要趕緊將銀行卡、支付寶賬號(hào)、微信賬號(hào)之類的賬戶凍結(jié)。 ?
別隨意填寫問(wèn)卷或者參與掃碼活動(dòng)。大家平時(shí)肯定在一些街頭、店鋪門口等地方,遇到有人讓你幫忙填寫調(diào)查問(wèn)卷,或者是掃二維碼注冊(cè),然后送你一些小獎(jiǎng)品,這種行為也會(huì)造成個(gè)人信息泄露。做這些事情,要了解清楚再進(jìn)行相關(guān)活動(dòng)。
?
驗(yàn)證碼是個(gè)神奇的東西,打死也不能告訴別人。驗(yàn)證碼有的時(shí)候可能是你卡里的錢被盜之前的“*一根救命稻草”,支付寶賬號(hào)更改密碼是要輸入驗(yàn)證碼才能完成的,前段時(shí)間比較火的騙術(shù)之“幫你買銀行貴金屬”也是如此,所以大家要像保護(hù)銀行卡密碼一樣的保護(hù)驗(yàn)證碼,打死也不要告訴陌生人。 ?
手機(jī)號(hào)不用了一定要注銷各種綁定的賬號(hào)。手機(jī)號(hào)不用了別以為停機(jī)就行了,停用的手機(jī)號(hào)會(huì)被銷號(hào)回收,二次放號(hào)給其他人使用。如果你以前用它綁定了微博、微信、支付寶、銀行卡等又沒(méi)取消,就很危險(xiǎn)了。所以手機(jī)號(hào)不用了一定要注銷綁定的各種賬號(hào),另外,*在更換號(hào)碼前重新綁定新手機(jī)號(hào)。 ?
車票、飛機(jī)票要妥善保存好。那回程的票根,你留作紀(jì)念,不必害怕面對(duì)離別~可以,但是前提是務(wù)必保存好,因?yàn)檫@些票根上面也有你的個(gè)人信息,一旦丟失,被壞人撿到就不好了。 ?
大數(shù)據(jù)服務(wù)對(duì)比
不同大數(shù)據(jù)服務(wù)提供商有不同的產(chǎn)品線,因此不同提供商的產(chǎn)品適用場(chǎng)景也會(huì)有所不同。我們重點(diǎn)分析三大服務(wù)提供商的大數(shù)據(jù)服務(wù)架構(gòu)。 ?
擁有大量關(guān)于大數(shù)據(jù)處理的經(jīng)驗(yàn)。初期大數(shù)據(jù)使用者大部分都使用亞馬遜打造的Hadoop架構(gòu)服務(wù)(EC2)。 ?
經(jīng)過(guò)厚重沉淀之后,Amazon在2009年提供開發(fā)EMR大數(shù)據(jù)服務(wù)。EMR服務(wù)提供了多種大數(shù)據(jù)處理分析方案,比如簡(jiǎn)單查詢服務(wù),關(guān)聯(lián)數(shù)據(jù)分析服務(wù)。EMR服務(wù)可以使用Hadoop語(yǔ)言繼續(xù)開發(fā),并且訪問(wèn)EMR服務(wù)的步驟也相當(dāng)簡(jiǎn)單并且安全。 ?
亞馬遜使用托管DynamoDB代替HBase,作為易于擴(kuò)展的NoSQL數(shù)據(jù)庫(kù)。 ?
谷歌云服務(wù)平臺(tái)出類拔萃,它所提供的并非虛擬化解決方案,而是提供由API定義的服務(wù)和應(yīng)用程序。程序員無(wú)需顧慮硬件,甚至不需要關(guān)心后臺(tái)的運(yùn)作行為。 ?
當(dāng)然這從某種程度也限制了程序員的工作,不過(guò)如果谷歌的服務(wù)適合業(yè)務(wù),那么使用起來(lái)將是全世界*效快捷的大數(shù)據(jù)架構(gòu)服務(wù)。 ?
谷歌的AppEngine作為云平臺(tái)管理服務(wù),提供了基于MapReduce的大數(shù)據(jù)并行計(jì)算服務(wù)。所有的這些服務(wù)都可以通過(guò)REST風(fēng)格的API訪問(wèn)。 ?
BigQuery作為分析的數(shù)據(jù)庫(kù),提供了類SQL的查詢語(yǔ)法。它的性能要比Apache Hive來(lái)得快! ?
微軟在大數(shù)據(jù)中屬于后來(lái)居上者。通過(guò)Microsoft Azure大數(shù)據(jù)服務(wù)平臺(tái),微軟融合自身海量成熟的軟件,例如SQL Server,提供了多種IaaS服務(wù)。 ?
微軟的服務(wù)面向更多的程序員,使得可以使用不同語(yǔ)言來(lái)對(duì)接大數(shù)據(jù)平臺(tái)Azure。Azure旨在提供一個(gè)生態(tài)的大數(shù)據(jù)分析開發(fā)環(huán)境,使得普通研究員也可以施展自己對(duì)大數(shù)據(jù)的理解!
?