現(xiàn)如今都是信息社會,并且還倡導“大物移云”【包含大數(shù)據(jù)、物聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)、云計算】等新型技術(shù)來為人們的日常生活服務(wù),于是乎信息技術(shù)【Information technology簡稱IT技術(shù)】也就隨之也火熱起來啦,因此一大波的人投身于互聯(lián)網(wǎng)中,下來就給大家介紹一下如何學習IT課程,希望對大家有所幫助!以下是小編為你整理的大數(shù)據(jù)如何學 ?
需要學習或者從事IT工作,剛開始肯定是一頭霧水,常人所理解的IT工作者肯定是一些程序員之類的角色,這里我想說你的理解有些偏差,并且即使是程序員也分好多種從事算法的、Web開發(fā)、C++客戶端研發(fā)等,還有好多細小的分類【下圖大致說一下我理解的IT有哪些方向吧,有點不全面,只是一個詮釋,如果作為一個新手我覺得可以去一些平臺論壇比如說zhi hu等里面會有許多專業(yè)人士針對某個問題進行專業(yè)的詮釋,大家可以借鑒一下】 ?
一個人是不可能將所有的方向都學到的。只能從事一個大的研究方向然后再到某個高深的領(lǐng)域進而再去擴展自己的廣度或者繼續(xù)這個深度廣度深度的問題等著我們學習到一定程序再開始琢磨做決定吧!
?
如何具體的學習【以JavaWeb為例】: ?
【了解行業(yè)*技術(shù),選購圖書】我覺得先看基礎(chǔ)語法書,了解一些大概,邊學習邊跟著操作【實現(xiàn)沒有界面的學籍管理等簡單的系統(tǒng)】: ?
進階高級:繼續(xù)看高階的書或者跟著視頻學習完成一些復雜的項目,比如說從事javaweb開發(fā)就得學習一些框架知識: ?
開始根據(jù)項目要求團隊或者自行開始實施做項目【有一些網(wǎng)站平臺會提供一些需要做的項目,掛在平臺上】: ?
就這樣一步步的踏入行業(yè)高級水平中,實踐中慢慢成長,結(jié)合自己的情況選擇廣度和深度 ?
? ?
數(shù)據(jù)分析例子 ?
Morton牛排店的品牌認知。當一位顧客開玩笑地通過推特向這家位于芝加哥的牛排連鎖店訂餐送到紐約Newark機場(他將在一天工作之后抵達該處)時,Morton就開始了自己的社交秀。首先,分析推特數(shù)據(jù),發(fā)現(xiàn)該顧客是本店的??停彩峭铺氐某S谜?。根據(jù)客戶以往的訂單,推測出其所乘的航班,然后派出一位身著燕尾服的侍者為客戶提供晚餐。也許,這聽起來過于離奇,但是你必須審視自己:“我是否有能力做到這個程度?”Laney說。 ?
PredPol Inc.。PredPol公司通過與洛杉磯和圣克魯斯的警方以及一群研究人員合作,基于地震預測算法的變體和犯罪數(shù)據(jù)來預測犯罪發(fā)生的幾率,可以精確到500平方英尺的范圍內(nèi)。在洛杉磯運用該算法的地區(qū),盜竊罪和暴力犯罪分布下降了33%和21%。 Tesco PLC(特易購)和運營效率。這家超市連鎖在其數(shù)據(jù)倉庫中收集了700萬部冰箱的數(shù)據(jù)。通過對這些數(shù)據(jù)的分析,進行更全面的監(jiān)控并進行主動的維修以降低整體能耗。 ?
American Express(美國運通,AmEx)和商業(yè)智能。以往,AmEx只能實現(xiàn)事后諸葛式的報告和滯后的預測?!皞鹘y(tǒng)的BI已經(jīng)無法滿足業(yè)務(wù)發(fā)展的需要?!盠aney認為。于是,AmEx開始構(gòu)建真正能夠預測忠誠度的模型,基于歷史交易數(shù)據(jù),用115個變量來進行分析預測。該公司表示,對于澳大利亞將于之后四個月中流失的客戶,已經(jīng)能夠識別出其中的24%。 ?
Express Scripts Holding Co.的產(chǎn)品制造。該公司發(fā)現(xiàn)那些需要服藥的人常常也是最可能忘記服藥的人。因此,他們開發(fā)了一個新產(chǎn)品:會響鈴的藥品蓋和自動的電話呼叫,以此提醒患者按時服藥。 ?
Infinity Property & Casualty Corp.的黑暗數(shù)據(jù)(dark data)。Laney對于黑暗數(shù)據(jù)的定義是,那些針對單一目標而收集的數(shù)據(jù),通常用過之后就被歸檔閑置,其真正價值未能被充分挖掘。在特定情況下,這些數(shù)據(jù)可以用作其他用途。該公司用累積的理賠師報告來分析欺詐案例,通過算法挽回了1200萬美元的代位追償金額。 ?
? ?
大數(shù)據(jù)分析的五個基本方面 ?
PredictiveAnalyticCapabilities(預測性分析能力) ?
數(shù)據(jù)挖掘可以讓分析員更好的理解數(shù)據(jù),而預測性分析可以讓分析員根據(jù)可視化分析和數(shù)據(jù)挖掘的結(jié)果做出一些預測性的判斷。 ?
DataQualityandMasterDataManagement(數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理)
?
數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理是一些管理方面的*實踐。通過標準化的流程和工具對數(shù)據(jù)進行處理可以保證一個預先定義好的高質(zhì)量的分析結(jié)果。 AnalyticVisualizations(可視化分析) ?
不管是對數(shù)據(jù)分析專家還是普通用戶,數(shù)據(jù)可視化是數(shù)據(jù)分析工具最基本的要求??梢暬梢灾庇^的展示數(shù)據(jù),讓數(shù)據(jù)自己說話,讓觀眾聽到結(jié)果。 SemanticEngines(語義引擎) ?
我們知道由于非結(jié)構(gòu)化數(shù)據(jù)的多樣性帶來了數(shù)據(jù)分析的新的挑戰(zhàn),我們需要一系列的工具去解析,提取,分析數(shù)據(jù)。語義引擎需要被設(shè)計成能夠從“文檔”中智能提取信息。 ?
DataMiningAlgorithms(數(shù)據(jù)挖掘算法) ?
可視化是給人看的,數(shù)據(jù)挖掘就是給機器看的。集群、分割、孤立點分析還有其他的算法讓我們深入數(shù)據(jù)內(nèi)部,挖掘價值。這些算法不僅要處理大數(shù)據(jù)的量,也要處理大數(shù)據(jù)的速度。 ?
假如大數(shù)據(jù)真的是下一個重要的技術(shù)革新的話,我們*把精力關(guān)注在大數(shù)據(jù)能給我們帶來的好處,而不僅僅是挑戰(zhàn)。 ?
? ?
storm集群組件 ?
了解Storm集群組件的功能 ?
Storm集群中包含兩類節(jié)點:主控節(jié)點(Master Node)和工作節(jié)點(Work Node)。其分別對應(yīng)的角色如下: ?
主控節(jié)點(Master Node)上運行一個被稱為Nimbus的后臺程序,它負責在Storm集群內(nèi)分發(fā)代碼,分配任務(wù)給工作機器,并且負責監(jiān)控集群運行狀態(tài)。Nimbus的作用類似于Hadoop中JobTracker的角色。 ?
每個工作節(jié)點(Work Node)上運行一個被稱為Supervisor的后臺程序。Supervisor負責監(jiān)聽從Nimbus分配給它執(zhí)行的任務(wù),據(jù)此啟動或停止執(zhí)行任務(wù)的工作進程。每一個工作進程執(zhí)行一個Topology的子集;一個運行中的Topology由分布在不同工作節(jié)點上的多個工作進程組成。 ?
Nimbus和Supervisor節(jié)點之間所有的協(xié)調(diào)工作是通過Zookeeper集群來實現(xiàn)的。此外,Nimbus和Supervisor進程都是快速失敗(fail-fast)和無狀態(tài)(stateless)的;Storm集群所有的狀態(tài)要么在Zookeeper集群中,要么存儲在本地磁盤上。這意味著你可以用kill -9來殺死Nimbus和Supervisor進程,它們在重啟后可以繼續(xù)工作。這個設(shè)計使得Storm集群擁有不可思議的穩(wěn)定性。 ?