【課程簡(jiǎn)介】
大數(shù)據(jù)培訓(xùn)
覆蓋大數(shù)據(jù)行業(yè)主流技術(shù)崗位,課程半年升級(jí)一次,緊跟市場(chǎng)與企業(yè)步伐
01 大數(shù)據(jù)入門基礎(chǔ)課程
1.JavaSE;2.MySQL;3.JDBC;4.Linux;5.shell;6.HTML;7.CSS;8.JavaScript;9.JSP;10.Servlet
02 大數(shù)據(jù)Hadoop基礎(chǔ)
1.大數(shù)據(jù)概論;2.Hadoop框架;3.HDFS分布式文件系統(tǒng);4.MapReduce計(jì)算模型;5.全真實(shí)訓(xùn)項(xiàng)目
03 大數(shù)據(jù)離線分析
1.Hive數(shù)據(jù)倉庫;2.Sqoop ETL工具;3.Azkaban工作流引擎;4.Ooize;5.Impala;6.全真實(shí)訓(xùn)項(xiàng)目
04 大數(shù)據(jù)實(shí)時(shí)計(jì)算
1.Zookeeper分布式協(xié)調(diào)系統(tǒng);2.HBase分布式數(shù)據(jù)庫;3.Redis數(shù)據(jù)庫;4.mogDB數(shù)據(jù)庫;5.Kudu列式存儲(chǔ)系統(tǒng);6.Storm實(shí)時(shí)數(shù)據(jù)處理平臺(tái);7.Kafka分布式發(fā)布訂閱消息系統(tǒng);8.Flume海量日志采集系統(tǒng);9.全真實(shí)訓(xùn)綜合項(xiàng)目
05 Spark數(shù)據(jù)計(jì)算
1.Scala;2.Spark;3RDD;4.Spark SQL;5. Streaming;6. Mahout;7.MLlib;8.GraphX;9.Spark R;10.Python;11.Alluxio;12.Python爬蟲;13.ElasticSearch;14.Lucene
Hadoop基礎(chǔ)實(shí)戰(zhàn)
項(xiàng)目名稱:搜狗搜索日志分析系統(tǒng)
數(shù)據(jù)體量:5000W+/日
硬件環(huán)境:Hadoop集群 12臺(tái)
軟件環(huán)境:Hadoop2.5.2+Hive1.2.1+MR+Oracle10g
項(xiàng)目描述:搜狗每天產(chǎn)生大量的日志數(shù)據(jù),從日志數(shù)據(jù)里面能提取到有用的數(shù)據(jù)包括每個(gè)用戶的ID、瀏覽次數(shù)、月/日瀏覽頻率、訪問源、瀏覽內(nèi)容等等,提取這些內(nèi)容、統(tǒng)計(jì)數(shù)據(jù)分析每個(gè)用戶行為,從而做出有利的決定。
大數(shù)據(jù)離線實(shí)戰(zhàn)
項(xiàng)目名稱:新浪微博數(shù)據(jù)分析系統(tǒng)
日均數(shù)據(jù)體量:3GB+
硬件環(huán)境:Hadoop集群 50臺(tái)
軟件環(huán)境:MapReduce+HBase0.98.9+Storm0.9.6+Hadoop2.5.2+Kafka2.10+Zooke
eper3.4.5+CentOS-6.5-X86
項(xiàng)目描述:此次項(xiàng)目我們需要處理微博產(chǎn)生的數(shù)據(jù),通過對(duì)數(shù)據(jù)的處理得到所需的數(shù)據(jù),微博擁有大量的用戶,大量的用戶潛在的價(jià)值是巨大,怎么挖掘這些潛在的寶藏就是我們項(xiàng)目最直接的目的,為了能夠?qū)崟r(shí)的進(jìn)行數(shù)據(jù)處理使用Storm流式計(jì)算系統(tǒng),和HBase、Zookeeper、Kafka組成框架,對(duì)數(shù)據(jù)進(jìn)行處理,當(dāng)然這些都是建立在hadoop集群上實(shí)現(xiàn)的,底層的存儲(chǔ)還是HDFS。
大數(shù)據(jù)實(shí)時(shí)計(jì)算
項(xiàng)目名稱:網(wǎng)絡(luò)流量流向異常賬號(hào)統(tǒng)計(jì)項(xiàng)目
數(shù)據(jù)體量:每天1000億,每秒峰值100 000
硬件環(huán)境:Hadoop集群 600臺(tái)
軟件環(huán)境:Hadoop2.5.2+Hive1.2.1+MR+Oracle10g
項(xiàng)目描述:運(yùn)營(yíng)商骨干網(wǎng)上采集現(xiàn)網(wǎng)流量流向信息,根據(jù)這些原始信息檢測(cè)賬號(hào)是否存在異常,如果多個(gè)終端使用同一個(gè)寬帶賬號(hào),超過一定閾值則觸發(fā)報(bào)警機(jī)制,例如閾值為5時(shí),同一個(gè)賬號(hào)同時(shí)連接的終端數(shù)量不能超過該值,如果超過則報(bào)警。
Spark階段項(xiàng)目
項(xiàng)目名稱:京東網(wǎng)上商城數(shù)據(jù)統(tǒng)計(jì)分析平臺(tái)
數(shù)據(jù)體量:5000W+/日
硬件環(huán)境:centos-6.5-x86 集群:spark standalone(Master-1,Worker-3)
軟件環(huán)境:hadoop,spark,hive,mysql,idea,navicat,kafka,flume
每日處理的數(shù)據(jù)量:3GB
項(xiàng)目描述:基于京東網(wǎng)上商城數(shù)據(jù)統(tǒng)計(jì)分析平臺(tái)--該項(xiàng)目采用了目前大數(shù)據(jù)領(lǐng)域非常流行的技術(shù)——Spark。本項(xiàng)目使用了Spark技術(shù)生態(tài)棧中最常用的三個(gè)技術(shù)框架,Spark Core、Spark SQL和Spark Streaming,進(jìn)行離線計(jì)算和實(shí)時(shí)計(jì)算業(yè)務(wù)模塊的開發(fā)。實(shí)現(xiàn)了包括:統(tǒng)計(jì)和分析UV、PV、登錄、留存、熱門商品離線統(tǒng)計(jì)、廣告流量實(shí)時(shí)統(tǒng)計(jì)3個(gè)業(yè)務(wù)模塊。
linux培訓(xùn)
?
兄弟連11年專注于Linux培訓(xùn)行業(yè),拼教學(xué)、論嚴(yán)管、談素養(yǎng)、比就業(yè),
怕死就別來兄弟連!
教學(xué)靠譜 icon
課程體系每年升級(jí),定期微調(diào),講師、項(xiàng)目經(jīng)理均為專職,培養(yǎng)體系嚴(yán)謹(jǐn)、實(shí)用;大咖講師,學(xué)員打分體系,講師好不好你說了算!
職業(yè)素養(yǎng)課 icon授之以魚更授之以漁:兄弟連創(chuàng)始人李超老師,也會(huì)親自授課,分享自己三十幾年的人生經(jīng)歷和經(jīng)驗(yàn)。
24小時(shí)開放機(jī)房 icon兄弟連一直堅(jiān)持人手一機(jī),學(xué)員可以隨時(shí)在教室學(xué)習(xí),無論晚上11點(diǎn)還是凌晨4點(diǎn),你都將看到為自己的理想而埋頭苦學(xué)的兄弟姐妹。
變態(tài)嚴(yán)管 icon變態(tài)嚴(yán)管,讓你破繭成蝶?!白儜B(tài)”的學(xué)習(xí)訓(xùn)練,因?yàn)閻勰?,所以?yán)厲,我們要培養(yǎng)的是IT特種兵。
項(xiàng)目經(jīng)理全程指導(dǎo) icon課上采用案例式教學(xué),通俗易懂,課下項(xiàng)目經(jīng)理一對(duì)一輔導(dǎo)強(qiáng)化訓(xùn)練,學(xué)與練交叉進(jìn)行強(qiáng)化記憶,你所要做的就是認(rèn)真聽,勤于問,樂于練。
就業(yè)保障 icon學(xué)不會(huì),免費(fèi)重修;找工作,免費(fèi)力薦。畢業(yè)后,你會(huì)發(fā)現(xiàn)UI/UE設(shè)計(jì)師的圈子里到處都是你的人脈,讓你在職場(chǎng)更加如虎添翼。
【教學(xué)環(huán)境】 [圖片3] ? [圖片4] [圖片5] [圖片6] ?