朋友圈

13140882082

全國統(tǒng)一學習專線 9:00-21:00

位置:程序開發(fā)培訓班 > 大數(shù)據(jù)開發(fā)培訓班 > 深圳大數(shù)據(jù)開發(fā)技巧與調(diào)優(yōu)培訓

深圳大數(shù)據(jù)開發(fā)技巧與調(diào)優(yōu)培訓

深圳大數(shù)據(jù)開發(fā)技巧與調(diào)優(yōu)培訓

授課機構: 深圳IT認證機構

課程價格: 請咨詢客服

開班時間:隨到隨學

上課地址: 請咨詢客服

優(yōu)惠價格: 請咨詢客服

咨詢電話:13140882082

課程介紹

發(fā)布日期:2024-09-20

課程亮點


師資:*講師團隊,豐富行業(yè)經(jīng)驗和企業(yè)培訓經(jīng)驗


特色:小班培訓,精品課程,面授+直播+錄播,上課方式多樣


培訓:免費重聽


適用對象


不限


課程內(nèi)容


*天


主題1:大數(shù)據(jù)平臺方案與實施


大數(shù)據(jù)基礎與發(fā)展過程


傳統(tǒng)大規(guī)模數(shù)據(jù)處理與分析存在的問題


大數(shù)據(jù)計算框架


離線計算框架;流式計算框架;內(nèi)存計算框架;


大數(shù)據(jù)平臺方案


CDH 、Hortonworks、MapR;傳統(tǒng)IT公司方案:Oracle Exadata,SAP HANA;核心組件;Hadoop 1.0與2.0版本關聯(lián)與區(qū)別;Hadoop生態(tài)系統(tǒng);Apache Hadoop方案;國外主流大數(shù)據(jù)平臺方案;國內(nèi)主流大數(shù)據(jù)平臺方案與廠商;大數(shù)據(jù)平臺方案比較;


大數(shù)據(jù)的行業(yè)應用


大數(shù)據(jù)的落地實施挑戰(zhàn)


主題2:大數(shù)據(jù)計算模型(一)–批處理MapReduce


MapReduce編程模型


Map處理;Reduce處理;MapReduce主程序設置;


MapReduce處理流程


數(shù)據(jù)讀取collect;中間數(shù)據(jù)sort;中間數(shù)據(jù)spill;中間數(shù)據(jù)shuffle;聚合分析reduce;


MapReduce開發(fā)高級應用


Combiner技術與應用場景;Partitioner技術與應用場景;多Reducers應用;


MapReduce開發(fā)與應用實踐


Hadoop平臺搭建與運行;MapReduce安裝與部署;應用案例:基于HDFS+MapReduce集成的服務器日志分析采集、存儲與分析MapReduce程序?qū)嵗_發(fā)與運行;


主題3:大數(shù)據(jù)存儲系統(tǒng)


HDFS分布式文件系統(tǒng)


NameNode單點故障解決方案;NFS冷備份;block的備份策略;fsimage和editslog;HDFS系統(tǒng)架構與原理;NameNode功能詳解;DataNode功能詳解;HDFS讀寫機制;HDFS高可用方案;


第二天


主題4:Hadoop軟件框架與優(yōu)化


Hadoop1.0框架


Hadoop JobTracker;Hadoop TaskTracker;


Hadoop 2.0 框架


ResourceManager組件;NodeManager組件;ApplicationMaster組件;YARN組件;


Hadoop 2.0 資源調(diào)度優(yōu)化


YARN調(diào)度原理;CapacityScheduler;FairScheduler;


Hadoop框架組件調(diào)優(yōu)


慢啟動優(yōu)化;心跳優(yōu)化;容錯優(yōu)化;MR計算框架參數(shù)調(diào)優(yōu);


HDFS調(diào)優(yōu)


RPC線程調(diào)優(yōu);本地文件系統(tǒng)調(diào)優(yōu);RAID與卷管理調(diào)優(yōu);小文件優(yōu)化;


主題5:大數(shù)據(jù)計算模型(二)實時交互計算– Spark


Spark編程模型


Scala:面向函數(shù)的編程;Scala常見函數(shù)與開發(fā);Scala編譯和運行;


Spark RDD開發(fā)模型


寬依賴;窄依賴;count;collect;saveAsTextFile;map;flatmap;filter;union;reduceByKey;groupByKey;Spark RDD運行機制;Spark RDD主要Transformation;Spark RDD主要Action;Spark RDD依賴關系;


Spark集群架構與關鍵組件


Spark作業(yè)運行機制


執(zhí)行DAG圖;任務集;executor執(zhí)行模型;


Spark開發(fā)與應用實踐


基于HDFS+Flume+Spark的服務器運行日志實時分析Spark程序?qū)嵗_發(fā)與運行;Spark運行環(huán)境搭建與部署;應用案例;


主題6:SQL on Hadoop大數(shù)據(jù)查詢


基于MapReduce的大數(shù)據(jù)查詢Hive


列存儲和行存儲;Hive架構與工作原理;Hive數(shù)據(jù)加載;Hive內(nèi)部表和外部表;Hive分區(qū)表和分通表;Hive的存儲方式;Hive SQL基本操作;


基于Spark的大數(shù)據(jù)查詢SparkSQL


數(shù)據(jù)表讀取、查詢與結果保存;json;Hive table;Parquet file;RDD;SparkSQL工作原理與執(zhí)行機制;SparkSQL數(shù)據(jù)模型Dataframe;SparkSQL數(shù)據(jù)讀取與結果保存;SparkSQL和Hive的區(qū)別與聯(lián)系;實踐SparkSQL操作;


第三天


主題7:大數(shù)據(jù)計算模型(三) 流計算


流數(shù)據(jù)處理應用場景


流數(shù)據(jù)處理特點;流計算系統(tǒng):SparkStreaming,Storm對比;


流數(shù)據(jù)計算框架:Spark Streaming


基于文件流的SparkStraeming程序;基于socket流的SparkStraeming程序;Spark Streaming基本概念;Spark Streaming數(shù)據(jù)模型DStream;Spark Streaming架構與工作機制;Spark Streaming數(shù)據(jù)源操作;Spark Streaming開發(fā)示例;


流數(shù)據(jù)計算框架:Storm


Spout,Bolt, Topology;Storm基本概念;Storm編程模型;數(shù)據(jù)流分組;并發(fā)度設置;容錯機制;


主題8:NoSQL數(shù)據(jù)庫


NoSQL數(shù)據(jù)庫


Hbase,MongoDB,Redis;關系型數(shù)據(jù)庫瓶頸;NoSQL數(shù)據(jù)庫概念,分類與適用場景;


列存儲NoSQL數(shù)據(jù)庫Hbase


高表與寬表;rowkey設計;LSM結構的數(shù)據(jù)組織與讀寫;Hmaster;RegionServer;Zookeeper;行、列簇、時間戳;Hbase原理與數(shù)據(jù)模型;Hbase系統(tǒng)架構;Hbase的讀寫機制;Hbase表的設計原則;Hbase適用場景;


主題9:大數(shù)據(jù)采集


RDBMS與Hadoop數(shù)據(jù)轉(zhuǎn)換工具Sqoop


Sqoop工作原理;


文件采集工具Flume


Flume組件與運行;Flume常用配置;


Kafka


Kafka基本概念: producer, broker, consumer;Kafka集群架構;Kafka運行機制;Kafka應用場景;

學員評價ASK list

  • 未**評價:現(xiàn)在的互聯(lián)網(wǎng)市場還挺有發(fā)展前景,涉及到日常生活各個方面,什么大數(shù)據(jù),云計算,5g之類的,小白一個沒什么基礎來了解一下......環(huán)境還不錯,正規(guī)的學校,算是大又亮吧,老師給我講解了互聯(lián)網(wǎng)近兩年的發(fā)展和就業(yè),課程是不斷更新和淘汰的,所以是新和市場融合度很高了!
    手機號碼: 181****5123   評價時間: 2024-09-20
  • 未**評價:自己之前考過一次VMware考試了,但是沒過, 一次偶然的機會試聽了IT認證的課程,發(fā)現(xiàn)老師講得很清晰,自己確實能理解就報了名,現(xiàn)在學了兩天了,老師講的很好,自己收獲很大
    手機號碼: 144****5540   評價時間: 2024-09-20
  • 未**評價:想通過ITIL考試來提升自己的薪資,這幾年這個考試還挺火的,自己想了想報了IT認證的專業(yè)課,有老師輔導肯定比自學好,況且IT認證的品牌還是有一定*度的 ,預祝自己順利通過考試!
    手機號碼: 183****7998   評價時間: 2024-09-20
  • 林**評價:我考過兩次華為認證都沒有過,裸考通過率是在太低了,網(wǎng)上買的資料不靠譜。還是線下班的教學比較是在,真真切切的上課,一次就過了
    手機號碼: 133****1728   評價時間: 2024-09-20
  • 未**評價:一直想找一個更加專業(yè)的PMP輔導機構,在同事的推薦下報名了IT認證的課程,上了一個星期了,老師講得很好,而且會即時解答提問,確實不錯
    手機號碼: 159****2924   評價時間: 2024-09-20
  • 周**評價:晚上是跟朋友一起過來參加個試聽課,也了解一下Linux認證的項目,因為我是零基礎,課上老師簡單講了一點,整體我比較滿意,體驗感不錯。
    手機號碼: 186****7437   評價時間: 2024-09-20

更多培訓課程,學習資訊,課程優(yōu)惠,課程開班,學校地址等學校信息,請進入 深圳IT認證機構網(wǎng)站詳細了解
咨詢電話:13140882082   微信:13140882082

如果本頁不是您要找的課程,您也可以百度查找一下:

還沒有找到合適的課程?趕快告訴課程顧問,讓我們顧問馬上聯(lián)系您! 靠譜 的培訓課程,省時又省力!

微信訪問

#tel_020#