課程亮點(diǎn)
師資:*講師團(tuán)隊(duì),豐富行業(yè)經(jīng)驗(yàn)和企業(yè)培訓(xùn)經(jīng)驗(yàn)
特色:小班培訓(xùn),精品課程,面授+直播+錄播,上課方式多樣
培訓(xùn):免費(fèi)重聽
適用對(duì)象
不限
學(xué)習(xí)目標(biāo)
掌握大數(shù)據(jù)分析與機(jī)器學(xué)習(xí)的完整流程
課程內(nèi)容
*天
大數(shù)據(jù)分析挖掘算法
內(nèi)容一:大數(shù)據(jù)分析挖掘算法
1.業(yè)界常見的大數(shù)據(jù)分析應(yīng)用場(chǎng)景以及對(duì)應(yīng)的分析算法模型應(yīng)用,及其案例
2.常用的統(tǒng)計(jì)分析模型的介紹,包括方差分析、線性擬合、回歸、邏輯回歸、因子分析、主成分分析、時(shí)間序列分析的基礎(chǔ)知識(shí)
3.常用的數(shù)據(jù)挖掘模型介紹,重點(diǎn)介紹六類機(jī)器學(xué)習(xí)與挖掘模型算法
4.業(yè)界主流的數(shù)據(jù)倉(cāng)庫(kù)工具和數(shù)據(jù)分析挖掘相關(guān)工具軟件的應(yīng)用概述
內(nèi)容二:機(jī)器學(xué)習(xí)
1.機(jī)器學(xué)習(xí)概念、發(fā)展歷程
2.機(jī)器學(xué)習(xí)的應(yīng)用場(chǎng)景
3.機(jī)器學(xué)習(xí)與統(tǒng)計(jì)分析
4.無(wú)監(jiān)督式學(xué)習(xí)概述
5.有監(jiān)督式學(xué)習(xí)概述
6.半監(jiān)督式學(xué)習(xí)概述
7.強(qiáng)化學(xué)習(xí)概述
8.人工神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)概述
9.深度學(xué)習(xí)概述
10.機(jī)器學(xué)習(xí)的應(yīng)用場(chǎng)景和應(yīng)用案例
第二天
Spark大數(shù)據(jù)實(shí)時(shí)與高性能處理平臺(tái)剖析
內(nèi)容:Spark大數(shù)據(jù)實(shí)時(shí)與高性能處理平臺(tái)剖析
1.Spark實(shí)時(shí)大數(shù)據(jù)處理平臺(tái)架構(gòu)
2.Spark編程模型以及Spark編程實(shí)例解析
3.Spark RDD內(nèi)存彈性分布式數(shù)據(jù)集的工作原理與機(jī)制
4.Spark Core的核心組件剖析
5.Spark系統(tǒng)架構(gòu)和運(yùn)行過(guò)程剖析
6.Spark on Yarn運(yùn)行原理和實(shí)例
7.Spark RDD transform、滑動(dòng)窗口、foreachRDD性能優(yōu)化、持久化、checkpoint、容錯(cuò)與事務(wù)、與Spark SQL整合使用
8.基于Spark的實(shí)時(shí)數(shù)據(jù)倉(cāng)庫(kù)與實(shí)時(shí)分析挖掘處理的應(yīng)用實(shí)踐,以及應(yīng)用案例
第三天
Spark SQL應(yīng)用實(shí)戰(zhàn)
內(nèi)容:Spark SQL應(yīng)用實(shí)戰(zhàn)
1.Spark SQL實(shí)時(shí)數(shù)據(jù)倉(cāng)庫(kù)的實(shí)現(xiàn)原理與操作
2.Spark SQL核心代碼剖析
3.Spark SQL客戶端開發(fā)包API
4.Spark SQL實(shí)時(shí)統(tǒng)計(jì)應(yīng)用
5.Spark SQL應(yīng)用程序開發(fā)實(shí)踐
第四天
Spark Streaming應(yīng)用實(shí)戰(zhàn)
內(nèi)容:Spark Streaming應(yīng)用實(shí)戰(zhàn)
1.Streaming與Storm在實(shí)時(shí)流計(jì)算處理應(yīng)用場(chǎng)景下的案例與比較
2.Spark Streaming與Spark交互的實(shí)現(xiàn)機(jī)制
3.Spark Streaming的核心代碼剖析
4.Spark Streaming客戶端編程實(shí)踐
5.Spark Streaming實(shí)時(shí)流數(shù)據(jù)分析處理應(yīng)用開發(fā)實(shí)踐
第五天
數(shù)據(jù)預(yù)處理與特征選擇
內(nèi)容一:數(shù)據(jù)預(yù)處理
1.?dāng)?shù)據(jù)抽取、轉(zhuǎn)換和加載
2.?dāng)?shù)據(jù)清洗
3.特征處理
內(nèi)容二:特征選擇與降維
1.特征選擇概述
2.Filter
3.Wrapper
4.Embedded
5.特征擴(kuò)增
6.降維、PCA、LDA、LLE、SVD
第六天
機(jī)器學(xué)習(xí)算法
內(nèi)容一:有監(jiān)督學(xué)習(xí)
1.KNN算法
2.決策樹算法
3.SVM算法
4.樸素貝葉斯算法
5.邏輯回歸算法
6.線性回歸算法
7.集成算法
內(nèi)容二:無(wú)監(jiān)督學(xué)習(xí)
1.聚類算法
2.關(guān)聯(lián)算法
內(nèi)容三:模型評(píng)估與優(yōu)化
1.模型優(yōu)化與評(píng)估概念
2.*優(yōu)化模型
3.模型評(píng)估與選擇
第七天
Spark MLlib數(shù)據(jù)挖掘
內(nèi)容:Spark MLlib數(shù)據(jù)挖掘
1. Spark MLlib概述
2. Spark MLlib評(píng)估矩陣
3. Spark MLlib關(guān)聯(lián)規(guī)則與推薦算法
4. Spark MLlib聚類與降維
5. Spark MLlib分類與回歸
6. Spark MLlib特征提取和轉(zhuǎn)換
7. Spark MLlib基礎(chǔ)統(tǒng)計(jì)分析
第八天
大數(shù)據(jù)挖掘案例
內(nèi)容:綜合實(shí)驗(yàn)
1. 房?jī)r(jià)售價(jià)預(yù)測(cè)
2. 個(gè)人收入分群
3.移民的簽證預(yù)測(cè)
4.銀行辦理定期存款業(yè)務(wù)預(yù)測(cè)