線下課程內容
-
01
Python語言基礎
-
02
商業數據分析
-
03
機器學習算法
-
04
項目實戰和就業指導
01Python語言基礎
初識Python語言
Python語言概述和環境安裝丨變量、數據類型和進制丨運算符和分支結構丨循環結構入門丨循環結構的應用
常用數據結構和函數
字符串丨列表的應用丨元組和集合丨字典類型的應用丨函數使用入門
函數和面向對象編程
包和模塊丨函數的用法丨裝飾器和生成器丨面向對象編程基礎丨面向對象編程進階
Python網絡數據采集
爬蟲概述和頁面抓取丨解析頁面的方式丨爬取數據的持久化丨Cookie和商業IP代理丨獲取頁面動態內容丨Selenium應用詳解丨提升爬蟲工作效率丨破解驗證碼丨爬蟲框架Scrapy
02商業數據分析
數據分析概述和Excel的應用
數據分析和數據分析師概述丨指標和指標體系建設丨Excel的安裝和上手丨Excel中的函數和公式計算丨Excel透視表、透視圖和商業數據看板
關系型數據庫和SQL
數據庫概述和MySQL的安裝使用丨表關系和SQL的應用丨SQL數據查詢詳解丨窗口函數和業務場景下的數據查詢丨Python程序接入MySQL數據庫
商業智能(BI)工具
MySQL其他相關知識丨從Excel到Power BI丨Power BI中的數據清洗和分析模型丨Power BI中的數據可視化和報表制作丨Power BI項目實操丨認識和使用Tableau丨認識和使用fineBI丨數據思維和分析模型
Python數據分析
Python數據分析工具介紹丨使用NumPy實現批量數據處理丨線性代數和NumPy的linalg模塊丨使用Pandas進行數據分析
03機器學習算法
機器學習的數學基礎
線性代數丨微積分丨概率論丨統計學丨信息論
機器學習算法
機器學習概述和kNN算法丨回歸算法丨邏輯回歸丨樸素貝葉斯丨決策樹丨支持向量機丨聚類算法和輪廓系數丨集成算法丨特征工程和評價指標丨機器學習項目實戰
深度學習和神經網絡
推薦系統丨深度學習和tensorflow入門丨tensorflow的應用丨卷積神經網絡
數據倉庫和大數據挖掘
Hadoop生態圈丨ETL工具丨數據倉庫丨Hive丨Spark概述
04項目實戰和就業指導
零售/電商行業數據分析項目實戰
為期5天的項目實戰
金融風險信用評估項目實戰
為期5天的項目實戰
就業指導和模擬面試
就業期的技術和心理準備丨如何制作一份優質的簡歷丨面試流程和注意事項丨模擬模式
線上課程內容
-
01
數學基礎
-
02
經典機器學習
-
03
深度學習
-
04
強化學習
01數學基礎
高等數學
什么是函數丨極限的定義丨無窮小與無窮大丨連續性與導數丨偏導數丨方向導數丨微積分的基本思想丨定積分原理丨牛頓-萊布尼茨公式丨泰勒公式及應用丨拉格朗日優化問題
線性代數
矩陣觀點的由來-方程可解性丨矩陣的逆丨行列式丨矩陣的向量空間與秩丨為什么要做矩陣分解丨特征值與特征向量丨基于特征值的矩陣分解丨SVD如何進行矩陣分解丨SVD在推薦系統中的應用
概率論
概率與頻率-古典學派丨條件概率與文氏圖丨離散隨機變量丨連續隨機變量丨什么是隨機抽樣丨從貝葉斯學派到貝葉斯推斷丨多維隨機變量丨期望及其求法丨大數定律與中心極限定律告訴我們什么丨極大似然估計丨統計推斷的做了哪些事情丨z分布與t分布丨f分布丨卡方分布丨使用卡方分布檢測相關性丨f分布與回歸分析
02經典機器學習
回歸模型
什么是回歸丨多元回歸的定義丨解析求解-較小二乘法丨梯度下降與迭代求解原理丨手擼梯度下降丨梯度下降的改進丨模型的評估方法-r2評分丨非線性問題如何解決-泰勒級數丨回歸問題的更一般表達丨模型復雜度與擬合丨如何解決過擬合與欠擬合丨嶺回歸與lasso回歸丨sklearn中的線性回歸丨sklearn中的嶺回歸與lasso回歸丨AR模型在回歸中的應用丨回歸項目(kaggle舊金山犯罪率預測)
分類方法
分類問題的定義丨從回歸到分類-邏輯函數的作用丨貝葉斯推斷與似然函數丨使用較大似然進行參數估計丨邏輯斯蒂損失定義丨邏輯斯蒂梯度下降推導丨手擼邏輯斯蒂丨使用邏輯斯蒂進行手寫體識別丨文本分類問題與NLP丨復習使用樸素貝葉斯框架的推斷丨使用樸素貝葉斯進行文本分類的原理丨樸素貝葉斯進行文本分類的實例丨sklearn中樸素貝葉斯實現丨高斯貝葉斯及其應用丨項目實戰(新聞分類)丨什么是決策樹丨信息如何度量丨信息增益表達了什么?丨使用ID3算法構建決策樹丨C4.5與CART樹使用的度量方法丨CART樹如何進行回歸丨分類方法的較優化思考丨支持向量與較優分類超平面丨svm模型的構建丨svm對偶問題的轉換丨smo算法與對偶問題的求解丨核函數如何解決非線性問題丨綜合項目(使用svm進行車牌識別)
聚類
數據的潛在結構與聚類丨距離的度量標準丨KMeans原理丨KMeans實現丨聚類算法的評估-輪廓系數丨基于密度的聚類丨層次聚類丨綜合項目
集成學習
集成學習概述-弱分類與強分類丨boosting與bagging丨adaboost概述丨adaboost原理丨adaboost推導與計算丨bagging抽樣的若干問題丨使用bagging與決策樹構建隨機森林丨隨機森林為什么有效?丨使用boosting與決策樹構建提升樹丨什么是梯度提升丨GBDT的原理與推導丨xgboost的原理與推導丨lightgbm的進一步改進丨綜合項目
03深度學習
深度前饋網絡
什么是神經網絡丨神經網絡能進行學習的原因-從XOR問題入手丨正向傳播的計算丨基于梯度的學習丨反向傳播的計算丨梯度消失與梯度爆炸-激活函數的選擇丨控制模型復雜度-神經網絡的正則化丨注意力機制
機器學習算法
機器學習概述和kNN算法丨回歸算法丨邏輯回歸丨樸素貝葉斯丨決策樹丨支持向量機丨聚類算法和輪廓系數丨集成算法丨特征工程和評價指標丨機器學習項目實戰
卷積網絡
計算機如何理解圖片丨卷積運算丨池化丨LeNet-一個完整的神經網絡結構丨卷積神經網絡的結構化輸出與數據類型丨VGG網絡-向深度邁進丨RESNET-解決退化問題作出的努力丨yolo-一次掃描完成多目標檢測丨其他流行的網絡結構介紹
循環網絡
綜合項目丨時間序列處理的發展和演進丨計算圖及其展開丨RNN網絡結構丨RNN如何處理時間序列丨雙向RNN丨RNN為什么起作用?丨遞歸與深度循環丨改進RNN的短視-LSTM丨使用LSTM完成詩歌生成器丨綜合項目
置信網絡
編碼與解碼丨什么是受限玻爾茲曼機丨受限玻爾茲曼機推導丨構建DBN丨使用DBN進行推薦與編碼丨綜合項目-廣告點擊優化
04強化學習
理論基礎
什么是強化學習丨多臂機丨MDP過程丨動態規劃丨策略梯度原理
模型實現
什么是Q-Learning丨Q-Learning的更新丨Q-Learning的實現丨什么是Sarsa丨Sarsa的原理與實現丨什么是DQN丨DQN如何更新丨DQN的實現丨什么是Actor Critic丨Actor Ctitic原理與實現