北京 切換校區

全國24小時免費熱線

400-009-1906

以下課程火熱報名中

尚學堂開班提醒

尚學堂大數據就業捷報頻傳

這,只是他們的起步薪水!

我們2019年統計,僅是學員畢業后進入京東(135)人,阿里(41)人,百度(53)人,
今日頭條(78)人,騰訊(71)人等等

他們的 月薪普遍超過2萬,成長為技術大牛、CTO、 成功創業等的尚學堂學長,層出不窮!

以上統計的,僅是學員畢業后首份工作的基本薪資,且不包含績效、獎金、補助等各項福利。

點擊查看,連續8期全部就業名單 >>

狂撒¥2019 豬年禮券200-3000元(僅限前100名)

不負春光,和學習戀愛

部分學員就業喜報

前沿課程+雄厚師資+變態管理=高薪大數據人才屢創新高

這,就是尚學堂大數據學院

2019,歡迎您來,大牛師資帶你嘗嘗大數據的甜頭!

肖老師

中國電信外聘大數據專家

企業大數據培訓專家

尚學堂大數據創始人

尚學堂大數據學院院長

李老師

騰訊中國好老師

大數據實戰專家

清華、北郵大數據及人工智能客座教授

大型集群架構調優經驗

尚學堂大數據學院教學總監

吳老師

企業大數據架構專家

企業大數據內訓金牌講師

10年企業工作經驗

尚學堂大數據項目開發部總監

賈老師

阿里云/騰訊云認證金牌講師

曾在BAT公司任職,多年實戰經驗

尚學堂大數據高級講師
  • 肖老師

  • 李老師

  • 吳老師

  • 賈老師

大數據174.35G視頻 / 685套課后作業 / 北京1500家企業面試題
戳我領取 >>

師資教學怎么樣?課程項目怎么樣?口碑怎么樣?

免費公開課讓您親自體驗下。

大牛引路,實戰貫穿!

  • 智慧交通項目
  • 電商日志分析項目
  • 游戲運營分析項目
  • App個性化推薦項目
  • 聯盟廣告分析項目

阿里巴巴基于杭州智慧交通項目

智慧交通是指在交通領域中充分運用大數據、云計算、互聯網、機器學習、等技術,通過高新技術匯集交通信息,對交通管理、交通運輸、公眾出行等等交通領域全方面以及交通建設管理全過程進行管控支撐,使交通系統在區域、城市甚至更大的時空范圍具備感知、互聯、分析、預測、控制等能力,以充分保障交通安全、發揮交通基礎設施效能、提升交通系統運行效率和管理水平,為通暢的公眾出行和可持續的經濟發展服務。

項目模塊:

天網搜車,智能研判,軌跡分析,套牌分析,稽查布控,跟車分析,晝伏夜出,統計分析等15大模塊。

技術架構:

hdfs +spark +kafka +flume + spark Streaming +spark MLlib+redis

某大型電商日志分析項目

日志分析項目是以數據為驅動,關注電商運營每一個環節,貫穿不同運營階段,隨時發現運營問題,調整運營計劃。一般來說電商平臺每天會產生100G到50T左右的日志數據。有了海量的數據就可以挖掘出有價值的決策依據。

需求模塊:

用戶分析,流量分析,活動效果分析,渠道分析和訂單分析等8八模塊

技術架構:

nginx + HDFS+ mapreduce +Hive+hbase +spark +flume +sqoop+mysql +D3

大型游戲運營分析項目

大型網絡游戲每天會產生10G—100G的數據,通過大數據分析可以幫助追蹤注冊轉化率數據、快速定位注冊刷號行為。通過對關卡的訪問數,成功率,失敗原因進行分析,來合理調整難易度。游戲生產虛擬物品,而不是印鈔。您需要找到玩家在不同階段對哪類物品有最強依賴,才能刺激痛點策劃拉收。

項目模塊:

玩家在線分析,等級分析,任務難度分析,收入分析,虛擬消費分析等7大模塊。

技術架構:

linux+hdfs+spark+mapreduce+hive+hbase。

App個性化推薦項目

推薦系統是利用 大數據和數據挖掘技術向客戶提供商品信息和建議,幫助用戶決定應該購買什么產品,模擬銷售人員幫助客戶完成購買過程。個性化推薦是根據用戶的興趣特點和購買行為,向用戶推薦用戶感興趣的信息和商品。

功能模塊:

清洗數據,構建訓練集,訓練模型,評估模型,推薦APP等

技術架構:

hdfs +hive +hbase +kafka +spark +spark MLlib+ python+redis +dubbo

聯盟廣告分析項目

廣告分析是指用大數據來分析和測定廣告促進商品或勞務銷售的效果。可以檢驗廣告目標是否正確、廣告媒體運用是否得當、廣告分布時間與頻率是否適宜、投入的廣告費用是否合理等,從而進一步檢驗出廣告決策是否正確、廣告創意設計是否需要改進等。廣告分析,能較客觀地測定廣告效果所取得的效益,提高廣告主對廣告的信心,也有利于廣告公司的業務發展。

項目模塊:

聯盟廣告分析項目-項目模塊:這塊沒有提供文案

技術架構:

nginx + HDFS+ mapreduce +Hive+hbase +spark +flume +sqoop+mysql +D3

其他培訓機構一直在模仿我們的項目,卻講不明白項目的思路,大數據實戰項目,思路還是原裝的好

領取hadoop實戰書一本 >>

大數據課程大綱

第一階段

1、學員可以自主選擇 2.5個月 或者 5.5個月 的J2EE課程,學完該階段考試合格進入大數據階段!

2、有基礎學員可以直接參加考試,合格直接進入大數據階段。

3、在職學員可直接進入周末班。每月一班隨到隨學。

第二階段
linux和高并發

第二階段
linux和高并發

第二階段
linux和高并發

01 Linux基礎

操作系統概述

Linux內核與GNU介紹

Linux發行版介紹

虛擬化安裝centos

虛擬網絡編輯器

規劃多主機網絡通信

虛擬化管理快照與克隆

SSH客戶端使用與配置

02 Linux初級

Linux命令行原理

help內部命令幫助

man命令8種幫助手冊

df/du文件系統分析

文件系統HFS規范

文件系統管理命令

bash的{}、$擴展

03 Linux文本操作

文件內容預覽命令

管道的使用

基于管道的文件游標預覽

日志文件追蹤

vi命令的快捷操作

vi命令的編輯模式

vi命令的末行模式

awk腳本案例:統計報表

04 Linux文本分析

grep檢索文件

正則表達式

文本分析命令cut

文本分析命令sort

文本分析命令wc

文本分析命令sed

sed案例:正則和s命令另類使用

文本分析命令awk

05 Linux管理

系統服務配置文件

用戶管理

組管理

權限管理

案例:多用戶角色資源綁定

網絡管理

進程管理

后臺服務管理

06 Linux安裝管理

操作系統軟件安裝原理

源碼編譯安裝及原理

RPM包管理機制原理

RPM的查詢、安裝、卸載

YUM倉庫原理

YUM本地、局域網倉庫源配置

案例:維護多個YUM源

YUM安裝中文幫助文檔

07 Linux高級

shell原理、命令原理

shell解釋器的4種腳本執行方式

shell函數、內部命令、外部命令總結

文件描述符與重定向

輸出重定向的6種方式

輸入重定向的4種方式

案例:重定向http協議到網站請求主頁

條件表達式

08 Linux腳本編程

本地、局部變量

位置、特殊變量

父子進程、環境變量

linux中for進程原理

管道的子進程執行原理

引用、命令替換擴展

命令狀態與邏輯判斷

算數表達式及bash擴展

09 Linux腳本案例

shell腳本:用戶管理

shell腳本:文件管理

shell腳本:增強for循環遍歷文件

shell腳本:游標for循環遍歷文件

shell腳本:重定向while循環遍歷文件

shell腳本:管道+while循環遍歷文件

bash解釋器的7中命令擴展總結

流程控制語句&bash詞的拆分擴展

10 網絡基礎

高并發及解決方案概述

TCP/IP協議:應用層

TCP/IP協議:傳輸控制層

TCP/IP協議:TCP協議/報文/三次握手

TCP/IP協議:網絡層

TCP/IP協議:路由表和IP協議原理

TCP/IP協議:鏈路層

TCP/IP協議:ARP協議及交換機原理

11 四層負載均衡

四層負載均衡LVS拓撲

NAT網絡原理

LVS的DNAT模式分析

LVS的DR模式分析

LVS的TUN模式分析

LVS的靜態調度算法

LVS的動態調度算法

內核配置ARP協議

LVS的命令講解

12 Keepalived實現高可用

高可用概述

健康檢查及故障遷移策略

分布式選主策略

keepalived原理

keepalived配置文件詳解

基于keepalived的高可用LVS

高可用驗證

后端健康檢查驗證

LVS的DR模式實驗搭建

13 Linux基礎

單點性能壓力下的面向服務開發理論

反向代理服務器原理

Nginx介紹

Nginx和Apache的httpd對比

IO的阻塞模型和異步非阻塞模型

Nginx角色框架原理

Nginx的內核參數配置

Nginx的內核sendfile零拷貝原理

Nginx的TCP配置

14 Nginx的反向代理和負載均衡

Nginx的虛擬服務器原理

Nginx的location匹配規則

Nginx的自動索引

Nginx的反向代理服務器配置

Nginx的upstream負載均衡配置

Nginx的DNS負載均衡配置

Nginx負載均衡下數據一致性解決方案

15 Session和緩存

Session一致性問題

Session復制

Session共享

Session同步

Memcached的緩存

K-V格式緩存

Tomcat和Memcache

緩存服務器

第三階段
Hadoop生態體系

第三階段
Hadoop生態體系

第三階段
Hadoop生態體系

第三階段
Hadoop生態體系

第三階段
Hadoop生態體系

第三階段
Hadoop生態體系

01 Linux基礎

1T文件處理

Hadoop歷史

Hadoop架構

NameNode講解

SecondaryNameNode講解

DataNode與副本防治策略

HDFS權限

HDFS安全模式

HDFS文件上傳流程

02 HDFS高級概念

hadoop完全分布式集群搭建

hadoop3新特性

NameNode的Federation

NameNode-HA

NameNode-HA集群搭建

NameNode-HA手動切換

NameNode-HA自動切換

java客戶端操作HDFS

HDFS讀文件流程

03 MR

MapReduce簡介與原語

MapReduce執行流程

二次排序

MapReduce作業提交流程

MapReduce作業執行流程

YARN-ResourceManager-HA搭建

運行自帶的wordcount程序

手寫wordcount程序

偽分布式集群搭建

04 MR源碼解析

MapReduce作業提交流程源碼解析

作業切片計算的源碼解析

MapTask輸入方式的源碼解析

MapTask執行流程源碼解析

MapTask輸出方式的源碼解析

MapTask環形緩沖區源碼解析

RedueTask的shuffle源碼解析

ReduceTask分組的源碼解析

ReduceTask輸出的源碼解析

05 MapReduce案例

天氣案例需求分析

天氣案例映射為MR原語

天氣案例鍵值對設計

天氣案例排序比較器分組比較器設計

天氣案例開發和運行

好友推薦需求分析

好友推薦映射為MR原語

好友推薦鍵值對設計

好友推薦開發和運行

06 MapReduce案例

PageRank簡介及算法介紹

PageRank映射為MR原語

PageRank鍵值對設計

PageRank編碼和運行

TFIDF簡介及算法

TFIDF映射為MR原語

TFIDF鍵值對設計

TFIDF編碼和運行

itemCF簡介及算法

07 Hive介紹及架構

hive的介紹

數據倉庫概念講解

數據倉庫與數據庫區別

Hive的架構原理

Hive元數據講解

Hive的使用場景

Hive的優缺點

Hive的執行引擎

Hive操作符

08 Hive架構

linux環境下mysql安裝

mysql登錄權限修改

Hive三種安裝搭建模式

Hive元數據存儲到mysql

基于內存數據庫模式搭建

基于遠程數據庫模式搭建

基于遠程數據庫服務搭建

Hive配置文件講解

Hive命令操作

09 Hive DDL1

Hive基礎數據類型

Hive復雜數據類型

Hive數據類型轉換

Hive創建數據庫

Hive創建表三種方式

Hive創建管理表

Hive創建外部表

Hive數據讀取規則Row Format

Hive語法解析

10 Hive DDL2

Hive數據讀取規則 Serde

Hive靜態分區管理

Hive動態分區管理

Hive刪除表

Hive修改表

Hive分桶表管理

Hive視圖

Hive索引

itemCF編碼和運行

11 Hive DML

Hive從本地加載數據

Hive從hdfs加載數據

Hive通過查詢插入數據

Hive插入數據到指定目錄

Hive insert values插入

Hive事務管理

Hive事務特性

Hive事務配置

Hive修改數據

12 Hive查詢

Hive全表查詢

Hive條件查詢

Hive分組查詢

Hive運算符

Hive內置函數

Hive自定義函數

Hive表連接

Hive排序方式

Hive嵌套查詢

13 Hive訪問方式

Hive命令行方式

Hive元數據管理

Hiveserver2講解

Hive beeline客戶端講解

Hive JDBC操作

Hive參數

Hive變量

Hive腳本運行方式

Hive GUI方式

14 Hive安全管理

Hive授權模式

Hive Legacy Mode

Hive 基于SQL標準授權模型

Hive 基于元數據授權模型

Hive角色管理

Hive授權命令

Hive回收權限命令

Hive刪除數據

Hive清空數據

15 Hive存儲及壓縮

Hive存儲壓縮管理

Hive列式存儲

Hive行式存儲

Hive textfile

Hive sequencefile

Hive orc file

Hive parquet file

Hive map端輸出

Hive reduce端輸出

16 Hbase介紹及架構

hbase介紹

NoSQL介紹

Hbase特點

Hbase存儲數據結構

Hbase數據模型

Hbase表結構介紹

Hbase架構圖

Hbase角色

Hbase內存結構介紹

Hbase存儲數據結構LSM樹

17 Hbase架構及操作

Hbase standalone模式安裝

Hbase 完全分布式安裝

Hbase 高可用

Hbase搭建注意

Hbase基本命令

Hbase DDL命令

Hbase DML命令

Hbase命名空間命令

Hbase寫數據流程

Hbase讀數據流程

18 Hbase Java API

Hbase創建表

Hbase刪除表

Hbase插入數據

Hbase更新數據

Hbase刪除數據

Hbase獲取一條數據

Hbase獲取某個范圍的數據

Hbase過濾器

Hbase與MR集成

Hbase與hive集成

19 Hbase壓縮存儲

Protobuffer講解

Protobuffer安裝

Protobuffer配置基本類型

Protobuffer配置集合類型

Protobuffer生成Java類

Hbase讀取Protobuffer生成的類

Hbase壓縮存儲

20 Flume架構

Flume日志收集工具

Flume agent架構

Flume組件

Flume集群講解

flume不同架構介紹

flume安裝

flume配置信息

flume單臺安裝

flume集群安裝

flume高可用講解

21 flume source講解

Avro source

Thrift source

Exec source

Spooling directory source

Kafka source

Netcat source

自定義Source

Source的分類

22 flume sink講解

Hdfs sink

Hive sink

Hbase sink

Avro sink

Thrift sink

Logger sink

Kafka sink

自定義Sink

23 Sqoop介紹及架構

Sqoop簡介

ETL講解

Sqoop架構圖

Sqoop架構設計

Sqoop版本介紹

Sqoop導入

Sqoop導出

Sqoop安裝

24 Sqoop操作

Sqoop導入數據到hdfs

Sqoop導入數據到hive

Sqoop導入數據到hbase

Sqoop通過查詢語句到hdfs

Sqoop導出數據到mysql

導出配置

Hdfs配置

Hbase配置

25 zookeeper

分布式協調框架

Zookeeper背景與介紹

分布式zookeeper環境及安裝

Zookeeper源語命令操作

關于節點類型、版本、元數據信息的意義

Zookeeper 的api 環境java操作集群演示

事件注冊與節點的變更

基于zookeeper的分布式協調案例

26 ElasticSearch

ElasticSearch的現狀與前景

Lucene框架與倒排索引原理

Lucene框架在el search搜索引擎中的作用

ElasticSearch全分布式特性

ElasticSearch的環境要求與安裝

Curl命令與rest風格的使用

Api搜索項目演示1

Api搜搜項目演示2

27 CDH

國內外大數據平臺介紹

Cloudera產品介紹

什么是CDH

什么是cloudera manager

什么是cloudera manager service

cloudera manager框架原理

集群基礎設施配置

純手工安裝cloudera manager

28cloudera manager使用

cloudera manager部署CDH

cloudera manager管理主機

cloudera manager管理集群

cloudera manager管理服務

cloudera manager管理實例

cloudera manager管理配置

cloudera manager管理監控

cloudera manager管理資源

service的dashboard

29 Hue的使用

Hue介紹

Hue安裝

Hue的HDFS管理與使用

Hue的YARN管理與使用

Hue的HIVE管理與使用

Hue的Oozie管理與使用

Hue的metadata管理與使用

Hue的用戶管理與使用

30 Impala的安裝

Impala介紹

內存計算與MR,SPARK計算的比較

impala框架角色講解

impala的安裝

impala的命令行使用

impala的命令參數詳解

impala的內部命令詳解

service圖表使用

service圖表創建

第四階段
Spark生態體系

第四階段
Spark生態體系

第四階段
Spark生態體系

第四階段
Spark生態體系

第四階段
Spark生態體系

01 Scala基礎語言應用

Scala背景介紹

Scala語言六大特性

Scala下載安裝配置

Scala IDE開發Scala配置

IDEA 開發Scala配置

Scala類型推斷機制

Scala數據類型

Scala基本語法

Scala類和對象

Scala 循環、判斷

02 Scala函數編程

Scala函數定義

Scala遞歸函數

Scala默認值函數

Scala可變參數函數

Scala匿名函數

Scala嵌套函數

Scala偏應用函數

Scala高階函數

Scala柯里化函數

ScalaActor通信模型

03 Scala字符串、集合

Scala String操作

Scala Array 操作

Scala可變數組操作

Scala List 操作

Scala 可變列表操作

Scala Set 操作

Scala 可變Set操作

Scala map 操作

Scala 可變map操作

Scala 元組操作及要點

04 Scala高級應用

Scala伴生類

Scala伴生對象

Scala樣例類

Scala樣例類案例

Scala Trait要點

Scala Trait 案例

Scala match匹配

Scala隱式值操作

Scala隱式參數操作

Scala隱式函數操作

Scala隱式類操作

05 Spark基礎使用

Spark技術介紹

Spark技術站詳解

Spark演變歷史

Spark與MR的區別

Spark 基于eclipse配置

Spark基于IDEA配置

Spark運行模式介紹

Spark集群搭建

Spark配置選項詳解

Spark Pi 任務提交運行

Spark客戶端搭建

06 Spark核心RDD

Spark編程核心RDD

SparkRDD原理及使用

RDD結構及注意點

RDD五大特性

RDD彈性原理

RDD分布式原理

RDD容錯原理

coalesce算子使用

zip,zipWithIndex使用

07 Spark 轉換算子

map算子使用

flatMap算子使用

filter算子使用

sample算子使用

reduceByKey算子使用

SortByKey算子使用

Join、union算子使用

Cogroup算子使用

distinct,使用

repartition算子使用

08 Spark行動算子

Foreach算子使用

Take算子使用

SaveAsTextFile使用

Count算子使用

Take算子使用

Collect算子使用

First算子使用

CountByKey使用

CountByValue使用

Reduce使用

09 Spark 持久化算子

持久化數據級別分類

持久化算子cache使用

Cache要點注意事項

持久化算子persist使用

Persist要點注意事項

持久化算子Checkpoint

Checkpoint執行流程

Checkpoint注意事項

Checkpoint使用優化

Spark任務提交參數詳解

10Spark任務提交方式及參數

Standalone-client模式原理

Standalone-client模式流程詳解

Standalone-cluster模式原理

Standalone-cluster模式流程詳解

Yarn-client模式原理

Yarn-client模式流程詳解

Yarn-cluster模式原理

Yarn-cluster模式流程詳解

Client模式提交命令和特點

Cluster模式提交命令和特點

11 Spark術語

Spark-ClusterManager

Spark-Driver

Spark-Master

Spark-Worker

Spark-Executor

Spark-線程池

Spark-Application

Spark-job

Spark-Stage

12 Spark計算模式

SparkRDD窄依賴

SparkRDD寬依賴

SparkStage切割劃分

SparkStage計算模式

Pipeline管道數據落地

Stage并行度劃分

提高Stage并行度方式

Spark-task

13 Spark任務調度

任務調度角色劃分

資源調度角色劃分

Spark資源調度過程

Spark任務調度過程

SparkDAG有向無環圖

粗粒度資源申請特點

細粒度資源申請特點

Spark推測執行機制

14 Spark任務提交案例

Spark pv,uv案例

Spark WordCount案例

Spark二次排序案例

Spark分組取topN案例

Spark分組取topN優化

Spark處理數據思路轉換

MasterHA高可用配置

MasterHA搭建注意點

15 Spark 高階應用

廣播變量及注意事項

累加器及注意事項

自定義累加器

版本對比變化

Spark-WebUI詳解

Spark日志查看

Pipeline計算模式驗證

歷史日志服務器配置

MasterHA高可用原理

16 Spark 核心之Shuffle

SparkShuffle概念

Spark-HashShuffle普通機制

Spark-HashShuffle優化機制

Spark-SortShuffle普通機制

Spark-SortShufflebypass機制

HashShuffle執行流程詳解

SortShuffle執行流程詳解

HashShuffle與SortShuffle對比

Shuffle文件尋址詳解

Spark oom問題處理

Spark統一內存管理劃分

17 SparkSQL初級

Shark原理分析

SparkSQL原理分析

SparkSQL演變過程

DataFrame與DataSet

SparkSQL數據源

SparkSQL底層架構

SparkSQL謂詞下推

Json格式數據轉DataSet

普通RDD和DataSet互操作

Parquet數據轉DataSet

Spark靜態內存管理劃分

18 SparkSQL高級

SparkSQL序列化問題

Hive On Spark原理

Spark On Hive原理

Spark On Hive配置詳解

SparkSQL DataSet存儲

SparkSQL之UDF

SparkSQL之UDAF

SparkSQL之over函數

JDBC數據轉DataSet

aS

KafkaTopic更改、刪除

19 SparkStreaming流式處理框架

SparkStreaming介紹

SparkStreaming&Strom

SparkStreaming接受數據原理

SparkStreaming之Dstream

SparkStreaming讀取Socket數據

foreachRDD算子使用

transform算子使用

updateStateByKey算子使用

window窗口操作

reduceByKeyAndWindow使用

DriverHA原理及搭建

20 Kafka分布式消息系統應用

Kafka分布式消息系統介紹

Kafka應用場景

Kafka生產消息原理

Kafka存儲消息原理

Kafka Topic、partition原理

Consumer消費消息原理

Kafka集群搭建

Kafka命令使用

Kafka消息系統特點

KafkaLeader均衡機制

Kafka版本更改對比

21 SparkStreaming+kafka整合

Receiver模式整合原理

Receiver模式問題及優化

Direct模式整合原理

Direct模式Api使用

WAL機制配置及使用

Receiver模式并行度設置

Direct模式并行度設置

無主架構模型

21 kafka整合

Direct模式offset管理

新版本Direct模式使用

新版本Direct模式對比

新版本Direct模式offset管理

SparkStreaming配置參數詳解

SparkStreaming反壓機制

Rdb 與aof類型

主從架構模型

22 Redis語法

Redis介紹

String1類型

String2類型

List1類型

List2類型

Set類型

Sorted set類型

Redis集群搭建

23 Storm流式計算

Storm應用場景

Storm架構模型

Storm框架介紹

Storm單詞統計練習

Storm分組策略

Storm分組實踐

Storm偽分布式安裝

24 Storm計算詳解

Storm異步與同步實時分析框架和實例

Storm全分布式

drpc實現

kafka 與storm

flume+kafka+storm

Storm容錯

Storm事務

Storm電信項目

第五階段
機器學習和算法

第五階段
機器學習和算法

第五階段
機器學習和算法

01 Python介紹及安裝

Python介紹

Python歷史

Python優缺點

Python應用場景

Python下載

Python安裝

Python ide安裝

Python helloworld

Python交互式窗口

Python注釋及亂碼

02 Python基礎知識

Python變量

Python類型

Python標識符

Python關鍵字

Python輸入

Python輸出

Python運算符

Python分支結構

Python input陷阱

Python 循環結構

03 Python集合類型

字符串

列表

元組

字典

可變類型

不可變類型

集合的迭代

集合排序

集合嵌套

04 Python函數

Python函數介紹

函數的定義與調用

Python參數

Python返回值

Python遞歸函數

Python匿名函數

高階函數

高階函數和遞歸計算

斐波拉契數列

05 Python文件操作

Python文件的打開與關閉

Python的讀寫

Python的定位讀寫

Python文件操作

Os模塊

文件批量處理

Mp3音樂播放

文件批量處理

06 Python類與對象

面向對象編程介紹

類與對象

定義類與創建對象

Self

保護對象的屬性

繼承

多繼承

多態

類屬性與實例屬性

類方法與靜態方法

07設計模式與異常

單例模式

工廠模式

異常簡介

異常捕獲

異常的傳遞

自定義異常

異常處理中排除異常

異常的分類

08 Python模塊及數據庫操作

模塊的使用與安裝

模塊制作

Python中的模塊

模塊的發布

模塊安裝及使用

Python連接mysql

Python查詢數據庫

數據API

API的封裝

09 Numpy庫

numpy介紹

numpy特點

numpy安裝

numpy基礎

矩陣的創建

矩陣的屬性

矩陣的基本運算

矩陣的常用函數

矩陣的切片

矩陣的索引

10 機器學習基礎

PySpark基礎配置

Python開發工具配置

PySpark運行開發原理

Python模塊安裝方式

機器學習數學基礎

線性回歸原理

梯度下降迭代確定模型

多元線性回歸原理

參數優化

模型過擬合問題

11 機器學習算法一

貝葉斯分類算法

貝葉斯概率分類原理

貝葉斯公式推廣

拉普拉斯估計原理

模型保存

KNN算法原理

KNN問題

機器學習中的歸一化

距離度量方式

Kmeans聚類算法原理

12 機器學習算法二

Kmens++算法

K值的選擇策略

TF-IDF原理

邏輯回顧分類算法原理

傅里葉變化

最大似然估計思想

邏輯回歸構造損失函數

邏輯回顧損失函數公式推導

邏輯回歸歸一化

混淆矩陣

13 機器學習算法三

推薦系統原理

推薦系統架構

lambda架構處理數據

實時和離線場景應用

ML下python在Hive中應用

dubbo使用zookeeper協調應用

dubbo服務提供端原理

dubbo服務消費端原理

dubbo在推薦系統中應用

實時在線推薦app

14 機器學習案例

垃圾郵件分類案例

數據點基于貝葉斯分類案例

手動實現KNN算法

數據點基于KNN算法分類

數據點Kmeans聚類案例

14 機器學習案例

基于Python的KMeans可視化

微博聚類案例

音樂分類案例

道路擁堵預測案例

推薦系統

第六階段
平臺架構師課程體系

第六階段
平臺架構師課程體系

第六階段
平臺架構師課程體系

01 Hive優化

hive優化思想

hive查詢計劃

hive本地模式

hive并行計算

hive嚴格模式

hive排序

hive map join

hive大表join

02 Hive優化

hive合并小文件

hive map與reduce個數

hive-jvm重用

Hive數據傾斜

Hive腳本編程

Hive腳本執行架構

Hive的任務的監控

hive map-side聚合

03 hbase優化

預分區

Rowkey設計

列族個數

Compact合并優化

Split優化

多htable并發寫

Htable參數設置

批量寫

04 hbase優化

多htable并發讀

批量讀

多線程并發讀

緩存查詢結果

Blockcache

Htablepool

Hbase索引

多線程并發寫

05 Spark核心源碼分析

Spark-pipeline iter 源碼分析

map源碼分析

flatMap源碼分析

reduceByKey源碼分析

combineByKey源碼分析

aggregateByKey源碼分析

sortByKey源碼分析

repartition源碼分析

06 Spark核心源碼分析

Spark-Master啟動源碼分析

Spark-Worker啟動源碼分析

Spark-Driver啟動源碼分析

Spark-Application注冊源碼分析

Spark-Executor啟動源碼分析

Spark-資源調度源碼分析

Spark-任務調度源碼分析

Spark-Shuffle-Write源碼分析

Spark-Shuffle-Read源碼分析

Spark數據傾斜不同解決方案

07 Spark優化

Spark分配更多的資源

Spark并行度調優

Spark 代碼調優

Spark 算子選擇使用

Spark 自定義分區器

Spark數據結構優化

Spark數據本地化調優

Spark內存調優

Spark對外內存調優

SparkShuffle調優

08 機器學習優化

有無截距

線性不可分問題

調整分類域值

魯棒性調優

歸一化數據

均值歸一化

邏輯回歸訓練方法選擇

機器學習中python腳本優化

09 Kylin介紹及架構

kylin的背景介紹

kylin的應用場景

kylin的發展歷史

kylin的工作原理

kylin的體系架構

kylin的核心,cube構建

kylin的sql查詢原理

kylin的特性和生態圈

kylin事實表

kylin維度表

10 kylin的安裝與部署

kylin的下載

kylin的安裝準備

kylin的部署方式

kylin安裝部署

KyLin和Hive

KyLin和hbase

KyLin和Zookeeper

OLAP分類

星型模型

雪花模型

11 kylin的使用及訪問方式

simple cube描述

cube構建

kylin的視圖

kylin的元數據存儲

kylin JDBC訪問方式

kylin rest方式

12 Flink流式處理框架一

Flink架構原理

Flink與Storm的區別

Flink與SparkStreaming的區別

Flink編程模型抽象層次

Flink無界數據流

Flink有界數據流

Flink程序和數據流

13 Flink流式處理框架二

窗口和時間

有狀態算子操作

容錯檢查點原理

Flink任務和算子鏈

Flink-TaskManager

Flink-JobManager

14 Flink流式處理框架三

Flink-DataStream Api操作

Flink與Kafka整合

基于本地模型部署Flink

基于Yarn模式部署Flink

TableApi 及SQL查詢使用

網頁排名案例實現

15 Flink流式處理框架四

數據類型和序列化

Flink高可用

Flink狀態和容錯

Flink保存點

Flink下載安裝使用

任務槽和資源

尚學堂大數據變態管理模式

完備的教學體系,為學員提供個性化輔導方案+數字化教學資源

管理體系

從心出發,助你學習、求職、晉升一路順暢!

學習氛圍濃厚
每日晚自習
360度生活照顧
定期末位輔導
就業指導服務
教學反饋系統
教學保障系統
學習測試系統
學習任務手冊
在線作業系統
綜合能力評定
我要高薪 >>

領取機器學習數據(100課時) 平臺架構師(140課時)
大數據174.35G視頻

  • 北京校區
  • 山西校區
  • 鄭州校區
  • 武漢校區
  • 四川校區
  • 長沙校區
  • 深圳校區
  • 上海校區
  • 廣州校區
  • 保定招生辦

北京京南校區:北京亦莊經濟開發區科創十四街6號院1號樓 賽蒂國際工業園
北京海淀區校區:北京市海淀區西三旗街道建材城西路中騰建華商務大廈東側二層尚學堂
咨詢電話:400-009-1906 / 010-56233821
面授課程:?JavaEE+微服務+大數據? ???大數據+機器學習+平臺架構?????Python+數據分析+機器學習??人工智能+模式識別+強化學習???WEB前端+移動端+服務端渲染

 

山西學區地址:山西省晉中市榆次區大學城大學生活廣場萬科商業A1座702

鄭州學區地址:河南電子商務產業園6號樓4層407
咨詢電話:0371-55177956

武漢學區地址:武漢市東湖高新區光谷金融港B22棟11樓
咨詢電話:027-87989193

四川學區地址:成都市高新區錦暉西一街99號布魯明頓大廈2棟1003室
咨詢電話:028-65176856 / 13880900114

網址:http://www.cssxt.com/
咨詢電話:0731-83072091

深圳校區地址:深圳市寶安區航城街道航城大道航城創新創業園A4棟210(固戍地鐵站C出口)
咨詢電話:0755-23061965 / 18898413781

上海尚學堂校區地址:上海市浦東新區城豐路650號
咨詢電話:021-67690939

廣州校區地址:廣州市天河區元崗橫路31號慧通產業廣場B區B1棟6樓尚學堂(地鐵3號線或6號線到“天河客運站”D出口,右拐直走約800米)
咨詢電話:020-2989 6995

保定招生辦公室

地址:河北省保定市競秀區朝陽南大街777號鴻悅國際1101室

電話:15132423123

Copyright 2006-2019 北京尚學堂科技有限公司  京ICP備13018289號-19  京公網安備11010802015183  
媒體聯系:18610174079 閆老師  
广东36选7福利彩