你的位置: 首頁 > 公開課首頁 > 職業技能 > 課程詳情

details

大數據分析與可視化技術應用實戰

暫無評價   
  • 開課時間:2019年07月26日 09:00 周五 已結束
  • 結束時間:2019年07月29日 17:00 周一
  • 開課地點:青島市
  • 授課講師: 謝老師
  • 課程編號:386091
  • 課程分類:職業技能
  •  
  • 收藏 人氣:33
你實際購買的價格
付款時最多可用0淘幣抵扣0元現金
購買成功后,系統會給用戶帳號返回的現金券
淘課價格
5800
可用淘幣
0
返現金券
待定

你還可以: 收藏

課程大綱:

課程詳情

第一天

上午數據分析基礎及實戰

第一講 R語言基礎

■講解R語言背景、國內發展狀況、基礎語法、數據結構及繪圖操作等內容。特別針對向量計算這塊,著重介紹R語言在這方面的優勢及用法。



第二講 統計分析基礎

■講解統計分析基礎,包括統計學基本概念,假設檢驗,置信區間等基礎,并結合數據案例說明其使用場景和運用方法。介紹數據分析流程和常見分析思路,并結合R語言案例進行講解。



第三講 R語言數據處理基礎

■從數據接入、數據統計、數據轉換等幾個方面進行講解。數據接入包含接入mysql、oracle、hadoop等常見數據庫操作;數據統計包含dplyr包、data.table等包的具體用法和講解;數據轉換包含R語言常用的apply族、reshape包、tidyr等包的具體用法和案例講解。

第一天

下午數據挖掘理論及核心技術第四講 數據挖掘基礎

■講解數據挖掘基本概念,細致講解業務理解、數據理解、數據準備、建立模型、模型評估、模型部署各環節的工作內容及相關技術;結合業界經典場景,講解數據挖掘的實施流程和方法體系。



第五講 數據挖掘核心技術

■細致講解抽樣、分區、樣本平衡、特征選擇、訓練模型、評估模型等數據挖掘核心技術原理,并結合案例講解其具體實現和用法。尤其針對樣本平衡,重點講解人工合成、代價敏感等算法;針對特征選擇,重點講解特征選擇的核心思路,并結合常見的R語言包進行案例演示。



第六講 R語言數據挖掘工具

■講解Rattle數據挖掘工具的用法,包括各項功能的具體使用;講解Microsoft R Server工具的具體用法和操作。

第二天

上午數據挖掘算法原理及實現第七講 特征降維算法及R語言實現

■講解主成分及因子分析原理,并結合案例進行R語言實現。



第八講 關聯規則算法及R語言實現

■講解Apriori關聯規則算法原理,并結合案例進行R語言實現。



第九講 決策樹算法及R語言實現

■講解ID3、C4.5、C5.0以及CART決策樹算法的實現原理,并結合案例進行R語言實現。



第十講 聚類算法及R語言實現

■講解kmeans、系統聚類算法原理,并結合R語言進行案例講解。

第二天

下午數據挖掘建模實戰

第十一講 基于乳腺癌數據進行降維分析并建立分類模型

■實戰部分:基于乳腺癌數據進行降維處理,并嘗試建立分類評估模型。旨在通過該模型,并潛在的乳腺癌患者進行識別。



第十二講 基于在線零售數據建立關聯規則模型

■實戰部分:基于在線零售數據,經過一定的處理,對該數據進行關聯規則建模,旨在從此數據中挖掘出潛在的規則,對業務運營進行指導決策。



第十三講 Lending Club信貸違約分析案例

■實戰部分:基于Lending Club信貸違約數據,嘗試從多個不同的維度進行數據分析,旨在發現一些有價值的信息,同時基于該數據,經過一定的處理,建立信貸違約識別模型,旨在對信貸業務辦理提供模型支持,降低違約風險。



第十四講 航空公司客戶分群案例

■實戰部分:基于航空公司的業務訴求,結合歷史乘客數據,建立客戶分群模型,旨在對客戶進行差異化營銷活動,提高客戶粘性和價值轉化。

第三天

上午R語言應用實戰(一)

第十五講 R語言與自然語言處理原理及案例

■講解自然語言處理基本概念和技法,包含分詞、關鍵字提取、文摘提取、文本分類、主題模型、word2vec等內容。并使用R語言進行案例講解。



第十六講 R語言網絡爬蟲及案例

■講解爬蟲實現的基本原理,并介紹XML包、rvest包、jsonlite、RSelenium的使用,同時結合真實案例進行演示。



第十七講 社交關系圖分析及R語言案例

■講解社交關系圖分析的基本原理和使用場景,介紹R語言igraph、d3Network、visNetwork包的用法,此外,介紹neo4j數據庫,并結合RNeo4j包進行講解,通過具體的案例,講解社交關系圖的構建和具體實現過程。

第三天

下午R語言應用實戰(二)

第十八講 數據分析圖表及R語言案例

■講解常用的數據分析圖表及其使用場景,同時結合R語言lattice包、ggplot2、recharts等包進行案例講解。



第十九講 使用R Markdown編寫數據分析報告

■講解使用R Markdown編寫數據分析報告的具體方法,并結合案例講解其用法。



第二十講 R語言shiny可視化開發實戰

■介紹R語言shiny的UI、Server、Reactivity、控件等內容,同時講解一個用shiny實現數據分析功能(兼圖表)的實際案例,搭建服務器,在企業內部實現輕量級數據分析應用。

第四天學習考核與業內經驗交流

講師介紹

游老師,( )資深講師。 計算機碩士,大數據分析、挖掘、可視化專家,高級培訓講師,曾服務于華為技術有限公司等多家企業,專注于機器學習、數據挖掘、大數據、知識圖譜等領域的研究、設計與實現,在互聯網、電信、電力、軍工等行業具有豐富的工程實踐經驗,對空間分析、欺詐檢測、廣告反作弊、推薦系統、客戶畫像、客戶營銷建模、知識抽取、智能問答、可視化分析、預測分析、系統架構、大數據端到端解決方案等方面具有深刻理解,多次作為R語言會議重要嘉賓出席會議并發表主題演講,著有《R語言預測實戰》等多本書籍。


謝老師,( )資深講師。某集團上市公司數據分析部負責人,主要利用R語言進行大數據的挖掘和可視化工作。從事數據挖掘建模工作已有10年,曾經從事過咨詢、電商、金融、電購、電力、游戲等行業,了解不同領域的數據特點。有豐富的利用R語言進行數據挖掘實戰經驗,部分研究成果曾獲得國家專利。


趙老師,( )資深講師。計算機博士,目前主要研究方向包括電子推薦、智能決策和大數據分析等。主持國家自然科學基金2項、中國博士后科研基金、上海市浦江人才、IBM Shared University Research以及多項企業合作課題等項目。已在《管理科學學報》、《系統工程學報》、Knowledge and Information Systems ,Information Processing Management,Information Systems Frontiers等國內外刊物和學術會議發表論文90多篇,其中被SCI、EI收錄40多篇。出版著作和教材《智能化的流程管理》、《客戶智能》、《商務智能(第四版)》、《商務智能 數據分析的管理視角(第三版)》、《數據挖掘實用案例集》等多部。


張老師,( )資深講師。天津大學軟件工程碩士,10多年的IT領域相關技術研究和項目開發工作,在長期軟件領域工作過程中,對軟件企業運作模式有深入研究,熟悉軟件質量保障標準ISO9003和軟件過程改進模型CMM/CMMI,在具體項目實施過程中總結經驗,有深刻認識。通曉多種軟件設計和開發工具。對軟件開發整個流程非常熟悉,能根據項目特點定制具體軟件過程,并進行項目管理和監控,有很強的軟件項目組織管理能力。對C/C++ 、HTML 5、python、Hadoop、java、java EE、android、IOS、大數據、云計算有比較深入的理解和應用,具有較強的移動互聯網應用需求分析和系統設計能力,熟悉Android框架、IOS框架等技術,了解各種設計模式,能在具體項目中靈活運用。


本課程名稱: 大數據分析與可視化技術應用實戰

查看更多:職業技能公開課

數據分析 統計分析 相關的最新課程
講師動態評分 與同行相比

授課內容與課綱相符00%

講師授課水平00%

服務態度00%

陕西11选5开奖