-
>
決戰(zhàn)行測5000題(言語理解與表達(dá))
-
>
軟件性能測試.分析與調(diào)優(yōu)實踐之路
-
>
第一行代碼Android
-
>
深度學(xué)習(xí)
-
>
Unreal Engine 4藍(lán)圖完全學(xué)習(xí)教程
-
>
深入理解計算機系統(tǒng)-原書第3版
-
>
Word/Excel PPT 2013辦公應(yīng)用從入門到精通-(附贈1DVD.含語音視頻教學(xué)+辦公模板+PDF電子書)
高等學(xué)校信息管理學(xué)專業(yè)系列教材大數(shù)據(jù)處理:從采集到可視化 版權(quán)信息
- ISBN:9787307215146
- 條形碼:9787307215146 ; 978-7-307-21514-6
- 裝幀:一般膠版紙
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>
高等學(xué)校信息管理學(xué)專業(yè)系列教材大數(shù)據(jù)處理:從采集到可視化 內(nèi)容簡介
本書共分為9章,章數(shù)據(jù)采集,主要介紹了大數(shù)據(jù)的概念、類型及其特征,常見的數(shù)據(jù)采集方法;第2章數(shù)據(jù)清洗,主要討論數(shù)據(jù)質(zhì)量的維度,數(shù)據(jù)可能存在的質(zhì)量問題,常見的數(shù)據(jù)清洗方法;第3章數(shù)據(jù)ETL,重點介紹了MGO方法;第4章數(shù)據(jù)存儲,主要介紹了大數(shù)據(jù)時代的一些主流數(shù)據(jù)存儲平臺和相關(guān)技術(shù);第5章回歸算法,主要介紹了線性回歸、決策樹回歸、隨機森林回歸等,并介紹了其實現(xiàn)的主要步驟以及相應(yīng)的Python語言實現(xiàn)代碼;第6章分類算法,主要介紹了邏輯回歸二分類和多分類、度提升分類樹等;第7章聚類算法,主要介紹了分割聚類、層次聚類、基于密度的聚類;第8章推薦算法,主要介紹了基于關(guān)聯(lián)規(guī)則的推薦、基于內(nèi)容過濾的推薦等主流方法;第9章數(shù)據(jù)可視化的關(guān)鍵技術(shù),主要介紹了數(shù)據(jù)的降維、可視化隱喻及相關(guān)的交互技術(shù)。
高等學(xué)校信息管理學(xué)專業(yè)系列教材大數(shù)據(jù)處理:從采集到可視化 目錄
1.1 大數(shù)據(jù)概念
1.2 大數(shù)據(jù)類型及特征
1.3 數(shù)據(jù)采集方法
1.3.1 問卷調(diào)查方法
1.3.2 網(wǎng)絡(luò)用戶數(shù)據(jù)收集方法
1.3.3 系統(tǒng)曰志采集方法
1.3.4 網(wǎng)絡(luò)數(shù)據(jù)采集方法
第2章 數(shù)據(jù)清洗
2.1 數(shù)據(jù)質(zhì)量維度
2.2 數(shù)據(jù)預(yù)處理之?dāng)?shù)據(jù)可能存在的問題
2.3 數(shù)據(jù)質(zhì)量問題的原因分析
2.3.1 數(shù)據(jù)源數(shù)據(jù)質(zhì)量問題的原因分析
2.3.2 數(shù)據(jù)分析階段數(shù)據(jù)質(zhì)量問題的原因分析
2.4 數(shù)據(jù)預(yù)處理之?dāng)?shù)據(jù)問題處理方法
2.4.1 變化量識別
2.4.2 錯誤拒絕
2.4.3 列清洗
2.4.4 行過濾
2.5 記錄匹配算法
……
高等學(xué)校信息管理學(xué)專業(yè)系列教材大數(shù)據(jù)處理:從采集到可視化 作者簡介
余肖生,博士,教授,三峽大學(xué)計算機學(xué)院教授,計算機學(xué)系書記,畢業(yè)于武漢大學(xué)信息管理學(xué)院。近年來發(fā)表各類學(xué)術(shù)論文30余篇,其中CSSCI源刊論文10余篇,多篇論文被EI、CPCI收錄。
- >
【精裝繪本】畫給孩子的中國神話
- >
我與地壇
- >
回憶愛瑪儂
- >
苦雨齋序跋文-周作人自編集
- >
巴金-再思錄
- >
名家?guī)阕x魯迅:朝花夕拾
- >
人文閱讀與收藏·良友文學(xué)叢書:一天的工作
- >
上帝之肋:男人的真實旅程