書馨卡幫你省薪 2024個人購書報告 2024中圖網(wǎng)年度報告
歡迎光臨中圖網(wǎng) 請 | 注冊
> >
高等學(xué)校信息管理學(xué)專業(yè)系列教材大數(shù)據(jù)處理:從采集到可視化

高等學(xué)校信息管理學(xué)專業(yè)系列教材大數(shù)據(jù)處理:從采集到可視化

出版社:武漢大學(xué)出版社出版時間:2020-07-01
開本: 其他 頁數(shù): 215
中 圖 價:¥30.4(8.0折) 定價  ¥38.0 登錄后可看到會員價
加入購物車 收藏
運費6元,滿39元免運費
?新疆、西藏除外
本類五星書更多>

高等學(xué)校信息管理學(xué)專業(yè)系列教材大數(shù)據(jù)處理:從采集到可視化 版權(quán)信息

高等學(xué)校信息管理學(xué)專業(yè)系列教材大數(shù)據(jù)處理:從采集到可視化 內(nèi)容簡介

本書共分為9章,章數(shù)據(jù)采集,主要介紹了大數(shù)據(jù)的概念、類型及其特征,常見的數(shù)據(jù)采集方法;第2章數(shù)據(jù)清洗,主要討論數(shù)據(jù)質(zhì)量的維度,數(shù)據(jù)可能存在的質(zhì)量問題,常見的數(shù)據(jù)清洗方法;第3章數(shù)據(jù)ETL,重點介紹了MGO方法;第4章數(shù)據(jù)存儲,主要介紹了大數(shù)據(jù)時代的一些主流數(shù)據(jù)存儲平臺和相關(guān)技術(shù);第5章回歸算法,主要介紹了線性回歸、決策樹回歸、隨機森林回歸等,并介紹了其實現(xiàn)的主要步驟以及相應(yīng)的Python語言實現(xiàn)代碼;第6章分類算法,主要介紹了邏輯回歸二分類和多分類、度提升分類樹等;第7章聚類算法,主要介紹了分割聚類、層次聚類、基于密度的聚類;第8章推薦算法,主要介紹了基于關(guān)聯(lián)規(guī)則的推薦、基于內(nèi)容過濾的推薦等主流方法;第9章數(shù)據(jù)可視化的關(guān)鍵技術(shù),主要介紹了數(shù)據(jù)的降維、可視化隱喻及相關(guān)的交互技術(shù)。

高等學(xué)校信息管理學(xué)專業(yè)系列教材大數(shù)據(jù)處理:從采集到可視化 目錄

第1章 數(shù)據(jù)采集
1.1 大數(shù)據(jù)概念
1.2 大數(shù)據(jù)類型及特征
1.3 數(shù)據(jù)采集方法
1.3.1 問卷調(diào)查方法
1.3.2 網(wǎng)絡(luò)用戶數(shù)據(jù)收集方法
1.3.3 系統(tǒng)曰志采集方法
1.3.4 網(wǎng)絡(luò)數(shù)據(jù)采集方法

第2章 數(shù)據(jù)清洗
2.1 數(shù)據(jù)質(zhì)量維度
2.2 數(shù)據(jù)預(yù)處理之?dāng)?shù)據(jù)可能存在的問題
2.3 數(shù)據(jù)質(zhì)量問題的原因分析
2.3.1 數(shù)據(jù)源數(shù)據(jù)質(zhì)量問題的原因分析
2.3.2 數(shù)據(jù)分析階段數(shù)據(jù)質(zhì)量問題的原因分析
2.4 數(shù)據(jù)預(yù)處理之?dāng)?shù)據(jù)問題處理方法
2.4.1 變化量識別
2.4.2 錯誤拒絕
2.4.3 列清洗
2.4.4 行過濾
2.5 記錄匹配算法
……
展開全部

高等學(xué)校信息管理學(xué)專業(yè)系列教材大數(shù)據(jù)處理:從采集到可視化 作者簡介

余肖生,博士,教授,三峽大學(xué)計算機學(xué)院教授,計算機學(xué)系書記,畢業(yè)于武漢大學(xué)信息管理學(xué)院。近年來發(fā)表各類學(xué)術(shù)論文30余篇,其中CSSCI源刊論文10余篇,多篇論文被EI、CPCI收錄。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網(wǎng)
在線客服