機(jī)器學(xué)習(xí)大數(shù)據(jù)平臺的構(gòu)建、任務(wù)實(shí)現(xiàn)與數(shù)據(jù)治理——使用AZURE、DEVOPS、MLOPS
-
>
決戰(zhàn)行測5000題(言語理解與表達(dá))
-
>
軟件性能測試.分析與調(diào)優(yōu)實(shí)踐之路
-
>
第一行代碼Android
-
>
深度學(xué)習(xí)
-
>
Unreal Engine 4藍(lán)圖完全學(xué)習(xí)教程
-
>
深入理解計算機(jī)系統(tǒng)-原書第3版
-
>
Word/Excel PPT 2013辦公應(yīng)用從入門到精通-(附贈1DVD.含語音視頻教學(xué)+辦公模板+PDF電子書)
機(jī)器學(xué)習(xí)大數(shù)據(jù)平臺的構(gòu)建、任務(wù)實(shí)現(xiàn)與數(shù)據(jù)治理——使用AZURE、DEVOPS、MLOPS 版權(quán)信息
- ISBN:9787302657637
- 條形碼:9787302657637 ; 978-7-302-65763-7
- 裝幀:平裝-鎖線膠訂
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>>
機(jī)器學(xué)習(xí)大數(shù)據(jù)平臺的構(gòu)建、任務(wù)實(shí)現(xiàn)與數(shù)據(jù)治理——使用AZURE、DEVOPS、MLOPS 本書特色
機(jī)器學(xué)習(xí)大數(shù)據(jù)平臺的構(gòu)建、任務(wù)實(shí)現(xiàn)與數(shù)據(jù)治理
你需要構(gòu)建安全、穩(wěn)定的數(shù)據(jù)平臺,需要可以擴(kuò)展到任何規(guī)模的工作負(fù)載。當(dāng)項(xiàng)目從實(shí)驗(yàn)室進(jìn)入生產(chǎn)環(huán)境時,你需要確信它可以應(yīng)對現(xiàn)實(shí)工作中的挑戰(zhàn)。本書能夠幫助你實(shí)現(xiàn)這些需求,將講述如何設(shè)計和實(shí)現(xiàn)基于云的、可以輕松監(jiān)控、擴(kuò)展和修改的數(shù)據(jù)基礎(chǔ)設(shè)施。
通過本書,你將學(xué)到構(gòu)建和維護(hù)大型企業(yè)大數(shù)據(jù)平臺所需的技能。書中包括設(shè)置基礎(chǔ)設(shè)施、編排、工作負(fù)載和治理,寫作風(fēng)格清晰、實(shí)用。在學(xué)習(xí)過程中,你將建立高效的機(jī)器學(xué)習(xí)管道,然后掌握省時的自動化和DevOps解決方案。書中基于Azure的示例很容易在其他云平臺上實(shí)現(xiàn)。
機(jī)器學(xué)習(xí)大數(shù)據(jù)平臺的構(gòu)建、任務(wù)實(shí)現(xiàn)與數(shù)據(jù)治理——使用AZURE、DEVOPS、MLOPS 內(nèi)容簡介
主要內(nèi)容 ● 數(shù)據(jù)字典和數(shù)據(jù)治理 ● 數(shù)據(jù)質(zhì)量管控、合規(guī)和分發(fā) ● 構(gòu)建自動化管道以提高可靠性 ● 數(shù)據(jù)攝取、存儲和分發(fā) ● 支持生產(chǎn)環(huán)境中的數(shù)據(jù)建模、分析和機(jī)器學(xué)習(xí)
機(jī)器學(xué)習(xí)大數(shù)據(jù)平臺的構(gòu)建、任務(wù)實(shí)現(xiàn)與數(shù)據(jù)治理——使用AZURE、DEVOPS、MLOPS 目錄
1.1 什么是數(shù)據(jù)工程 2
1.2 本書讀者對象 3
1.3 什么是數(shù)據(jù)平臺 3
1.3.1 數(shù)據(jù)平臺的構(gòu)成 4
1.3.2 基礎(chǔ)設(shè)施即代碼,無代碼基礎(chǔ)設(shè)施 6
1.4 使用云構(gòu)建 7
1.4.1 IaaS、PaaS 和SaaS 7
1.4.2 網(wǎng)絡(luò)、存儲和計算 7
1.4.3 如何使用Azure 8
1.4.4 與Azure 交互 8
1.5 實(shí)現(xiàn)Azure 數(shù)據(jù)平臺 11
1.6 本章小結(jié) 13
第Ⅰ部分 基礎(chǔ)設(shè)施
第2 章 存儲 17
2.1 在數(shù)據(jù)平臺中存儲數(shù)據(jù) 18
2.1.1 跨多個數(shù)據(jù)織物存儲數(shù)據(jù) 19
2.1.2 SSOT 20
2.2 Azure Data Explorer簡介 22
2.2.1 部署Azure Data Explorer集群 23
2.2.2 使用Azure Data Explorer 26
2.2.3 解決查詢限制問題 29
2.3 Azure Data Lake Storage簡介 30
2.3.1 創(chuàng)建Azure Data Lake Storage 賬戶 30
2.3.2 使用Azure Data Lake Storage 31
2.3.3 集成Azure Data Explorer 32
2.4 數(shù)據(jù)攝取 34
2.4.1 數(shù)據(jù)攝取頻率 34
2.4.2 加載類型 36
2.4.3 數(shù)據(jù)重建和重新加載 38
2.5 本章小結(jié) 41
第3 章 DevOps 43
3.1 什么是DevOps 44
3.2 Azure DevOps 簡介 47
3.3 部署基礎(chǔ)設(shè)施 50
3.3.1 導(dǎo)出Azure Resource Manager 模板 51
3.3.2 創(chuàng)建Azure DevOps 服務(wù)連接 54
3.3.3 部署Azure Resource Manager 模板 56
3.3.4 理解Azure Pipelines 60
3.4 部署Azure Data Explorer對象和分析 61
3.4.1 使用Azure DevOps 市場擴(kuò)展 63
3.4.2 將所有內(nèi)容都存儲在Git并自動部署所有內(nèi)容 67
3.5 本章小結(jié) 68
第4 章 編排 69
4.1 導(dǎo)入Bing COVID-19 開放數(shù)據(jù)集 70
4.2 Azure Data Factory 簡介 72
4.2.1 設(shè)置數(shù)據(jù)源 73
4.2.2 設(shè)置數(shù)據(jù)接收器 75
4.2.3 設(shè)置管道 79
4.2.4 設(shè)置觸發(fā)器 82
4.2.5 使用Azure Data Factory進(jìn)行編排 84
4.3 Azure Data Factory 的DevOps 84
4.3.1 從Git 部署Azure Data Factory 87
4.3.2 設(shè)置訪問控制 88
4.3.3 部署生產(chǎn)環(huán)境的Azure Data Factory 90
4.3.4 小結(jié) 92
4.4 使用Azure Monitor 進(jìn)行監(jiān)控 93
4.5 本章小結(jié) 95
第Ⅱ部分 具體的工作任務(wù)
第5 章 數(shù)據(jù)處理 99
5.1 數(shù)據(jù)建模技術(shù) 100
5.1.1 規(guī)范化和反規(guī)范化 100
5.1.2 數(shù)據(jù)倉庫 103
5.1.3 半結(jié)構(gòu)化數(shù)據(jù) 104
5.1.4 小結(jié) 107
5.2 身份鑰匙環(huán) 108
5.2.1 構(gòu)建身份鑰匙環(huán) 109
5.2.2 理解鑰匙環(huán) 111
5.3 時間線 113
5.3.1 構(gòu)建時間線視圖 113
5.3.2 使用時間線 115
5.4 應(yīng)用DevOps 以保證數(shù)據(jù)處理能夠按計劃可靠地運(yùn)行 116
5.4.1 使用Git 追蹤和處理函數(shù) 116
5.4.2 使用Azure Data Factory構(gòu)建鑰匙環(huán) 117
5.4.3 擴(kuò)展規(guī)模 123
5.5 本章小結(jié) 127
第6 章 數(shù)據(jù)分析 129
6.1 開發(fā)環(huán)境和生產(chǎn)環(huán)境分離下如何訪問數(shù)據(jù) 130
6.1.1 對生產(chǎn)數(shù)據(jù)處理后再部分復(fù)制到開發(fā)環(huán)境 132
6.1.2 將生產(chǎn)數(shù)據(jù)完全復(fù)制到開發(fā)環(huán)境 133
6.1.3 在開發(fā)環(huán)境中提供生產(chǎn)數(shù)據(jù)的只讀視圖 133
6.1.4 小結(jié) 135
6.2 設(shè)計數(shù)據(jù)分析的工作流程 136
6.2.1 原型 138
6.2.2 開發(fā)和用戶驗(yàn)收測試 139
6.2.3 生產(chǎn)環(huán)境 141
6.2.4 小結(jié) 143
6.3 讓數(shù)據(jù)科學(xué)家能夠自助移動數(shù)據(jù) 144
6.3.1 基本原則和相關(guān)背景 145
6.3.2 數(shù)據(jù)合約 145
6.3.3 管道驗(yàn)證 146
6.3.4 事后分析 150
6.3.5 小結(jié) 151
6.4 本章小結(jié) 151
第7 章 機(jī)器學(xué)習(xí) 153
7.1 訓(xùn)練一個機(jī)器學(xué)習(xí)模型 154
7.1.1 使用scikit-learn訓(xùn)練模型 155
7.1.2 高消費(fèi)者模型實(shí)現(xiàn) 156
7.2 引入Azure Machine Learning 158
7.2.1 創(chuàng)建工作區(qū) 158
7.2.2 創(chuàng)建Azure Machine Learning 計算目標(biāo) 159
7.2.3 設(shè)置Azure Machine Learning 存儲 160
7.2.4 在云中運(yùn)行機(jī)器學(xué)習(xí) 162
7.2.5 小結(jié) 167
7.3 MLOps 167
7.3.1 從Git 部署 168
7.3.2 存儲管道ID 171
7.3.3 小結(jié) 172
7.4 機(jī)器學(xué)習(xí)的編排 172
7.4.1 連接Azure Data Factory與Azure Machine Learning 173
7.4.2 機(jī)器學(xué)習(xí)編排 175
7.4.3 小結(jié) 178
7.5 本章小結(jié) 179
第Ⅲ部分 數(shù)據(jù)治理
第8 章 元數(shù)據(jù) 183
8.1 理解大數(shù)據(jù)平臺中元數(shù)據(jù)的需求 184
8.2 介紹Azure Purview 186
8.3 維護(hù)數(shù)據(jù)字典 190
8.3.1 設(shè)置掃描 190
8.3.2 瀏覽數(shù)據(jù)字典 194
8.3.3 小結(jié) 195
8.4 管理數(shù)據(jù)術(shù)語表 196
8.4.1 添加新的術(shù)語 196
8.4.2 審查術(shù)語 198
8.4.3 自定義模板和批量
導(dǎo)入 198
8.4.4 小結(jié) 200
8.5 了解Azure Purview 的高級功能 200
8.5.1 追蹤數(shù)據(jù)血緣 200
8.5.2 分類規(guī)則 201
8.5.3 REST API 203
8.5.4 小結(jié) 204
8.6 本章小結(jié) 204
第9 章 數(shù)據(jù)質(zhì)量 207
9.1 數(shù)據(jù)測試概述 207
9.1.1 可用性測試 208
9.1.2 正確性測試 209
9.1.3 完整性測試 210
9.1.4 異常檢測測試 212
9.1.5 小結(jié) 214
9.2 使用Azure Data Factory進(jìn)行數(shù)據(jù)質(zhì)量檢查 214
9.2.1 使用Azure Data Factory進(jìn)行測試 215
9.2.2 執(zhí)行測試 218
9.2.3 創(chuàng)建和使用模板 219
9.2.4 小結(jié) 221
9.3 擴(kuò)展數(shù)據(jù)測試 221
9.3.1 支持多個數(shù)據(jù)平臺 221
9.3.2 按計劃運(yùn)行測試和觸發(fā)運(yùn)行測試 223
9.3.3 編寫測試 224
9.3.4 存儲測試定義和結(jié)果 228
9.4 本章小結(jié) 231
第10 章 合規(guī) 233
10.1 數(shù)據(jù)分類 234
10.1.1 特征數(shù)據(jù) 234
10.1.2 遙測數(shù)據(jù) 235
10.1.3 用戶數(shù)據(jù) 235
10.1.4 用戶擁有的數(shù)據(jù) 236
10.1.5 業(yè)務(wù)數(shù)據(jù) 236
10.1.6 小結(jié) 236
10.2 將敏感數(shù)據(jù)變得不那么敏感 237
10.2.1 聚合 238
10.2.2 匿名化 239
10.2.3 偽匿名化 242
10.2.4 數(shù)據(jù)掩碼 246
10.2.5 小結(jié) 246
10.3 訪問控制模型 247
10.3.1 安全組 248
10.3.2 保護(hù)Azure Data Explorer 250
10.3.3 小結(jié) 255
10.4 GDPR 和其他考慮因素 256
10.4.1 數(shù)據(jù)處理 256
10.4.2 數(shù)據(jù)主體請求 256
10.4.3 其他考慮因素 259
10.5 本章小結(jié) 259
第11 章 數(shù)據(jù)分發(fā) 261
11.1 數(shù)據(jù)分發(fā)概述 262
11.2 構(gòu)建數(shù)據(jù)API 264
11.2.1 Azure Cosmos DB簡介 266
11.2.2 填充Cosmos DB集合 269
11.2.3 檢索數(shù)據(jù) 271
11.2.4 小結(jié) 274
11.3 機(jī)器學(xué)習(xí)模型如何對外提供服務(wù) 274
11.4 共享數(shù)據(jù)進(jìn)行批量復(fù)制 274
11.4.1 分離計算資源 275
11.4.2 Azure Data Share簡介 277
11.4.3 小結(jié) 282
11.5 數(shù)據(jù)共享的*佳實(shí)踐 282
11.6 本章小結(jié) 284
附錄A Azure 服務(wù) 285
附錄B KQL 快速參考 287
附錄C 運(yùn)行代碼示例 289
機(jī)器學(xué)習(xí)大數(shù)據(jù)平臺的構(gòu)建、任務(wù)實(shí)現(xiàn)與數(shù)據(jù)治理——使用AZURE、DEVOPS、MLOPS 相關(guān)資料
“本書提供了清晰且易于復(fù)用的示例,是數(shù)據(jù)工程方面的權(quán)威和全面指南。”
——Kelum Prabath Senanayake Echoworx
“這是一本全方位涵蓋解決方案架構(gòu)師或工程師需要考慮的所有方面的Azure寶典。”
——Albert Nogués, 法國達(dá)能
“本書將是一次意義非凡的穿越Azure生態(tài)系統(tǒng)之旅。你將快速構(gòu)建管道并連接組件!”
——Todd Cook,Appen
“本書是機(jī)器學(xué)習(xí)與DevOps工程師通往Azure世界的絕佳教程。”
——Krzysztof Kamyczek,Luxoft
◆◆◆◆◆ 有志于研究Azure數(shù)據(jù)平臺和數(shù)據(jù)工程?本書將助你騰飛!
——valiant2ex
我目前從事與Azure和Azure數(shù)據(jù)工廠相關(guān)的工作。入職之初,我對這些知識一無所知。本書從數(shù)據(jù)工程的角度剖析Azure生態(tài)系統(tǒng),使我的技術(shù)飛速提升。本書示例豐富,在學(xué)習(xí)之旅中,我備感愉悅輕松。
Azure是浩瀚的知識海洋,本書就像一盞明燈,將我們引向成功的彼岸。有本書在手,數(shù)據(jù)工程解決方案學(xué)習(xí)曲線將變得十分平緩。
◆◆◆◆◆ 關(guān)于Azure數(shù)據(jù)工程的重量級好書。
——Rodrigo de Moura Leite Proenca
我是一名從事數(shù)據(jù)工程工作的新軟件工程師,此前曾讀過另一本指南書籍。但遇到這本更好的書,我頓感眼前一亮,相見恨晚!本書知識內(nèi)涵豐富,極具價值,不僅呈現(xiàn)理論概念,而且列舉實(shí)例,幫助讀者加深理解這些概念。
本書還提供一個GitHub Repo來幫助運(yùn)行命令,可幫你省下大量時間!還有很棒的圖表,讓你更直觀、更全面、更透徹地理解技術(shù)原理。
機(jī)器學(xué)習(xí)大數(shù)據(jù)平臺的構(gòu)建、任務(wù)實(shí)現(xiàn)與數(shù)據(jù)治理——使用AZURE、DEVOPS、MLOPS 作者簡介
弗拉德·里斯庫蒂亞(Vlad Riscutia),是微軟的軟件架構(gòu)師。
- >
苦雨齋序跋文-周作人自編集
- >
山海經(jīng)
- >
名家?guī)阕x魯迅:朝花夕拾
- >
隨園食單
- >
月亮與六便士
- >
我從未如此眷戀人間
- >
龍榆生:詞曲概論/大家小書
- >
李白與唐代文化