DATA2001:數據科學:大數據和數據多樣性作業教程

2023-02-26 15:25    來源:網絡        閱讀量:0

DATA2001: Data Science :大數據和數據多樣性作業教程本課程重點介紹有效探索和分析大數據集合的方法和技術。整個城市的行人事故熱點在哪里?根據用戶在旅游網站上發布的帖子,哪些是最受歡迎的旅游地點?結合和分析來自各種來源和數據庫的數據的能力對于研究和行業的明智決策至關重要。學生將學習如何從數據科學項目中常見的各種數據模型中提取、組合和匯總數據,例如關系、半結構化、時間序列、地理空間、圖像、文本。除了通過使用相關 Python 庫的經驗來提高他們的編程技能外,本課程還將向學生介紹使用 SQL 進行聲明式數據處理的概念,并分析關系數據庫中的數據。將為學生提供來自例如的數據集。 、社交媒體、交通、健康和社會科學,并在小用例的背景下教授基本的探索性數據分析和挖掘技術。本課程將使學生進一步了解分析大數據量所涉及的挑戰,例如在多臺計算機之間分發和分發數據以及執行計算以處理“大數據”的想法。

詳細入學規則學習成果完成本單元后,您應該能夠:

LO1。使用適當的 Python 庫來自動化各種數據的數據科學活動

LO2。從各種數據模型中攝取、組合和匯總數據

LO3。展示使用各種數據集(包括關系、半結構化、時間序列、地理定位、圖像、文本)的經驗,包括結合不同類型數據的經驗

LO4。理解并生成聲明式查詢以從數據集中提取適當的信息,包括使用 SQL 的能力

LO5。了解分析“大數據”的主要挑戰:數據量、種類、速度、準確性

LO6。了解數據量對數據處理的影響,并了解解決此問題的方法,例如索引、壓縮、數據分區和分布式處理框架 (Hadoop)。

LO7。在處理數據時表現出對隱私問題的意識

"優點留學網"的部分文章內容來源于網絡收集,如有侵權請聯系我們刪除!

稿件內容僅為傳遞更多信息之目的,不代表本網觀點,亦不代表本網站贊同其觀點或證實其內容的真實性。

最近在线播放观看视频免费