Data Mining and Analysis
(6 sessions, 9 hours)
Language: English/廣東話
$4,800
推廣價 $3,800
WORKSHOP OUTLINE
Session 1
getting FAMILIAR WITH THE TOOLS
-
Concept of data mining and analysis.
-
Types and sources of data.
-
Python library - Numpy.
-
Python library - Matplotlib.
-
Python library - Pandas.
-
Jupyter Notebook and Google Colab.
-
數據挖掘和分析的概念。
-
數據的種類和來源。
-
認識 Python Numpy。
-
認識 Python Matplotlib。
-
認識 Python Panda。
-
介紹常用平台 Jupyter Notebook 和 Google Colab。
Session 2
Data cleaning and handling
-
Handling missing data.
- Data transformation.
-
Regular expression.
-
Hierarchical clustering method.
-
Combing and merging data sets.
-
Data reshaping and pivoting.
-
處理資料不全的數據。
-
數據變換。
-
正規表示式。
-
系統聚類法。
-
梳理和整合一籃子數據。
-
數據重組和架構。
session 3
plotting and visualization
-
Importance of Data Visualization.
-
Plot data with Python library - Matplotlib.
-
Different types of display formats.
-
Adjust the plotting attributes.
-
Annotation on the plot.
-
Plot with Pandas or Seaborn.
-
認識數據可視化的重要性。
-
利用 Python library - Matplotlib 繪製圖表。
-
介紹不同型式的圖表。
-
調整圖表屬性。
-
在圖表上進行標註。
-
運用高階工具製圖 (Pandas 或 Seaborn)。
session 4
project one
-
Details will be disclosed later..
-
內容稍後發佈。
session 5
project two
-
Details will be disclosed later..
-
內容稍後發佈。
Session 6
Data aggregation and analysis
-
Data aggregation in Pandas.
-
Introduction of Pivot Tables
-
Case Studies of data mining and analysis.
-
Summary of the workshop.
-
Introduction of advanced topic - Machine Learning.
-
在 Pandas 上進行數據分析。
-
介紹數據透視表的應用。
-
數據挖掘和分析的案例研究。
-
工作坊總結。
-
進階工作坊簡介 - 機器學習 (Machine Learning)。