• Home
  • About
    • Miles' Blog photo

      Miles' Blog

      Miles 用來記錄學習心得及筆記的地方。

    • Learn More
    • Email
    • Github
  • Posts
    • All Posts
    • All Tags
  • Projects

機器學習 百日馬拉松

18 Apr 2019

Reading time ~2 minutes

本篇為紀錄參與百日馬拉松的主題及內容整理。

資料介紹與評估指標

EDA-1/讀取資料EDA: Data summary

3-1如何新建一個 dataframe?3-2 如何讀取其他資料? (非 csv 的資料)

EDA: 欄位的資料類型介紹及處理

EDA: 資料分佈

EDA: Outlier 及處理

常用的數值取代:中位數與分位數連續數值標準化

DataFrame operationData frame merge/常用的 DataFrame 操作

EDA from Correlation

EDA: 不同數值範圍間的特徵如何檢視/繪圖與樣式Kernel Density Estimation (KDE)

把連續的變數離散化

Subplots

Heatmap & Grid-plot

模型初體驗 Logistic Regression

特徵工程簡介

特徵類型

數值型特徵 - 補缺失值與標準化

數值型特徵 - 去除離群值

數值型特徵 - 去除偏態

類別型特徵 - 基礎處理

類別型特徵 - 均值編碼

類別型特徵 - 其他進階處理

時間型特徵

特徵組合 - 數值與數值組合

特徵組合 - 類別與數值組合

特徵選擇

特徵評估

分類型特徵優化 - 葉編碼

機器學習概論

機器學習-流程與步驟

機器如何學習?

訓練/測試集切分的概念

regression vs. classification

評估指標選定/evaluation metrics

regression model 介紹 - 線性迴歸/羅吉斯回歸

regression model 程式碼撰寫

regression model 介紹 - LASSO 回歸/ Ridge 回歸

regression model 程式碼撰寫

tree based model - 決策樹 (Decision Tree) 模型介紹

tree based model - 決策樹程式碼撰寫

tree based model - 隨機森林 (Random Forest) 介紹

tree based model - 隨機森林程式碼撰寫

tree based model - 梯度提升機程式碼撰寫

超參數調整與優化

Kaggle 競賽平台介紹

Kaggle第一次期中考 考ML與調參相關

clustering 1 非監督式機器學習簡介

clustering 2 聚類算法

clustering 2 聚類算法

clustering 3 階層分群算法

clustering 4 階層分群法

dimension reduction 1 降維方法-主成份分析

dimension reduction 1 降維方法-主成份分析

dimension reduction 2 降維方法-T-SNE

dimension reduction 2 降維方法-T-SNE

神經網路介紹

深度學習體驗 : 模型調整與學習曲線

深度學習體驗 : 啟動函數與正規化

Keras 安裝與介紹

Keras Dataset

Keras Sequential API

Keras Module API

Multi-layer Perception多層感知

損失函數

激活函數

Gradient Descent

Gradient Descent 數學原理

BackPropagation

optimizers

訓練神經網路的細節與技巧 - Validation and overfit

訓練神經網路前的注意事項

訓練神經網路的細節與技巧 - Learning rate effect

[練習 Day] Compare different combinations of optimizers & learning rates

訓練神經網路的細節與技巧 - Regularization

訓練神經網路的細節與技巧 - Dropout

訓練神經網路的細節與技巧 - Batch normalization

[練習 Day] Comparing combinations of Activation function, optimizer and batch_norm or not

訓練神經網路的細節與技巧 - 使用 callbacks 函數做 earlystop

訓練神經網路的細節與技巧 - 使用 callbacks 函數儲存 model

訓練神經網路的細節與技巧 - 使用 callbacks 函數做 reduce learning rate

訓練神經網路的細節與技巧 - 撰寫自己的 callbacks 函數

訓練神經網路的細節與技巧 - 撰寫自己的 Loss function

使用傳統電腦視覺與機器學習進行影像辨識

[練習 Day] 使用傳統電腦視覺與機器學習進行影像辨識

卷積神經網路 (Convolution Neural Network, CNN) 簡介

卷積神經網路架構細節

卷積神經網路 - 卷積(Convolution)層與參數調整

卷積神經網路 - 池化(Pooling)層與參數調整

Keras 中的 CNN layers

使用 CNN 完成 CIFAR-10 資料集

訓練卷積神經網路的細節與技巧 - 處理大量數據

訓練卷積神經網路的細節與技巧 - 處理小量數據

訓練卷積神經網路的細節與技巧 - 轉移學習 (Transfer learning)

影像辨識



Data MiningData ScienceA.I.Deep Learning Share Tweet +1