🎯 Mục tiêu học tập
Sau khi hoàn thành khóa học này, bạn sẽ có khả năng:
Kiến thức (Knowledge)
1. Hiểu nền tảng Machine Learning
- Phân biệt được các loại ML: Supervised, Unsupervised, Reinforcement Learning
- Giải thích được workflow của một dự án ML end-to-end
- Hiểu các khái niệm: overfitting, underfitting, bias-variance tradeoff
2. Nắm vững các thuật toán cơ bản
Supervised Learning
- Linear Regression & Polynomial Regression
- Logistic Regression
- Decision Trees & Random Forest
- Support Vector Machines (SVM)
- K-Nearest Neighbors (KNN)
Unsupervised Learning
- K-Means Clustering
- Hierarchical Clustering
- Principal Component Analysis (PCA)
- Association Rules
3. Đánh giá và cải thiện model
- Sử dụng các metrics phù hợp (Accuracy, Precision, Recall, F1, AUC-ROC)
- Thực hiện Cross-validation
- Tuning hyperparameters với Grid Search và Random Search
Kỹ năng (Skills)
Kỹ năng thực hành
Đây là các kỹ năng bạn sẽ thành thạo sau khóa học:
| Kỹ năng | Mức độ | Công cụ |
|---|---|---|
| Data Preprocessing | ⭐⭐⭐⭐ | Pandas, NumPy |
| Exploratory Data Analysis | ⭐⭐⭐⭐ | Matplotlib, Seaborn |
| Feature Engineering | ⭐⭐⭐ | Scikit-learn |
| Model Training | ⭐⭐⭐⭐ | Scikit-learn |
| Model Evaluation | ⭐⭐⭐⭐ | Scikit-learn |
| Model Deployment | ⭐⭐⭐ | Flask, Streamlit |
Learning Outcomes (Kết quả đầu ra)
Sau khóa học, bạn có thể:
# Ví dụ: Workflow hoàn chỉnh bạn sẽ thực hiện được
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import classification_report
# 1. Load và xử lý dữ liệu
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
# 2. Train model
model = RandomForestClassifier(n_estimators=100)
model.fit(X_train, y_train)
# 3. Đánh giá
predictions = model.predict(X_test)
print(classification_report(y_test, predictions))
Bloom's Taxonomy Mapping
graph TB
A[Remember - Ghi nhớ] --> B[Understand - Hiểu]
B --> C[Apply - Áp dụng]
C --> D[Analyze - Phân tích]
D --> E[Evaluate - Đánh giá]
E --> F[Create - Sáng tạo]
style A fill:#e8f5e9
style B fill:#c8e6c9
style C fill:#a5d6a7
style D fill:#81c784
style E fill:#66bb6a
style F fill:#4caf50
| Level | Mục tiêu cụ thể |
|---|---|
| Remember | Liệt kê các thuật toán ML cơ bản |
| Understand | Giải thích cách hoạt động của từng thuật toán |
| Apply | Triển khai thuật toán với Scikit-learn |
| Analyze | Phân tích kết quả và lựa chọn model phù hợp |
| Evaluate | Đánh giá hiệu suất và cải thiện model |
| Create | Xây dựng dự án ML end-to-end |
Checkpoint đánh giá
Các mốc đánh giá
Bạn sẽ được đánh giá qua các checkpoint sau:
- Tuần 2: Quiz kiến thức cơ bản (20%)
- Tuần 4: Mini Project - Classification (25%)
- Tuần 6: Mini Project - Clustering (25%)
- Tuần 8: Final Project (30%)
➡️ Tiếp theo: Xem Data Dictionary để hiểu về dataset sẽ sử dụng trong khóa học.
