📝 Quiz: Kiến thức cơ bản Machine Learning
Kiểm tra lại kiến thức đã học trong các bài trước.
Hướng dẫn
- Tổng cộng: 10 câu hỏi
- Thời gian: 15 phút
- Điểm đạt: 70% (7/10 câu đúng)
Câu 1: Định nghĩa Machine Learning
Machine Learning là:
- A. Lập trình máy tính bằng các quy tắc if-else phức tạp
- B. Cho phép máy tính học từ dữ liệu mà không cần lập trình rõ ràng
- C. Một loại robot thông minh
- D. Chương trình máy tính chạy nhanh hơn
Machine Learning cho phép máy tính tự động cải thiện hiệu suất dựa trên kinh nghiệm (dữ liệu) mà không cần được lập trình cụ thể cho từng tình huống.
Câu 2: Supervised vs Unsupervised
Điểm khác biệt chính giữa Supervised Learning và Unsupervised Learning là:
- A. Supervised Learning nhanh hơn
- B. Unsupervised Learning cần nhiều dữ liệu hơn
- C. Supervised Learning sử dụng dữ liệu đã được gán nhãn
- D. Unsupervised Learning chỉ dùng cho hình ảnh
Supervised Learning học từ dữ liệu đã có nhãn (label), trong khi Unsupervised Learning tìm patterns trong dữ liệu không có nhãn.
Câu 3: Classification Problem
Bài toán nào sau đây là Classification?
- A. Dự đoán giá nhà
- B. Phát hiện email spam
- C. Dự đoán nhiệt độ ngày mai
- D. Dự đoán doanh số bán hàng
Phát hiện spam là Classification vì output là phân loại (spam/not spam). Các bài toán còn lại đều có output là giá trị liên tục nên thuộc Regression.
Câu 4: Overfitting
Overfitting xảy ra khi:
- A. Model quá đơn giản
- B. Model học cả noise trong training data
- C. Training data quá ít
- D. Test accuracy cao hơn training accuracy
Overfitting xảy ra khi model quá phức tạp, học quá chi tiết training data (bao gồm cả noise), dẫn đến training accuracy cao nhưng test accuracy thấp.
Câu 5: Train-Test Split
Tại sao cần chia data thành train set và test set?
- A. Để giảm thời gian training
- B. Để có nhiều data hơn
- C. Để đánh giá khả năng generalize của model trên data chưa thấy
- D. Vì training data luôn bị lỗi
Test set được giữ riêng để đánh giá khách quan hiệu suất model trên dữ liệu mới (unseen data), đảm bảo model có khả năng generalize tốt.
Câu 6: Feature Scaling
Khi nào cần thực hiện Feature Scaling?
- A. Luôn luôn với mọi thuật toán
- B. Với các thuật toán nhạy với scale như SVM, KNN
- C. Chỉ với dữ liệu categorical
- D. Không bao giờ cần thiết
Feature scaling cần thiết với các thuật toán tính toán khoảng cách (KNN, SVM, Neural Networks) hoặc gradient-based. Với Decision Tree, Random Forest thì không cần thiết.
Câu 7: Confusion Matrix
Trong Confusion Matrix, True Positive (TP) là:
- A. Model dự đoán Positive và thực tế là Positive
- B. Model dự đoán Negative và thực tế là Positive
- C. Model dự đoán Positive và thực tế là Negative
- D. Model dự đoán Negative và thực tế là Negative
Câu 8: Clustering
K-Means Clustering thuộc loại:
- A. Supervised Learning
- B. Unsupervised Learning
- C. Reinforcement Learning
- D. Semi-supervised Learning
K-Means là thuật toán clustering, tìm nhóm tự nhiên trong data không có nhãn, nên thuộc Unsupervised Learning.
Câu 9: Cross-Validation
Lợi ích của K-Fold Cross-Validation là:
- A. Giảm thời gian training
- B. Tăng kích thước dataset
- C. Đánh giá model ổn định và giảm variance trong kết quả
- D. Tăng accuracy của model
Câu 10: Bias-Variance Tradeoff
Khi Bias cao và Variance thấp, model thường:
- A. Underfit
- B. Overfit
- C. Perfect fit
- D. Không xác định được
High Bias + Low Variance = Underfitting (model quá đơn giản). High Variance + Low Bias = Overfitting (model quá phức tạp).
Kết quả
Hoàn thành Quiz
Bạn đã hoàn thành quiz kiến thức cơ bản ML!
Tiêu chí đánh giá:
- 9-10 câu đúng: Xuất sắc! 🌟
- 7-8 câu đúng: Tốt! Đạt yêu cầu ✅
- 5-6 câu đúng: Cần ôn tập thêm 📚
- Dưới 5 câu: Nên học lại các bài trước ⚠️
➡️ Tiếp theo: Xem Tổng kết và chuẩn bị cho module tiếp theo!
