Skip to content

CyberSoft Machine Learning 03 - Descriptive Statistics

Notifications You must be signed in to change notification settings

Tynab/Descriptive-Statistics

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

18 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

BÀI TẬP

  1. Áp dụng lý thuyết CLT để tính giá trị trung bình của SalePrice (tập dữ liệu giá nhà) chỉ sử dụng 400 mẫu. Tính độ lệch chuẩn và vẽ biểu đồ histogram cho dữ liệu mean dựa và CLT.
  2. Phân tích mối quan hệ giữa SalePrice và các thuộc tính kiểu loại (categorical data) và rút ra nhận xét. Ít nhất 3 thuộc tính.
  3. Phân tích mối quan hệ giữa SalePrice và các thuộc tính kiểu số (numerical data) và rút ra nhận xét. Ít nhất 3 thuộc tính.
  4. Chọn kỹ thuật phù hợp (LabelEncoder và OnehotEncoding) để biến đổi các thuộc tính kiểu loại.
  5. Xử lý các dữ liệu nhiễu trong dữ liệu và tính lại hệ số tương quan so với SalePrice.