Skip to content

hoanglong8/Microsoft-DS-for-beginners

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Data Science for Beginners - A Curriculum (Chương trình giảng dạy)

Open in GitHub Codespaces

GitHub license GitHub contributors GitHub issues GitHub pull-requests PRs Welcome

GitHub watchers GitHub forks GitHub stars

Azure Cloud Advocates tại Microsoft rất vui mừng được cung cấp chương trình giảng dạy 10 tuần, 20 bài học về Khoa học dữ liệu. Mỗi bài học bao gồm các bài kiểm tra trước và sau bài học, hướng dẫn bằng văn bản để hoàn thành bài học, giải pháp và bài tập. Phương pháp sư phạm dựa trên dự án của chúng tôi cho phép bạn học trong khi xây dựng, một cách đã được chứng minh để các kỹ năng mới được "stick - gắn kết với nhau".

Hearty thanks to our authors: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.

🙏 Special thanks 🙏 to our Microsoft Student Ambassador authors, reviewers and content contributors, notably Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar , Vidushi Gupta, Jasleen Sondhi

 Sketchnote by (@sketchthedocs)
Data Science For Beginners - Sketchnote by @nitya

Thông báo - Chương trình giảng dạy mới về AI tạo sinh vừa được phát hành!

We just released a 12 lesson curriculum on generative AI. Come learn things like:

  • prompting and prompt engineering
  • text and image app generation
  • search apps

Như thường lệ, sẽ có bài học, bài tập phải hoàn thành, kiểm tra kiến ​​thức và thử thách.

Hãy xem thử nhé:

https://aka.ms/genai-beginners

Are you a student?

Bắt đầu với các tài nguyên sau:

  • Student Hub page Trong trang này, bạn sẽ tìm thấy các tài nguyên dành cho người mới bắt đầu, gói Student và thậm chí là cách để nhận được chứng chỉ miễn phí. Đây là một trang bạn muốn đánh dấu và kiểm tra theo thời gian vì chúng tôi thay đổi nội dung ít nhất là hàng tháng.
  • Microsoft Learn Student Ambassadors Tham gia cộng đồng đại sứ sinh viên toàn cầu, đây có thể là con đường đưa bạn đến với Microsoft.

Getting Started

Teachers: Chúng tôi đã một vài gợi ý về cách sử dụng chương trình giảng dạy này. Chúng tôi rất mong nhận được phản hồi của bạn trong diễn đàn thảo luận này!

Students: để tự sử dụng giáo trình này, hãy fork toàn bộ kho lưu trữ và tự hoàn thành các bài tập, bắt đầu bằng bài kiểm tra trước bài giảng. Sau đó, đọc bài giảng và hoàn thành các hoạt động còn lại. Cố gắng tạo các dự án bằng cách hiểu các bài học thay vì sao chép mã giải pháp; tuy nhiên, mã đó có sẵn trong các thư mục /solutions trong mỗi bài học theo định hướng dự án. Một ý tưởng khác là thành lập một nhóm học tập với bạn bè và cùng nhau xem qua nội dung. Để học thêm, chúng tôi khuyên bạn nên sử dụng Microsoft Learn.

Meet the Team

Promo video

Gif by Mohit Jaisal

🎥 Nhấp vào hình ảnh ở trên để xem video về dự án và những người đã tạo ra nó!

Pedagogy - Nguyên lý sư phạm

Chúng tôi đã chọn hai nguyên lý sư phạm khi xây dựng chương trình giảng dạy này: đảm bảo chương trình dựa trên dự án và bao gồm các bài kiểm tra thường xuyên. Đến cuối loạt bài này, sinh viên sẽ học được các nguyên tắc cơ bản của khoa học dữ liệu, bao gồm các khái niệm đạo đức, chuẩn bị dữ liệu, các cách khác nhau để làm việc với dữ liệu, trực quan hóa dữ liệu, phân tích dữ liệu, các trường hợp sử dụng khoa học dữ liệu trong thế giới thực, v.v.

Ngoài ra, một bài kiểm tra ít rủi ro trước khi vào lớp sẽ thiết lập mục đích của học sinh đối với việc học một chủ đề, trong khi một bài kiểm tra thứ hai sau giờ học đảm bảo khả năng ghi nhớ lâu hơn. Chương trình giảng dạy này được thiết kế linh hoạt và thú vị, có thể học toàn bộ hoặc một phần. Các dự án bắt đầu nhỏ và trở nên phức tạp hơn vào cuối chu kỳ 10 tuần.

Find our Code of Conduct, Contributing, Translation guidelines. We welcome your constructive feedback!

Each lesson includes:

  • Optional sketchnote
  • Optional supplemental video
  • Pre-lesson warmup quiz
  • Written lesson
  • For project-based lessons, step-by-step guides on how to build the project
  • Knowledge checks
  • A challenge
  • Supplemental reading
  • Assignment
  • Post-lesson quiz

A note about quizzes: Tất cả các bài kiểm tra đều nằm trong thư mục Quiz-App, tổng cộng có 40 bài kiểm tra, mỗi bài có ba câu hỏi. Chúng được liên kết từ trong các bài học, nhưng ứng dụng bài kiểm tra có thể chạy cục bộ hoặc triển khai trên Azure; hãy làm theo hướng dẫn trong quiz-app thư mục. Chúng đang dần được bản địa hóa.

Lessons

 Sketchnote by (@sketchthedocs)
Data Science For Beginners: Roadmap - Sketchnote by @nitya
Lesson Number Topic Lesson Grouping Learning Objectives Linked Lesson Author
01 Định nghĩa Khoa học dữ liệu Introduction Tìm hiểu các khái niệm cơ bản về khoa học dữ liệu và mối liên quan của nó với trí tuệ nhân tạo, máy học và dữ liệu lớn. lesson video Dmitry
02 Đạo đức Khoa học dữ liệu Introduction Khái niệm, thách thức và khuôn khổ về đạo đức dữ liệu. lesson Nitya
03 Định nghĩa dữ liệu Introduction Cách phân loại dữ liệu và các nguồn phổ biến của nó. lesson Jasmine
04 Giới thiệu về Thống kê & Xác suất Introduction Các kỹ thuật toán học về xác suất và thống kê để hiểu dữ liệu. lesson video Dmitry
05 Làm việc với dữ liệu quan hệ Working With Data Giới thiệu về dữ liệu quan hệ và những kiến ​​thức cơ bản về khám phá và phân tích dữ liệu quan hệ bằng Ngôn ngữ truy vấn có cấu trúc, còn gọi là SQL (phát âm là “see-quell”). lesson Christopher
06 Working with NoSQL Data Working With Data Introduction to non-relational data, its various types and the basics of exploring and analyzing document databases. lesson Jasmine
07 Working with Python Working With Data Basics of using Python for data exploration with libraries such as Pandas. Foundational understanding of Python programming is recommended. lesson video Dmitry
08 Data Preparation Working With Data Topics on data techniques for cleaning and transforming the data to handle challenges of missing, inaccurate, or incomplete data. lesson Jasmine
09 Visualizing Quantities Data Visualization Learn how to use Matplotlib to visualize bird data 🦆 lesson Jen
10 Visualizing Distributions of Data Data Visualization Visualizing observations and trends within an interval. lesson Jen
11 Visualizing Proportions Data Visualization Visualizing discrete and grouped percentages. lesson Jen
12 Visualizing Relationships Data Visualization Visualizing connections and correlations between sets of data and their variables. lesson Jen
13 Meaningful Visualizations Data Visualization Techniques and guidance for making your visualizations valuable for effective problem solving and insights. lesson Jen
14 Introduction to the Data Science lifecycle Lifecycle Introduction to the data science lifecycle and its first step of acquiring and extracting data. lesson Jasmine
15 Analyzing Lifecycle This phase of the data science lifecycle focuses on techniques to analyze data. lesson Jasmine
16 Communication Lifecycle This phase of the data science lifecycle focuses on presenting the insights from the data in a way that makes it easier for decision makers to understand. lesson Jalen
17 Data Science in the Cloud Cloud Data This series of lessons introduces data science in the cloud and its benefits. lesson Tiffany and Maud
18 Data Science in the Cloud Cloud Data Training models using Low Code tools. lesson Tiffany and Maud
19 Data Science in the Cloud Cloud Data Deploying models with Azure Machine Learning Studio. lesson Tiffany and Maud
20 Data Science in the Wild In the Wild Data science driven projects in the real world. lesson Nitya

GitHub Codespaces

Follow these steps to open this sample in a Codespace:

  1. Click the Code drop-down menu and select the Open with Codespaces option.
  2. Select + New codespace at the bottom on the pane. For more info, check out the GitHub documentation.

VSCode Remote - Containers

Follow these steps to open this repo in a container using your local machine and VSCode using the VS Code Remote - Containers extension:

  1. If this is your first time using a development container, please ensure your system meets the pre-reqs (i.e. have Docker installed) in the getting started documentation.

To use this repository, you can either open the repository in an isolated Docker volume:

Note: Under the hood, this will use the Remote-Containers: Clone Repository in Container Volume... command to clone the source code in a Docker volume instead of the local filesystem. Volumes are the preferred mechanism for persisting container data.

Or open a locally cloned or downloaded version of the repository:

  • Clone this repository to your local filesystem.
  • Press F1 and select the Remote-Containers: Open Folder in Container... command.
  • Select the cloned copy of this folder, wait for the container to start, and try things out.

Offline access

You can run this documentation offline by using Docsify. Fork this repo, install Docsify on your local machine, then in the root folder of this repo, type docsify serve. The website will be served on port 3000 on your localhost: localhost:3000.

Note, notebooks will not be rendered via Docsify, so when you need to run a notebook, do that separately in VS Code running a Python kernel.

Help Wanted!

If you would like to translate all or part of the curriculum, please follow our Translations guide.

Other Curricula

Our team produces other curricula! Check out:

About

Microsoft courses: 10 Weeks, 20 Lessons, Data Science for All!

Resources

License

Code of conduct

Security policy

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 99.9%
  • Other 0.1%