Azure Cloud Advocates tại Microsoft rất vui mừng được cung cấp chương trình giảng dạy 10 tuần, 20 bài học về Khoa học dữ liệu. Mỗi bài học bao gồm các bài kiểm tra trước và sau bài học, hướng dẫn bằng văn bản để hoàn thành bài học, giải pháp và bài tập. Phương pháp sư phạm dựa trên dự án của chúng tôi cho phép bạn học trong khi xây dựng, một cách đã được chứng minh để các kỹ năng mới được "stick - gắn kết với nhau".
Hearty thanks to our authors: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.
🙏 Special thanks 🙏 to our Microsoft Student Ambassador authors, reviewers and content contributors, notably Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar , Vidushi Gupta, Jasleen Sondhi
Data Science For Beginners - Sketchnote by @nitya |
We just released a 12 lesson curriculum on generative AI. Come learn things like:
- prompting and prompt engineering
- text and image app generation
- search apps
Như thường lệ, sẽ có bài học, bài tập phải hoàn thành, kiểm tra kiến thức và thử thách.
Hãy xem thử nhé:
Bắt đầu với các tài nguyên sau:
- Student Hub page Trong trang này, bạn sẽ tìm thấy các tài nguyên dành cho người mới bắt đầu, gói Student và thậm chí là cách để nhận được chứng chỉ miễn phí. Đây là một trang bạn muốn đánh dấu và kiểm tra theo thời gian vì chúng tôi thay đổi nội dung ít nhất là hàng tháng.
- Microsoft Learn Student Ambassadors Tham gia cộng đồng đại sứ sinh viên toàn cầu, đây có thể là con đường đưa bạn đến với Microsoft.
Teachers: Chúng tôi đã một vài gợi ý về cách sử dụng chương trình giảng dạy này. Chúng tôi rất mong nhận được phản hồi của bạn trong diễn đàn thảo luận này!
Students: để tự sử dụng giáo trình này, hãy fork toàn bộ kho lưu trữ và tự hoàn thành các bài tập, bắt đầu bằng bài kiểm tra trước bài giảng. Sau đó, đọc bài giảng và hoàn thành các hoạt động còn lại. Cố gắng tạo các dự án bằng cách hiểu các bài học thay vì sao chép mã giải pháp; tuy nhiên, mã đó có sẵn trong các thư mục /solutions trong mỗi bài học theo định hướng dự án. Một ý tưởng khác là thành lập một nhóm học tập với bạn bè và cùng nhau xem qua nội dung. Để học thêm, chúng tôi khuyên bạn nên sử dụng Microsoft Learn.
Gif by Mohit Jaisal
🎥 Nhấp vào hình ảnh ở trên để xem video về dự án và những người đã tạo ra nó!
Chúng tôi đã chọn hai nguyên lý sư phạm khi xây dựng chương trình giảng dạy này: đảm bảo chương trình dựa trên dự án và bao gồm các bài kiểm tra thường xuyên. Đến cuối loạt bài này, sinh viên sẽ học được các nguyên tắc cơ bản của khoa học dữ liệu, bao gồm các khái niệm đạo đức, chuẩn bị dữ liệu, các cách khác nhau để làm việc với dữ liệu, trực quan hóa dữ liệu, phân tích dữ liệu, các trường hợp sử dụng khoa học dữ liệu trong thế giới thực, v.v.
Ngoài ra, một bài kiểm tra ít rủi ro trước khi vào lớp sẽ thiết lập mục đích của học sinh đối với việc học một chủ đề, trong khi một bài kiểm tra thứ hai sau giờ học đảm bảo khả năng ghi nhớ lâu hơn. Chương trình giảng dạy này được thiết kế linh hoạt và thú vị, có thể học toàn bộ hoặc một phần. Các dự án bắt đầu nhỏ và trở nên phức tạp hơn vào cuối chu kỳ 10 tuần.
Find our Code of Conduct, Contributing, Translation guidelines. We welcome your constructive feedback!
- Optional sketchnote
- Optional supplemental video
- Pre-lesson warmup quiz
- Written lesson
- For project-based lessons, step-by-step guides on how to build the project
- Knowledge checks
- A challenge
- Supplemental reading
- Assignment
- Post-lesson quiz
A note about quizzes: Tất cả các bài kiểm tra đều nằm trong thư mục Quiz-App, tổng cộng có 40 bài kiểm tra, mỗi bài có ba câu hỏi. Chúng được liên kết từ trong các bài học, nhưng ứng dụng bài kiểm tra có thể chạy cục bộ hoặc triển khai trên Azure; hãy làm theo hướng dẫn trong
quiz-app
thư mục. Chúng đang dần được bản địa hóa.
Data Science For Beginners: Roadmap - Sketchnote by @nitya |
Lesson Number | Topic | Lesson Grouping | Learning Objectives | Linked Lesson | Author |
---|---|---|---|---|---|
01 | Định nghĩa Khoa học dữ liệu | Introduction | Tìm hiểu các khái niệm cơ bản về khoa học dữ liệu và mối liên quan của nó với trí tuệ nhân tạo, máy học và dữ liệu lớn. | lesson video | Dmitry |
02 | Đạo đức Khoa học dữ liệu | Introduction | Khái niệm, thách thức và khuôn khổ về đạo đức dữ liệu. | lesson | Nitya |
03 | Định nghĩa dữ liệu | Introduction | Cách phân loại dữ liệu và các nguồn phổ biến của nó. | lesson | Jasmine |
04 | Giới thiệu về Thống kê & Xác suất | Introduction | Các kỹ thuật toán học về xác suất và thống kê để hiểu dữ liệu. | lesson video | Dmitry |
05 | Làm việc với dữ liệu quan hệ | Working With Data | Giới thiệu về dữ liệu quan hệ và những kiến thức cơ bản về khám phá và phân tích dữ liệu quan hệ bằng Ngôn ngữ truy vấn có cấu trúc, còn gọi là SQL (phát âm là “see-quell”). | lesson | Christopher |
06 | Working with NoSQL Data | Working With Data | Introduction to non-relational data, its various types and the basics of exploring and analyzing document databases. | lesson | Jasmine |
07 | Working with Python | Working With Data | Basics of using Python for data exploration with libraries such as Pandas. Foundational understanding of Python programming is recommended. | lesson video | Dmitry |
08 | Data Preparation | Working With Data | Topics on data techniques for cleaning and transforming the data to handle challenges of missing, inaccurate, or incomplete data. | lesson | Jasmine |
09 | Visualizing Quantities | Data Visualization | Learn how to use Matplotlib to visualize bird data 🦆 | lesson | Jen |
10 | Visualizing Distributions of Data | Data Visualization | Visualizing observations and trends within an interval. | lesson | Jen |
11 | Visualizing Proportions | Data Visualization | Visualizing discrete and grouped percentages. | lesson | Jen |
12 | Visualizing Relationships | Data Visualization | Visualizing connections and correlations between sets of data and their variables. | lesson | Jen |
13 | Meaningful Visualizations | Data Visualization | Techniques and guidance for making your visualizations valuable for effective problem solving and insights. | lesson | Jen |
14 | Introduction to the Data Science lifecycle | Lifecycle | Introduction to the data science lifecycle and its first step of acquiring and extracting data. | lesson | Jasmine |
15 | Analyzing | Lifecycle | This phase of the data science lifecycle focuses on techniques to analyze data. | lesson | Jasmine |
16 | Communication | Lifecycle | This phase of the data science lifecycle focuses on presenting the insights from the data in a way that makes it easier for decision makers to understand. | lesson | Jalen |
17 | Data Science in the Cloud | Cloud Data | This series of lessons introduces data science in the cloud and its benefits. | lesson | Tiffany and Maud |
18 | Data Science in the Cloud | Cloud Data | Training models using Low Code tools. | lesson | Tiffany and Maud |
19 | Data Science in the Cloud | Cloud Data | Deploying models with Azure Machine Learning Studio. | lesson | Tiffany and Maud |
20 | Data Science in the Wild | In the Wild | Data science driven projects in the real world. | lesson | Nitya |
Follow these steps to open this sample in a Codespace:
- Click the Code drop-down menu and select the Open with Codespaces option.
- Select + New codespace at the bottom on the pane. For more info, check out the GitHub documentation.
Follow these steps to open this repo in a container using your local machine and VSCode using the VS Code Remote - Containers extension:
- If this is your first time using a development container, please ensure your system meets the pre-reqs (i.e. have Docker installed) in the getting started documentation.
To use this repository, you can either open the repository in an isolated Docker volume:
Note: Under the hood, this will use the Remote-Containers: Clone Repository in Container Volume... command to clone the source code in a Docker volume instead of the local filesystem. Volumes are the preferred mechanism for persisting container data.
Or open a locally cloned or downloaded version of the repository:
- Clone this repository to your local filesystem.
- Press F1 and select the Remote-Containers: Open Folder in Container... command.
- Select the cloned copy of this folder, wait for the container to start, and try things out.
You can run this documentation offline by using Docsify. Fork this repo, install Docsify on your local machine, then in the root folder of this repo, type docsify serve
. The website will be served on port 3000 on your localhost: localhost:3000
.
Note, notebooks will not be rendered via Docsify, so when you need to run a notebook, do that separately in VS Code running a Python kernel.
If you would like to translate all or part of the curriculum, please follow our Translations guide.
Our team produces other curricula! Check out: