このガイドでは、「初心者のためのデータサイエンス」カリキュラムの使用例と一般的なワークフローを紹介します。
このカリキュラムは柔軟に設計されており、以下の方法で利用できます:
- 自己ペース学習: 自分のペースで独立してレッスンを進める
- 教室での指導: 指導付きの構造化されたコースとして使用する
- 勉強会: 仲間と協力して学ぶ
- ワークショップ形式: 集中的な短期学習セッション
各レッスンは学習効果を最大化するために一貫した構造を持っています:
- 事前クイズ: 既存の知識をテスト
- スケッチノート (オプション): 主要な概念の視覚的な要約
- ビデオ (オプション): 補足的なビデオコンテンツ
- 書面によるレッスン: 核心的な概念と説明
- Jupyter Notebook: 実践的なコーディング演習
- 課題: 学んだ内容を練習
- 事後クイズ: 理解を強化
# 1. Navigate to the lesson directory
cd 1-Introduction/01-defining-data-science
# 2. Read the README.md
# Open README.md in your browser or editor
# 3. Take the pre-lesson quiz
# Click the quiz link in the README
# 4. Open the Jupyter notebook (if available)
jupyter notebook
# 5. Complete the exercises in the notebook
# 6. Work on the assignment
# 7. Take the post-lesson quiz# Activate your virtual environment
source venv/bin/activate # On macOS/Linux
# OR
venv\Scripts\activate # On Windows
# Start Jupyter from the repository root
jupyter notebook- セルを実行:
Shift + Enterを押すか「Run」ボタンをクリック - すべてのセルを実行: メニューから「Cell」→「Run All」を選択
- カーネルの再起動: 問題が発生した場合は「Kernel」→「Restart」を選択
# Import required libraries
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
# Load a dataset
df = pd.read_csv('data/sample.csv')
# Explore the data
df.head()
df.info()
df.describe()
# Create a visualization
plt.figure(figsize=(10, 6))
plt.plot(df['column_name'])
plt.title('Sample Visualization')
plt.xlabel('X-axis Label')
plt.ylabel('Y-axis Label')
plt.show()- Jupyterは定期的に自動保存します
- 手動保存:
Ctrl + S(macOSではCmd + S)を押す - 進捗は
.ipynbファイルに保存されます
# Navigate to quiz app directory
cd quiz-app
# Start the development server
npm run serve
# Access at http://localhost:8080- レッスンの冒頭に事前クイズへのリンクがあります
- レッスンの最後に事後クイズへのリンクがあります
- 各クイズには3つの質問があります
- クイズは学習を強化するために設計されており、徹底的にテストするものではありません
- クイズは0~39の番号が付けられています(合計40問)
- 各レッスンには通常、事前クイズと事後クイズがあります
- クイズのURLにはクイズ番号が含まれています:
https://ff-quizzes.netlify.app/en/ds/quiz/0
# 1. Set up your environment (see INSTALLATION.md)
# 2. Start with Lesson 1
cd 1-Introduction/01-defining-data-science
# 3. For each lesson:
# - Take pre-lesson quiz
# - Read the lesson content
# - Work through the notebook
# - Complete the assignment
# - Take post-lesson quiz
# 4. Progress through all 20 lessons sequentially特定のトピックに興味がある場合:
# Example: Focus on Data Visualization
cd 3-Data-Visualization
# Explore lessons 9-13:
# - Lesson 9: Visualizing Quantities
# - Lesson 10: Visualizing Distributions
# - Lesson 11: Visualizing Proportions
# - Lesson 12: Visualizing Relationships
# - Lesson 13: Meaningful Visualizations# 1. Review the Data Science Lifecycle lessons (14-16)
cd 4-Data-Science-Lifecycle
# 2. Work through a real-world example (Lesson 20)
cd ../6-Data-Science-In-Wild/20-Real-World-Examples
# 3. Apply concepts to your own project# Learn about cloud data science (Lessons 17-19)
cd 5-Data-Science-In-Cloud
# 17: Introduction to Cloud Data Science
# 18: Low-Code ML Tools
# 19: Azure Machine Learning Studio# Create a learning journal
mkdir my-learning-journal
# For each lesson, create notes
echo "# Lesson 1 Notes" > my-learning-journal/lesson-01-notes.md- 毎日または毎週、専用の時間を確保する
- 週に最低1つのレッスンを完了する
- 過去のレッスンを定期的に復習する
- Discordコミュニティに参加する
- Discordの#Data-Science-for-Beginnersチャンネルで議論に参加する Discord Discussions
- 進捗を共有し、質問をする
レッスンを完了した後、学んだ概念を個人プロジェクトに応用する:
# Example: Analyze your own dataset
import pandas as pd
# Load your own data
my_data = pd.read_csv('my-project/data.csv')
# Apply techniques learned
# - Data cleaning (Lesson 8)
# - Exploratory data analysis (Lesson 7)
# - Visualization (Lessons 9-13)
# - Analysis (Lesson 15)- 詳細なガイダンスについてはfor-teachers.mdを確認
- 共有環境を設定する(GitHub ClassroomやCodespacesなど)
- コミュニケーションチャネルを確立する(Discord、Slack、またはTeams)
推奨10週間スケジュール:
- 第1~2週: 導入(レッスン1~4)
- 第3~4週: データの操作(レッスン5~8)
- 第5~6週: データの可視化(レッスン9~13)
- 第7~8週: データサイエンスライフサイクル(レッスン14~16)
- 第9週: クラウドデータサイエンス(レッスン17~19)
- 第10週: 実世界の応用と最終プロジェクト(レッスン20)
# Serve documentation locally for classroom use
docsify serve
# Students can access at localhost:3000
# No internet required after initial setup- 学生のNotebookを確認して演習が完了しているか確認
- クイズのスコアを通じて理解度をチェック
- データサイエンスライフサイクルの原則を使用して最終プロジェクトを評価
# Example custom assignment template
"""
Assignment: [Topic]
Objective: [Learning goal]
Dataset: [Provide or have students find one]
Tasks:
1. Load and explore the dataset
2. Clean and prepare the data
3. Create at least 3 visualizations
4. Perform analysis
5. Communicate findings
Deliverables:
- Jupyter notebook with code and explanations
- Written summary of findings
"""# Clone the entire repository
git clone https://github.com/microsoft/Data-Science-For-Beginners.git
# Download datasets in advance
# Most datasets are included in the repository# Serve with Docsify
docsify serve
# Access at localhost:3000cd quiz-app
npm run serve翻訳は40以上の言語で利用可能です:
# Access translated lessons
cd translations/fr # French
cd translations/es # Spanish
cd translations/de # German
# ... and many more各翻訳は英語版と同じ構造を維持しています。
- Microsoft Learn - 追加の学習パス
- Student Hub - 学生向けリソース
- Azure AI Foundry - コミュニティフォーラム
- 一般的な問題についてはTROUBLESHOOTING.mdを確認
- GitHub Issuesを検索
- Discordに参加
- 問題の報告や貢献についてはCONTRIBUTING.mdを確認
免責事項:
この文書は、AI翻訳サービスCo-op Translatorを使用して翻訳されています。正確性を追求しておりますが、自動翻訳には誤りや不正確な部分が含まれる可能性があります。元の言語で記載された文書を正式な情報源としてお考えください。重要な情報については、専門の人間による翻訳を推奨します。この翻訳の使用に起因する誤解や誤解釈について、当方は一切の責任を負いません。