מה זו סטיית תקן?
סטיית תקן (Standard Deviation) מודדת כמה הנתונים "מפוזרים" או "מתפזרים" סביב הממוצע.
- סטיית תקן נמוכה: הנתונים קרובים לממוצע (אחידות)
- סטיית תקן גבוהה: הנתונים רחוקים מהממוצע (שונות גדולה)
דוגמה אינטואיטיבית
שתי כיתות עם ממוצע 80:
- כיתה א': ציונים 78, 79, 80, 81, 82 → סטיית תקן נמוכה (כולם קרובים ל-80)
- כיתה ב': ציונים 50, 70, 80, 90, 110 → סטיית תקן גבוהה (פערים גדולים)
הנוסחה
סטיית תקן של אוכלוסייה (σ)
σ = √[Σ(xi - μ)² / n]
סטיית תקן של מדגם (s)
s = √[Σ(xi - x̄)² / (n-1)]
ההבדל: במדגם מחלקים ב-(n-1) במקום n. זה נקרא "תיקון בסל" ומתקן הטיה סטטיסטית.
חישוב שלב אחר שלב
דוגמה: ציוני מבחן
נתונים: 72, 85, 78, 91, 84
שלב 1: חשבו את הממוצע
- x̄ = (72 + 85 + 78 + 91 + 84) / 5 = 410 / 5 = 82
שלב 2: חשבו את הסטיות מהממוצע
| ערך (xi) | xi - x̄ | (xi - x̄)² |
|---|---|---|
| 72 | -10 | 100 |
| 85 | 3 | 9 |
| 78 | -4 | 16 |
| 91 | 9 | 81 |
| 84 | 2 | 4 |
שלב 3: סכמו את הריבועים
- Σ(xi - x̄)² = 100 + 9 + 16 + 81 + 4 = 210
שלב 4: חלקו וחשבו שורש
- אוכלוסייה: σ = √(210/5) = √42 ≈ 6.48
- מדגם: s = √(210/4) = √52.5 ≈ 7.25
פרשנות התוצאה
כלל 68-95-99.7 (להתפלגות נורמלית)
- 68% מהנתונים נמצאים בטווח μ ± 1σ
- 95% מהנתונים נמצאים בטווח μ ± 2σ
- 99.7% מהנתונים נמצאים בטווח μ ± 3σ
דוגמה
אם ממוצע הציונים 80 וסטיית התקן 10:
- 68% מהתלמידים קיבלו בין 70-90
- 95% מהתלמידים קיבלו בין 60-100
- כמעט כולם (99.7%) קיבלו בין 50-110
שונות vs סטיית תקן
| שונות (Variance) | סטיית תקן | |
|---|---|---|
| סימון | σ² או s² | σ או s |
| נוסחה | Σ(xi-μ)²/n | √[Σ(xi-μ)²/n] |
| יחידות | ריבוע היחידות | אותן יחידות כמו הנתונים |
| יתרון | קלה יותר לחישוב | קלה יותר לפרשנות |
מתי משתמשים בסטיית תקן?
1. בקרת איכות בייצור
מפעל מייצר ברגים באורך 10 מ"מ.
- סטיית תקן 0.1 מ"מ → איכות גבוהה (אחידות)
- סטיית תקן 1 מ"מ → בעיה בייצור (פערים גדולים)
2. שוק ההון (סיכון)
סטיית תקן של תשואות מניה מודדת את הסיכון:
- מניה עם σ = 5% → יציבה יחסית
- מניה עם σ = 30% → תנודתית (סיכון גבוה)
3. חינוך
פיזור ציונים בכיתה:
- סטיית תקן נמוכה → רוב התלמידים ברמה דומה
- סטיית תקן גבוהה → פערים גדולים בין תלמידים
4. מחקר מדעי
דיוק מדידות:
- σ קטן → מדידות מדויקות וחוזרות על עצמן
- σ גדול → יש שגיאות מדידה משמעותיות
נוסחה מקוצרת לחישוב מהיר
נוסחה שימושית למחשבון:
σ² = (Σxi²/n) - μ²
במילים: ממוצע הריבועים פחות ריבוע הממוצע.
דוגמה
נתונים: 2, 4, 6
- μ = (2+4+6)/3 = 4
- Σxi² = 4 + 16 + 36 = 56
- σ² = 56/3 - 16 = 18.67 - 16 = 2.67
- σ = √2.67 ≈ 1.63
טעויות נפוצות
1. בלבול בין n ל-n-1
❌ תמיד לחלק ב-n
✅ אוכלוסייה = n, מדגם = n-1
2. שכחה להוציא שורש
❌ σ = Σ(xi-μ)²/n (זו השונות!)
✅ σ = √[Σ(xi-μ)²/n]
3. חישוב סטייה לפני ממוצע
❌ לחשב סטיות לפני שיודעים את הממוצע
✅ קודם ממוצע, אחר כך סטיות
סיכום: מתי להשתמש במה?
| מצב | נוסחה |
|---|---|
| כל הנתונים של האוכלוסייה | σ (חילוק ב-n) |
| מדגם מתוך אוכלוסייה | s (חילוק ב-n-1) |
| n גדול (מעל 30) | כמעט אין הבדל |