סטטיסטיקה

סטיית תקן — מה זה ואיך מחשבים

סטיית תקן מודדת כמה הנתונים מפוזרים סביב הממוצע. נוסחה: σ = √[Σ(xi-μ)²/n]. ככל שסטיית התקן גבוהה יותר, הנתונים יותר מפוזרים. לדוגמה: ציונים 80,82,78,81,79 → ממוצע 80, סטיית תקן 1.41.

מה זו סטיית תקן?

סטיית תקן (Standard Deviation) מודדת כמה הנתונים "מפוזרים" או "מתפזרים" סביב הממוצע.

  • סטיית תקן נמוכה: הנתונים קרובים לממוצע (אחידות)
  • סטיית תקן גבוהה: הנתונים רחוקים מהממוצע (שונות גדולה)

דוגמה אינטואיטיבית

שתי כיתות עם ממוצע 80:

  • כיתה א': ציונים 78, 79, 80, 81, 82 → סטיית תקן נמוכה (כולם קרובים ל-80)
  • כיתה ב': ציונים 50, 70, 80, 90, 110 → סטיית תקן גבוהה (פערים גדולים)

הנוסחה

סטיית תקן של אוכלוסייה (σ)

σ = √[Σ(xi - μ)² / n]

סטיית תקן של מדגם (s)

s = √[Σ(xi - x̄)² / (n-1)]

ההבדל: במדגם מחלקים ב-(n-1) במקום n. זה נקרא "תיקון בסל" ומתקן הטיה סטטיסטית.

חישוב שלב אחר שלב

דוגמה: ציוני מבחן

נתונים: 72, 85, 78, 91, 84

שלב 1: חשבו את הממוצע

  • x̄ = (72 + 85 + 78 + 91 + 84) / 5 = 410 / 5 = 82

שלב 2: חשבו את הסטיות מהממוצע

ערך (xi)xi - x̄(xi - x̄)²
72-10100
8539
78-416
91981
8424

שלב 3: סכמו את הריבועים

  • Σ(xi - x̄)² = 100 + 9 + 16 + 81 + 4 = 210

שלב 4: חלקו וחשבו שורש

  • אוכלוסייה: σ = √(210/5) = √42 ≈ 6.48
  • מדגם: s = √(210/4) = √52.5 ≈ 7.25

פרשנות התוצאה

כלל 68-95-99.7 (להתפלגות נורמלית)

  • 68% מהנתונים נמצאים בטווח μ ± 1σ
  • 95% מהנתונים נמצאים בטווח μ ± 2σ
  • 99.7% מהנתונים נמצאים בטווח μ ± 3σ

דוגמה

אם ממוצע הציונים 80 וסטיית התקן 10:

  • 68% מהתלמידים קיבלו בין 70-90
  • 95% מהתלמידים קיבלו בין 60-100
  • כמעט כולם (99.7%) קיבלו בין 50-110

שונות vs סטיית תקן

שונות (Variance)סטיית תקן
סימוןσ² או s²σ או s
נוסחהΣ(xi-μ)²/n√[Σ(xi-μ)²/n]
יחידותריבוע היחידותאותן יחידות כמו הנתונים
יתרוןקלה יותר לחישובקלה יותר לפרשנות

מתי משתמשים בסטיית תקן?

1. בקרת איכות בייצור

מפעל מייצר ברגים באורך 10 מ"מ.

  • סטיית תקן 0.1 מ"מ → איכות גבוהה (אחידות)
  • סטיית תקן 1 מ"מ → בעיה בייצור (פערים גדולים)

2. שוק ההון (סיכון)

סטיית תקן של תשואות מניה מודדת את הסיכון:

  • מניה עם σ = 5% → יציבה יחסית
  • מניה עם σ = 30% → תנודתית (סיכון גבוה)

3. חינוך

פיזור ציונים בכיתה:

  • סטיית תקן נמוכה → רוב התלמידים ברמה דומה
  • סטיית תקן גבוהה → פערים גדולים בין תלמידים

4. מחקר מדעי

דיוק מדידות:

  • σ קטן → מדידות מדויקות וחוזרות על עצמן
  • σ גדול → יש שגיאות מדידה משמעותיות

נוסחה מקוצרת לחישוב מהיר

נוסחה שימושית למחשבון:

σ² = (Σxi²/n) - μ²

במילים: ממוצע הריבועים פחות ריבוע הממוצע.

דוגמה

נתונים: 2, 4, 6

  • μ = (2+4+6)/3 = 4
  • Σxi² = 4 + 16 + 36 = 56
  • σ² = 56/3 - 16 = 18.67 - 16 = 2.67
  • σ = √2.67 ≈ 1.63

טעויות נפוצות

1. בלבול בין n ל-n-1

❌ תמיד לחלק ב-n

✅ אוכלוסייה = n, מדגם = n-1

2. שכחה להוציא שורש

❌ σ = Σ(xi-μ)²/n (זו השונות!)

✅ σ = [Σ(xi-μ)²/n]

3. חישוב סטייה לפני ממוצע

❌ לחשב סטיות לפני שיודעים את הממוצע

✅ קודם ממוצע, אחר כך סטיות

סיכום: מתי להשתמש במה?

מצבנוסחה
כל הנתונים של האוכלוסייהσ (חילוק ב-n)
מדגם מתוך אוכלוסייהs (חילוק ב-n-1)
n גדול (מעל 30)כמעט אין הבדל

מחשבונים קשורים

שאלות נפוצות

מה סטיית תקן אומרת לנו?

סטיית תקן מודדת את הפיזור של הנתונים סביב הממוצע. סטיית תקן נמוכה = נתונים קרובים לממוצע (אחידות). סטיית תקן גבוהה = נתונים מפוזרים (שונות גדולה).

מה ההבדל בין סטיית תקן של מדגם לאוכלוסייה?

באוכלוסייה (σ) מחלקים ב-n. במדגם (s) מחלקים ב-(n-1) כדי לתקן הטיה סטטיסטית. במדגמים גדולים ההבדל זניח.

האם סטיית תקן יכולה להיות שלילית?

לא. סטיית תקן היא תמיד אפס או חיובית. היא אפס רק כשכל הנתונים זהים (אין פיזור כלל).

מה הקשר בין סטיית תקן לשונות?

שונות (variance) היא סטיית תקן בריבוע. σ² = שונות. סטיית תקן נוחה יותר כי היא באותן יחידות של הנתונים.

מתי משתמשים בסטיית תקן?

בבקרת איכות (סטייה מהתקן), בפיננסים (סיכון של מניה), בחינוך (פיזור ציונים), ובמחקר מדעי (דיוק מדידות).

מאמרים קשורים