מה זה מחשבון סטיית תקן?
מחשבון סטיית תקן מחשב את סטיית התקן של קבוצת נתונים. סטיית התקן מודדת כמה הנתונים מפוזרים סביב הממוצע — ערך גבוה אומר פיזור רב, ערך נמוך אומר ריכוז סביב הממוצע.
יש שתי גרסאות: סטיית תקן של אוכלוסייה (σ, מחלקים ב-n) כשיש את כל הנתונים, וסטיית תקן של מדגם (s, מחלקים ב-n-1) כשהנתונים הם רק חלק מהאוכלוסייה.
כלל 68-95-99.7: בהתפלגות נורמלית, 68% מהנתונים נמצאים בטווח ±1σ מהממוצע, 95% בטווח ±2σ, ו-99.7% בטווח ±3σ.
איך מחשבים סטיית תקן?
שלבים: 1) חישוב ממוצע, 2) חישוב הפרש כל ערך מהממוצע, 3) העלאה בריבוע של ההפרשים, 4) ממוצע הריבועים (שונות), 5) שורש ריבועי.
נוסחה: σ = √[Σ(xᵢ - μ)² / N] | s = √[Σ(xᵢ - x̄)² / (n-1)]
דוגמה: דוגמה 1: נתונים 2,4,4,4,5,5,7,9. ממוצע=5, σ=√5≈2.24. דוגמה 2: ציונים 70,80,90 — ממוצע=80, σ=√(200/3)≈8.16. דוגמה 3: משכורות 10K, 10K, 10K — σ=0 (אין פיזור).
מקור: סטטיסטיקה — מדדי פיזור
מתי משתמשים בסטיית תקן?
- שוק ההון: תנודתיות מניה = סטיית תקן התשואות. מניה עם σ=2% יציבה יותר מ-σ=5%
- בקרת איכות: מוצר תקין אם המידה בטווח ±3σ מהמפרט
- ציונים: "ציון Z" = (ציון-ממוצע)/σ. Z=1 אומר σ אחד מעל הממוצע
- רפואה: ערכי מעבדה — ערך תקין בטווח ±2σ מהממוצע
- סקרים: שגיאת תקן = σ/√n. עם 1000 נסקרים, השגיאה קטנה פי √1000 ≈ 31
- ספורט: עקביות שחקן — σ נמוך = ביצועים יציבים
שאלות נפוצות
למה מחלקים ב-n-1 במדגם?
זו תיקון בסל (Bessel's correction). הממוצע במדגם מוטה לעבר הנתונים, לכן השונות המחושבת קטנה מדי. החלוקה ב-n-1 מפצה על כך.
מה ההבדל בין שונות לסטיית תקן?
שונות (variance) היא ממוצע ריבועי ההפרשים. סטיית תקן היא השורש שלה. סטיית תקן נוחה יותר כי היא באותן יחידות כמו הנתונים.
מה זה כלל 68-95-99.7?
בהתפלגות נורמלית: 68% מהנתונים נמצאים בטווח ±1σ מהממוצע, 95% בטווח ±2σ, ו-99.7% בטווח ±3σ.
מה זה שגיאת תקן?
שגיאת התקן מודדת עד כמה ממוצע המדגם קרוב לממוצע האוכלוסייה. SE = σ/√n. ככל ש-n גדול יותר, השגיאה קטנה.
איך מזהים ערכים חריגים (outliers)?
ערך חריג הוא מעל Q3 + 1.5×IQR או מתחת ל-Q1 - 1.5×IQR. בהתפלגות נורמלית: מעבר ל-±3σ נחשב חריג.
סטטיסטיקה — מדדי פיזור