שיחה:היסטוגרמה

תוכן הדף אינו נתמך בשפות אחרות.
הוספת נושא
מתוך ויקיפדיה, האנציקלופדיה החופשית
תגובה אחרונה: לפני 5 שנים מאת בן נצר בנושא מקור השם

אני חושש שהערך עוסק בדיאגרמת מקלות ולא בהיסטוגרמה. כדאי לבדוק.

הערך עוסק בהיסטוגרמה, ומציג היסטוגרמה באופן גרפי תוך שימוש ב"דיאגרמת מקלות" (פעם ראשונה שאני נתקל במונח הזה בעברית). אם לקחת את הדוגמה מהערך, ההיסטוגרמה היא התפלגות הגילאים ביישוב: מחלקים את המשתנה (גיל) לכמה קבוצות שאין ביניהן חפיפה, וסופרים כמה יחידות במדגם (תושבי היישוב) נמצאות בתוך כל חלוקה שכזו. את אותו המידע אפשר להציג בטבלה או בדיאגרמת פאי (אם מנרמלים לאחוזים ולא למספר תושבים אבסולוטי). "דיאגרמת מקלות" היא פשוט דרך מקובלת להציג היסטוגרמות. ‏odedee שיחה 11:54, 13 בפברואר 2008 (IST)תגובה

העברה משיחת משתמש:Odedee[עריכת קוד מקור]

שלום. מתנצל אם זו לא הדרך המקובלת ליצור קשר. רציתי להסב תשומת ליבך (כאחד המומחים המדעיים בוויקיפדיה) לערך היסטוגרמה. מקריאת הערך נראה לי שהוא מתאים יותר לתאר דיאגרמת מקלות ולא היסטוגרמה.84.108.254.66 (שיחה | תרומות | מונה) לא חתם 00:00, 10 בינואר 2000 (IST)תגובה

זו דרך מקובלת בהחלט ליצור קשר. אינני נוהג להגדיר את עצמי כמומחה, אבל אסתכל על הערך תיכף. באופן כללי, היסטוגרמה אפשר בהחלט לשרטט כדיאגרמת מקלות (או פאי או כמה אחרות) - השאלה היא מה מוצג, לא איך מוצג. ‏odedee שיחה 11:49, 13 בפברואר 2008 (IST)תגובה
מצטער שאני מטריד בנקודה, אבל חשוב לי הדיוק בערך. נראה לי שבגלל המינוח בעברית יש בעייתיות. ראה בוויקיפדיה אנגלית את הערך en:Bar chart לעומת הערך en:Histogram. בדיאגרמת מקלות (Bar chart) אין חשיבות לשטח המלבן אלא רק לגובהו ולכן אפשר מקלות ואפשר מוטות(bars). בהיסטוגרמה חשוב מאוד השטח של כל "מלבן" המייצג קטגוריה. חשוב שהשטח הזה יהיה פרופורציוני לשכיחות היחסית של אותה קטגוריה. כמו כן, המרווחים בין המלבנים חשובים בהיסטוגרמה - ואילו בדיאגרמת מקלות, אין להם משמעות (כי כאמור אין משמעות "לרוחב המלבן" = ציר X). בהיסטוגרמה יכולים להיות מרווחים (בין עמודות=מלבנים) אבל משמעותם שבאותו אינטרוול אין תצפיות (שכיחות 0) ואילו בדיאגרמת מקלות/מוטות אין כאמור משמעות למרווחים אלה. לכן בגרף היסטוגרמה המלבנים צמודים ובדיאגרמת מקלות לא. בערך בעברית לא מוזכר נושא שטח המלבן כלל וגם לא שכיחות יחסית של קטגוריות. בנוסף, התיאור הגרפי שם פשוט לא מתאים לתאר היסטוגרמה, מה שמוצג שם זו דיאגרמת מקלות/מוטות.
קודם כל, אתה מוזמן לשפר את הערך על פי הבנתך, ואם יהיו חילוקי דעות עליה, אפשר יהיה לדון בכך בשיחת הערך (זה בכל מקרה המקום העדיף, לא כאן). הנקודה שאתה מעלה היא מעניינת, כי נראה לי שבהרבה מקרים לא נתקלים בהבדלים האלה. אני לא מומחה בהבדלים בין היסטוגרמה ל-bar diagram אבל אני חושב שיש שיאמרו שהם בכלל אותו דבר. שאלה: אם נתונה כמות האוכלוסייה בקבוצות הגיל 9-0, 19-10, 59-20 ו"60 ומעלה", האם אתה אומר שההתפלגות הזו איננה היסטוגרמה, כי רוחב העמודה האחרונה אינו ידוע? ‏odedee שיחה 22:38, 13 בפברואר 2008 (IST)תגובה
ראשית, תודה על הפידבק. לאחר שקראתי שוב הודעתי הקודמת רציתי להבהיר שאין לי כמובן כל טענות אליך (הניסוח שלי לא היה הכי מוצלח לטעמי בנקודות מסויימות). לגבי השאלה שהצגת- נגעת לדעתי בליבו של העניין. לא מצאתי הגדרה מספיק מדוייקת בספרות. אבל היסטוגרם אמור לתאר (גרפית) תצפיות. לכן מספר הנקודות בו יהיה סופי ולכן תמיד נוכל להגדיר אינטרוולים סופיים. כפי שהבאת בדוגמה שלך - זו בדיוק הבעיה - שאי אפשר לשרטט מלבן שרוחבו "60 ומעלה" (ושטחו פרופורציוני לשכיחות הקטגוריה) כי הקטגוריה לא סופית. בפועל, נפתור את הבעיה ע"י תחימת הקטגוריה, למשל 60-80 (או מה שיתאים למחקר). בנוסף, הקטגוריות (=אינטרוולים) צריכות להיות "צמודות" ככה ש- 0-9, 10-19 "הופכים" ל- 0-9.5, 9.5-19.5 וכו'. לכן למשל אי אפשר לשרטט היסטוגרם לנתונים בפורמט משתנה אורדינלי, אלא רק אם הם בפורמט משתנה אינטרוולי ומעלה. לסיום, אציין שישנם אמנם מקרים נדירים שמפרידים בין הקטגוריות בגרף (כלומר המלבנים מבודדים), בד"כ בכדי להבליט משהו מבחינה גרפית, אך הם לא מבודדים באופן טבעי כמו שבדיאגרמת מקלות/מוטות. לגבי "שיפור" הערך, מקווה שאוכל להגיע לכך בקרוב. כרגע הדוגמה שם מאוד -לא מדוייקת- והגרף שם, מבחינתי, פשוט לא נכון. ושוב תודה על הזמן שהקדשת לעיין בסוגיה שהעלתי.
אני מסכים שבדרך כלל המלבנים צמודים זה לזה, אבל אני לא בטוח מהי ההגדרה ה"נכונה" לאינטרוולים. כדאי למצוא כזו ואז לשפר את הערך בהתאם. אולי כדאי שתפנה אל עוזי ו. ונשמע את דעתו. ‏odedee שיחה 00:59, 14 בפברואר 2008 (IST)תגובה
תודה על הערותיך בנושא. 84.108.254.66 01:57, 14 בפברואר 2008 (IST)תגובה
Formally, a histogram may be though of as the *function* holding the number of occurrences of each value of a data set. I don't know of a standard way to represent a histogram graphically, but agree that a bar diagram is just one form, not necessarily the only one.
Therefore, I suggest transferring this value to "bar diagram" (which more accurately describes the current content), keeping the link for now. Eventually someone will write "histogram", probably explaining the difference. Uzi V. 04:10, 15 בפברואר 2008 (IST)תגובה
Odedee, הצדק עימך שאפשר לכלול היסטוגרמה כתת-סוג של דיאגרמת מקלות (ואף התרגום המילולי של היסטוגרם הוא ..."דיאגרמת מקלות"). אבל מאחר שהרוב המוחלט של הטקסטים המודרניים מבדילים בין השניים, כדאי, לדעתי, שגם בוויקיפדיה יהיה כך. לא יקרה אסון אם הערך לא יהיה מדוייק. אני מבין שיש עוד הרבה עבודה על וויקיפדיה. נמתין בסבלנות עד שייגמר הטיפול בערכים החשובים/פופולריים (הארי פוטר ושות') ושיגיע מועדם של ערכים איזוטריים שכאלה. (לא נכתב בציניות אלא מתוך הכרה במגבלות כוח האדם המצומצם העוסק במלאכת הכתיבה/עריכה). יום טוב ושוב תודה על הפידבקים שלך!.
התחלתי ליצור את הערך דיאגרמת מקלות, כך נוכל להבדיל (ולדקדק בהבחנה) בין שני הכלים + הדוגמה הועברה לערך דיאגרמת מקלות.
גם אני מכיר את המונחים כנבדלים זה מזה באופן אותו תאר האנונימי. יחסיות האמת • ט"ו באדר א' ה'תשס"ח 02:00:22

כל הכבוד[עריכת קוד מקור]

הערך תופס צורה יפה. הערה קטנה: את התמונות והטבלאות עדיף לשים מיושרות לשמאל, בדרך כלל בגודל 250px. זה מאפשר ניצול טוב יותר של רוחב הדף ומונע גלילה מיותרת. ‏odedee שיחה 10:45, 23 בפברואר 2008 (IST)תגובה

מאוד נראה כדיאגרמת מקלות ולא כהיסטוגרמה[עריכת קוד מקור]

ציר הY בהיסטורגרמה ככל הידוע לי הוא צפיפות ולא שכיחות. כמו כן הגבולות צריכים להיות אמיתיים ולא מדומים כמו שנראה בגרף (יש רווח=מדומים). אני לא יודעת איך יוצרים בויקי גרפים אבל לדעתי הטעות היא קריטית משו..אורלילי - שיחה א' בכסלו ה'תשע"ב 21:31, 27 בנובמבר 2011 (IST)תגובה

מקור השם[עריכת קוד מקור]

תוכן הפסקה משובש וחסר משמעות. נראה שחסר משפט או שניים. בן נצר - שיחה 11:20, 22 במרץ 2019 (IST)תגובה

דיווח שאורכב ב-12 בספטמבר 2020[עריכת קוד מקור]

דיווח מהדף ויקיפדיה:דיווח על טעויות

כתוב כי שטח ההיסטוגרמה מייצג את השכיחות (שזה נכון), ומיד לאחר מכן רשום שציר ה y מייצג את השכיחות (שזה לא נכון ולא יכול להיות נכון אם השטח מייצג את השכיחות).

מה שאמור להיות כתוב: שטח - מייצג את השיחות גובה/ציר הy - מייצג "צפיפות" (כלומר "שכיחות ליח' שטח).