שיחה:Big data

תוכן הדף אינו נתמך בשפות אחרות.
מתוך ויקיפדיה, האנציקלופדיה החופשית

תיקנתי מעט את הנושא של חישוב מבוזר. MapReduce היא שיטת עבודה בחישוב מבוזר במקביל. גם Hadoop משתמש בשיטת עבודה כזו. המוצר המקורי בו נעשה שימוש בשיטה זו הוא Google MapReduce ולכן הנחתי שהכוונה היא אליו. Avi rosenthal18:38, 14 במרץ 2012 (IST)[תגובה]

הוספתי תוכן לגבי הביקורת שהעלתה דנה בוייד לגבי השימוש שנעשה ב Big Data במרחב האקדמי כפי שמופיע בערך האנגלי אך משום מה היא נמחקה בטענה כי הנושא אינו בעל חשיבות,דעתכם?

מדובר בביקורת בנאלית - את המשפט "עיסוק יתר בשיטות עיבוד המידע והטיפול בו ללא שמירה על עקרונות בסיסיים של מחקר אקדמי כגון מדגם מייצג עלולים להוביל להטיה בתוצאות המחקר" אפשר לומר על כל פעולה של עיבוד מידע, ובשינוי ניסוח קל - על כל פעולה אנושית, למשל "עיסוק יתר בשיטות קילוף התפוז והטיפול בו ללא שמירה על עקרונות בסיסיים של שימוש בסכין כגון זהירות עלולים להוביל לפציעות". דוד שי - שיחה 17:58, 19 בינואר 2013 (IST)[תגובה]

על הבנאליות של הביקורת ניתן להתווכח,אך אני אחדד שאלתי,האם הערכים בשפות השונות לא אמורים להיות זהים ככל שניתן?האם זה שהתוכן קיים בערך המקורי באנגלית לא אומר בהכרח שהוא "כשר" גם לערך בעברית? אם התוכן אינו מתאים לערך אזי יש צורך למחוק אותו גם מכל מופעיו בשלל השפות בו הוא מופיע,לא כך?

ממש לא. לכל ויקיפדיה עורכים משלה ושיקולים משלה. בדיון בדף השיחה אפשר להציג את המתרחש בוויקיפדיות אחרות, אך בדרך כלל אין לזה משקל רב. דוד שי - שיחה 19:42, 30 בינואר 2013 (IST)[תגובה]

בגיליון דצמבר 2012 - ינואר 2013 של כתב העת "אקזקיוטיב הופיעו מאמרים אחדים בנושא Big Data, והתרגום שניתן למושג זה הוא "נחשולי נתונים". בעיני זהו תרגום נאה מאוד, אבל לא פגשתי אותו בשום מקום אחר. מה דעתכם על שינוי שם הערך לנחשולי נתונים? דוד שי - שיחה 13:14, 9 במרץ 2013 (IST)[תגובה]

השם "נחשול" לא מתאים. הרי לא מדובר בטיפול בתופעה חד פעמית כמו גל שבא ועובר. גיא - שיחה 17:11, 9 במרץ 2013 (IST)[תגובה]
התרגום (הלא מוצלח) טרם השתרש, מקרה "רהב" ו"נפטון" קלאסי. כזכור לך, אנחנו משקפים מציאות ולא יוצרים אותה. Ranbarשיחהבואו לתיאטרון - תהנו מהמזגן

תיקון ההגדרה של ביג דטה בהתיחס להגדרה בויקיפידיה האנגלית[עריכת קוד מקור]

ההגדרה באנגלית היא, שאוסף נתונים נקרא "גדול" אם הוא גדול ומסובך עד כדי כך שלא ניתן בכלים הקימים לנהל אותו, לאחסן, לנתח וכו'. הבעיה, שלפי הגדרה זו, לא ייתכן שיימצא פתרון לביג דטה!!! כי ברגע שיימצא פתרון, הביג דטה יתרחק מחדש לתחום הבלתי מושג... לכן נמנעתי לאחר עיון מתרגום הערך באנגלית. במקום להסתמך על סימנים חיצוניים משתנים בהגדרות הנוכחיות (האנגלית וגם העברית), אסתמך על המחוללים של ביג דטה, שהם תמיד מובילים לבעיות אי שליטה בנתונים. להלן ההגדרה שבכוונתי לתת: ביג דטה הוא מידע מבוזר, שמגיע ממקורות רבים, בפורמטים מגוונים, בעלי איכויות משתנות, או שמכיל תכנים שאינם מתוכננים ממרכז ניהול יחיד. מספיק שיהיה מאפין אחד מהנ"ל כדי שהנתונים יצאו משליטה ולכן כבר יתאימו למה שנקרא אינטואיטיבית ביג דטה.


קישור שבור[עריכת קוד מקור]

במהלך מספר ריצות אוטומטיות של הבוט, נמצא שהקישור החיצוני הבא אינו זמין. אנא בדקו אם הקישור אכן שבור, ותקנו אותו או הסירו אותו במקרה זה!

--Matanyabot - שיחה 20:09, 7 בינואר 2014 (IST)[תגובה]


מונח בעיברית[עריכת קוד מקור]

בכתבה שפרסמתי בגלובס בנושא ביג דטא (http://www.globes.co.il/news/article.aspx?did=1000796701) השתמשתי בביטוי ״מידעצום״ היות ולא הייתה (ועדיין אין) מילה בעיברית. האם כדאי להפנות ״מידעצום״ לערך זה? או אולי לציין את ההצעה ל״עיברות״ ?

ראשית, איני בטוח שתוספת הכתבה בערך מועיל, מבלי לפגוע בכבודך, חלילה. הכתבה שלך (כידוע, יש כלל ויקיפדי נגד כתיבה עצמית, לא יודע אם זה חל על קישורים) ישנה, והרבה קרה מאז בתחום הזה. שנית, המונח שהצעת באותה כתבה, מה לעשות, לא תפס. ויקיפידה אינה מילון חידושים לשפה העברית. אם וכאשר המונח יתפוס (מסופקני, נוכח חלוף הזמן), אז אפשר יהיה להשתמש בו. --מיכאלל - שיחה 21:49, 25 במאי 2014 (IDT)[תגובה]

תיקון הגדרת ביג דטה למעלה[עריכת קוד מקור]

התיקון למטה של ביג-דטה על פי הערך big data בויקיפדיה באנגלית, בוצע ע"י Edith Ohri, משתמש Editho

? אדם מה - שיחה 13:12, 1 ביוני 2015 (IDT)[תגובה]

נתוני עתק לפי החלטת האקדמיה ללשון. אבנר - שיחה 09:23, 14 באפריל 2016 (IDT)[תגובה]

נגד "ביג דאטה" הוא השם המקובל בשיח העברי. העברה ל"נתוני עתק" תהיה ניתוק מוחלט מהמציאות (בדיוק כמו העברה של אינטרנט למרשתת). עמרישיחה 10:08, 14 באפריל 2016 (IDT)[תגובה]
אין שום סיכוי שהשם "נתוני עתק" ייקלט (המילה "עתק" רחוקה מלהיות בשימוש נפוץ), ואני משוכנע שגם האקדמיה ללשון יודעת זאת. נשארה השאלה: מדוע הוצע מושג עברי שאין סיכוי שייקלט? דוד שי - שיחה 21:08, 14 באפריל 2016 (IDT)[תגובה]
דוד ועמרי, נתוני עתק נמצאים בשימוש עוד הרבה לפני החלטת האקדמיה. במבחן גוגל יש עשרות אלפי מופעים. האקדמיה פשוט נתנה לכך גושפנקא. אבנר - שיחה 11:55, 15 באפריל 2016 (IDT)[תגובה]
גוגל נותן הרבה פחות מעשרות אלפי מופעים. מה גם שזה כלל לא רלוונטי האם המושג העברי יקלט. יותר חשוב זאת השאלה האם הוא כבר נקלט, מה שרחוק מאוד מהמציאות. אני עובד בחברה שעוסקת בתחום. נראה לי שיש לי קצת מושג. עמרישיחה 13:14, 15 באפריל 2016 (IDT)[תגובה]
גם אני עובד בחברה שעוסקת בתחום ומשתמש בהרבה מונחים באנגלית על אף שיש להם תרגום נאות. זו עדיין ויקיפדיה העברית ולא האנגלית. אבנר - שיחה 13:22, 15 באפריל 2016 (IDT)[תגובה]
גם לאינטרנט יש תרגום לעברית. מדוע אנחנו לא משתמשים במונח העברי שלו? מאותה סיבה שלא יהיה נכון כרגע להעביר ל"נתוני עתק". אם המונח העברי היה נקלט והיה נמצא בשימוש באופן סביר, עוד היה אפשר לטעמי לשקול את זה, אבל זה רחוק מאוד מהמציאות. עמרישיחה 13:49, 15 באפריל 2016 (IDT)[תגובה]
גוגל מציג 84 מופעים של נתוני עתק, וחלקם בעקבות הודעת האקדמיה ללשון. נותרו כמה עשרות מופעים עצמאיים, הרבה יותר ממה שחשבתי (חשבתי על 0), ועדיין מספר שאינו מצדיק שינוי שם. דוד שי - שיחה 14:09, 15 באפריל 2016 (IDT)[תגובה]
וכמה מופעים יש של Big data בעברית? אבנר - שיחה 14:53, 15 באפריל 2016 (IDT)[תגובה]
הרבה יותר. משום מה לא מופיע מספר המופעים כשעושים חיפוש מתקדם, אבל ברור שמדובר בכמות גדולה בהרבה. בנוסף יש גם לא מעט מופעים עבור "ביג דאטה". עמרישיחה 15:02, 15 באפריל 2016 (IDT)[תגובה]
נגד בעקרון אני בעד שימוש בשם עברי. אבל נהגו כאן להתשמש בשמוש עבריים רק אם הם נמצאים בשימוש רחב, וזה לא המצב עם big data. אינג. יונה ב. - שיחה - הבה נכחילה 17:58, 14 ביוני 2016 (IDT)[תגובה]
בקובץ התקנות מופיע המושג "נתוני עתק", כנראה בעקבות צה"ל. דוד שי - שיחה 07:31, 11 בנובמבר 2020 (IST)[תגובה]

לדעתי התרגומים הקודמים ל-volatility (נדיפות) ו-Veracity (מהימנות) עדיפים על אי-יציבות ואי-אמינות, כיוון שהם מדויקים יותר ואינם מתארים את המצב על דרך השלילה. כמו כן, יתכן ש"אמיתוּת" מתאים יותר ממהימנות. שרשרשיחה 10:04, 11 בפברואר 2017 (IST)[תגובה]