שיחת ויקיפדיה:מיזמי ויקיפדיה/מיזם פיתוח ערכים בולטים בתהליך חצי אוטומטי בסיוע בוט

תוכן הדף אינו נתמך בשפות אחרות.
הוספת נושא
מתוך ויקיפדיה, האנציקלופדיה החופשית

יצירת/גיור הבוט למיזם[עריכת קוד מקור]

שלום למפעילי הבוטים, DMY, Bharel, ערן, Kotz, Matanya, GuySh, Uziel302, האם מישהו מכם יוכל לקחת על עצמו לייצר/לגייר בוט המתאים למיזם דנא? להרחבה ראו דיון קודם. תודה רבה והמשך שבוע נעים, Amiroשיחה 09:50, 3 באפריל 2019 (IDT)תגובה

Amiro, אני מתנגד נחרצות לכל הקשור לתרגום מכונה. אין טעם לבקש פיתוח כשאין אישור של הקהילה להכניס תרגום מכונה לערכים. אתה רוצה לעשות גוגל טרנסלייט ולבדוק קפדנית, תעשה את זה לבד. Uziel302 - שיחה 10:22, 3 באפריל 2019 (IDT)תגובה
Uziel302, לא מדובר ב"הכנסת תרגום מכונה לערכים". מדובר בבוט שיצור תוכן לטיוטה, ואלו יעברו למרחב הערכים רק לאחר שויקיפד אנושי יעבוד עליהם בהתאם לאמות המידה הרגילות שעושים בהן שימוש בויקיפדיה:העברת דפי טיוטה. זה סך הכל כלי עבודה. Amiroשיחה 10:25, 3 באפריל 2019 (IDT)תגובה
Amiro, מה מונע ממך לעשות את זה בערך אחד ולהמחיש לנו שאתה מצליח להביא את הערך לאמות המידה הרגילות? האמנם השלב של העתק הדבק מגוגל טרנסלייט הוא עיקר העבודה שצריך בוט בשביל זה? Uziel302 - שיחה 10:28, 3 באפריל 2019 (IDT)תגובה
זה ממש לא גוגל טרנסלייט. לצורך המחשה ראה את הערך הזה שנוצר על ידי בוט בויקי השוודית (הדוגמה הובאה על ידי ויקי ג'נקי). אני באמת לא מבין מה ההתנגדות שיהיו 1,000 ערכים כמו הערך השוודי בטיוטה על יישובים גדולים, ושויקיפדים המשתתפים במיזם ישפרו אותם ויעבירו אותם למרחב הערכים כמו כל ערך אחר. Amiroשיחה 10:32, 3 באפריל 2019 (IDT)תגובה

דוגמא לאופן בו הערכים הללו יכולים להיראות אם נשכיל להשתמש בבוט כך צריך להיראות התוצר הסופי של בוט שייצר את הבסיס לערך מסוג זה + וכך צריך להיראות הערך לאחר התוספות הקטנות והתיקונים הראשוניים. אשמח לשמוע משוב לגבי דברים שרצוי לתקן. WikiJunkie - שיחה 20:14, 3 באפריל 2019 (IDT)תגובה

מיזם נחמד, חבל שאני לא מפעיל בוט ולא יודע איך. גיא - פתרון למחיקה 20:23, 3 באפריל 2019 (IDT)תגובה
בוט לא יודע ולא יכול לייצר ערכים יש מאין. הוא צריך בסיס נתונים שממנו הוא שואב ומגדירים תוכן. למשל אם יש בסיס נתונים של ערים ומספר תושבים אפשר להגדיר תבנית של "<עיר> היא עיר ב<מדינה> ואוכלוסייתה <תושבים> תושבים" וכו'. בעיה אחת ביצירת בוט כזה היא ענייני תעתוק שבהם צריך להיזהר, ובעיה אחרת היא שערכים שמכילים רק מידע סטטיסטי ולא תוכן של ממש - אפשר לייצר אותם מראש כטבלה. (למשל אין צורך לייצר 6 ערכים שיצינו רק את האוכלוסייה לכל שורה במחוזות סנט וינסנט והגרנדינים - הטבלה מתארת את המידע היטב). בכל זאת, אם מרגישים שתבנית מוכנה לערך יכולה להפוך את כתיבת הערך לקלה ופשוטה יות, אפשר להיעזר בויקיפדיה:יצירה על פי תבנית. אם תרצו אפשר להעשיר את התבניות שנוצרות שם כך שיכילו כבר מספר תושבים או שטח מוויקינתונים והתוצאה דומה למדי לבוט ולא מצריכה כמעט עבודה. ערן - שיחה 21:06, 3 באפריל 2019 (IDT)תגובה
תודה על המשוב. אני בהחלט מבין שישנן אפשרויות אחרות ליצר ערכים, אף על פי כן, הפעם אני מציע משהו מעט שונה ממה שניסינו עד היום... וזאת משום שאני מעוניין לבדוק כאן אם בעצם משתמשים בודדים מסוגלים ליצור כמות גדולה של ערכים בסיסיים סבירים (לנושאים חשובים בלבד כמו ערכי הערים הגדולות ביותר בעולם שעדיין לא נוצרו) באמצעות תהליך העבודה המזורז שאני מנסה לגבש כאן. על מנת שהאפשרות שאני מציע תהיה ברת קיימא (המגבלות האנושיות שלי לא מאפשרות לי לייצר אלף ערכים באמצעות ויקיפדיה:יצירה על פי תבנית בזמן סביר), אהיה חייב להקטין באופן מהותי את משך הזמן וכמות הקליקים שמעורבים ביצירת ערך חדש מאפס. מצד שני אני לא חותר לייצר קצרמרים של שורה אחת - בכוונתי לוודא שהערכים הללו כן יכילו תוכן מתורגם בנוסף לתוכן הבסיסי שהבוט מייצר (כפי שהדגמתי מעל).
ממה שכתבת מעל, הבנתי שאתה סבור שכן אפשר ליצור מהדורה עברית לבוט מהסוג הזה, אבל יצירתו כנראה תהיה מורכבת מדי ותצריך זמן רב מדיי בהכנתו, ולכן הצעת לשקול ללכת על האפשרויות הקיימות?
במידה שכך, בכוונתי לחפש דרכים חלופיות שיאפשרו לי לקבל תוצאה דומה במינימום קליקים (יש לי כבר עתה רעיון חלופי שאני מעוניין לבדוק), אלא אם כן יש עורך אחר שסבור שהוא מסוגל לייבא/לגייר את הבוט השוודי? WikiJunkie - שיחה 21:26, 3 באפריל 2019 (IDT)תגובה
לגבי התעתוק - עברתי בעצמי על כל התעתיקים של כל הערים ברשימה, ובמקרה שטעיתי מישהו יתקן את זה לאחר שהערך יווצר (הערכים לא חייבים להיות מושלמים עוד משלב א'). איך זה שונה מהמצב בו עורך רגיל בויקיפדיה העברית יוצר מאפס ערך על עיר עם התעתוק הלא נכון ומגיע אחר כך עורך אחר שמתקן את התעתוק של השם? (האם כולם חייבים להתייעץ עם אבשלום קור לפני יצירת ערכים על ערים?) WikiJunkie - שיחה 21:30, 3 באפריל 2019 (IDT)תגובה
עוד עניין - ציינת למעלה ש"ערכים שמכילים רק מידע סטטיסטי ולא תוכן של ממש - אפשר לייצר אותם מראש כטבלה" - אנא בדוק שוב את הערך קוימבטור, הוא מכיל טקסטים מורכבים יותר שלא ניתן לשלוף ישירות מויקינתונים ולסדר בטבלה פשוטה ("פני השטח באזור קוימבטור הם שטוחים" + "האזור שמשתרע מסביב לקוימבטור מאופיין בצפיפות אוכלוסייה גבוהה" + "האזור סביב קוימבטור מורכב ברובו מאדמות חקלאיות" + "החודש החם ביותר הוא מרץ, כאשר באותו החודש הטמפרטורה הממוצעת היא 32 מעלות צלזיוס", וכו'). כמו כן, לא הצעתי שהם יכילו רק מידע סטטיסטי - אני מתכוון לוודא שאל כל הערכים הללו תתווסף לפחות שורה או שתיים של מידע נוסף שאיננו מידע סטטיסטי (כפי שעשיתי בערך קוימבטור) . WikiJunkie - שיחה 21:36, 3 באפריל 2019 (IDT)תגובה
WikiJunkie, לייצר המוני ערכים עם שמות שגויים או בעייתיים זו בעיה בפני עצמה, זה יותר מסתם "ערך לא מושלם", בטח כשאפשר למנוע את זה מראש. ביצוע העברות להמוני ערכים ותיקון תוכן בהתאם הוא לא דבר של מה בכך, ואני אומר את זה מניסיון. מרפרוף קליל מאוד, אני מזהה כבר לפחות 10 טעויות, ואני לא בקיא בתעתיק שפות הודיות שממלאות חלק נכבד מהרשימה. העובדה שמישהו יטפל בתעתיקים הייתה אחד התנאים שלפיהם חשבתי שההתנגדות שלי לא אמורה להשפיע. Mbkv717שיחה • כ"ז באדר ב' ה'תשע"ט • 21:42, 3 באפריל 2019 (IDT)תגובה
שוב, אני רוצה להבהיר שלצערי הרב לא יהיה לי כאן שום רובוקופ או ג'יני שיסייעו לעשות מעשה קסם כך שעד מחר יהיו פה אלף ערכים נוספים. מדובר פשוט בשיטת עבודה אחרת שתאפשר לי לייצר ביום כנראה בין 4-8 ערכים התחלתיים סבירים לנושאים חשובים (אם תהיה לי מוטיבציה לעשות זאת). 4-8 ערכים ביום לא יגרמו להצפה של הויקיפדיה העברית בשגיאות (הכוונה גם להשתמש במרחב טיוטה בעת פיתוח הערכים) - ודאי לא כעת לאחר שעברתי על כל אלף התעתיקים ווידאתי שהתעתיקים יהיו סבירים (כיצד זה שונה מכך שהייתי יוצר בעצמי בלי שום עזרה אחרת ערכים עם תעתיק לא טוב?). האם ישנו איסור על יצירת ערכי ערים עם תעתיק שאינו 100% לפי כללי התעתוק? אם כן, אנא הפנו אותי לדף המדיניות בו הכלל הזה רשום. WikiJunkie - שיחה 21:56, 3 באפריל 2019 (IDT)תגובה
העניין הוא שאי אפשר לייצר גם מנטרים במהירות גבוהה מהרגיל - אני משתדל לעבור על ערכים חדשים שכוללים תבנית עיר ולטפל בבעיות שנוצרות (אתם מוזמנים לעבור על השינויים עשיתי בקוימבטור, שמבחינתי בלעדיהם הוא לא במצב סביר, וקחו בחשבון שלקחו לי כמה דקות לעשות אותם, ותכפילו בכמה ערכים), ויצירה מראש של ערכים בעייתיים אולי לא אסורה (ואיני בקי במדיניות בנושא), אבל בעיקר מקשה על אחרים (אם דיברנו עד עכשיו על הצפה של קצרמרים סבירים, מבחינתי הצפת שמות בעייתיים דומה יותר להצפת ערכים טעוני שכתוב). אני גם נוהג לטפל בקישורים פנימיים לערכים חדשים, וזה גם יכול לקחת כמה דקות טובות לכל ערך. במקרים מסובכים, בירור שם יכול לקחת לי רבע שעה (בערים גדולות זה כנראה לא יקרה, אבל לפעמים פשוט אי אפשר), ולפעמים זו רק התחלה של דיון בין בעלי ידע שיכול להימשך כמה ימים. אתה מוזמן גם להסתכל בתרומות שלי ולראות כמה זמן אני משקיע בממוצע בוויקיגמדות של ערכים חדשים, ובעוד שנה וקצת כנראה שיהיה לי הרבה פחות זמן לטפל בדברים האלה, ואני לא רואה הרבה עורכים נכנסים לתחום הזה (מיותר לציין שהדבר הזה מעכב תוכניות שלי עצמי לכתיבת ערכים). אני גם לא רואה הרבה עורכים ותיקים מכניסים בכוונה תחילה טעויות לוויקיפדיה, ואם יש עורכים שחוזרים על טעות מסוימת פעמים רבות אני משתדל מאוד להבהיר להם ולגרום להם לא לחזור עליה. בינתיים אני רואה שהעברת את קוימבטור למרחב הערכים, אז כבר לא כזה ברור לי שמדובר במרחב טיוטה. Mbkv717שיחה • כ"ז באדר ב' ה'תשע"ט • 22:21, 3 באפריל 2019 (IDT)תגובה
ראוי להזכיר במקרה הזה גם את וק:שום גמדים לא יבואו. Mbkv717שיחה • כ"ז באדר ב' ה'תשע"ט • 22:25, 3 באפריל 2019 (IDT)תגובה
העברתי את הערך למרחב הערכים כי אני כתבתי בו את כל התוכן, עם ניסוחים בשפה שלי, על סמך ערך שיצר בוט בויקיפדיה השוודיה (לא מדובר פה על בוט שיצר ערך מאפס עבור הויקיפדיה העברית) + כי אני עברתי עליו היטב + כי הוספתי לו מידע נוסף + כי אני מעוניין כעת לראות מה הקהילה מתקנת על מנת שאבין טוב יותר כיצד לייצר ערכים טובים יותר בתהליך מהסוג הזה בפעם הבאה. תודה על שעזרת לשפר אותו.
לא ידעתי שאתה משקיע זמן כה רב בבדיקה ובתיקון של ערכים. תודה! נכון לעתה עושה הרושם שישנם מכשולים שונים שמקשים עליי לבצע בכוחות עצמי פיתוח של ערכים בתהליך חצי אוטומטי כפי שהייתי רוצה. ייתכן מאוד שהמיזם הזה יצטרך להמשיך להיות מושהה עד שמשתמש:בורה בורה ימצא זמן לסייע לי כאן. אני בהחלט מבין את החשש שלך מכך שאוסיף בכל יום 4-8 ערכים חדשים, משום שאתה מרגיש שאתה חייב למצוא את הזמן לטפל בכל השינויים שמבוצעים בויקיפדיה העברית. משום כך ודאי תשמח לשמוע שאין לי כוונה להתמקד בערכים בעלי חשיבות מינורית, ולכן השקעתי לא מעט זמן בגיבוש הרשימה הזו שמכילה את כל ערכי הערים הכי גדולות (וכמו גם ערכי ערים גדולות אשר הכי מבוקשות בויקיפדיה האנגלית) שמשום מה לא נכתבו עד היום בויקיפדיה העברית. אם היית מבקש ממני לא לכתוב 4-8 ערכים ביום על כפרים נידחים בפפואה גינאה החדשה משום שאני מבזבז לכולם פה את הזמן הייתי מבין ואולי אף מסכים עם טענתך, אבל פה מדובר בערים עצומות כמו קוימבטור וויסאקפאטנאם שמכילים ביחד קרוב ל-3 מיליון תושבים! WikiJunkie - שיחה 22:50, 3 באפריל 2019 (IDT)תגובה
WikiJunkie, אם אתה הלקוח היחיד של הבוט, חבל על זמן הפיתוח. אם יש צפי לתורמים רבים שיעזרו בבוט ויפיקו בעזרתו ערכים איכותיים באופן שלא היה ניתן בלעדיו, אנא פרט למה אתה מאמין שזה המצב. Uziel302 - שיחה 23:08, 3 באפריל 2019 (IDT)תגובה
גם אני אהיה לקוח של הבוט. אני חושב שג'נקי יסכים שהפיתוח יותנה בגיוס של 10 עורכים מראש. עניין נוסף, כמובן שהמיזם יתצבע בשלבים, מציע להתחיל עם פיילוט של עשרה ערכים. ככה לא יגרם שוב נזק מחבלי הלידה.Amiroשיחה 06:22, 4 באפריל 2019 (IDT)תגובה
מאוד אופטימי מצדך. לא תמצא 10 עורכים שמוכנים לשתף פעולה לאורך זמן במיזם ויקיפדיה אחד. ייתכן שעדיף יהיה לעבוד על פיתוח/גיור הבוט לבד. WikiJunkie - שיחה 07:27, 4 באפריל 2019 (IDT)תגובה

אמ;לק; @Amiro; אינני מעוניין; איחתלי לבוט בהצלחה. ‏«kotz» «שיחה» 14:23, 12 באפריל 2019 (IDT)תגובה

הערות על קוימבטור[עריכת קוד מקור]

אישית לפחות איני רואה ערך במשפט התבניתי: "הנקודה הגבוהה ביותר בקרבת העיר נמצאת בגובה 1,442 מטרים מעל פני הים, 14.8 ק"מ צפונית-מערבית לקוימבטור", בוודאי כשאותה נקודה היא אפילו לא מקום ספציפי, שאפילו בוויקי' הבוטיות אין עליו ערך. כמו כן, העובדה שאין ציון שנה לאוכלוסייה (בערך עצמו ובהערה שהוא מסתמך עליה, בוויקינתונים יש ציון שנה שצריך לבדוק מאיפה הגיע) ואין בכלל מקור למטרופולין היא גם משהו שצריך לטפל בו. אני רואה גם שימוש ב-{{formatnum}} או משהו כזה, שלעניות דעתי זה חיסכון זמן מוגזם, אבל ניחא. (כמובן שפעמים רבות נתקלתי בערכים שעלו במצב הרבה יותר גרוע, אבל זו לא סיבה להתעלם מהדברים האלה.) Mbkv717שיחה • כ"ח באדר ב' ה'תשע"ט • 07:01, 4 באפריל 2019 (IDT)תגובה
הפתרון לכך הוא לסמן את כל הטקסט שנוצר, לעשות COPY+PASTE ולערוך מחדש כך שיכיל גם שנה לנתוני האוכלוסייה ויכיל את המידע בטקסט במקום שימשיכו להיות משולבים תבניות {{formatnum}}. WikiJunkie - שיחה 07:27, 4 באפריל 2019 (IDT)תגובה
ציון תאריך נשאב מוויקינתונים זה בסדר ומספיק. גם אם תכתוב שנה / תאריך בתבנית ויש נתון מעודכן יותר בוויקינתונים, נתון האוכלוסייה המקומי יידרס בהצגה. כך תכנתנו את התבנית הספציפית הזו. בורה בורה - שיחה 09:53, 4 באפריל 2019 (IDT)תגובה
אף על פי כן אני יכול להבין את מי שיטען שעדיף שיהיה רשום "מספר התושבים בעיר היה 959,823 נכון ל-21 ביולי 2015" מאשר "מספר התושבים בעיר הוא 959,823." (כאשר הנתון אשר מתעדכן בכל פעם באופן אוטומטי מבלי שידוע ממתי התוקף של מספר התושבים). WikiJunkie - שיחה 11:39, 4 באפריל 2019 (IDT)תגובה