שיחת ויקיפדיה:כללים לתעתיק מאיטלקית/רשימת יישובים

תוכן הדף אינו נתמך בשפות אחרות.
הוספת נושא
מתוך ויקיפדיה, האנציקלופדיה החופשית

העבודה היפה[עריכת קוד מקור]

לאמיר א׳ אהרוני, כל הכבוד על העבודה היפה. Rebecca - שיחה 17:24, 24 בינואר 2011 (IST)תגובה

אופס, רק עכשיו ראיתי את זה.
תודה, ואני מקווה שזו רק ההתחלה. אני מקווה לשפר את האיטלקית ולהתרחב לעוד שפות – ספרדית, קטלאנית, פורטוגלית, רוסית, אוקראינית, טורקית ואולי עוד... --אמיר א׳ אהרוני - שיחה 11:27, 16 ביוני 2011 (IDT)תגובה

כל הכבוד![עריכת קוד מקור]

והערה קטנה: הגייה נפוליטנית שונה במקצת מהאיטלקית, ונוכחנו בכך בביקורנו שם, בנובמבר האחרון. התוכנה סימנה כבעייתיים שמות כאיסקיה (Ischia) ופוצואולי (Pozzuoli) – אף שקלעה להגייתם המקומית הנכונה. לעומת זאת, את פומפיי (Pompei) תירגמה ל-פומפאִי. כדאי לבדוק גם כיצד הוגים בנפוליטינית צירופים כ-CE, CC, CI ו-CIA. דקישיחהמילה בסלע 13:59, 25 בינואר 2011 (IST)תגובה

בשפה הנפוליטנית עצמה ההגייה בהחלט שונה. שמות נפוליטניים כאן כמעט בוודאות אינם נכונים.
סימנתי את כל השמות שיש בהם z כלא־ודאיים, כי יש לבדוק אותם אחד־אחד. את עניין Ischia אבדוק. --אמיר א׳ אהרוני - שיחה 11:27, 16 ביוני 2011 (IDT)תגובה

ויקינתונים[עריכת קוד מקור]

Amire80: אתחיל מדוגמה ספציפית שהביאה אותי לדף הזה, והיא שבפאביו קאפלו חסר מיקום הלידה שלו, אבל הוא קיים בוויקינתונים ונדרש לתעתק אותו לעברית, בהנחה שהתעתיק כאן נכון, אשמח לעדכן את d:Q53140 בתעתיק זה ואז יהיה לנו את מקום הלידה בעברית של כל מי שנולד שם, ובפרט פאביו קאפלו.

באופן כללי יותר, האם אפשר להיעזר בסקריפט כדי לייצר תעתיקים לכל היישובים (ואולי מעבר לזה) באיטליה שאין להם תעתיק בעברית ולייצא את זה לוויקינתונים? (במילים אחרות, עד כמה אפשר לסמוך על התעתיקים) אם אי אפשר לסמוך על התעתיקים, האם נראה לך שאפשר ליצור ויקיפדיה:אסם ובעזרת הסקריפט+בדיקה ידנית של דוברי איטלקית לאמת את אותם? אם כן אני (וכנראה גם Mikey641) נשמח לעזור בייצוא של הרשימה לוויקינתונים. ערן - שיחה 19:01, 19 באוגוסט 2017 (IDT)תגובה

ערן. יש הרבה שכתוב לידם "(בשם הזה כמעט בוודאות יש בעיות)" אז אותם לא נעביר. אבל את השאר נראה לי שאפשר להעביר. יש לי כבר קוד מוכן להזנה בquickstatements בויקיפדיה:כללים לתעתיק מאיטלקית/רשימת יישובים/ויקינתונים--‏Mikey641שיחה 19:24, 19 באוגוסט 2017 (IDT)תגובה
אופס. לא ראיתי שזה תועתק אוטומטית... נחכה לאמיר--‏Mikey641שיחה 19:25, 19 באוגוסט 2017 (IDT)תגובה
Mikey641: מעולה, לא חשבתי על quickstatements :) בוא נחכה לאמיר, ואם לפחות לגבי חלק מהתעתיקים אפשר לסמוך או לאשרר אותם יחסית בקלות במעבר ידני אז אפשר יהיה לעדכן בוויקינתונים. אפשר גם לייצר את הרשימה מחדש - כלומר לכתוב SPARQL שמוציא את רשימת היישובים באיטליה מוויקינתונים שאין להם תעתיק ועליהם להריץ את הסקריפט של אמיר. ערן - שיחה 19:31, 19 באוגוסט 2017 (IDT)תגובה
רעיון טוב לייצא רשימה. יש יותר מ-40,000 (הרצתי ללא LIMIT וזה קרס, אז שמתי 40)
SELECT ?item ?itemLabelit WHERE {
  ?item wdt:P31/wdt:P279* wd:Q486972.
  ?item rdfs:label ?itemLabelit .
  FILTER(LANG(?itemLabelit) = 'it') .
  OPTIONAL {?item rdfs:label ?itemLabelhe  FILTER(LANG(?itemLabelhe) = 'he') .}
  FILTER (!BOUND(?itemLabelhe))
}LIMIT 40000

יש ללחוץ כאן כדי להריץ!--‏Mikey641שיחה 19:56, 19 באוגוסט 2017 (IDT)תגובה

  1. אף אחד מהפריטים ברשימה אינו ראוי לשימוש ללא בדיקה אנושית!!! זה משעשע שהדיון הזה מגיע ימים ספורים אחרי הדיונים על בוט ליצירת ערכים במזנון. זאת דוגמה לתעתיק אוטומטי, ולמען הסר כל ספק, אין להשתמש באף אחד מהשמות האלה ללא בדיקה.
  2. זה סתם משהו שעשיתי מתוך שעמום לפני כמה שנים, יותר בשביל ללמוד להשתמש בגיטהאב ולהתאמן בניקוד, מאשר לייצר רשימות אמיתיות של יישובים לשימוש אוטומטי. ברצינות, ממש תיזהרו עם זה.
  3. אם מישהו בכל זאת רוצה להשתמש בזה, אז נא לשים לב לכך שהכול פה מנוקד (למה? – ר׳ הסעיף הקודם). שימו לב שכשעוברים לכתיב חסר־ניקוד, צריך להוסיף אותיות וי״ו ויו״ד, ולשנות עוד כל מיני דברים.
  4. כתבתי את הסקריפט לפני שעבדתי במשרה מלאה ולפני שהייתי אבא. היום אין לי לצערי זמן לתקן את הסקריפט הזה, אבל זאת תוכנה חופשית! אז אם למישהו מתחשק, תרגישו חופשיים לשפר.
  5. אף אחד מהפריטים ברשימה אינו ראוי לשימוש ללא בדיקה אנושית!!! --אמיר א׳ אהרוני - שיחה 20:07, 19 באוגוסט 2017 (IDT)תגובה