Music OCR

מתוך ויקיפדיה, האנציקלופדיה החופשית

Music OCR הוא יישום של טכנולוגית זיהוי תווים אופטי לצורך המרת תווי מוזיקה מודפסים לפורמט דיגיטלי בר-עריכה (כגון MusicXML ו-LilyPond) ובר-נגינה (כגון MIDI).

היסטוריה[עריכת קוד מקור | עריכה]

מחקר ראשוני בזיהוי של תווי מוזיקה מודפסים נעשה בשנות ה-60 המאוחרות של המאה ה-20 ב-MIT ומכונים נוספים. [1]

המוצר המסחרי הראשון בתחום, MIDISCAN, שוחרר ב-1991 על ידי חברת Musitek.

בניגוד לזיהוי אופטי של טקסט, שבו המילים מעובדות בטור, זיהוי אופטי של מוזיקה מחייב עיבוד של אלמנטים מקבילים. לכן, המיקום היחסי של סימני הדינמיקה והוראות ביצוע מוזיקליות נוספות מהווים חלק חשוב מאלגוריתם הזיהוי.

לתוכנות זיהוי מודרניות יכולת דיוק של מעל ל-99% עבור סריקה איכותית וסימון סטנדרטי.[דרוש מקור] מכיוון שנקודה מסמלת סטקטו או הארכת תו, כל "הפרעה" בסריקה עלולה לגרום לשגיאות בפענוח.

תוכנות לזיהוי אופטי של תווי מוזיקה[עריכת קוד מקור | עריכה]

תוכנות קוד פתוח[עריכת קוד מקור | עריכה]

  • Audiveris - מבוסס ג'אווה (רישיון: GPL)

תוכנות מסחריות[עריכת קוד מקור | עריכה]

shazam (גרסה לפלאפונים)

קישורים חיצוניים[עריכת קוד מקור | עריכה]

ויקישיתוף מדיה וקבצים בנושא Music OCR בוויקישיתוף

הערות שוליים[עריכת קוד מקור | עריכה]

  1. ^ Pruslin, Dennis Howard, Automatic Recognition of Sheet Music, 1966 (גישה לקובץ בתאריך 2007-01-24)