קידוד חיזוי ליניארי – הבדלי גרסאות
מ Kotz העביר את הדף קידוד חיזוי לינארי לשם קידוד חיזוי ליניארי: החלטת אקדמיה + עדכון בוט ההחלפות |
|||
(4 גרסאות ביניים של 4 משתמשים אינן מוצגות) | |||
שורה 1: | שורה 1: | ||
'''קידוד חיזוי |
'''קידוד חיזוי ליניארי''' (ב[[אנגלית]]: '''Linear Predictive Coding''' או בקיצור '''LPC''') הוא כלי המשמש בעיקר ל[[עיבוד אותות קול|עיבוד אותות אודיו]] ולעיבוד דיבור לייצוג המעטפה הספקטראלית של [[אות (תקשורת)|אות]] [[דיבור]] [[דיגיטלי]] בצורה [[דחיסת נתונים|דחוסה]], תוך שימוש במידע של מודל חיזוי ליניארי{{הערה|{{cite book |last= Deng |first= Li |author2=Douglas O'Shaughnessy |title= Speech processing: a dynamic and optimization-oriented approach |publisher= [[Marcel Dekker]] |year= 2003 |pages= 41–48 |isbn= 0-8247-4040-8 |url=https://books.google.com/books?id=136wRmFT_t8C&pg=PA41&lpg=PP1&focus=viewport}}}}. זוהי אחת הטכניקות החזקות ביותר לניתוח דיבור, ואחת השיטות היעילות ביותר עבור קידוד דיבור באיכות טובה בקצב סיביות נמוך, ומספק הערכות מדויקות ביותר של פרמטרי דיבור. |
||
== מבט על == |
== מבט על == |
||
קידוד חיזוי |
קידוד חיזוי ליניארי מתחיל עם ההנחה כי אות דיבור מיוצר על ידי זמזום בקצה של צינור (קולות דיבור), כאשר מדי פעם נוספים קולות של שריקות ופיצוצים ([[עיצורים שורקים]] ו[[עיצורים סותמים]]). למרות שמודל זה נראה גס, הוא למעשה קירוב טוב של המציאות של קולות דיבור. הגלוטיס (החלל שבין הקפלים הקוליים) מייצר את הזמזום, המאופיין בעוצמתו (עוצמת קול) ותדירות (גובה הצליל). [[מערכת הקול]] (הגרון והפה) יוצרת את הצינור, המאופיין על ידי התהודה שלו, אשר מעוררים [[פורמנט]]ים בצליל המיוצר. |
||
קידוד חיזוי |
קידוד חיזוי ליניארי מנתח את האות דיבור על ידי אמידת פורמנטים, הסרת ההשפעות שלהם מאות הדיבור, והערכת העוצמה והתדירות של הזמזומים הנותרים. התהליך של הסרת פורמנטים נקרא סינון הפוך, והאות הנותר לאחר חיסור של האות המסונן נקרא אות שארית (residue). |
||
את המספרים המתארים את האינטנסיביות ואת התדירות של הזמזום, הפורמנטים, ואת אות השארית, ניתן לאחסן או להעביר אותם בנפרד. שיטת קידוד החיזוי |
את המספרים המתארים את האינטנסיביות ואת התדירות של הזמזום, הפורמנטים, ואת אות השארית, ניתן לאחסן או להעביר אותם בנפרד. שיטת קידוד החיזוי הליניארי מסנתזת את אות הדיבור על ידי הפיכת התהליך: משתמשת בפרמטרים של הזמזום ואות השארית כדי ליצור אות מקור, אחר כך משתמשת בפורמטים כדי ליצור מסנן (המייצג את הצינור), ולבסוף מעבירה את המקור דרך המסנן, כדי לייצר דיבור. |
||
בגלל שאותות הדיבור משתנים עם הזמן, תהליך זה נעשה על חתיכות קצרות של אות הדיבור, אשר נקראים מסגרות; בדרך כלל 30 עד 50 מסגרות לשנייה מניבות דיבור מובן עם דחיסה טובה. |
בגלל שאותות הדיבור משתנים עם הזמן, תהליך זה נעשה על חתיכות קצרות של אות הדיבור, אשר נקראים מסגרות; בדרך כלל 30 עד 50 מסגרות לשנייה מניבות דיבור מובן עם דחיסה טובה. |
||
== ייצוג מקדמים של קידוד חיזוי |
== ייצוג מקדמים של קידוד חיזוי ליניארי == |
||
קידוד חיזוי |
קידוד חיזוי ליניארי משמש לעיתים קרובות לשידור מידע לגבי המעטפת הספקטרלית, ולכן הוא צריך להיות מסוגל לספוג שגיאות שידור. העברת מקדמי המסנן ישירות אינה רצויה, שכן הם רגישים מאוד לשגיאות. במילים אחרות, טעות קטנה יכולה לעוות את כל הספקטרום, או גרוע מכך, טעות קטנה עלולה להפוך את מסנן החיזוי לבלתי יציב. |
||
קיימות שיטות מתקדמות לייצוג המקדמים כגון מקדמי החזרה LAR ו - |
קיימות שיטות מתקדמות לייצוג המקדמים כגון מקדמי החזרה LAR ו -LSP. כאשר האחרונה צברה פופולריות שכן היא מבטיחה יציבות של החזאי ושגיאות ספקטרליות הן מקומיות עבור סטיות מקדמים קטנות. |
||
== ראו גם == |
== ראו גם == |
||
שורה 25: | שורה 25: | ||
{{הערות שוליים}} |
{{הערות שוליים}} |
||
[[קטגוריה:ויקיפדיה: ערכים של משתמשים חדשים|2017 06]] |
[[קטגוריה:ויקיפדיה: ערכים של משתמשים חדשים|2017 06]] |
||
[[קטגוריה:עיבוד אותות]] |
[[קטגוריה:עיבוד אותות ספרתי]] |
גרסה אחרונה מ־11:07, 23 בדצמבר 2023
קידוד חיזוי ליניארי (באנגלית: Linear Predictive Coding או בקיצור LPC) הוא כלי המשמש בעיקר לעיבוד אותות אודיו ולעיבוד דיבור לייצוג המעטפה הספקטראלית של אות דיבור דיגיטלי בצורה דחוסה, תוך שימוש במידע של מודל חיזוי ליניארי[1]. זוהי אחת הטכניקות החזקות ביותר לניתוח דיבור, ואחת השיטות היעילות ביותר עבור קידוד דיבור באיכות טובה בקצב סיביות נמוך, ומספק הערכות מדויקות ביותר של פרמטרי דיבור.
מבט על
[עריכת קוד מקור | עריכה]קידוד חיזוי ליניארי מתחיל עם ההנחה כי אות דיבור מיוצר על ידי זמזום בקצה של צינור (קולות דיבור), כאשר מדי פעם נוספים קולות של שריקות ופיצוצים (עיצורים שורקים ועיצורים סותמים). למרות שמודל זה נראה גס, הוא למעשה קירוב טוב של המציאות של קולות דיבור. הגלוטיס (החלל שבין הקפלים הקוליים) מייצר את הזמזום, המאופיין בעוצמתו (עוצמת קול) ותדירות (גובה הצליל). מערכת הקול (הגרון והפה) יוצרת את הצינור, המאופיין על ידי התהודה שלו, אשר מעוררים פורמנטים בצליל המיוצר.
קידוד חיזוי ליניארי מנתח את האות דיבור על ידי אמידת פורמנטים, הסרת ההשפעות שלהם מאות הדיבור, והערכת העוצמה והתדירות של הזמזומים הנותרים. התהליך של הסרת פורמנטים נקרא סינון הפוך, והאות הנותר לאחר חיסור של האות המסונן נקרא אות שארית (residue).
את המספרים המתארים את האינטנסיביות ואת התדירות של הזמזום, הפורמנטים, ואת אות השארית, ניתן לאחסן או להעביר אותם בנפרד. שיטת קידוד החיזוי הליניארי מסנתזת את אות הדיבור על ידי הפיכת התהליך: משתמשת בפרמטרים של הזמזום ואות השארית כדי ליצור אות מקור, אחר כך משתמשת בפורמטים כדי ליצור מסנן (המייצג את הצינור), ולבסוף מעבירה את המקור דרך המסנן, כדי לייצר דיבור.
בגלל שאותות הדיבור משתנים עם הזמן, תהליך זה נעשה על חתיכות קצרות של אות הדיבור, אשר נקראים מסגרות; בדרך כלל 30 עד 50 מסגרות לשנייה מניבות דיבור מובן עם דחיסה טובה.
ייצוג מקדמים של קידוד חיזוי ליניארי
[עריכת קוד מקור | עריכה]קידוד חיזוי ליניארי משמש לעיתים קרובות לשידור מידע לגבי המעטפת הספקטרלית, ולכן הוא צריך להיות מסוגל לספוג שגיאות שידור. העברת מקדמי המסנן ישירות אינה רצויה, שכן הם רגישים מאוד לשגיאות. במילים אחרות, טעות קטנה יכולה לעוות את כל הספקטרום, או גרוע מכך, טעות קטנה עלולה להפוך את מסנן החיזוי לבלתי יציב.
קיימות שיטות מתקדמות לייצוג המקדמים כגון מקדמי החזרה LAR ו -LSP. כאשר האחרונה צברה פופולריות שכן היא מבטיחה יציבות של החזאי ושגיאות ספקטרליות הן מקומיות עבור סטיות מקדמים קטנות.
ראו גם
[עריכת קוד מקור | עריכה]קישורים חיצוניים
[עריכת קוד מקור | עריכה]הערות שוליים
[עריכת קוד מקור | עריכה]- ^ Deng, Li; Douglas O'Shaughnessy (2003). Speech processing: a dynamic and optimization-oriented approach. Marcel Dekker. pp. 41–48. ISBN 0-8247-4040-8.