העתיד כבר כאן! הכירו את טכנולוגיית TTS לזיהוי והפקת דיבור
האם האמנת שאי פעם תוכל לתת למחשב להקריא לך את היצירה הספרותית האהובה עליך?המדע הבדיוני הזה, כבר קיים בשנת 2018! טכנולוגיית TTS מתקדמת בצעדי ענק והיא כאן כדי להישאר!
טכנולוגיית TTS הינה מערכת טקסט לזיהוי והפקת דיבור הקולטת אינפוט, מזהה ומנתחת אותו לא רק בכל הנוגע למילים בודדות, אלא עבור משפטים שלמים ואף טקסטים ארוכים ומורכבים.
במאמר זה נבדוק מה המשמעות של המערכת, לאיזה שימושים היא יעילה ומהם הצרכים להם היא מספקת מענה מיטבי.
אז מהי מערכת טקסט לדיבור?
מערכת טקסט לזיהוי והפקת דיבור, כשמה כן היא – מערכת ממוחשבת שמסוגלת לפענח ולייצר דיבור אנושי.
במקרה של זיהוי דיבור יהיה קלט, שיגיע ממיקרופון במכשיר שאליו מדבר המשתמש או משיחה טלפונית נכנסת, והמערכת תזהה את התוכן או את זהותו של הדובר.
כך, ישנם ארגונים כמו קופות חולים, המאפשרים ללקוח להזמין תור לפגישה באמצעות מערכת שמפענחת את תכני הדיבור, וכן מוסדות בנקאיים, העושים שימוש בטכנולוגיה לצורך זיהוי הלקוח על פי קולו, במקום הקשת סיסמאות מסורבלת.
בנוסף, נעשה שימוש במערכת כסינטיסייזר שמפיקה ומייצרת באופן מלאכותי דיבור בקול אנושי, שיכלול מתקדם שפותח לראשונה לצרכי הנגשה למען אוכלוסיית לקויי הראייה.
איך מערכת לזיהוי והפקת דיבור פועלת?
״ישנן מערכות TTS שונות בשוק״ מציינת עדי כהן, מנהלת בחברת פייקול, ״חלקן מתבססות על שרשור מקטעי דיבור מוקלטים, המאוחסנים במסדר נתונים ייעודי, בעוד שהדגמים המתקדמים יותר הנם מכשירי סינטיסייזר לכל דבר, אשר מפיקים פלט של דיבור אנושי באמצעות מודלים חדשניים של מערכות קול".
מערכת מתקדמת של סינטיסייזר דיבור מורכבת משני מערכים: החזיתי והעורפי.
תפקיד המערך החזיתי הוא לעבד טקסט כתוב וגולמי כך שיהיה מוכן להקראה, על ידי המרת קיצורים, ראשי תיבות, מספרים וסמלים למקבילות כתובות בשפה המבוקשת.
בהמשך לכך, מחלק המערך החזיתי את הטקסט לחלקים תחביריים, כמו חלקי משפט ומשפטים, וליחידות פונטיות. בתום עיבודו של הטקסט, ממיר המערך העורפי את היחידות הפונטיות לצלילים קוליים וברורים, הניתנים להשמעה כפלט המדמה דיבור אנושי.
שימושים רווחים במערכות טקסט לדיבור ויתרונותיהן
״מערכות טקסט לדיבור אמנם הומצאו במקור לרווחתם של ציבור לקויי הראייה״, מציינת עדי, ״אך נמצאות כיום בשימוש רחב בשוק, וחולשות על תחומים מתרבים והולכים של יישומים שחורגים בהרבה מהנגשה לבעלי מוגבלויות בלבד. מוסדות חינוך ואקדמיה, גופי תחבורה ציבורית, אפליקציות ומשחקים בעולם הגיימינג כמו גם חברות וארגונים עסקיים מובילים – כולם משתמשים ומסתמכים על מערכות טקסט לדיבור בטכנולוגיית TTS".
לפניכם שימושים עיקריים ויתרונות משמעותיים שטמונים במערכות טקסט לדיבור כיום:
מערכות TTS כטכנולוגיה המסייעת לתלמידים ולסטודנטים במוסדות הכשרה וחינוך
מבחנים מהווים, כידוע, גורם ללחץ ולסטרס עבור תלמידי בית ספר וסטודנטים גם יחד, כשלחץ הבחינות מקשה על חלק מהנבחנים לקרוא את ההוראות והשאלות שכלולות במבחן.
מערכת טקסט לדיבור מספקת דרך קלה ויעילה להמרת התוכן לקול, ו'מקריאה' לנבחן את שאלות הבחינה, על מנת למקסם את הישגיו הלימודיים.
יתרון משמעותי טמון בכך עבור ציבור ליקויי למידה המתקשים בקריאה, ואשר מערכת כזו יכולה לסייע להם ממשית במינוף הציונים, תוך אפשור של חוויית למידה מהנה, המשוחררת מתחושות תסכול מעיקות.
מערכות TTS כטכנולוגיה לקידום נגישות באינטרנט
בהתאם לחוק נגישות האתרים באינטרנט, שהוחל מחודש אוקטובר בשנת 2017, כל עסק שהכנסותיו השנתיות עולות על מיליון שקלים בשנה, או שאתר האינטרנט שלו הוקם לאחר מועד החלת החוק – מחויב להנגישו לציבור בעלי המוגבלויות.
חוק זה מבוסס על העיקרון לפיו על המרחב האינטרנטי להיות נגיש לכולם, לרבות לקויי למידה וראייה, ובעלי מוגבלויות נוספים כמו חולי פרקינסון.
״חשוב לדעת״, מציינת עדי, ״שבעלי המוגבלויות מהווים כחמישית מכלל אוכלוסיית הגולשים באינטרנט בישראל, מתוכם למעלה מ-23,000 עיוורים, בעוד שברחבי העולם ישנם כ-774מיליון איש המוגדרים כבעלי ליקויי אוריינות ו-285 מיליון עיוורים בקירוב, המהווים קהל יעד משמעותי ופוטנציאלי״.
מערכות הטקסט לדיבור מאפשרות לעיוורים להיחשף לתוכן על ידי הקראתו, ללקויי למידה להבין טוב יותר את המסרים הכלולים באתר האינטרנט, ולבעלי מוגבלויות מוטוריות כמו חולי פרקינסון – להפעיל את האתרים באמצעות קולם במקום בלחיצה על העכבר והמקלדת.
מערכות TTS בשירות עולם הגיימינג והבידור
אפליקציות שונות ובראשן 'ווייז' הידועה, לצד משחקי מחשב וגיימינג ואתרים בידוריים, עושים שימוש בטכנולוגיית TTS , לצורך המחשה ושיפור חווייתו של הגיימר או המשתמש.
כולנו כבר התרגלנו לקול האנושי שמנחה אותנו מהמכשיר הנייד מתי לפנות ולאן, עד להכרזה 'הגעת ליעד', ורבים מאתנו נהנים לשוחח עם דמויות בדיוניות בקווסטים ובמשחקי מציאות מדומה, תוך העצמת האשליה שאנו מדברים, לכאורה, עם בני אדם ממשיים.
מערכות TTS כטכנולוגיה המשפרת את השירות למשתמשים בתחבורה ציבורית
טכנולוגיית ה-TTS להפקת דיבור מקלה על מסירתן של הודעות לציבור הנוסעים, על מנת שיוכלו להשלים את נסיעתם בבטחה תוך קבלת מלוא המידע החיוני בזמן.
הודעות על איחור במועד הגעת הרכבת, שינוי במסלולו של קוו האוטובוס ואזכוריהם של כללי בטיחות בסיסיים, מושמעים באמצעות מערכת ה- TTS דרך רמקולים מרכזיים בכלי הרכב הציבוריים ובמתחמי התחנות, ומגיעים לציבור הנוסעים בזמן אמת, באופן נהיר וברור.
מערכות TTS ללימודי שפות ולרכישת כישורי אוריינות
אנשים הרוצים ללמוד שפה חדשה או לשפר את כישורי האוריינות שלהם יכולים לעשות זאת בקלות חסרת תקדים.
אחד המרכיבים החשובים ברכישת שפה חדשה, מבוסס על האזנה לצליליה וקליטה של זרימת המשפטים, אופן ההגייה הנכון ונימת הדיבור האופיינית.
מערכות טקסט לדיבור מאפשרות ללומדים שפה חדשה לקלוט אותה במהירות ובאופן מדויק, מבלי להסתמך על שירותיו של מורה אנושי.
בנוסף, מסייעות מערכות TTS לשיפור הדיקציה, בהירות ההתבטאות וכישורי האוריינות בקרב אנשים שנתקלים בקשיים בתחומים אלו, ומעוניינים לשדרג את יכולותיהם באופן עצמאי.
מערכות TTS ככלי עזר לציבור האילמים
נוסף על הסיוע המשמעותי שמערכות טקסט לדיבור מעניקות לציבור העיוורים, לקויי הלמידה ובעלי המוגבלויות המוטוריות, הם גם באים לעזרתם של ציבור האילמים.
כיום אילמים יכולים להקליד כל מסר שהם רוצים לומר, ולהשמיעו לבני שיחם על ידי לחיצת כפתור.
מדובר בפריצת דרך של ממש, שמהווה עזרה חשובה ומשמעותית, אשר דוגמא מוחשית לה ניתן לראות בהרצאותיו של פרופ' סטיבן הוקינג זכרו לברכה, האסטרופיזיקאי הידוע והמבריק שסלל את הקריירה המזהירה שלו בצילה של מחלת ה-ALS, הגורמת לשיתוק מלא של שרירי הגוף, לרבות שרירי הדיבור.
מערכות TTS כטכנולוגיה לשיפור השירות והרחבת מעגלי לקוחות של עסקים מתקדמים:
מערכת המאפשרת שליחת הודעות אוטומטית, קביעת תורים באמצעות מענה קולי והקראת חדשות אודות החברה ללקוחותיה, מהווה את סטנדרט השירות המצופה כיום מבתי עסק מתקדמים ועדכניים.
״לא רק שמערכות טקסט לדיבור מגבירות משמעותית את נוכחותו של בית העסק במרחב האינטרנטי״, מציינת עדי, ״הן גם מנגישות אותו לבעלי המוגבלויות וכן ללקוחות שמקיימים אורח חיים של מולטי-טסקינג, ומעוניינים להאזין למסרי החברה והודעותיה תוך עיסוק במשימות אחרות".
זאת ועוד: המרת הטקסט שהוזן לקול ברור ושליחתו ללקוחות קיימים ופוטנציאליים, מהווה דרך מזמינה, קלה להבנה ונגישה שמקדמת מעורבות רבה יותר של הלקוח באמצעות ערוץ הפצה נוסף.
זו דרך נפלאה לבדל את העסק, להציע ערך נוסף ללקוחותיו, לשפר את תדמיתה של החברה כבעלת מודעות מפותחת להנגשת שירותיה לציבור בעלי המוגבלויות ולתרום לשגשוג כלכלי ועסקי.
לסיכום, כיום מערכות הטקסט לדיבור משמשות לא רק את בעלי המוגבלויות ולקויות הראייה, אלא נמצאות בשימוש רחב על ידי מוסדות חינוך, תאגידי תחבורה ציבורית, מרכזי לימוד שפה ומספר גדל והולך של אתרי אינטרנט המייצגים חברות וארגונים שונים.
אין ספק שטכנולוגיית ה-TTS היא העתיד שכבר נמצא כאן, כפי שיעידו קהלי הלקוחות המתרחבים שמשתמשים בה, ומצפים לראותה כחלק מסטנדרט עדכני של שירות מתקדם כיום. מומלץ לכל בעל עסק שמעוניין להישאר רלוונטי לנסות ולשלב מערכת TTS כחלק אינטגראלי ממערכי ההפצה וקשרי הלקוחות.
תודה.
לתגובה חדשה
חזור לתגובה