''דג בבל'' מהמדריך לטרמפיסט בגלקסייה לפיתוח
אמנון כרמל

האם ומתי נצליח לבנות מכשיר אוטומטי לתרגום משפה לשפה בזמן אמת, ומה יהיו ההשפעות של מכשיר שכזה שזמין לכל אדם בכל מקום ובאופן מיידי? מהם הקשיים שנאלץ לפתור לפני שנצליח לייצר מתרגם מוצלח שכזה? על כל זאת ועוד, במאמר שלפניכם.
אתחיל במקרה שקרה לי לאחרונה: ישבתי בסלון עם אישתי והסבא שלה. הסבא דובר רק ספרדית, ומכיוון שכל מה שאני יודע להגיד בספרדית מסתכם פחות או יותר ב-"מוּי כיף", התקשורת בינינו דורשת תרגום סימולטני על ידי אדם שלישי. לפתע עלה במוחי רעיון. פתחתי את המחשב הנייד עם האינטרנט האלחוטי ונכנסתי לאתר התרגום של גוגל. כתבתי משפטים פשוטים באנגלית, ובן רגע קיבלתי תרגום בספרדית, מה שהקל מאוד על התקשורת בינינו. אז נכון שקשה לנהל כך שיחה מעמיקה וקולחת, אבל זה בהחלט מאפשר תקשורת בסיסית. כיצד יראה הדור הבא של הטכנולוגיה המעניינת הזו?

המונח "דג בבל" (Babel Fish) לקוח מספרו המופלא של דאגלס אדאמס (זצ"ל) - "מדריך הטרמפיסט לגלקסייה". בספר מוזכר בין היתר דג זעיר מכוכב אחר אותו משחילים לתוך האוזן, ומכיוון שהוא ניזון מגלי מוח, הוא יוצר תרגום אוטומטי בין כל השפות ביקום, ועל כן שמו "דג בבל".
ובכן כנראה שלא נאלץ להמתין למציאת דגים חייזרים שמעכלים גלי מוח. ייתכן מאוד כי בקרוב תוכלו למצוא מתרגם שפות אוטומטי שכזה בטלפון הסלולי שלכם. דמיינו מכשיר (דיגיטלי מן הסתם) שיוכל לתרגם שיחה בשפה א` לשפה ב` בזמן אמת. כוונתי היא למצב בו אני מדבר עברית ליד הטלפון הסלולרי שלי, (או כל מכשיר קטן אחר בעל מיקרופון), ומיד מושמעים הדברים באנגלית או צרפתית, או לחילופין מופיע טקסט על מסך ובו המילים שאמרתי בשפה אחרת.

אגיע מיד לשורה התחתונה - מכשיר תרגום אוטומטי שכזה ברמה גבוהה עדיין אינו נראה באופק. למרות התקדמות אדירה בתחום זיהוי שפה באמצעים דיגיטליים שנעשתה בעשרות השנים האחרונות, אנו עדיין רחוקים מאוד מיכולת להבנת שיחה. למעשה גם אם נצליח לנתח את השיחה ברמה גבוהה (לזהות את כל המילים הנאמרות בדיוק של 90% ומעלה), הרי שאנו עוד יותר רחוקים מהיכולת לתרגם כל מילה באופן מדויק בהתאם להקשר השיחה. החדשות הרעות יותר הן שללא פריצת דרך משמעותית ומהפכנית בתחום המחשוב, קיימים מכשולים רבים בדרך שיהיה כמעט בלתי אפשרי להתגבר עליהם. מי שרוצה להבין יותר לעומק מדוע אנו עדיין רחוקים מיכולת ניתוח שפה, מוזמן לקרוא את המאמר שכתבתי בנושא ונקרא "האם ניתן ליצור אינטליגנציה מלאכותית אמיתית".

פרופ` דוד הראל, דיקן הפקולטה למתמטיקה ומדעי המחשב במכון ויצמן, וחתן פרס ישראל לשנת 2004, הקדיש את הפרק האחרון בספרו "המחשב אינו כל יכול" לבעיית הבנת השפה - Natural language processing או בקיצור NLP. הוא מביא כמה דוגמאות משעשעות שממחישות את הקושי בהבנת מילים:
"את המשפט: אני לא יודע איך לומר לך", ניתן בקלות להבין בטעות כאילו נאמר: "אני לא יודע איך לא מר לך." באופן דומה, המשפט: "אני שונא שירה", יכול להישמע כמו: "אני שונא שיר רע" (ע"מ 253).
את הבעייתיות הרבה הכרוכה בהבנת הדקויות והמבנה הסמנטי של שפה מדוברת הוא מדגים באמצעות הדוגמה המפורסמת שהיא ספק אמיתית וספק אגדה אורבאנית לפיה בימי המלחמה הקרה, משרד ההגנה האמריקאי רצה לפתח מתרגם ממוחשב שיוכל לתרגם מרוסית לאנגלית וההיפך. אחרי זמן ארוך בו פיתחו המדענים מערכת שכזו, הגיע קצין בכיר כדי לבחון את תוצאות עבודתם. הוא הזין למערכת את המשפט: "The spirit is willing but the flesh is weak", וביקש מהמחשב לתרגם את המשפט לרוסית ואת התוצאה לתרגם חזרה לאנגלית. התוצאה הייתה: "The vodka is strong but the meat is rotten". פרופ` הראל מסכם את הבעייה וכותב: "איננו אומרים שזה [הבנת השפה הטבעית] בלתי אפשרי או חסר תקווה, אלא רק שזה הרבה הרבה יותר קשה ממה שנדמה, וכרוך בהרבה הרבה יותר מכפי שנראה לעין" (ע"מ 256).




ולמרות כל זאת ברמה בסיסית הטכנולוגיה כבר קיימת ותוכלו למצוא לפחות מכשיר מסחרי אחד המתיימר לבצע תרגום סימולטני של מילים מאנגלית לגרמנית, צרפתית או ספרדית ואף להגות את התרגום בקול. מכשיר זה נקרא "Universal Translator". מעולם לא ניסיתי את המכשיר, אך קשה לי להאמין שהוא מציע יכולת גבוהה במיוחד. באתר היצרן כתוב כי הם בחרו לתרגם אוצר מילים שמכיל כ- 3,000 ביטויים נפוצים המתאימים לתיירים. עם כמות מילים מצומצמת שכזו, גם אם הן מזוהות באחוזים גבוהים, ברור כי לא ניתן לקיים שיחות פילוסופיות מעמיקות. בנוסף למכשיר המדובר, קיימות תוכנות רבות בעולם לתרגום משפטים (ובעיקר מילים) שמסוגלות לתרגם באופן שיאפשר הבנה כללית של המסמך המתורגם. דוגמה שימושית וטובה לכך היא התרגומון של גוגל אותו כבר הזכרתי בתחילת המאמר או התרגומון של Alta Vista והתרגומון המצויין של AJAX בהם אני משתמש מידי פעם לתרגום מגרמנית, צרפתית וסינית לאנגלית. אל תטעו - התרגום עדיין ברמה נמוכה מאוד ורחוק מיכולת לתרגום משפטים מורכבים, אבל ברמת מילה בודדת או משפטים פשוטים וקצרים, מספק תוצאות סבירות, אך כרגע תוכנות אלו דורשות חיבור לאינטרנט או לפחות שימוש במחשב של ממש.


אם וכאשר תהיה בידנו טכנולוגיה שכזו, למה היא תשמש? נראה כי אחד השימושים היעילים והנפוצים ביותר למכשיר שכזה יהיה בידי תיירים. דמיינו תייר שמגיע לארץ אחרת ולא צריך לשבור את השיניים על חמשת המילים שלמד בשפה המקומית. אלא שקיימת בכך סכנה של תרגום לקוי שאפילו לא תוכלו לזהות מיידית משום שלא תבינו את השפה. זה טוב כשמדובר בתייר ישראלי שמגיע לארה"ב ושואל עובר אורח "מה השעה?", והמכשיר יאמר משהו כמו: "?What is the hour", אבל מה יקרה אם תייר אמריקאי יאמר למכשיר: "?Where can I buy Icecream" שעלול להיות מתורגם לעובר אורח ישראלי כ: "איפה יכול אני לקנות אני צורח?"

עם פיתוחים נוספים והתקדמות הטכנולוגית הצפויה, ניתן להניח כי נראה בעשור הקרוב נסיונות מסחריים יעילים יותר בטכנולוגיה שכזו, ואני מאמין כי בעשרים השנה הקרובות נוכל למצוא כמעט בכל טלפון סלולרי (שיהיה למעשה מחשב אישי נייד), מכשיר שיעבוד בצורה שתאפשר תקשורת בסיסית אך יעילה ובטוחה בין שני דוברי שפות שונות. מכשיר שכזה יוכל לשמש למטרות צבאיות במצבים בהם חיילים צריכים לתקשר עם אוכלוסיה הדוברת שפה זרה, עובדים בשדה תעופה בינלאומי, בשגרירויות ובמקומות אחרים בהם דוברים כמה שפות, וכמובן שימוש לצרכי תיירות ועסקים.




לידיעה זו התפרסמו  2  תגובות
תגובות
1   תודה, מאמר מעניין
22:53:00  15/02/2007 מיאו   
בהקשר זה, סדרת טלויזיה מומלצת לצפייה: "פארסקייפ".

2   למההההההההההה
18:52:00  21/03/2007 אורין  הכגיע 
למה אין תרגום לאנגלית אני יותר לא כסעסגכעגכעי



לתחילת הכתבה
 
קישורים
קישור ישיר לפרסום בבלוג של כרמל


חדשות אחרונות
קולנוע
19/11/2010 זה שיר פרידה – ISF סוגר את שעריו
11/09/2010 עיבודים לרוב - והפעם המגדל האפל מאת סטפן קינג
14/08/2010 חרב אור הכחולה תגיע לקרן הכחולה
08/08/2010 הצצה בלעדית לטיזר של האוונג'רס
30/07/2010 הנוסע השמיני : ההתחלה

טלויזיה
17/10/2010 פרק השבוע של האקס מן - פרק 76 והאחרון
30/09/2010 פרק השבוע של האקס מן - פרק 75
27/09/2010 פרק השבוע של האקס מן - פרק 74
20/09/2010 פרק השבוע של האקס-מן פרק 73
10/09/2010 פרק השבוע של האקס מן- פרק 72

ספרים
06/09/2010 הוצאה מחודשת לצלל-אלף
30/07/2010 אן רייס משתגעת סופית
25/07/2010 ספר הנופלים של מאלאזן נסגר.
14/07/2010 הכבוד המיצרי
27/06/2010 והמנצח במדלית זהב... ניל גיימן

סיפורים
04/06/2010 נפתחה תחרות הסיפורים הקצרים על שם עינת פלג ז"ל לשנת 2010
02/05/2008 סקופ בלעדי ! פנטסיה 2000 ב-2008
12/09/2007 שנה טובה
09/08/2007 פרס גפן 2007 – הצבעה לשלב א'
06/08/2007 תחרות סיפורים שנתית – פרס עינת

קומיקס
22/07/2010 האם היו ערפדים בתורה?
13/07/2010 הארווי פארקר נפטר בגיל 70
15/07/2009 קומיקס וירקות לפרס אייזנר
05/07/2009 מייקל ג'קסון הקומיקס
03/06/2009 אלכס רוס ומייק קארי חוברים למען ה-Human Torch

מקומי
02/09/2010 להפחיד בעברית
26/07/2010 פסטביל אייקון מחפש כריש מכירות
24/05/2010 קול קורא להגשת אירועים לפסטיבל אייקון
28/11/2009 כנס מאורות בנושא אסטרונומיה ומדע בדיוני יוצא לדרך!
15/08/2009 מכרז לפעילות דוכן יד-שנייה באייקון

מסע בין כוכבים
15/05/2009 Q כאן
12/05/2009 צוות שחקני פרייזר עושים כבוד לסדרת וויאג'
11/05/2009 קפטן גים טי קרי דור ההמשך
05/05/2009 אבודים במסע בין כוכבים
17/04/2009 וכך זה התחיל

אנימה
02/09/2008   Voltron בדרך למסך הגדול
17/04/2008   Ghost in the Shell -3D
20/03/2008   פוניו לא סתם על הצוק
19/03/2008   'ננה' בין המועמדים לפרס טזוקה
16/03/2008   קיטארו למבוגרים

אימה
12/09/2007   שנה טובה
13/11/2006   הצצה ראשונה ל- The Hills Have Eyes 2
06/11/2006   מסורת לא שוברים - בהאלווין הבא - מסור 4
25/10/2006   זומבים זומבים ועוד זומבים ב''יום המתים''
24/10/2006   פינהד כפי שמעולם לא ראינו אותו

משחקי תפקידים
05/02/2010   כנס מבוכים ודרקונים, 28 בפברואר 2010
27/09/2007   טקטיקה - חנות משחקים חדשה בדיזינגוף סנטר
12/09/2007   שנה טובה
24/07/2007   כנס "קרא-קון" לשיטות משחקי תפקידים
26/02/2007   כנס ביגור

עתידנות
11/12/2008   הלו, שומעים אותי?
23/11/2008   פריצת דרך בהשתלות
05/11/2008   אנרגיה סולארית
31/10/2008   מטוסים גרעיניים?
24/10/2008   שמש נצחית בראש צלול

משחקי מחשב
25/07/2010   הטריילר החדש של DC universe
26/06/2009   מלחמת הכוכבים לגו
19/02/2009   Counter-Strike המשחק האהוב ביותר בישראל של 2008
18/07/2008   DC משיקה את DC Universe Online, משחק רשת מרובה משתתפים
14/06/2008   Old Republic 3?
כתבות אחרונות
קולנוע
איך למדתי להפסיק לדאוג ולאהוב את אבודים זהו.
חגי אלקיים
27/06/2010
שש שנים עברו-חלפו להן. שש שנים של שאלות, של תיאוריות, ובעיקר – של דמויות.

טלויזיה
פרק ראשון מ''בן אלמוות מאת רוג'ר זילאזני''
רוג'ר זילאזני (1937-1995)
25/12/2008
במהלך "שלושת הימים" נחרב כדור הארץ. בני האדם עזבו כבר מזמן את הערבות הרדיואקטיביות השוממות והפכו לנוודים, בני בלי בית, המתגוררים ביקום לא להם. רק מתי מעט, אידיאליסטים, מוזחים, שארית הפליטה, עושים את דרכם בין הצללים בחיפוש אחר אתמול שלעולם לא יחזור.

ספרים
ג'ובניק: סיפור אישי -רקע לאומי
עופר ברנשטיין
06/10/2008
כתבה חדשה ומעניינת של לא אחר מעופר ברנשטיין.

סיפורים
פנטזי.קון 2009
יוליה שנרר
11/08/2009
מציאות או פנטזיה?

קומיקס
צריך סוף לסיפור אהבה? ביקורת סרט
רז גרינברג
18/04/2008
מאז יצירת המופת הראשונה שלו, "Voices of Distant Star", נשמע קולה של חבורה צעקנית ונרגשת שהכתירה את הבמאי מקוטו שינקאי בתואר "מיאזאקי הבא". אם לשפוט על פי סרטו האחרון, "5 סנטימטרים בשניה", בקרוב מאוד נצטרך להודות שהם צדקו.

מקומי
אז למה להם פוליטיקה עכשיו? ז'אנר האימה כמבטא הלך רוח פוליטי
איתן גפני
16/05/2007
מאמרו החדש של איתן גפני על הזוועתונים החדשים של הקולנוע
טינה לאמריקנים: ביקורת על הטינה 2
איתן גפני
16/05/2007
איתן גפני חוזר עם ביקורת על הטינה 2 וסרטי אימה המבוססים על סרטי אימה יפנים

מסע בין כוכבים
Fuzion- the generic rules
אבי סבג
01/12/2006
חברת hero games יחד עם R. Talsorian איחדו כוחות כדי ליצור שיטת משחק אוניברסלית שתנצל את היסודות העקרונות שבשיטות הגיבור וב- Interlock (שיטת המשחק של R. Talsorian) ותתיך אותם לכדי שיטה פשוטה, גמישה, פתוחה אוניברסלית וחופשית, כלומר שתופץ חינם ברשת. התוצאה, כפי שנראה, היתה טובה משקיוו.

אנימה
כוח המחץ- התמונות
עומרי בר-לב
30/01/2009

אימה
מטאל גיר סוליד 4
עומרי בר-לב
20/07/2010
מטאל גיר סוליד, היא אחת מסדרות המשחקים הנחשבות ביותר שיש היום. הסדרה התחילה לפני יותר מעשרים שנה ועדיין רצה בהצלחה גדולה.

משחקי תפקידים

עתידנות

משחקי מחשב