|
|
|
|
|
|
''דג בבל'' מהמדריך לטרמפיסט בגלקסייה לפיתוח
אמנון כרמל
|
|
האם ומתי נצליח לבנות מכשיר אוטומטי לתרגום משפה לשפה בזמן אמת, ומה יהיו ההשפעות של מכשיר שכזה שזמין לכל אדם בכל מקום ובאופן מיידי? מהם הקשיים שנאלץ לפתור לפני שנצליח לייצר מתרגם מוצלח שכזה? על כל זאת ועוד, במאמר שלפניכם.
|
אתחיל במקרה שקרה לי לאחרונה: ישבתי בסלון עם אישתי והסבא שלה. הסבא דובר רק ספרדית, ומכיוון שכל מה שאני יודע להגיד בספרדית מסתכם פחות או יותר ב-"מוּי כיף", התקשורת בינינו דורשת תרגום סימולטני על ידי אדם שלישי. לפתע עלה במוחי רעיון. פתחתי את המחשב הנייד עם האינטרנט האלחוטי ונכנסתי לאתר התרגום של גוגל. כתבתי משפטים פשוטים באנגלית, ובן רגע קיבלתי תרגום בספרדית, מה שהקל מאוד על התקשורת בינינו. אז נכון שקשה לנהל כך שיחה מעמיקה וקולחת, אבל זה בהחלט מאפשר תקשורת בסיסית. כיצד יראה הדור הבא של הטכנולוגיה המעניינת הזו? המונח "דג בבל" (Babel Fish) לקוח מספרו המופלא של דאגלס אדאמס (זצ"ל) - "מדריך הטרמפיסט לגלקסייה". בספר מוזכר בין היתר דג זעיר מכוכב אחר אותו משחילים לתוך האוזן, ומכיוון שהוא ניזון מגלי מוח, הוא יוצר תרגום אוטומטי בין כל השפות ביקום, ועל כן שמו "דג בבל". ובכן כנראה שלא נאלץ להמתין למציאת דגים חייזרים שמעכלים גלי מוח. ייתכן מאוד כי בקרוב תוכלו למצוא מתרגם שפות אוטומטי שכזה בטלפון הסלולי שלכם. דמיינו מכשיר (דיגיטלי מן הסתם) שיוכל לתרגם שיחה בשפה א` לשפה ב` בזמן אמת. כוונתי היא למצב בו אני מדבר עברית ליד הטלפון הסלולרי שלי, (או כל מכשיר קטן אחר בעל מיקרופון), ומיד מושמעים הדברים באנגלית או צרפתית, או לחילופין מופיע טקסט על מסך ובו המילים שאמרתי בשפה אחרת. אגיע מיד לשורה התחתונה - מכשיר תרגום אוטומטי שכזה ברמה גבוהה עדיין אינו נראה באופק. למרות התקדמות אדירה בתחום זיהוי שפה באמצעים דיגיטליים שנעשתה בעשרות השנים האחרונות, אנו עדיין רחוקים מאוד מיכולת להבנת שיחה. למעשה גם אם נצליח לנתח את השיחה ברמה גבוהה (לזהות את כל המילים הנאמרות בדיוק של 90% ומעלה), הרי שאנו עוד יותר רחוקים מהיכולת לתרגם כל מילה באופן מדויק בהתאם להקשר השיחה. החדשות הרעות יותר הן שללא פריצת דרך משמעותית ומהפכנית בתחום המחשוב, קיימים מכשולים רבים בדרך שיהיה כמעט בלתי אפשרי להתגבר עליהם. מי שרוצה להבין יותר לעומק מדוע אנו עדיין רחוקים מיכולת ניתוח שפה, מוזמן לקרוא את המאמר שכתבתי בנושא ונקרא "האם ניתן ליצור אינטליגנציה מלאכותית אמיתית". פרופ` דוד הראל, דיקן הפקולטה למתמטיקה ומדעי המחשב במכון ויצמן, וחתן פרס ישראל לשנת 2004, הקדיש את הפרק האחרון בספרו "המחשב אינו כל יכול" לבעיית הבנת השפה - Natural language processing או בקיצור NLP. הוא מביא כמה דוגמאות משעשעות שממחישות את הקושי בהבנת מילים: "את המשפט: אני לא יודע איך לומר לך", ניתן בקלות להבין בטעות כאילו נאמר: "אני לא יודע איך לא מר לך." באופן דומה, המשפט: "אני שונא שירה", יכול להישמע כמו: "אני שונא שיר רע" (ע"מ 253). את הבעייתיות הרבה הכרוכה בהבנת הדקויות והמבנה הסמנטי של שפה מדוברת הוא מדגים באמצעות הדוגמה המפורסמת שהיא ספק אמיתית וספק אגדה אורבאנית לפיה בימי המלחמה הקרה, משרד ההגנה האמריקאי רצה לפתח מתרגם ממוחשב שיוכל לתרגם מרוסית לאנגלית וההיפך. אחרי זמן ארוך בו פיתחו המדענים מערכת שכזו, הגיע קצין בכיר כדי לבחון את תוצאות עבודתם. הוא הזין למערכת את המשפט: "The spirit is willing but the flesh is weak", וביקש מהמחשב לתרגם את המשפט לרוסית ואת התוצאה לתרגם חזרה לאנגלית. התוצאה הייתה: "The vodka is strong but the meat is rotten". פרופ` הראל מסכם את הבעייה וכותב: "איננו אומרים שזה [הבנת השפה הטבעית] בלתי אפשרי או חסר תקווה, אלא רק שזה הרבה הרבה יותר קשה ממה שנדמה, וכרוך בהרבה הרבה יותר מכפי שנראה לעין" (ע"מ 256).
ולמרות כל זאת ברמה בסיסית הטכנולוגיה כבר קיימת ותוכלו למצוא לפחות מכשיר מסחרי אחד המתיימר לבצע תרגום סימולטני של מילים מאנגלית לגרמנית, צרפתית או ספרדית ואף להגות את התרגום בקול. מכשיר זה נקרא "Universal Translator". מעולם לא ניסיתי את המכשיר, אך קשה לי להאמין שהוא מציע יכולת גבוהה במיוחד. באתר היצרן כתוב כי הם בחרו לתרגם אוצר מילים שמכיל כ- 3,000 ביטויים נפוצים המתאימים לתיירים. עם כמות מילים מצומצמת שכזו, גם אם הן מזוהות באחוזים גבוהים, ברור כי לא ניתן לקיים שיחות פילוסופיות מעמיקות. בנוסף למכשיר המדובר, קיימות תוכנות רבות בעולם לתרגום משפטים (ובעיקר מילים) שמסוגלות לתרגם באופן שיאפשר הבנה כללית של המסמך המתורגם. דוגמה שימושית וטובה לכך היא התרגומון של גוגל אותו כבר הזכרתי בתחילת המאמר או התרגומון של Alta Vista והתרגומון המצויין של AJAX בהם אני משתמש מידי פעם לתרגום מגרמנית, צרפתית וסינית לאנגלית. אל תטעו - התרגום עדיין ברמה נמוכה מאוד ורחוק מיכולת לתרגום משפטים מורכבים, אבל ברמת מילה בודדת או משפטים פשוטים וקצרים, מספק תוצאות סבירות, אך כרגע תוכנות אלו דורשות חיבור לאינטרנט או לפחות שימוש במחשב של ממש. אם וכאשר תהיה בידנו טכנולוגיה שכזו, למה היא תשמש? נראה כי אחד השימושים היעילים והנפוצים ביותר למכשיר שכזה יהיה בידי תיירים. דמיינו תייר שמגיע לארץ אחרת ולא צריך לשבור את השיניים על חמשת המילים שלמד בשפה המקומית. אלא שקיימת בכך סכנה של תרגום לקוי שאפילו לא תוכלו לזהות מיידית משום שלא תבינו את השפה. זה טוב כשמדובר בתייר ישראלי שמגיע לארה"ב ושואל עובר אורח "מה השעה?", והמכשיר יאמר משהו כמו: "?What is the hour", אבל מה יקרה אם תייר אמריקאי יאמר למכשיר: "?Where can I buy Icecream" שעלול להיות מתורגם לעובר אורח ישראלי כ: "איפה יכול אני לקנות אני צורח?" עם פיתוחים נוספים והתקדמות הטכנולוגית הצפויה, ניתן להניח כי נראה בעשור הקרוב נסיונות מסחריים יעילים יותר בטכנולוגיה שכזו, ואני מאמין כי בעשרים השנה הקרובות נוכל למצוא כמעט בכל טלפון סלולרי (שיהיה למעשה מחשב אישי נייד), מכשיר שיעבוד בצורה שתאפשר תקשורת בסיסית אך יעילה ובטוחה בין שני דוברי שפות שונות. מכשיר שכזה יוכל לשמש למטרות צבאיות במצבים בהם חיילים צריכים לתקשר עם אוכלוסיה הדוברת שפה זרה, עובדים בשדה תעופה בינלאומי, בשגרירויות ובמקומות אחרים בהם דוברים כמה שפות, וכמובן שימוש לצרכי תיירות ועסקים.
|
|
|
לידיעה זו התפרסמו 2 תגובות
|
תגובות
|
1 תודה, מאמר מעניין
|
|
22:53:00 15/02/2007
|
מיאו
|
|
בהקשר זה, סדרת טלויזיה מומלצת לצפייה: "פארסקייפ".
|
|
2 למההההההההההה
|
|
18:52:00 21/03/2007
|
אורין
|
הכגיע
|
למה אין תרגום לאנגלית אני יותר לא כסעסגכעגכעי
|
|
|
|
|
קישורים
|
|
|
חדשות אחרונות
|
קולנוע
|
19/11/2010
|
זה שיר פרידה – ISF סוגר את שעריו
|
11/09/2010
|
עיבודים לרוב - והפעם המגדל האפל מאת סטפן קינג
|
14/08/2010
|
חרב אור הכחולה תגיע לקרן הכחולה
|
08/08/2010
|
הצצה בלעדית לטיזר של האוונג'רס
|
30/07/2010
|
הנוסע השמיני : ההתחלה
|
|
טלויזיה
|
17/10/2010
|
פרק השבוע של האקס מן - פרק 76 והאחרון
|
30/09/2010
|
פרק השבוע של האקס מן - פרק 75
|
27/09/2010
|
פרק השבוע של האקס מן - פרק 74
|
20/09/2010
|
פרק השבוע של האקס-מן פרק 73
|
10/09/2010
|
פרק השבוע של האקס מן- פרק 72
|
|
ספרים
|
06/09/2010
|
הוצאה מחודשת לצלל-אלף
|
30/07/2010
|
אן רייס משתגעת סופית
|
25/07/2010
|
ספר הנופלים של מאלאזן נסגר.
|
14/07/2010
|
הכבוד המיצרי
|
27/06/2010
|
והמנצח במדלית זהב... ניל גיימן
|
|
סיפורים
|
04/06/2010
|
נפתחה תחרות הסיפורים הקצרים על שם עינת פלג ז"ל לשנת 2010
|
02/05/2008
|
סקופ בלעדי ! פנטסיה 2000 ב-2008
|
12/09/2007
|
שנה טובה
|
09/08/2007
|
פרס גפן 2007 – הצבעה לשלב א'
|
06/08/2007
|
תחרות סיפורים שנתית – פרס עינת
|
|
קומיקס
|
22/07/2010
|
האם היו ערפדים בתורה?
|
13/07/2010
|
הארווי פארקר נפטר בגיל 70
|
15/07/2009
|
קומיקס וירקות לפרס אייזנר
|
05/07/2009
|
מייקל ג'קסון הקומיקס
|
03/06/2009
|
אלכס רוס ומייק קארי חוברים למען ה-Human Torch
|
|
מקומי
|
02/09/2010
|
להפחיד בעברית
|
26/07/2010
|
פסטביל אייקון מחפש כריש מכירות
|
24/05/2010
|
קול קורא להגשת אירועים לפסטיבל אייקון
|
28/11/2009
|
כנס מאורות בנושא אסטרונומיה ומדע בדיוני יוצא לדרך!
|
15/08/2009
|
מכרז לפעילות דוכן יד-שנייה באייקון
|
|
מסע בין כוכבים
|
15/05/2009
|
Q כאן
|
12/05/2009
|
צוות שחקני פרייזר עושים כבוד לסדרת וויאג'
|
11/05/2009
|
קפטן גים טי קרי דור ההמשך
|
05/05/2009
|
אבודים במסע בין כוכבים
|
17/04/2009
|
וכך זה התחיל
|
|
אנימה
|
02/09/2008
|
Voltron בדרך למסך הגדול
|
17/04/2008
|
Ghost in the Shell -3D
|
20/03/2008
|
פוניו לא סתם על הצוק
|
19/03/2008
|
'ננה' בין המועמדים לפרס טזוקה
|
16/03/2008
|
קיטארו למבוגרים
|
|
אימה
|
12/09/2007
|
שנה טובה
|
13/11/2006
|
הצצה ראשונה ל- The Hills Have Eyes 2
|
06/11/2006
|
מסורת לא שוברים - בהאלווין הבא - מסור 4
|
25/10/2006
|
זומבים זומבים ועוד זומבים ב''יום המתים''
|
24/10/2006
|
פינהד כפי שמעולם לא ראינו אותו
|
|
משחקי תפקידים
|
05/02/2010
|
כנס מבוכים ודרקונים, 28 בפברואר 2010
|
27/09/2007
|
טקטיקה - חנות משחקים חדשה בדיזינגוף סנטר
|
12/09/2007
|
שנה טובה
|
24/07/2007
|
כנס "קרא-קון" לשיטות משחקי תפקידים
|
26/02/2007
|
כנס ביגור
|
|
עתידנות
|
11/12/2008
|
הלו, שומעים אותי?
|
23/11/2008
|
פריצת דרך בהשתלות
|
05/11/2008
|
אנרגיה סולארית
|
31/10/2008
|
מטוסים גרעיניים?
|
24/10/2008
|
שמש נצחית בראש צלול
|
|
משחקי מחשב
|
25/07/2010
|
הטריילר החדש של DC universe
|
26/06/2009
|
מלחמת הכוכבים לגו
|
19/02/2009
|
Counter-Strike המשחק האהוב ביותר בישראל של 2008
|
18/07/2008
|
DC משיקה את DC Universe Online, משחק רשת מרובה משתתפים
|
14/06/2008
|
Old Republic 3?
|
כתבות אחרונות
|
קולנוע
|
איך למדתי להפסיק לדאוג ולאהוב את אבודים זהו.
חגי אלקיים
27/06/2010
שש שנים עברו-חלפו להן. שש שנים של שאלות, של תיאוריות, ובעיקר – של דמויות.
|
|
טלויזיה
|
פרק ראשון מ''בן אלמוות מאת רוג'ר זילאזני''
רוג'ר זילאזני (1937-1995)
25/12/2008
במהלך "שלושת הימים" נחרב כדור הארץ. בני האדם עזבו כבר מזמן את הערבות הרדיואקטיביות השוממות והפכו לנוודים, בני בלי בית, המתגוררים ביקום לא להם. רק מתי מעט, אידיאליסטים, מוזחים, שארית הפליטה, עושים את דרכם בין הצללים בחיפוש אחר אתמול שלעולם לא יחזור.
|
|
ספרים
|
ג'ובניק: סיפור אישי -רקע לאומי
עופר ברנשטיין
06/10/2008
כתבה חדשה ומעניינת של לא אחר מעופר ברנשטיין.
|
|
סיפורים
|
פנטזי.קון 2009
יוליה שנרר
11/08/2009
מציאות או פנטזיה?
|
|
קומיקס
|
צריך סוף לסיפור אהבה? ביקורת סרט
רז גרינברג
18/04/2008
מאז יצירת המופת הראשונה שלו, "Voices of Distant Star", נשמע קולה של חבורה צעקנית ונרגשת שהכתירה את הבמאי מקוטו שינקאי בתואר "מיאזאקי הבא". אם לשפוט על פי סרטו האחרון, "5 סנטימטרים בשניה", בקרוב מאוד נצטרך להודות שהם צדקו.
|
|
מקומי
|
אז למה להם פוליטיקה עכשיו? ז'אנר האימה כמבטא הלך רוח פוליטי
איתן גפני
16/05/2007
מאמרו החדש של איתן גפני על הזוועתונים החדשים של הקולנוע
|
טינה לאמריקנים: ביקורת על הטינה 2
איתן גפני
16/05/2007
איתן גפני חוזר עם ביקורת על הטינה 2 וסרטי אימה המבוססים על סרטי אימה יפנים
|
|
מסע בין כוכבים
|
Fuzion- the generic rules
אבי סבג
01/12/2006
חברת hero games יחד עם R. Talsorian איחדו כוחות כדי ליצור שיטת משחק אוניברסלית שתנצל את היסודות העקרונות שבשיטות הגיבור וב- Interlock (שיטת המשחק של R. Talsorian) ותתיך אותם לכדי שיטה פשוטה, גמישה, פתוחה אוניברסלית וחופשית, כלומר שתופץ חינם ברשת. התוצאה, כפי שנראה, היתה טובה משקיוו.
|
|
אנימה
|
כוח המחץ- התמונות
עומרי בר-לב
30/01/2009
|
|
אימה
|
מטאל גיר סוליד 4
עומרי בר-לב
20/07/2010
מטאל גיר סוליד, היא אחת מסדרות המשחקים הנחשבות ביותר שיש היום. הסדרה התחילה לפני יותר מעשרים שנה ועדיין רצה בהצלחה גדולה.
|
|
משחקי תפקידים
|
|
עתידנות
|
|
משחקי מחשב
|
|
|