פרק שלישי מתוך פרויקט אי-גאנג של פורבס ישראל.
את הטלפונים החדשים שמקבלים פקודות קוליות אתם ודאי מכירים – הפקודות הן משפטים קצרים שנקבעו מראש "להתקשר לתומר", "לחייג שוב". אז עכשיו, דמיינו לעצמכם שהמכשיר יוכל לקבל מכם גם הוראות בסגנון חופשי כמו "בא לי לדבר עם אחותי", או "אולי תנסה לתפוס אחד מהסגנים שלי?". הסגנון החופשי הזה נקרא "שפה טבעית", שפת היומיום שלנו שאינה פורמלית, והחידוש שמציעה חברת Linguistic Agents הוא ביכולת של מחשבים למיניהם להבין שפה כזו, ולא רק את נוסחאות ההפעלה הקבועות מראש. מדובר בגיזת זהב שרבים מחפשים אחריה כבר מספר שנים – איך נוכל לתכנת את המחשב כך שיבין אותנו טוב יותר.
"בדרך כלל, תוכנות בתחום הזה רוצות לעשות רושם כאילו הן מבינות, אבל זה רק רושם. אם רוצים שהמחשב יבצע פקודות, 'כאילו' זה לא מתאים", אומר ששון מרגליות, מייסד LA והמנכ"ל שלה. "מסורתית, אנשים היו חייבים לעבוד לפי דרישות המחשב, בקצב שלו, כמו תינוק, ולהאכיל אותו בכפית". מרגליות מתאר את הפיתוח שלו כקפיצת מדרגה – "כמו המעבר מהירוגליפים לכתב אותיות".
למה בעצם מסובך כל כך לתת פקודות למחשב בשפת יומיום? כי השפה הטבעית צופנת המון משמעויות וכפלי משמעות. אפילו מילה אחת כמו "הלך" מכילה בתוכה המון נתונים שאנחנו לוקחים כמובנים מאליהם (מי הלך? הוא. מתי הלך? בעבר, לאן הלך? לשם. וכולי). מדובר בתרגום של ממש שצריך לעשות, מסביר מרגליות. "עבורנו פשוט לפענח כי המוח מפענח את השפה ברמת התת מודע. אבל המחשב לא יודע את השפה, ועבורו זה כבר לא כ"כ פשוט. המחשב דומה לכלב – הוא מבין פקודות פשוטות, אבל זה רק מפני שאילפו אותו, ואפשר לתת לו פקודות רק בצורה אחת".
כאמור, ב-LA לקחו על עצמם ללמד את המחשב את ההבנה עצמה. האלגוריתם שפותח בחברה לוקח למשל את כל הנתונים הנלווים לאותה מילה קצרה "הלך", וממפה אותם בתרשים "עץ", על פי היגיון מסוים. כל הנתונים שנוגעים לזמן (מתי הלך?) נמצאים על "ענף" אחד בתרשים, וכולי. ערבול הנתונים הזה הוא שלב הכרחי, ההופך את המידע זמין למחשב וקשה לבני אדם. אחרי הפענוח ובניית העץ, ניתן לצמצם את המידע לנתונים בסיסיים בשפת בניית האתרים XML.
מרגליות, דתי חרדי, בא מתחום הבלשנות התיאורטית (תחום החוקר את האופן שבו המוח מפרק ומבין שפה), והתמחה בננו-סינטקס (NanoSyntax) – ענף חדש וחדיש של בלשנות תיאורטית, הקיים רק מאז 2004. "למה זה ננו תחביר?", הוא מסביר, "כי בתחום הזה מפרקים את המלים והמשפטים לחלקיקי נאנו, כמו. אנחנו לוקחים 'מולקולות' גדולות, מפרקים ואז מחברים חזרה ל'מולקולות' אחרות". מה שהביא ל"קפיצה" של מרגליות הוא השילוב בין תחום המחקר שלו לתחום הקרוי "עיבוד שפה טבעית" (NLP).
הפיתוח שנולד מהשידוך הזה הוא "מנוע" שמסוגל לנתח ולהבין משפט שלם. "היום מנתחים מילה או רצף מילים", אומר מרגליות. "אצלנו זה כבר ברמת המשפט, כולל נתונים שמרומזים בתוך המשפט ומשתמעים ממנו". המנוע, המסוגל לפרק ולהבין עשרות משפטים בשנייה, מאפשר למחשב להבין את שפת האנוש וליישם את הפקודה שניתנת לו. "אפשר ליישם את הבסיס בכל השפות מיפנית ועד יידיש", אומר מרגליות, "באותה תוכנה בדיוק ללא שינויים". ניתוח התוכן ((Parsing מוצג למשתמש בטכנולוגיית Ajax המאפשרת טעינת מידע עדכני בדף מבלי הצורך לטעון את כולו שוב ושוב – מה שמקל על מהירות ויעילות היישום.
ובכן, מה עושים עם זה חוץ מלחלק הוראות לטלפון? היישומים רבים מספור. ראשית והכי בולט – יישום המספק ניתוחי טקסט ומאפשר שדרוג משמעותי של החיפושים הקיימים באינטרנט וברשתות מידע בכלל. אם המחשב "יבין" שאתם מחפשים את Mister Brown, הוא לא יפנה אתכם לאתרים שעוסקים בצבע חום. "אצלנו, האינדקס של החיפוש יכול להבין כפלי משמעויות ולהבין את ההבדל בין שם האדם בראון לבין הצבע החום", אומר שרולי טייבר, מנהל מערכות המידע בחברה.
.
יישום נוסף הוא אתרים חינוכיים ולומדות מחשב, שבעזרת פיתוח כמו של LA יוכלו "להבין" את התלמיד, לאפשר לו להציב תשובות בשפה טבעית (ולא למשל רק לענות על שאלון אמריקאי) ולשפוט את הישגיו טוב יותר. תחום נוסף ורחב הוא משחקי מחשב, שבהם אפשר יהיה "לדבר" עם גיבור המשחק ולתת לו הוראות כיד הדמיון הטובה עליכם (גם אם בהקלדת טקסט).
מחשב שמבין שפה טבעית יוכל גם להיות כלי מסחרי רב ערך, אומרים ב-LA, ביישומים של צ'אט אוטומטי בשירות לקוחות. "בארה"ב יש כבר שירות אוטומטי", אומר שמעון הכהן, סגן נשיא לפיתוח עסקי, "אבל התפרט מסובך, ולרוב בסוף האדם לוחץ על 0 ומגיע למענה אנושי. ביישום שלנו, אם הלקוח יפרט את הבעיה במלים שלו, הוא יוכל לעבור לשלוחה המתאימה בלי תפריט". המנוע יעקוב אחר תלונת הלקוח והאנשים המוזכרים בה, ויזכור למשל מי זה 'הם' ומי זה 'הוא', פרט שבשפה טבעית הוא מובן מאליו אבל אצל המחשב יוצר בלבול. גם בתקשורת סלולרית יהיה אפשר לשלוח בקשה או שאילתא ב-SMS בשפה טבעית למוקד התנועה למשל, בניגוד להיום, שיש צריך לשלוח קוד.
יישום נוסף שבו המחשב יכול לעזור הוא סריקות טקסט. "כשהכתב על הדף הסרוק לא מזוהה, המחשב מנחש הרבה פעמים. כאן כיוון שהוא "מבין" את המשפט, הוא יוכל לבדוק כמה אפשרויות ולבחור את המדויקת ביותר ביניהן. "עיקר העניין הוא הבנת ההוראות הפשוטות" אומר מרגליות, "5-6-7 מילים שהיום המחשב פשוט לא מבין. אני רוצה למשל להקיש בגוגלdo it again ושהוא לא יחפש לי את המלים הללו, אלא ימלא את הפקודה ויבצע חיפוש מחודש. זאת בניגוד למצב הקיים כרגע, שבו אנחנו צריכים ללמוד את שפת החיפוש בגוגל".
אם מפליגים מעט רחוק יו
תר, מעבר למחשב האישי, מכשירים חכמים יכולים לפעול בכל הבית, במה שנקרא "הבית החכם" – שלט טלוויזיה שמבצע פקודות קוליות בשפה טבעית, למשל. "היום, מערכות בינה מלאכותית יכולות לעשות הרבה דברים, חוץ מאשר את זה", מבהיר הכהן. התוכנה של LA יכולה כבר היום לעבוד עם זיהוי קול, ותיאורטית לייתר את המקלדת במכשיר הסלולרי לטובת פקודות כמו "תמצא בבקשה את הטלפון של המסעדה שבה אנחנו יושבים, ושלח אותו ב-SMS לחברים שלי".
הפיתוח של LA משתלב יפה באחד הטרנדים החמים באינטרנט של היום, הלא הוא הווב הסמנטי – השאיפה לקטלג, למיין ולשים "תווית" על כל פיסת מידע שמוצבת באינטרנט, כך שיישומים ומנועי חיפוש שונים יוכלו למצוא את המידע ולהציג אותו. עם זאת, החברה נוסדה כבר ב-1999 ("לפני שהתחום הומצא"). לחברה יש פטנט אחד הממתין לרישום, והמוצר עצמו הוא שני מוצרים שונים: "מנוע" שמיועד לאתרים או למכשירים עצמם, וכן תוכנה למשתמשי קצה. "ניתן לשלב את האלגוריתם בצורה הדרגתית בשיטות קיימות", אומר הכהן. "וזה אומר שיתאפשר חיבור למערכות לגאסי ישנות בארגון".
ש: האם אין עוד מתחרים בתחום הזה?
מרגליות: "האחרים מנסים לגלות איך עוברים ממחשב לדיבור טבעי, ואנחנו עובדים להפך. יש לנו גם יתרון זמן וגם ייחודיות".
עד עתה קיבלה החברה השקעות סיד בסך של כמיליון דולר, רובה מ-Voyant Technologies, חברה בתחום תקשורת הכל (שנמכרה מאז לפוליקום). כעת בוחנים שם השקעות או שיתופי פעולה אסטרטגיים. על פי מרגליות, המוצר עצמו כבר מוגמר, ו-5 מיליון הדולר שהחברה שואפת לגייס כעת אמורים לסייע ל"אריזה" ולשיווק בלבד. גם את השיווק ירצו לעשות בדרך מושכלת: "אנחנו לא רוצים להתמקד רק בתחום אחד", אומר מרגליות. "גוגל התמקדו פעם בחיפוש, והיום החיפוש שלהם כבר לא כזה טוב, כי הם יצאו לשוק והתרחבו ליישומים נוספים. אנחנו נישאר בהתמקדות שלנו כפיתוח בלשני, נמכור יכולות לחברות אחרות, ואנחנו נהיה השכבה החכמה".
"כרגע אנחנו מתמקדים יותר בחיפוש ופקודות מאשר במשחקים ופיתוחי קול", אומר טייבר, "כי את היישומים האחרים האלה אפשר לפתח גם בשת"פ עם חברות אחרות. ואנחנו נהיה החומר המייצב שלהן".
ש: אם תקבלו הצעה לרכישה, תממשו אותה?
טייבר: "אנחנו לא שואפים למכור בטווח המיידי. יש הרבה יותר פוטנציאל אם לא נמכור".
תגובות
לזמן שבו אפשר יהיה לתת הוראות בסגנון חופשיכמו,למשל: "אני חם אש על א',טלפון-טלפון שעל הקיר,אתה חושב שאתה יכול לארגן לי זיון איתה? בהסכמה,כמובן! וליתר ביטחון תקליט הכל!"
לכתוב משהו עליהם ועל הטכנולוגיה (המשוערת) שלהם.
באופן אישי ההערכות של הדובר נראות לי קצת (הרבה) מנופחות.
אבל כנראה שיש קסם מסויים שמושך משקיעים בהוספת המילה 'ננו' – למשל פרס שהכריז בגרמניה: "כלי נשק שיפותחו בטכנולוגיה עתידית, הננו-טכנולוגיה תנצח את הטילים":
http://www.ynet.co.il/articles/0,7340,L-3311272,00.html
אורן, אין שום קשר בין ננו-סינטאקס לננו-טכנולוגיה.
אבל ננו-סינטאקס זה מונח שיווקי שהמציאו בLA בדיוק כמו שפרס משתמש במילה ננו לצרכי שיווק בלי שום קשר למציאות.
בקשר לLA – הם לא הראשונים שהכריזו על מהפכה בתחום הבלשנות החישובית ומן הסתם הם גם לא האחרונים.
אורן,
אתה טועה לגבי ננו-סינטאקס. זה פשןוט שם כולל לאוסף תיאוריות בלשניות חדשות מאוד. אתה צודק שרבים הכריזו על מהפכה בבלשנות חישובית, אבל אף אחד לא רתם את התאוריות החדשות ביותר של צ'ומסקי מהשנים האחרונות ממש לטובת המחשבים. לדעתי יש כאן משהו חדש שיכול לעורר מהפכה של ממש.
אני לא בקיא מספיק בבלשנות מודרנית כדי לדעת מה הפוטנציאל של הכיוון החדש הזה. אבל שמעתי מספיק פעמים על מחשבים שיבינו שפה טבעית 'ממש עוד רגע'.
אולי הפעם נופתע
אתה נשמע כמו מישהו עם אינסייד אינפורמיישן.
אני לא בקיא ב"בתאוריות החדשות ביותר של חומסקי מהשנים האחרונות ממש" אבל דווקא יש לי נגיעה מסויימת בלשנות מודרנית וגם בהשקה שלה לישומים בלשניים. לי נדמה שעוד חזון רב למועד ורבות הבעיות האקוטיות הבלתי פתורות מפירורי הבעיות הפתורות בתחום. נדמה לי שזה נכון הן לגבי בלשנות והן לגבי בלשנות חישובית או עיבוד שפה.
יודע מה – הלואי ואני טועה ואתה צודק. זה יביא לי הרבה עניין ולLA הרבה כסף.
ההכרזות של LA הינן בתחום הננו-סינטקס והן עבורי אוטופיה (בינתים), הדוגמות שניתנו אינן בתחום ננו. כבר לפני 2004 ובהרבה ידענו להבחין בין המשמעויות השונות של פוליסמים כמו BROWN המודגם כאן