אלישע והזוויות
אלישע והזוויות
ללמד מחשב מה זה מזלג [2-5]
0:00
Current time: 0:00 / Total time: -29:45
-29:45

ללמד מחשב מה זה מזלג [2-5]

וגם על צבים, "המשרד" והקשר שבין פיקסאר ומכונות לומדות

שלום כולם, וברוכים הבאים לאלישע והזוויות, עונה שנייה, פרק חמישי. היום ט'  אלול, ה-12 לספטמבר, ואנחנו נדבר היום על בינה מלאכותית ושפה. אבל קודם כל, לפני שנתחיל, רציתי להזכיר לכם שיש מייל לפודקאסט, כמו גם חשבון טוויטר ואתר אינטרנט שבו תוכלו למצוא את כל הפרקים של הפודקאסט גם בגרסה כתובה, ומי שנרשם לאתר מקבל מייל כל פעם שיוצא פרק. אז, הלינקים בתיאור הפרק, ואתם מוזמנים ליצור קשר ולהגיב באופן חופשי. אני מבטיח לנסות ולענות לכל מי שיכתוב.

בפרק הקודם הסתכלנו על מבנה המנוע של הבינה המלאכותית של ימינו, והיום אנחנו נחפור עוד בתשתיות שלה. כזכור, מבחן טיורינג מסתמך על היכולת של מכונה לנהל שיחה עם בן אדם, מה שמצריך ממנה להבין שפה של בני אדם. אז היום אנחנו נרצה לחטט קצת בשאלה כיצד מחשבים מבינים שפה, וספיציפית, איך מחשבים מבינים את המשמעות של מילים? שווה לציין ששפה היא הרבה מעבר לרק המשמעות של מילים. לשפה יש גם דקדוק, ומילים משנות את משמעותן בהקשרים שונים, וכן הלאה. אבל הבסיס לכל זה הוא, קודם כל, להבין את המשמעות של מילה בודדת, ובזה אנחנו נתמקד היום.

מהניסיון שלי, המפתח להבנת רעיונות עמוקים ומורכבים הוא למצוא את הדימוי האלגנטי ביותר עבורם, אז בפרק הזה יהיו כמה דימויים כאלו, ואני מקווה שזה יקלע לטעם שלכם ויעזור לקונספטים שנציג כאן להחליק לכם בקלילות בגרון. הדימוי הראשון שישרת אותנו כאן שאוב מעולם סרטי הילדים. אני משער שרוב המאזינים, אם לא כולם, מכירים את הז'אנר של סרטי דיסני ופיקסאר, שבהם ישנו עולם מאד דומה לשלנו, רק שבו האנשים מוחלפים במשהו אחר. בסרט "צעצוע של סיפור" הדמויות הן צעצועים, בסרט "באג לייף" הנמלים הם הדמויות האנושיות, ב"זוטופיה" כל חיות העולם מאכלסות מטרופולין גדול כמו ניו-יורק, ובסרטים "מכוניות" ו"מטוסים" אתם יכולים לנחש לבד מה עבר האנשה. 

ובכן, על אותו מטבע, גם אנחנו "נחייה" יישות כלשהי היום, והרי היא המילה, או בואו נגיד - את כל המילים בשפה העברית. בואו נדמיין סיפור על עולם דמיוני שבו מילים הם דמויות חיות, אנשים כמוני וכמוכם. כל מילה חיה בעולם הזה במקום מסויים, והיא אוהבת לחיות קרוב למילים שדומות לה. אם תפתחו את הספר שמספר על העולם הזה, תמצאו בכריכה הפנימית שלו מפה מאויירת של העולם הזה, עם ציונים של אזורי עניין. נניח, יכול להיות שתראו שיש עיר שבה גרים כל הצבעים, המילים "אפור", "ירוק", "כחול" וכן הלאה. במקום אחר בעולם תהיה עיר שבה יגורו כל המקצועות, מילים כמו "רופא", "סבל", "מתכנתת", "נהגת" וכן הלאה. וגם הערים הללו יהיו ממוקמות יחסית אחת לשניה באופן שעושה שכל. נניח, עיר המונחים הפיזיקליים כנראה תהיה קרובה לעיר המונחים המתמטיים, ועיר שיש בה שמות של שחקני הוליווד תהיה ליד עיר שיש בה שמות של צלמי פאפראצי. 

ככל שאתם, והילדים שלכם, מביטים במפה, אתה רואים שמי שעיצב אותה ממש עשה עבודת אומן, וחשב על המון דברים מגניבים. לדוגמה, אתם שמים לב שמילים של צורת רבים תמיד נמצאות ממזרח למילים של צורת רבות, כלומר בלשון נקבה. הילד שלכם גם מעיר שבעיר הצבעים, ככל שהצבע כהה יותר הוא נמצא צפונה יותר בעיר. כיוון שגם בעולם הזה יש בתי דירות, המפה תתייחס גם לגובה ולא רק לאורך ורוחב, ואז אולי תגלו שככל שלמילים יש משמעות עוצמתית יותר, הן גרות בקומה גבוהה יותר בבניין שלהן. כך נראה שהמילה "ענק" תהיה בקומה גבוהה יותר מאשר המילה "גדול", והמילה "פצפון" תהיה בקומת הקרקע.

עכשיו, דמיינו שהילד שלכם הוא חנון. חנון מקצועי ומוכשר. יום אחד, הוא חוזר הביתה ואיתו דף משבצות שקוף, כמו מתוך מחברת חשבון אבל שקוף. הוא לוקח את הספר, פותח אותו ומניח עליו את דף המשבצות. הוא מסמן נקודה מסויימת כראשית הצירים, נקודה אפס-אפס-אפס, ואז הוא מסמן עבור כל מילה במפה את הקואורדינטות שלה. "תראי אמא" הוא אומר כשהוא מסיים, "תראי מה עשיתי. עכשיו אני יכול לתכנת GPS שיעזור לנווט מהמילה 'ילד' למילה 'כאפות' ". :) 

נשים את ההומור היבש שלי בצד, ונחזור לנושא שלנו. אני משער שכבר ניחשתם את הקשר לפודקאסט: כשמלמדים מחשבים שפה, אנחנו בעצם עוזרים להם לשרטט מפה שכזו, כשכל מילה מופיעה על המפה. למפת מילים שכזו קוראים בשפה המדעית word embeddings, או "הטמעות מילים", כדי להביע את העובדה שלקחנו את כל המילים בשפה ו"הטמענו" אותם באיזה מרחב גיאוגרפי, כך שלכל מילה יש קואורדינטה במרחב הזה. וספיציפית, הטמעות מילים איכותיות הן כאלו שהמיקומים של כל מילה מייצגים, במובן מסויים, את המשמעות שלה.

יש המון מחקר שהוקדש בעבר וגם היום לפיתוח שיטות לייצור הטמעות מילים שכאלו, ואנחנו ניגע בחלק מהטכניקות לזה בהמשך הפרק. אבל בשלב הזה אני רוצה לעצור ולשאול: מה ההשלכות של ההתמרה הזו? ותנו לי למקד עבורכם את הפנס שלי על שלוש השלכות שכאלו, שכן אם באמת אפשר להכין מפה שכזו, מדובר באירוע דרמטי ביותר.

בראש ובראשונה, מה שעשינו כאן הוא חשוב בגלל שמחשבים לא מבינים שפה של בני אדם, אבל הם יודעים טוב מאד איך לעבוד עם מספרים וקואורדינטות. מחשב יכול לחשב מרחקים בין שתי נקודות במפה, וגם לחשב את הכיוון היחסי של תנועה מנקודה א' לנקודה ב', וכן הלאה. במילים אחרות, המעבר מאוסף מילים רנדומלי למפת המילים היפה שלנו הוא מה שסולל לנו את הדרך להעביר את כל נושא השפה לייצוג שמחשבים יכולים לעבוד איתו. 

המרכיב השני שהופך את המעבר הזה למשמעותי הוא העובדה שבָמפה שאנחנו מייצרים המיקום של המילים איננו אקראי, אלא הוא בהלימה למשמעות של המילים. כפי שתיארתי קודם, במפה הדמיונית הזו מילים דומות נמצאות קרוב אחת לשניה, וכיוונים במפה גם הם בעלי משמעות. אז לדוגמה, אם הייתי רוצה לכתוב תוכנה שמוצאת מילים נרדפות, אני יכול פשוט לומר למחשב - "הנה הקואורדינטה של מילה X, תמצא את המילה Y שהכי קרובה ל-X במפה, וזו כנראה תהיה מילה נרדפת". נכון מגניב? ברור שמגניב!

ויש נקודה השלישית, אולי הנקודה העמוקה ביותר. זוכרים את הילד החנון שלנו, שהגיע הביתה עם השקף המשובץ? איפה הוא סימן את ראשית הצירים? איפה שהוא רצה. לא משנה איפה הוא היה מסמן את הנקודה 000, המפה היתה בדיוק אותו דבר, רק עם מספרים שונים. השקף שלו לא שינה את המפה עצמה, ולא השפיע על המרחק בין שתי מילים או הזווית ביניהן, אלא רק את הייצוג המספרי שיהיה לנקודות על המפה. אז כשחושבים על זה, מגלים את התובנה הסופר-חשובה הבאה: אם אני מספר לכם שהמילה "חתול" מצויה בקואורדינטה (1 2 3), למספרים הללו אין באמת חשיבות. כל המשמעות שלהם היא רק בדבר אחד - שהם מקודדים עבורי את המיקום היחסי של "חתול" ביחס לשאר המילים במפה.


אלו שלושת ההשלכות של המעבר למפת המילים. כפי שבטח שמתם לב, הדגשתי באופן חד דווקא את הנקודה השלישית, ואני רוצה שתבינו למה. אז, נקו את הראש, שכחו לרגע מהמפות שלנו, וצאו איתי לכיוון מחשבה אחר. תחשבו רגע על מילון עברי-עברי, כזה רגיל כמו שלכולנו היה בבית הספר היסודי. קחו שם כל מילה - נניח, המילה "מזלג". מזלג מוגדר במילון ספיר המקוון כ-"כּלי מוּארָך בעל שיניים לאכילה של מזון מוצק", כלומר - הוא מוגדר על ידי סדרת מילים כלשהי. עכשיו, כל אחת מהמילים הללו גם כן מוגדרת במילון, ושוב על ידי סדרת מילים אחרת, שגם כל אחת מהן מוגדרת על ידי מילים אחרות, וכן הלאה. אז בעצם, מה זה מילון? זהו ספר, שכולל את כל המילים בשפה, ומגדיר את המשמעות של כל מילה על ידי תיאור היחס שלה לסדרת מילים אחרות!

אם כן, מה שאני רוצה להציע לכם כאן הוא את הרעיון הבא: שאותה מפה של עולם המילים שדמיינו קודם לכן היא בעצם המקבילה הממוחשבת של מילון: כמו שבמילון המשמעות של מילה מעוצבת רק על ידי מילים אחרות, כך גם במפה שבנינו קודם, המשמעות של מילה מקודדת רק ביחס שלה לשאר המילים בשפה. לא פחות ולא יותר. ונכון, יש הבדלים בין מילון לבין המפה שתיארנו - לדוגמה, בהגדרה מילונית יש רק סדרה קצרה של מילים, לא את כל המילים בשפה, לעומת המפה שלנו. אבל מה שחשוב לענייננו הוא העובדה שבשתיהן מדובר במערכת סגורה: בשתיהן, המשמעות של כל מילה מעוצבת רק על ידי היחס שלה למילים אחרות, ותו לא.


אולי זה נראה לכם פשוט וקל, אבל הרשו לי לנסות לשכנע אתכם שיש משהו קצת מטריד ברעיון הזה, שהמשמעות של מילה מובעת על ידי מילים אחרות. שכן, אם כל מילה מוגדרת על ידי מילים אחרות, אז די מהר ניווכח שיהיו לנו במילון בהכרח הגדרות מעגליות. לדוגמה, בואו ניקח את המילים "זכר" ו"נקבה". במילון ספיר אונליין:

  • זכר מוגדר כ"מין בבעלי החיים ובצמחים שתפקידו להעביר לבת הזוּג (הנקבה) זֶרע להפריה ולהולָדה", 

  • ואילו נקבה מוגדרת כ"מין בבעלי החיים ובצמחים שתפקידוֹ לקלוט את זֶרע הזָכר להולדה".

שימו לב שהמילה זכר מופיעה בהגדרה למילה נקבה, ונקבה - בהגדרה של זכר. יש כאן הגדרה מעגלית. בעולמות הלוגיקה, הגדרה מעגלית היא דבר פסול. זה בעצם להגדיר מילה על ידי שימוש בה עצמה. לומר "ההגדרה של אבן היא אבן" זו לא הגדרה בכלל, אלא אמירה סתמית חסרת ערך. אבל איכשהו, במילונים, זה לא מפריע לנו. למה זה לא מפריע לנו?

הסיבה לכך גם היא, האמת, די מתבקשת. כי המילון רק בא לעזור לנו ליישר קו סביב ההגדרות של מילים שאת המיפוי שלהם לעולם האמיתי אנחנו מכירים כבר לפני כן, גם בלי קשר למילון. ילד יודע מה זה מזלג לא בגלל שקרא את ההגדרה במילון, אלא כי ההורים שלו הראו לו הרבה מזלגות ואמרו לו שזה מזלג. אם כן, המילון אמנם מכיל הגדרות מעגליות, ומה שמאפשר את השימוש בו הוא שהמילים הם בראש ובראשונה ייצוגים של דברים בעולם שבחוץ שאנחנו מכירים בלי כל קשר למילון. במילים אחרות, העולם שבחוץ - אני אקרא לזה כאן לפעמים ה"עולם האמיתי", אבל אל תתפסו אותי על משמעות המילה "אמיתי" כאן - הוא העוגן הנסתר למילון, שנותן למילים הללו משמעות יציבה. 

האופן שבו מילים יכולות לאבד את משמעותן כשאין להם עוגן אמיתי מובע בכל מני הקשרים קומיים. נניח, קחו את הדיאלוג המגוחך הבא שקורה בסדרה "המשרד" האמריקאית, בין דווייט, המעצבן המשרדי, לבין ג'ים, הבחור הנחמד במשרד שגם אוהב להתעלל קצת בדוייט כשהוא עובר גבול מסויים. הרקע לקטע הבא הוא שלפני כמה פרקים, ג'ים קיבל קידום והוא עכשיו הבוס הישיר של דווייט. בוקר אחד, כשג'ים מגיע בכמה דקות איחור למשרד, דווייט מביט בו בעלבון, משרבט משהו על דף צהוב ונותן אותו לג'ים, ואומר לו שהדף הזה הינו הערה שלילית. ואז קורה הדיאלוג הבא:

דוויט: אתה צריך ללמוד, ג'ים. אתה אולי מספר שתיים במשרד, אבל אינך מעל החוק.

ג'ים: או-הו, אני מבין לגמרי. וגם, יש לי הרבה שאלות. כמו, מה זה בכלל אומר "הערה שלילית"?

דוויט: בוא נגיד את זה ככה. אתה לא רוצה לקבל שלוש כאלה.

ג'ים: יאללה, ספר לי.

דוויט: שלוש הערות שליליות, ותקבל התראה.

ג'ים: וואו, זה נשמע רציני.

דוויט: או-הו, זה רציני. חמש התראות, ותירשם לך הפרה. ארבע כאלה, ותקבל אזהרה בעל פה. תמשיך ככה, ואתה כבר תקבל אזהרה בכתב. שתיים כאלה, ותתחיל באמת לסבול, כשאני אוציא דו"ח משמעת. דו"ח שאני אעלה על הכתב ושיגיע ישירות לשולחן של הממונה הישיר שלי.

ג'ים: הממונה הישיר שלך, שזה אני.

דוויט: אממ… נכון.

מה שקורה כאן בדיאלוג הזה הוא שלאורכו מתברר שלמילים שדווייט אומר, אין באמת משמעות. כל אחת תלויה או מובילה לשניה, וכשמצליחים להתיר את כל המורכבות הלשונית שדוייט המציא, מגלים שאין לזה שום עוגן במציאות, אלו מילים שנשמעות דרמטיות אבל ללא תוכן אמיתי. המצב הזה של רגרסיה שבסופה אין כלום, מתקשר אצלי בראש לעוד קטע הומוריסטי. יש לו כמה גרסאות, אבל הנה אחת מהן:

לאחר הרצאה על קוסמולוגיה ומבנה מערכת השמש, ניגשה גברת קטנה ומבוגרת אל המרצה. 

"התיאוריה שלך, שהשמש היא מרכז מערכת השמש והארץ היא כדור שמסתובב סביבה, נשמעת מאוד משכנעת, אדוני, אבל היא שגויה. יש לי תיאוריה טובה יותר," אמרה הגברת הקטנה. 

"ומהי התיאוריה שלך, גברתי?" שאל המרצה בנימוס. 

"אנחנו חיים על פיסת אדמה שנמצאת על גבו של צב ענק." אמרה האישה. 

במקום לנפץ את התיאוריה המוזרה הזו על ידי הצגת אסופה של ראיות מדעיות נחרצות, החליט המרצה לנסות ולשכנע אותה בעדינות. "אם התיאוריה שלך נכונה, גברתי," הוא שאל, "על מה עומד הצב הזה?" 

"אתה איש חכם מאוד, פרופסור, וזו שאלה טובה מאוד," השיבה הגברת הקטנה, "אבל יש לי תשובה לזה, והיא כזו: הצב הראשון עומד על גבו של צב שני, גדול בהרבה, שעומד ישירות מתחתיו!" 

"ועל מה עומד הצב השני?" המשיך המרצה בסבלנות. 

לכך השיבה הגברת הקטנה בתרועת ניצחון. "שאלות שכאלו הינן חסרות טעם —הצבים ממשיכים ככה כל הדרך למטה."

גם כאן, ההומור טבוע בכך שכל צב נשען על צב שתחתיו, אבל נראה שאין באמת דרך שכל מגדל הצבים הזה יוכל להתקיים, כי אין לו עוגן אמיתי שחיצוני למערכת הצבים, משהו שכל הצבים בסופו של דבר נשענים עליו כדי לקבל יציבות. כמו בטיעוניו של דוייט, בתחילת התהליך נשמע שאולי יש להם כאן משהו, אבל מתברר לאחר זמן קצר שבעצם למילים שלהם אין באמת משמעות. מהלך החשיבה שלהם מאבד ממשות כשמגיעים לסופו. 


אז מה יש לנו כאן בעצם? אפשר לומר שראינו שיש למילים שני רבדים של משמעות. רובד אחד הוא הרובד הפשוט, הקישור של המילים לעולם שבחוץ, המיפוי שלהם למה שהם מתייחסים אליו. בני אדם רוצים לתקשר לגביי משהו שם בחוץ, והם מגבשים מילים שמאפשרים להם לדבר על כך כחברה. במובן הזה, המשמעות של המילה מעוגנת במשהו שחיצוני לשפה. ברובד השני, יש להן משמעות שהינה רק פנימית לשפה: משמעות שמנוסחת על ידי שימוש במילים אחרות, או, בגרסה הממוחשבת, קואורדינטות שמאפיינות את המיקום היחסי של מילה נתונה ביחס למיקום של שאר המילים. 

כשאנו אומרים שמחשבים "מבינים" את המשמעות של מילים, אנחנו מתכוונים לכך שיש להם גישה למשמעות שלהן רק במובן השני. זה גם הגיוני, כמובן. גם אם נניח שהייתם מצליחים איכשהו להסביר למחשב שהמילה "מזלג" קשורה למזלג פיזי, את המילה "אהבה" אין למחשב שום דרך להבין. זו מילה שאת העיגון שלה במציאות אנחנו, כבני אדם, חווים באופן ייחודי. הדרך היחידה שמחשב יוכל אי פעם לעכל את הרעיון של "אהבה" היא בצורה השניה, שבה המילה אהבה ממוקמת במיקום הראוי לה במפת עולם המילים, ומתוך היחס שלה למילים אחרות, כמו "נישואין", "משפחה" ו"רומנטיקה" המחשב יוכל להסיק את התשובה לשאלה, "מה זו אהבה?" 

אבל, בשל המגבלה הזו, יכולים אנשים לבוא ולומר - "שמעו, זה די מבריק הקטע הזה של מפת המילים - אבל זה לא מבריק מספיק. אתם בעצמכם מודים שמחשבים לא יכולים באמת להבין את המשמעות האמיתית של מילים. המילים לא מעוגנות עבורם במציאות החיצונית, וזו מגבלה שאי אפשר להתגבר עליה! GPT לעולם יהיה רק מכונה שמוציאה פלט שנראה מגניב, אבל אין לו באמת עומק". ואכן, אנחנו נראה את הדעות הללו בהמשך העונה. אבל כרגע, לפחות לפרק הזה, אני רוצה לתת את הקייס החזק ביותר דווקא לצד שסבור שמה שיש בידי המחשב הוא די והותר כדי לא רק להוציא פלט שיש לו משמעות, אלא אפילו כדי, בהמשך, לחשוב ממש על העולם האמיתי. כדי להבין את זה, אני רוצה שנקדיש כמה דקות לשאלה - איך באמת בונים מפת מילים שכזו? 

להסביר איך זה קורה באופן מדוייק יקח הרבה יותר מדי זמן ויותר מדי צלילה לעומקים טכניים, אז כרגיל, אנחנו ניגע רק בקווים המנחים של התהליך, של חלקים ממנו, כדי לקבל את הרושם הכללי שיספיק לצורך הדיון שלנו כאן. מה שאני ארצה להראות לכם היום הוא שגם בלי לדעת דבר או חצי דבר על העולם, אפשר לחלץ מתוך השפה הרבה מידע על היחס שבין מילים שונות, מידע שיכול לשמש אותנו בבניית מפה שכזו. אז שוב, נקו את הראש ודמיינו את הסיפור הבא. נניח שחייזרית טסה לה בחלל ועוברת ליד כדור הארץ. אין לה זמן לרדת ולחקור את המין האנושי, אבל היא כן מספיקה לעשות האקינג לאחד הלוויינים של אילון מאסק, להתחבר לאינטרנט ולהוריד את כל הספרות העברית, כולל כל הדפים בעברית באינטרט, אליה למחשב. עכשיו, היא לא מכירה עברית בכלל, וגם לא מכירה את העולם שלנו בגרוש, אבל יש לה זיכרון פנומנלי והמון זמן לשרוף עד שהיא מגיעה חזרה לבית שלה במאדים. מה היא יכולה ללמוד על המילים בשפה העברית?

ובכן, יש כל מני טריקים שהיא יכולה להפעיל, שכולם מבוססים אך ורק על התבוננות בתבניות של השפה כפי שהיא מוצגת בספרות העברית. טריק אחד הוא להסתכל על מבנה של משפטים. נניח שהיא תחפש את כל המקומות שמופיעה המילה "אכלתי", ואז עושה רשימה כל המילים שמופיעות מיד אחריה. כנראה שברשימה הזו ימצאו הרבה סוגי אוכל, נכון? וכמובן, יהיו עוד קבוצות של מילים שאינם מאכלים, כמו תיאורי זמן (אכלתי אתמול) וכו', אבל עדיין, אוכל יהיה מאד דומיננטי שם, ומצד שני מילים רבות, כמו המילה "פלסטיק", לא יופיעו אפילו פעם אחת. אם כן, ניתן יהיה להבין שיש קשר חזק יותר בין המילים "אכלתי" ו"תפוח" מאשר המילים "אכלתי" ו"פלסטיק", ולמקם את "תפוח" קרוב יותר מאשר "פלסטיק" במפה. 

עכשיו שהבנתם את הטריק הראשון הזה, בטח תוכלו לחשוב על עוד טריקים. לדוגמה, אולי פשוט תסתכלו על האותיות של כל מילה, ותשימו מילים עם אותיות דומות, באותו סדר, אחת בקירבת השניה. בעברית, למילים יש שורשים, ומילים בעלות שורש משותף גם יחלקו, הרבה פעמים, משמעות דומה, אז זה יכול להיות אחלה רעיון. וחוץ מזה, יש גם תחיליות וסיומות שחוזרות על עצמן, כמו הסיומת "ים" או הסיומת "ות". גם כאן אתם רואים איך בלי לדעת דבר על העולם שלנו אפשר להסיק משהו לגבי המילים - יחסי דמיון ושונות, קרבה וריחוק. ועוד טריק חביב אחד לסיום - אפשר להסתכל במילונים! למילים דומות יהיו הגדרות דומות, אז אם לשתי מילים יש הגדרות עם הרבה מילים משותפות - יש סיכוי לא רע שהן קשורות במשמעותן.

רשימת הטריקים שמניתי כאן איננה מקיפה את כל האפשרויות. עולם מדעי המחשב מלא וגדוש בטכניקות מתוחכמות הרבה יותר ממה ששיתפתי כאן, טכניקות שסוחטות המון משמעות מהמבנה של המילים והשפה ועוזרות לייצר מפות מילים מאד מפורטות ומדוייקות. צריך גם להבין ששפה היא דבר סופר מורכב. תחשבו אפילו רק על העובדה שלמילים יש כמה משמעויות, לפעמים משמעות סלנגית שהופכת למשמעות הרשמית, וכן הלאה. עם כל זה שאני מנסה לתאר דברים כאן באופן שקל להבנה, חשוב לזכור שכל צעד כאן הוא צעד שלקח הרבה זמן של הרבה אנשים חכמים לגלות, לפתח ולדייק.

לענייננו, התהליך שתיארתי כאן יכול לתרום לדיון על השאלה ששאלנו קודם. אתם זוכרים ששאלנו - האם העובדה שמחשבים רק מבינים את המשמעות של מילים במובן היחסי, בלי עוגן במציאות, אומרת שאין להם סיכוי לחשוב על העולם האמיתי? לדעתי, כשרואים את האופן שבו מייצרים את המפה הזו, מבינים שאי אפשר לשלול כל כך מהר את האופציה הזו. ולמה? שכן, אם העולם היה שונה, אז השפה היתה שונה, וממילא המפה היתה משתנה. אם אנשים היו נוהגים לאכול פלסטיק באופן קבוע, אז המשפט "אכלתי פלסטיק" היה מופיע בכל הטקסטים שהם למדו, נכון? כלומר, אמנם המפה שהם בונים מקודדת רק את היחסים שבין המילים, אבל הטקסטים שאנו נותנים להם לעבד אינם מנותקים מהעולם, אלא קשורים אליו באופן חזק ומשקפים משהו לגביו. דרך אחרת לומר זאת היא שהאדם המציא את השפה כדי לעזור לו לחשוב ולתקשר עם אחרים לגביי העולם - העולם הפיזי, העולם הפנימי שלו, וכן הלאה. ממילא, אפשר לחשוב על שפה כמו פלסטלינה שמישהו הטביע בתוכה צורה, צורה שמשקפת את העולם האמיתי. אז נכון - מחשבים יכולים להתממשק רק עם הפלסטלינה הזו, רק עם המבנה היחסי שבין מילה אחת לחברתה - אבל היחס הזה אינו מקרי, אלא הוא עצמו תולדה של איך שהעולם האמיתי בנוי, נראה ועובד. ובזכות זה, בזכות ההלימה של השפה למציאות, המחשב יכול, דרך העבודה על ועם השפה האנושית, ללמוד על המציאות שמעבר לשפה.

דרך אגב, ממש לסיום, רציתי לשתף עוד דוגמה יפה ומגניבה שממחישה את העניין הזה, של האופן שבו העולם משוקף דרך השפה, והיא הקונספט של אונומטופיה. למי שלא מכיר, על פי ויקיפדיה, אונומטופיה "היא מילה או צירוף מילים שצלילם מזכיר את הדבר שהם מסמנים". יש לכך הרבה דוגמאות, כמו נניח המילה "לצפצף" שנשמעת כמו ציפצוף, וכך גם המילים רישרוש וזימזום. זו דוגמה יפהפיה לאופן שבו השפה מעצבת את עצמה באופן שתופס חלק מהמציאות ומקודד אצלה באופן אלגנטי, כזה שגם מחלחל עד למחשב. נכון מגניב? ידעתי שתאהבו.


אז, זהו להיום! אני מקווה שהיה לכם מעניין, כמובן, ושהדברים שהוצגו כאן, עם כל זה שיש הרבה פרטים שאנחנו מדלגים עליהם בנפנוף ידיים קליל, היו לכם ברורים ומעוררי מחשבה. חוץ מזה, בהקשר של השאלה של העונה הזו, האם מחשבים יכולים לחשוב - אני רוצה לקוות שאתם גם קצת יותר מבינים כמה תחכום נכנס לבנייה של המערכות הללו שסביבנו, ולמה מי שעוסק בתחום יכול להאמין שכן, מחשבים יכולים להבין שפה אנושית ובהמשך אולי גם להתל בנו כשהם מדברים אותה. 

מהפרק הבא, אתם תתחילו לראות את הצד השני של המטבע שחשפנו היום. אנחנו נראה עוד צדדים של המאמצים לבניית מכונות חושבות, אבל נתחיל לגלות למה, מאחורי הזוהר וההתלהבות, מסתתרות להם עובדות שמרמזות שאולי המצב הוא הפוך. אולי, עם כל הגאונות של המערכות הקיימות, יש להן גבול שלא יוכלו לעבור אותו. 

ועד אז… להתראות… ביי…

Discussion about this podcast