היא-לי נוי,
Senior Product Manager, AI Lead, SysAid
איך להוציא את ה-Artificial מחווית השיחה במוצרי AI שאנחנו בונים?
2024-08-19
•
6 דקות קריאה
ב-1867 מצאו ציידים את דינה סאניצ׳אר, ילד בן 10 שמינקותו גודל על ידי להקת זאבים. דינה, שנלקח מהמערה שהייתה ביתו הישר לבית יתומים, לא הצליח ללמוד לדבר בכל שנות חייו. הסיפור של דינה, שככל הנראה נשמע מוכר, היה ההשראה לספר הגו׳נגל של קיפלינג.
שיחה, היא צורת התקשורת הראשונה והבסיסית ביותר שאנחנו חווים כבני אדם, ונרכשת בשנותיו הראשונות של התינוק, בהתקיימות כמה תנאי סף; למשל - שמבנה המוח יתפתח באופן תקין, ושהפעוט ייחשף לתקשורת עם בני אנוש ולא עם להקת זאבים.
היכולת לתקשר באופן ורבלי עם אנשים סביבנו היא ככל הנראה אחת מהיכולות הטבעיות הכי לא מוערכות. אבל כשהיכולת הזו לא ממומשת, כשאנחנו לא מצליחים לתקשר באופן איכותי עם האנשים שסביבנו, אנחנו מרגישים בזה מיד. היכולת לנהל שיחה טובה, אמנם היא יכולת אנושית-טבעית, אך בהחלט לא פשוטה ויש שיאמרו שמדובר באומנות לכשעצמה.
אנחנו מצויים עמוק בתוך מהפיכת AI ששמה את היכולת האנושית הזו בלב ליבה של הטכנולוגיה המלאכותית ביותר שהכרנו עד היום. אז איך אנחנו מלמדים אמנות אנושית שכזו, את אותם יצורי שיח שרואים טוקנים במקום מילים, ומספרים היכן שאנשים רואים משמעות?
ממשתמש - למשוחח
לשם כך, אשמח לעשות הפוגה קלה בשימוש המנוכר שלנו -אנשי ונשות המוצר- בתואר ״המשתמש״ החד צדדי, ולשדרג את המשתמש העמל בתואר ״המשוחח״ - שותף פעיל במוצר שכל תכליתו דיאלוג.
בשנים האחרונות העבודה שלי כמנהלת מוצר התמקדה בפיתוח מוצרי Conversation AI, או צ'אטבוטים, בשמם הידוע לשמצה. פריצתם של מודלי השפה הגדולים (LLM) כמובן היוו קו פרשת מים שהפריד בין חוויית שיחה מסורבלת ומלאכותית, לבין שיחה שוטפת וטבעית יותר.
תכלית השיחה
לכל שיחה קיימת איזושהי מטרה, בין אם תפקידה להשיג מידע ולהניע את הצד השני לפעולה, ובין אם תפקידה לייצר תחושת שייכות וקרבה לאדם אחר; מטרה שיכולה להתמלא גם באמצעות שיחת חולין (Small talk).
השוני גדול גם בקרב מוצרי Conversational AI; החל מעוזרים (Assistants) שמטרתם לספק את המידע הרלוונטי ואף להתניע פעולה רצויה, ועד מוצרים שתפקידם למלא את הצורך בקרבה ואמפתיה כמו AI Friend ודומיו.
תהיה אשר תהיה תכלית המוצר, קיימים מספר חוקים המאפיינים שיחה טבעית. היום נדבר על חלקם, וכיצד לתרגם אותם אל תוך המוצר שלנו.
אפקט ההתאמה
כולנו מכירים אותו. כשאנחנו משוחחים עם אנשים שונים - בגילאים שונים או יכולות קוגניטיביות שונות - אנחנו בדרך כלל ננסה להתאים את רמת השיח שלנו על מנת שיתבצע דיאלוג מוצלח. כלומר, שהצד השני יבין ויוכל לעזור לקדם את השיחה ליעד שלה.
בלי לשים לב, אנשים ששוחחו עם מודלי השפה השונים שיצאו אל השוק על פני השנים האחרונות - גם הם ביצעו התאמות ביחס ליכולות השיח שהציג המודל.
בתחילת המסע, כששוחחנו עם עצי-החלטות בכסות של ממשק שיחה, ניסינו לנחש מאחורי איזה ענף מסתתר המידע אליו אנחנו חותרים. התאמנו את עצמנו ליכולות של הטכנולוגיה דאז לנהל את ה״שיח״ בשלבים, מתוך תקווה שלא פספסנו את ההזמנות היחידה שלנו להמשיך בענף ה״נכון״ ולהגיע למבוקשנו.
המשוחח המתוסכל היה בוודאי שמח לראות את עץ ההחלטות שעומד מאחורי המכונה, ופשוט לנתב את דרכו בשיחה. אלמנט הפשטות פשוט לא היה שם. על המשוחח היה להתאים את עצמו לתפקיד הפסיכולוג ולפרש את כוונותיו של הצ'אטבוט.
עם הגעתם של מודלי השפה הגדולים הראשונים (כמו Bert, GPT-2), המשוחח האנושי זיהה קפיצה משמעותית ביכולתם הקוגניטיבית, ובהתאם עשה התאמה נוספת; עכשיו עליו לשוחח עם המודל כאילו הוא מדבר עם ילד בן 6. עם GPT-3 או מקבילו Claude2 דיבר כאילו הוא מדבר עם נער מתבגר, ואילו היום, אנשים המשוחחים עם מודלים כגון gpt-4o מתאימים עצמם לשיח עם מבוגר המתמחה במגוון תחומים רבים.
במחקר שניסה לבחון כיצד בני האדם התאימו את עצמם לאבולוציה המהירה של בני השיחה המלאכותיים, ניתן לראות כי עם כל שדרוג של מודל שיחה, בני האדם מייחסים לו הן יכולת קוגניטיבית גבוהה יותר והן יכולת תודעתית (Self Consciousness) עמוקה יותר. המחקר ניסה לבדוק האם המודלים החדשים סוף כל סוף יחצו את מבחן טורינג. מבחן טורינג, שנטבע אי שם בשנות החמישים, אינו סטטי אלא כזה המשתנה על פני הזמן, בעקבות תפישתם המתפתחת של בני האדם את המכונות. לכן, בשנות ה-60, 'אליזה' - מוצר Conversational AI שניסה להתחזות לפסיכותרפיסטית, אכן הצליח להטעות באנושיותו את הציבור. אולם היום יהיה לאליזה קשה מאד להונות את המשוחח שיזהה בקלות את מכלול היוריסטיקות שמכוונות אותה.
במחקר השתתפו כ-500 איש ששוחחו למשך 5 דקות עם ארבע ישויות שונות; אליזה הפסיכוטרפיסטית (AI), מודל GPT 3.5, מודל GPT 4, ואדם.
מתוצאות המחקר ניתן לראות כי עם כל שדרוג של הטכנולוגיה גבר מספר האנשים שהאמין כי הוא מדבר עם אדם בשר ודם. בשיחה עם GPT-4 כ-54% מהמשתתפים חשבו שמדובר באדם. באופן משעשע, בשיחה מול האדם האמיתי רק 67% מהמשתתפים האמינו שאכן אדם אמיתי נמצא בצד השני.
הטכנולוגיות ימשיכו להשתפר ולהציג יכולת מהירות, הסקה, זיכרון ועוד, אך האם זה מספיק?
אלו מביננו שמתעסקים בבניין ממשקי שיחה למיניהם - האם קיימים אלמנטים נוספים שנמצאים בידיים שלנו כדי להפוך את החוויה לטבעית יותר?
בכל שיחה קיימת הנחה נסתרת של שיתוף פעולה; ששני הצדדים מסכימים לנסות לעבוד יחד על מנת להבין ולהיות מובן על ידי האחר. כדי להגשים זאת, פול גרייס - פילוסוף אמריקאי משנות ה-70, טבע מספר עקרונות שיחה. בחלק הבא נתאר את העקרונות וכיצד להתאימם כשאנחנו מאפיינים מוצרי Conversational AI.
לפני שנצלול, כמה הערות צד -
- מרבית מההמלצות הבאות יכולות להיות מושגות בהנדסת פרומפט טובה (Prompt Engineering). ולכן, במידה והמוצר שלכם מכיל פרומפטים מערכתיים הנסתרים מעיניו של המשוחח, סביר שאלו יהיו המקומות המתאימים ביותר להטמיע את ההנחיות למודל.
- במאמר זה אני מתמקדת בשיחה של שתי ישויות. המצב נהיה קצת יותר מורכב כשאנחנו מאפיינים שיחה רבת משתתפים; כלומר מספר אנשים וצא׳טבוטים.
מתכון לשיחה טבעית
מרכיב 1 - ההתאמה
אמנם הזכרנו כבר את אלמנט ההתאמה אך מדובר באחד המרכיבים החשובים.
דמיינו את השיחה הבאה -
״היי, אח, מה קורה איתך?״
״שלום אדוני, בימים אלו אני מקדיש את זמני בחיפוש המשרה הבאה״
קיים חוסר התאמה בין סגנונות הדיבור, דבר שהופך את השיחה לפחות טבעית וזורמת. ככל שהמוצר תומך בממשק קול ולא רק בטקסט - ההתאמה הטבעית הופכת להיות עוד יותר מורכבת ותדרוש התייחסות גם לקצב הדיבור, שימוש במנעד (pitch), מבטא וכו. נסו להתאים אלמנטים אלו כמו גם את אוצר המילים והתחביר לפרסונה המרכזית שלכם.
Don’t over do it
אולי חוויתם את התחושה הלא נוחה הזו כשאדם משתמש בג׳רגון לא-לו. אולי מדובר בהורה שניסה את מזלו באימוץ מילות סלאנג והשיחה הופכת ברגע למאולצת ולא טבעית. בעוד שייתכן מאד שהמודל יידע להתנסח בז׳רגון של המשתמש, תנסו לדמיין מצבי קצה שעשויים להגחיך את המוצר בעיני המשוחח. וחישבו האם סוג המוצר (legal or insurance assistance) יכולים לסבול מצבי קצה שכאלו. במידה ולא - זה המקום לייצר הגנות (Guardrails) מתאימות.
מרכיב 2 - מדברים בתורות
כדי לייצר חוויית שיחה טובה לצדדים, אנחנו מצפים למעין משחק טניס טוב שבו שני השחקנים שומרים על הכדור במגרש, מבחינים בתנועות של האחר ובכיוון התעופה של הכדור, ומשנים את מיקומם ותגובתם בהתאם.
דמיינו מצב שבו שחקן א׳ מגיש את הכדור ושניה לאחר מכן גם שחקן ב׳ מחליט להגיש את הכדור שהיה לו ביד. שני השחקנים זרקו שתי אמירות לאוויר שלא בהכרח יתקשרו ויאפשרו לשיח לזרום.
שני השחקנים צריכים להיות שותפים שווים בשיחה, ולהימנע ממצב שאחד מהם ישתלט עליה.
- איזון - וודאו שהתשובות של הצא׳טבוט לא ארוכות מידיי או מכילות אינפורמציה רבה מידיי. במקום, נסו לייצר תשובות מדוייקות וקצרות שמסתיימות בהנעת המשוחח לתגובה, למשל באמצעות follow-up question.
- Context awareness - היא המפתח להימנע ממוצר שמרגיש רובוטי ומנותק. לדוגמה, אם משתמש שואל שאלה על מוצר ומאוחר יותר מתייחס אליו שוב, הצאטבוט צריך להיות מסוגל לזכור פרטים מהשיחה הקודמת.
שימו לב איזה סוג של פרטים אתם מזריקים לחלון הקונטקסט - זהו מהם המרכיבים שראויים להיות ב׳זיכרון ארוך-טווח׳ (מידע אישי על המשוחח על הנושאים שעניינו אותו?), ומהם המרכיבים שראויים להיות ב׳זיכרון קצר-הטווח׳ - כלומר אך ורק לאורך השיחה הנוכחית.
תופעת ״מסיימי המשפט״.
האם הטכנולוגיה מותאמת לכולם? איך מתמודדים עם ״מסיימי המשפטים״. בעוד שההתנהגות -שרבים מאיתנו חוטאים בה- לנחש את דבריו של שותף השיחה שלנו, יכולה להתפרש כלא מכבדת וחסרת סבלנות, כשאנחנו ניצבים בפני טכנולוגיה, היכולת לעצור את השצף בצד השני הופכת להכרחית לניהול שיחה אפקטיבית ופחות מתישה למשוחח.
בעוד ממשקי טקסט מאפשרים -לכל היותר- לעצור שצף טקסט שמתקדם לכיוון לא נכון, ולכוון את המודל מחדש, דווקא ממשקי השיחה הקוליים מאפשרים את ההתנהגות המגונה באופן מרשים ביותר.
מרכיב 3 - רלוונטיות התוכן
״אנחנו שומעים ומבינים רק מה שאנחנו יודעים למחצה״ (ת׳ורו).
Given-New vs. Given-Given
אחד מעקרונות תורת השיח מבדיל בין תוכן שמכיל אך ורק מידע שכבר נאמר במהלך השיחה, ומכונה 'Given-Given', לבין תוכן שמבתבסס על הנאמר אך מוסיף מידע חדש המכונה 'Given-New'.
הימנעו מחזרתיות - צ'אטבוטים צריכים לבנות באופן עקבי על מה שהמשתמש כבר הזכיר או שאל. על ידי שמירה על מבנה של Given-New, הבוט יוצר שיחה שוטפת והגיונית, ומונע קפיצות פתאומיות בהיגיון או בהקשר. צאטבוט שיפול לתבנית given-given -עשוי להתיש את המשוחח ולהגיע למבוי סתום די מהר.
לדוגמה, אם המשתמש כבר קיבל את אפשרויות השילוח ושואל על זמני האספקה, אך הבוט ממשיך לחזור על שיטות השילוח במקום לענות לשאלה החדשה, זהו מצב של Given-Given.
- ציידו את הצ'אטבוט ביכולת לזהות שאילתות דומות, והובלת השיחה להצגת תוכן חדש. לדוגמה, אם משתמש שואל את אותה שאלה מספר פעמים, הבוט יכול לומר, "נראה שאתה שואל על X. תרצה לשמוע פרטים נוספים על הנושא?"
- אמנו את הצ'אטבוט לזהות מתי השיחה נתקעת (מצב של Given-Given) ולעודד את המשוחח להתקדם עם נושאים או מידע חדשים. לדוגמה, "כבר תיארתי את פרטי זמן הסוללה. תרצה לשמוע על איכות המסך?"
התמודדות עם הבהרות - במקרים מסוימים, משתמש עשוי לבקש הבהרה או לחזור על שאלה. הצ'אטבוט לא צריך להגיב עם אותו המידע בדיוק אלא להכיר בצורך של המשתמש להבהרה לפני שהוא חוזר או מנסח מחדש את המידע. זהו מאזן בין הדינמיקה של Given-New ו-Given-Given.
דוגמה: אם המשתמש אומר, "אני לא מבין בדיוק את זמן הסוללה," הבוט יכול להגיב, "למחשב הנייד יש זמן סוללה של 10 שעות בשימוש רגיל, מה שאומר..."
גם לצאטבוט שמורה הזכות להבהיר את הנאמר מול המשוחח. וודאו שאתם משתמשים בה בסיטואציות נדירות המצדיקות את החזרתיות.
לדוגמה: כאשר הצאטבוט מזהה שהמשוחח מעוניין שיבצע עבורו פעולה אגרסיבית כמחיקת רשומה למשל, סביר ורצוי שהתגובה תאופיין במבנה Given-Given.
מרכיב 4 - החיבור הרגשי
“People will forget what you said, but will never forget how you made them feel" (Maya Angelo)
זיהוי מצבו הרגשי של המשוחח והבעת אמפתיה הם מרכיב חשוב בהפיכת השיחה לטבעית יותר, ומרכיב קריטי ככל שהמוצר מתמקד ביצירת תחושת שייכות וקרבה (מטפלים וירטואליים למשל).
היום, למשוחח יש סט ציפיות מחויית השיחה, ציפייה שמבוססת על שיחות עבר עם מוצרי Conversational AI קיימים בשוק. כמי שמאפיינים את חווית השיח הבאה של המשתמשים שלנו, יש לנו הזדמנות להפתיע אותם.
זהו את הסנטימנט של המשוחח, הזריקו את המידע המתרים אל תוך הקונטקסט של השיחה, וודאו שהצאטבוט מתייחס לכך בתשובותיו. עצם ההכרה במצבו של המשוחח מעצימה את החיבור והאמון של המשוחח.
תגרמו להם לחייך. הוספת הומור קליל לשיחה, ברגעים בלתי צפויים אך מתאימים,תשבור את המונוטוניות של האינטראקציה, תחזק עוד את הקשר האישי ותגדיל את עלות ההחלפה (switching cost) למוצר אלטרנטיבי.
תפתיעו אותם!
תובנות מועילות שהמשוחח לא מצפה להן - הן ה delighters של הצ'אטבוט.
דמיינו אפליקציית פרודוקטיביות שבה הצלחתם לזהות שהמשוחח נוטה לעבוד בשעות מאוחרות. אמירה כמו: "שמתי לב שאתה נוטה לעבוד לאחר השעה 9 בערב. האם תרצה שאעזור לך לתזמן הפסקות או להזכיר לך להירגע לקראת סוף היום?". תגובה כזו יכולה להגביר את התחושה שהצ'אטבוט ״מכיר״ אותנו. מצב כזה יחזק את אלמנט ה"lock-in" במוצר שלנו - כלומר, יגרום למשוחח לוותר על שימוש במוצר אלטרנטיבי בעקבות תחושה שיאלץ לוותר על הפרסונליזציה העשירה שעמל עליה.
לסיום, חשוב לזכור שהשיחה היא לא רק פעולה מכאנית של החלפת מידע – היא מערכת יחסים דינאמית. בדיוק כמו שבמערכות יחסים אמיתיות אנחנו מצפים להבנה, אמפתיה וחיבור רגשי, כך גם בשיחה בין אדם למכונה. האתגר שלנו הוא לקחת את הטכנולוגיה המתקדמת ביותר ולהפיח בה חיים, להפוך אותה ממשהו קר ומנותק לכלי שמרגיש לנו טבעי ואנושי. כאשר נצליח לגרום לצ'אטבוטים שלנו לא רק להבין את המשתמשים, אלא גם להפתיע אותם, לחזק את הקשר עמם, ולגרום להם לחייך – אז נוכל באמת להגיד שהוצאנו את ה-"Artificial" מחוויית השיחה, והחזרנו אותה למקום שאליו היא שייכת – למקום של חיבור אנושי.
שתפו את הבלוג:
Startup for Startup אישי
קבלו עדכונים על הנושאים שהכי מעניינים אתכם
שלי Startup for Startup
קבלו עדכון ישר למייל ברגע שיוצא תוכן חדש בנושא.
הירשמו לאיזור האישי
צרו פרופיל אישי באתר ותוכלו להתחבר לאחרים ואחרות, לקבל תכנים מותאמים אישית, ולשמור את התכנים שהכי מעניינים אתכם.
עוד תוכן בנושא:
בלוג
5 דק'
04/2025
AI evals: תפקידו החדש של מנהל המוצר?
פודקאסט
5 דק'
04/2025
בקצרה: איך בונים מוצר GenAI שמשרת לקוחות קצה יום-יום בארגוני B2C
דרך הסיפור של ״אלה״, הבנקאית הדיגיטלית של ONE ZERO, נבחן כיצד ניתן ליצור ערך אמיתי ללקוחות באמצעות אימון פנימי וחיצוני, גישה מודולרית לשיפור מתמיד, ומעקב חכם אחר ביצועי המערכת.
בלוג
3 דק'
04/2025
זכויות יוצרים על תוצרים של בינה מלאכותית: האם אתם בעלי זכות יוצרים ביצירה
פודקאסט
20 דק'
04/2025
מה מנהלי מוצר יכולים ללמוד מהמוצר הכי ויראלי בשוק? מחשבות על Base44
בפרק הזה אנחנו צוללים להצלחה של Base 44, מנתחים איך כלים מבוססי AI משנים את הדרך שבה בונים מוצרים, ואיזה תובנות מנהלי ומנהלות מוצר יכולים לקחת לעבודה היומיומית שלהם. נדבר על הדרך לקיצור הזמן עד לרגע קבלת הערך עבור המשתמשים, על תמחור חכם, ויראליות מובנית, וגם על האתגרים שבאים עם הצמיחה המהירה. האזינו לפרק באתר
בלוג
4 דק'
03/2025
סוכני AI: איך הסטרטאפ שלכם יכול לנצל את הטכנולוגיה לקידום המכירות?
פודקאסט
33 דק'
03/2025
פרודקטיבי: איך עוזרים למשתמשים שלנו להתחיל, או: מה עושים עם בעיית הדף הלבן? (רזיאל איינהורן, Pecan AI)
איך יודעים שהפתרון שלנו עובד? למה לפעמים חוויה קלה מדי דווקא עלולה לפגוע בהבנה של המשתמשים? מה אפשר ללמוד מחוויות Co-pilot ואיך ליישם אותן נכון?
וידאו
34 דק'
02/2025
Trends in Fundraising: What Investors Look For in the Age of AI (Gigi Levi-Weiss)
וידאו
18 דק'
02/2025
Building companies with AI agents (Mickey Haslavsky)
וידאו
37 דק'
02/2025
Fireside Chat - Everything AI (Adi Soffer Teeni & Gigi Levy-Weiss)
וידאו
02/2025
איך משקיעים אמריקאים רואים השקעות בטכנולוגיות AI?
פודקאסט
29 דק'
02/2025
פרודקטיבי: איך עושים Discovery נכון בעולמות ה-Gen AI? (אבירם מרום, Riverside)
אנחנו מדבירם על איך בונים פיצ׳רים שימושיים ולא רק גימיקים, מתי כדאי לשחרר מוצר לא מושלם כדי ללמוד מהיוזרים, ואיך מוצאים את הבעיות הכואבות באמת בתוך שפע האפשרויות החדשות.
וידאו
40 דק'
01/2025
איך לבנות מהר עם AI כדי ליצור בידול ולנצח חברות גדולות יותר
הניוזלטר שלנו
הירשמו וקבלו עדכונים על פרקים חדשים, כתבות, אירועים ועוד הפתעות!
רוצים לקחת חלק בשיתוף ידע?
אם גם אתם רוצים להצטרף למשימה שלנו להעשיר את האקוסיסטם בידע ותובנות, אם אתם רוצים לשאול אותנו משהו, אם אתם מרגישים שיש משהו שעזר לכם וכולם צריכים לדעת, נשמח לשמוע.
Startup for Startup