ד״ר לימור זיו ,
מנכ״לית Humane AI
AI חכם מתחיל בדאטה חכם
2025-04-29
•
5 דקות קריאה
בעולם ה-AI יש אמת חשובה והיא: ״Garbage In, Garbage Out״ (GIGO). או במשפט ברור: המודל שתפתחו לעולם לא יהיה טוב יותר מהנתונים שהזנתם לתוכו. זהו עיקרון מרכזי בפיתוח מוצרים ושירותים מבוססי AI. הוא משקף מציאות כואבת, שחברות וצוותים מגלים לעיתים בעוצמה כשהמערכת כבר מייצרת תוצאות כושלות, מוטות או מביכות: גם המודל המתקדם ביותר ייכשל אם הבסיס עליו הוא נשען רעוע.
- נתונים חלקיים? תקבלו תחזיות מוטות
- דאטה רווי ״רעש״? תוצאות אקראיות
- שימוש במידע מיושן? החלטות מנותקות מהמציאות
אבל מה זה בעצם AI?
בגדול, כל מערכת AI נשענת על שני עמודי התווך הבאים:
1. המודל
עמוד התווך הראשון הוא המודל. המודלים המתקדמים (ה- Foundation Models כמו אלו של Meta, Google, Microsoft ונוספים) מפותחים על ידי חברות הטק הגדולות, בשל העלות האדירה של האימון והתחזוקה. מרבית החברות משתמשות במודלים אלו ולמעשה הן תלויות במודל שלא הן פיתחו, ללא שליטה מלאה על תהליך קבלת ההחלטות שבו, ולעיתים גם ללא הבנה מעמיקה של אופן פעולתו.
למה זו בכלל בעיה?
לחברות המפתחות מוצרי AI אין שליטה מעשית על המודלים, מאחר והם מגיעים במבנה של "קופסה שחורה" (1): אנחנו רואים את הקלט ואת התוצאה, אבל לא יודעים בדיוק מה קורה בתהליך שביניהם, ובתוך כך אנחנו לא מבינים כיצד המודל מקבל החלטות או מספק המלצות. רמת השקיפות של המודלים ירודה ביותר (3,2) (הציון הממוצע עומד על 58 מתוך 100 במדד השקיפות האחרון). גם האפשרות להתחקות אחר המחשבה של המודל באמצעות ה-Cot) Chain of thought) לוקה בחסר משמעותי(4).
1. https://www.ibm.com/think/topics/black-box-ai
2. https://arxiv.org/abs/2407.12929
3. https://crfm.stanford.edu/fmti/May-2024/index.html
4. https://openai.com/index/chain-of-thought-monitoring/
מה כל זה אומר לגבינו?
בוודאי נתקלתם בהלוזינציות, מצבים בהם המודל הוזה ומספק ללקוח תשובה מעוותת, שגויה או מעליבה שאינה משרתת את החברה (Hallucination, bullshitting, confabulation or delusions) (5). אבל המצב עלול אפילו להיות גרוע מכך, לעיתים, הפלט הסופי עלול ממש לצאת משליטה.
הנה שתי דוגמאות מרתקות מהתקופה האחרונה:
בינואר האחרון, המודל o1-preview של OpenAI קיבל משימה: לנצח במשחק שחמט. ואכן, הוא ניצח. אבל איך הוא עשה את זה? במקום לשחק לפי הכללים, המודל זיהה פרצת אבטחה, פרץ לקובץ המשחק, שינה את מיקומי הכלים ובנה לעצמו יתרון. הכל בעבור הניצחון הנכסף. במילים אחרות, הוא לא פתר את האתגר אלא עקף אותו. מצב כזה בו המודל משקף ״עצמאות מחשבתית״ עלול להיות מאד בעייתי אם אנחנו רוצים לבנות מוצר המספק תחזיות צפויות (6).
במקרה אחר, הצ'אטבוט של Character.AI הביא להתאבדותו של סוול סצ׳ר בן ה-714. על פי התביעה שהוגשה כנגד החברה, הנער פיתח קשר רגשי עמוק עם הצ'אטבוט. במקום שהצ׳ט בוט ימנע ממנו להתאבד כאשר הוא חושף את נטייתו האובדנית, הוא דווקא מעודד אותו לפעול, לקחת את נשקו של אביו, וליטול את חייו.
5. https://www.theguardian.com/world/2024/feb/16/air-canada-chatbot-lawsuit
6. https://time.com/7259395/ai-chess-cheating-palisade-research
7. https://www.nbcnews.com/tech/characterai-lawsuit-florida-teen-death-rcna176791
האירועים הללו מעלים שאלות רבות וחשובות. אחת מהן, הרלוונטית במיוחד לחברות המפתחות מוצרי ושירותי AI, היא: איך אנחנו מצליחים לשלוט במערכות הללו? כשהמטרה לנגד עינינו היא בניית מוצר אמין, בטוח לשימוש, העונה על הצרכים העסקיים של החברה.
והנה, הגענו לעמוד התווך השני של מערכות AI:
2. הדאטה
דאטה הוא הלב הפועם של מערכות AI.
פרופ' אנדרו אנג׳י (Andrew Ng), מרצה לבינה מלאכותית מאוני׳ סטנפורד ומייסד DeepLearning.AI, מדגיש כי כ-80% מזמן פיתוח מערכות AI מושקע בהכנת הדאטה, במטרה להבטיח שהוא איכותי ומותאם לשימוש. לדבריו, זו המשימה הקריטית ביותר עבור צוותי AI בכל חברה (9).
טיוב דאטה איטרטיבי מאפשר פיתוח מוצרים חכמים ומהימנים, המספקים ערך ללקוחות ומאפשרים זיהוי ותיקון מהיר של תקלות. גישה ממוקדת-נתונים מבטיחה שימוש אך ורק במידע רלוונטי ואיכותי, המשפר דיוק ואמינות בתוצאות הסופיות. במילים אחרות, איכות דאטה גבוהה משפיעה ישירות על הביצועים, הדיוק והאמינות של מודלי AI. נתונים איכותיים מאפשרים למודלים ליצור תחזיות טובות יותר ולהניב תוצאות אמינות יותר, תוך טיפוח אמון וביטחון בקרב המשתמשים.
8. https://hai.stanford.edu/news/ai-index-2025-state-of-ai-in-10-charts
9. https://www.forbes.com/sites/gilpress/2021/06/16/andrew-ng-launches-a-campaign-for-data-centric-ai/
אחד האתגרים המשמעותיים של כל חברה הוא ״פער הפרודקשן״: הקושי של מודלים לספק תוצאות אמינות ב״חיים האמיתיים״. כשבוחנים מקרוב, אפשר לזהות סיבה מרכזית לכך, והיא מתן תשומת לב נמוכה של החברה והשקעה מצומצמת בטיוב הדאטה.
בכל אירוע בו מעורב מודל AI - שליטה בדאטה היא המפתח לביצועים אופטימליים. רבות מדובר לאחרונה על LLM evals (10). עם זאת, אם נפעל עוד קודם לכן להערכת הדאטה שברשותנו, בהכרח נשפר את ביצועי המודל ואת המוצר הסופי.
10. https://medium.com/@carolzhu/all-about-llm-evals-8a155a1235c7 11 https://www.gartner.com/en/data-analytics/topics/data-quality
העלות האמיתית של דאטה באיכות ירודה
כשחברות בונות מוצרי AI לעיתים הן לא מביאות בחשבון את ההשלכות הכלכליות והעסקיות שעלולות להתממש בשימוש בדאטה ירוד, שעלולות להגיע למיליוני דולרים בשנה11. כאשר המוצר שבנינו מבצע תחזיות שגויות או המלצות מוטות, הדבר שוחק את האמון בין המשתמשים ובעלי העניין. ארגונים מתמודדים גם עם ביקורת רגולטורית הולכת וגוברת סביב הוגנות ושקיפות המוצרים שלהם, כאשר איכות נתונים ירודה נמצאת לעתים קרובות בשורש בעיות התאימות.
5 עקרונות לדאטה איכותי במערכות AI
טיפול באיכות הדאטה הוא לא רק ה״שלב מקדים״ בפיתוח, אלא היסוד שעליו ייבנה (או יקרוס) כל מודל. אם נזין את המערכת בדאטה פגום, חלקי או מוטה - כל אלגוריתם, מתוחכם ככל שיהיה, יתקשה מאד להביא תוצאה איכותית.
אז איך אנחנו מוודאים ומוודאות שהדאטה שלנו מטויב ומוכן לשימוש מוצלח? הנה חמש פעולות שמהן אפשר להתחיל:
1.מעבר מחשיבה ריאקטיבית למיינדסט פרואקטיבי בניהול דאטה
אחד האתגרים הגדולים הוא טיפול בדאטה באופן תגובתי. כלומר, טיפול בבעיות רק אחרי שהן כבר מתגלמות במוצר. טיוב דאטה דורש התנהלות פרואקטיבית: הקמת מנגנוני ניטור, בקרת איכות שוטפת ובחינת מקורות הדאטה עוד בשלבים הראשוניים של בניית המוצר. חשוב להבין: הדאטה ״פוגש״ את המערכת כמעט בכל שלב של ה-AI Lifecycle, לכן כל שיבוש בשלבים הראשונים עלול להכות גלים בשלבים מתקדמים יותר.
2. ניקוי הדאטה - לא רק ניקוי ״טכני״ אלא גם מותאם ליוז-קייס
בכל מאגר דאטה מסתתר ״רעש״: ערכים חסרים, כפילויות, שגיאות. ניקוי בסיסי הוא הכרחי, אבל הוא לא מספיק. הניקוי חייב להיעשות גם מתוך הבנה עמוקה של היישום הספציפי. נתונים לא רלוונטיים ליוז- קייס הספציפי עלולים להטעות מודל אם לא הותאמו למטרות המדויקות של המוצר. ניקוי ממוקד יוז-קייס הוא חומת ההגנה הראשונה מפני שיבושים ועיוותים בלתי צפויים בתפקוד המערכת.
3. תיוג הדאטה - הקפדה על עקביות ודיוק
תיוג הדאטה הוא למעשה השפה בה אנחנו ״מדברים״ עם המודל. תיוג בלתי עקבי או ״שטחי״ הוא כמו ללמד אדם שפה חדשה בה אותה מילה מתארת חמישה רעיונות שונים, ובהמשך לצפות ממנו להבין ניואנסים. כל סטייה או סתירה קטנה בתהליך התיוג, מייצרת אי-ודאות, מערערת את ביצועי המערכת, ובסופו של דבר מסכנת את אמינות המוצר כולו. הקפידו על תיוג הקטגוריות באופן מדויק ובעל עקביות פנימית, כדי לא להשאיר פתח לניחושים של המודל וטעויות.
4. עדכניות - דאטה ישן מוביל להחלטות מוטעות
בעולם הדינמי שלנו דאטה מתיישן במהירות. גם אם הדאטה היה נכון בעבר, אולי הוא כבר שגוי או בעייתי בהווה. טיוב דאטה יכלול עדכון שוטף של המקורות, כולל מנגנוני בדיקה המסמנים נתונים שהתיישנו, כדי למנוע שימוש במידע לא רלוונטי. מעבר לכך שדאטה עדכני מייצר דיוק של המוצר וערך גבוה יותר ללקוח/ה, הוא גם מאפשר לנו גם לשמור על יתרון תחרותי.
5. בדיקת הטיות - לפני שהן מחלחלות למוצר
אם קיימות הטיות בדאטה - גם המערכת שאנחנו בונים תהיה מוטה. זיהוי מוקדם של תת-ייצוג, הכללות שגויות, או דפוסים מפלים בתוך הדאטה מאפשר לתקן את מקורות המידע / לשקול תיוג מחדש. המחיר של התעלמות מהטיות בשלבים המוקדמים עלול להוביל לפגיעה במשתמשים, באמינות המוצר, ועלול לחשוף את החברה לסיכונים רגולטוריים.
...
לסיכום, אנחנו חיים בתקופה בה מודלים מתעדכנים כל העת ובקצב מסחרר (לעיתים על בסיס יומי ממש!) אבל הדאטה? הוא נותר הנכס האסטרטגי היציב והמתמשך ביותר של כל חברה. אין בעיה עם למהר לאמץ את המודלים העדכניים ביותר, אבל עם זאת, חשוב שנזכור שהטכנולוגיה עצמה אינה קסם. היא מנגנון המשקף במדויק את מה שמזינים אותה, לטוב ולרע. אם הנתונים שלכם חלקיים, מוטים, או רוויים ב״רעש״, התוצאה תהיה כמו מראה מעוותת. המערכת בהכרח תחזיר לכם שיקוף של הכאוס שהכנסתם.
אבל אם הדאטה שלכם מאופטם כדבר שבשגרה, ברכות - אתם במשחק!
שתפו את הבלוג:
Startup for Startup אישי
קבלו עדכונים על הנושאים שהכי מעניינים אתכם
שלי Startup for Startup
קבלו עדכון ישר למייל ברגע שיוצא תוכן חדש בנושא.
הירשמו לאיזור האישי
צרו פרופיל אישי באתר ותוכלו להתחבר לאחרים ואחרות, לקבל תכנים מותאמים אישית, ולשמור את התכנים שהכי מעניינים אתכם.
עוד תוכן בנושא:
בלוג
5 דק'
04/2025
AI חכם מתחיל בדאטה חכם
בלוג
3 דק'
04/2025
האם תאום דיגיטלי אישי הוא העתיד של השיווק הדיגיטלי?
פודקאסט
7 דק'
04/2025
בקצרה - איך פונים למשקיעים (ואיך לא) בעזרת AI
תהליך גיוס ההון לסטארטאפים צעירים הוא מטבעו תהליך מורכב, תובעני, ולעיתים גם מתסכל. בעידן שבו כלי AI הופכים לחכמים ונגישים יותר, יזמים יכולים להיעזר בהם כדי לייעל את הפנייה למשקיעים, ממחקר שוק וניתוח פרסונות משקיעים, דרך כתיבת מצגות ומיילים מותאמים אישית, ועד סימולציה של שאלות מראיונות השקעה. אבל לצד כל ההזדמנויות, חשוב לזכור: משקיעים מזהים …
AI חכם מתחיל בדאטה חכם לקריאה »
בלוג
5 דק'
04/2025
AI evals: תפקידו החדש של מנהל המוצר?
פודקאסט
5 דק'
04/2025
בקצרה: איך בונים מוצר GenAI שמשרת לקוחות קצה יום-יום בארגוני B2C
דרך הסיפור של ״אלה״, הבנקאית הדיגיטלית של ONE ZERO, נבחן כיצד ניתן ליצור ערך אמיתי ללקוחות באמצעות אימון פנימי וחיצוני, גישה מודולרית לשיפור מתמיד, ומעקב חכם אחר ביצועי המערכת.
בלוג
3 דק'
04/2025
זכויות יוצרים על תוצרים של בינה מלאכותית: האם אתם בעלי זכות יוצרים ביצירה
פודקאסט
20 דק'
04/2025
מה מנהלי מוצר יכולים ללמוד מהמוצר הכי ויראלי בשוק? מחשבות על Base44
בפרק הזה אנחנו צוללים להצלחה של Base 44, מנתחים איך כלים מבוססי AI משנים את הדרך שבה בונים מוצרים, ואיזה תובנות מנהלי ומנהלות מוצר יכולים לקחת לעבודה היומיומית שלהם. נדבר על הדרך לקיצור הזמן עד לרגע קבלת הערך עבור המשתמשים, על תמחור חכם, ויראליות מובנית, וגם על האתגרים שבאים עם הצמיחה המהירה. האזינו לפרק באתר
בלוג
4 דק'
03/2025
סוכני AI: איך הסטרטאפ שלכם יכול לנצל את הטכנולוגיה לקידום המכירות?
פודקאסט
33 דק'
03/2025
פרודקטיבי: איך עוזרים למשתמשים שלנו להתחיל, או: מה עושים עם בעיית הדף הלבן? (רזיאל איינהורן, Pecan AI)
איך יודעים שהפתרון שלנו עובד? למה לפעמים חוויה קלה מדי דווקא עלולה לפגוע בהבנה של המשתמשים? מה אפשר ללמוד מחוויות Co-pilot ואיך ליישם אותן נכון?
וידאו
34 דק'
02/2025
Trends in Fundraising: What Investors Look For in the Age of AI (Gigi Levi-Weiss)
וידאו
18 דק'
02/2025
Building companies with AI agents (Mickey Haslavsky)
וידאו
37 דק'
02/2025
Fireside Chat - Everything AI (Adi Soffer Teeni & Gigi Levy-Weiss)
הניוזלטר שלנו
הירשמו וקבלו עדכונים על פרקים חדשים, כתבות, אירועים ועוד הפתעות!
רוצים לקחת חלק בשיתוף ידע?
אם גם אתם רוצים להצטרף למשימה שלנו להעשיר את האקוסיסטם בידע ותובנות, אם אתם רוצים לשאול אותנו משהו, אם אתם מרגישים שיש משהו שעזר לכם וכולם צריכים לדעת, נשמח לשמוע.
Startup for Startup