אמיתי בונה,
AI Expert | Product Manager, VOOM Insurance
איך לזהות טקסט שנכתב בעזרת ChaGPT?
2024-04-28
•
5 דקות קריאה
מכירים את זה שאתם קוראים אימייל או פוסט ומרגיש לכם שChatGPT כתב אותו אבל אתם לא יודעים לשים את האצבע בדיוק למה?
אני מסתובב עם התחשובה הזו כבר תקופה, אז החלטתי לבדוק את העניין אחת ולתמיד…
והתוצאות - מפתיעות!
מסתבר שזו תופעה מוכרת ויש ת'רדים שלמים ברדיט עם דוגמאות ל" Overused ChatGPT Phrases" - מילים וביטויים שChatGPT משתמש בהם בתדירות גבוהה לעומת בני אדם. זו גם אחת הסיבות לכך שכשאנחנו קוראים את הטקסטים האלה הוא מרגישים לנו מוזר ולא תמיד יודעים למה…
הנה כמה דוגמאות שחזרו על עצמם:
- I hope this email finds you well
- It's important to note
- Embark on a journey
- First and foremost
- Take a dive into
- Testament to
- Courtesy of
- Delve into
- Navigate
- Tapestry
- Bustling
- Realm
מתחיל לצלצל לכם מוכר?
משתמש אחד בשם Jordan Gibbs לקח את זה אפילו צעד קדימה: הוא החליט לערוך ניסוי שיבדוק מה המילים והביטויים שהכי חוזרים על עצמם ביחד לטקסטים אנושיים.
הוא כתב קוד שיצר לו 2,500 פרומפטים בנושאים שונים ואז שולח אותם לצ'אט וקיבל בחזרה קובץ טקסט עצום של של 1.2 מיליון מילים שנוצרו ע"י ChatGPT. על מנת להשוות את התוצאות לטקסט של בני אדם הוא השתמש בקורפוס עצום של טקסטים מהאינטרנט באורך 97 מיליון מילים. בהמשך כך הוא כתב סקריפט שמחפש ביטויים ומילים שחוזרים על עצמם בתדירות גבוהה בכל אחד מהטקטסים במטרה לענות על השאלה:
איזה מילים וביטויים מופיעים בטקסט המלאכותי בתדירות הכי גבוהה ביחס לטקסטים האנושי?
הנה למשל הביטויים של 3 ו4 מילים שמופיעים בטקסט של ג'יפיטי בסבירות של פי 1,000 או יותר מאשר בטקסטים אנושיים:
here are some innovative
Are some strategies
Remember the key
This could involve
Here are several
This might include
ובקטגורית המילים הבודדות, המילים המובילות שיצאו הן:
- Reimagined
- Verdant
- Bustling
- Cannot
- Delved
- Twinkled
- Transcended
- Repurposed
- Thrived
- Marveled
אז למה זה בעצם קורה?
אני לא באמת יודע, אבל לפי ההגיון שלי זה פשוט מילים שהופיעו בתדירות גבוהה בטקסטים שהמודל אומן עליו. ייתכן למשל שהאימון הבתצע על טקסט יותר ספרותי, אקדמי או בשפה מיושנת יותר מהשפה המדוברת בה אנחנו משתמשים כיום.
אז מה אפשר לעשות לגבי זה?
👈 קודם כל - להיות מודעים לתופעה. לשים לב אם בה לך הכתיבה עם הצ'אט אתם רואים את הביטויים האלה או ביטויים אחרים שנשמעים לכם קצת תלושים או בשפה גבוהה מדי וכאשר זה קורה לבקש מהצ'אט שיחליף אותך או לערוך בעצמכם.
👈 דרך קצת מתחכמת שאני לא בטוח עדיין מה אני חושב עליה היא להוסיף לCustom insturctions הנחיה לא להשתמש במילים הספיציפיות האלה. אני לא מתלהב מהרעיון כי אין מספיק מקום להכניס לשם את כל המילים והביטויים וזה גם קצת בזבוז של הפיצ'ר הזה כי יש דברים הרבה יותר מועילים שאפשר לכתוב שם, אבל זה לפוסט שיגיע בהמשך :)
👈 אפשר לנסות לשנות את סגנון הכתיבה בצורה גורפת, בעזרת משפטים כמו:
“Avoid unnecessary jargon unless it is industry-specific and necessary for clarity”
או ממש ללמד אותו את סגנון הכתיבה שלכם כפי שתיארתי בבלוג הקודם.
👈 יש גם כל מיני כלים ואתרים שמתיימרים לזהות טקסטים שנכתבו ע"י בינה מלאכותית ואפשר להעתיק אליהם את הטקסט כדי לבדוק, אבל לדעתי זה לא פתרון פרקטי וגם קראתי בכמה מקומות שהאחוזי הצלחה שלהם לא משהו.
רשימת מקורות:
המקור לגרפים שבתמונה (הת'רד המקורי ברדיט):
https://www.reddit.com/r/OpenAI/comments/18ho014/chatgpt_is_1000x_more_likely_to_use_the_word/
https://www.reddit.com/r/OpenAI/comments/18ie4pd/comment/kdcix9h/
הבלוג שמסביר איך בוצע הניסוי:
https://medium.com/@jordan_gibbs/which-phrases-are-the-most-chatgpt-of-all-b0911e3faf6b
שתפו את הבלוג:
Startup for Startup אישי
קבלו עדכונים על הנושאים שהכי מעניינים אתכם
שלי Startup for Startup
קבלו עדכון ישר למייל ברגע שיוצא תוכן חדש בנושא.
הירשמו לאיזור האישי
צרו פרופיל אישי באתר ותוכלו להתחבר לאחרים ואחרות, לקבל תכנים מותאמים אישית, ולשמור את התכנים שהכי מעניינים אתכם.
עוד תוכן בנושא:
בלוג
5 דק'
04/2025
AI evals: תפקידו החדש של מנהל המוצר?
פודקאסט
5 דק'
04/2025
בקצרה: איך בונים מוצר GenAI שמשרת לקוחות קצה יום-יום בארגוני B2C
דרך הסיפור של ״אלה״, הבנקאית הדיגיטלית של ONE ZERO, נבחן כיצד ניתן ליצור ערך אמיתי ללקוחות באמצעות אימון פנימי וחיצוני, גישה מודולרית לשיפור מתמיד, ומעקב חכם אחר ביצועי המערכת.
בלוג
3 דק'
04/2025
זכויות יוצרים על תוצרים של בינה מלאכותית: האם אתם בעלי זכות יוצרים ביצירה
פודקאסט
20 דק'
04/2025
מה מנהלי מוצר יכולים ללמוד מהמוצר הכי ויראלי בשוק? מחשבות על Base44
בפרק הזה אנחנו צוללים להצלחה של Base 44, מנתחים איך כלים מבוססי AI משנים את הדרך שבה בונים מוצרים, ואיזה תובנות מנהלי ומנהלות מוצר יכולים לקחת לעבודה היומיומית שלהם. נדבר על הדרך לקיצור הזמן עד לרגע קבלת הערך עבור המשתמשים, על תמחור חכם, ויראליות מובנית, וגם על האתגרים שבאים עם הצמיחה המהירה. האזינו לפרק באתר
בלוג
4 דק'
03/2025
סוכני AI: איך הסטרטאפ שלכם יכול לנצל את הטכנולוגיה לקידום המכירות?
פודקאסט
33 דק'
03/2025
פרודקטיבי: איך עוזרים למשתמשים שלנו להתחיל, או: מה עושים עם בעיית הדף הלבן? (רזיאל איינהורן, Pecan AI)
איך יודעים שהפתרון שלנו עובד? למה לפעמים חוויה קלה מדי דווקא עלולה לפגוע בהבנה של המשתמשים? מה אפשר ללמוד מחוויות Co-pilot ואיך ליישם אותן נכון?
וידאו
34 דק'
02/2025
Trends in Fundraising: What Investors Look For in the Age of AI (Gigi Levi-Weiss)
וידאו
18 דק'
02/2025
Building companies with AI agents (Mickey Haslavsky)
וידאו
37 דק'
02/2025
Fireside Chat - Everything AI (Adi Soffer Teeni & Gigi Levy-Weiss)
וידאו
02/2025
איך משקיעים אמריקאים רואים השקעות בטכנולוגיות AI?
פודקאסט
29 דק'
02/2025
פרודקטיבי: איך עושים Discovery נכון בעולמות ה-Gen AI? (אבירם מרום, Riverside)
אנחנו מדבירם על איך בונים פיצ׳רים שימושיים ולא רק גימיקים, מתי כדאי לשחרר מוצר לא מושלם כדי ללמוד מהיוזרים, ואיך מוצאים את הבעיות הכואבות באמת בתוך שפע האפשרויות החדשות.
וידאו
40 דק'
01/2025
איך לבנות מהר עם AI כדי ליצור בידול ולנצח חברות גדולות יותר
הניוזלטר שלנו
הירשמו וקבלו עדכונים על פרקים חדשים, כתבות, אירועים ועוד הפתעות!
רוצים לקחת חלק בשיתוף ידע?
אם גם אתם רוצים להצטרף למשימה שלנו להעשיר את האקוסיסטם בידע ותובנות, אם אתם רוצים לשאול אותנו משהו, אם אתם מרגישים שיש משהו שעזר לכם וכולם צריכים לדעת, נשמח לשמוע.
Startup for Startup