הנדסת פרומפטים

הנדסת פרומפטים (Prompt engineering) היא טכניקה מענף הבינה המלאכותית, כאשר "פרומפט" בהקשר זה הוא קלט מסוים, לרוב בצורת הנחיה, שאלה או שאילתא, המוזן למודל בינה מלאכותית או למודל שפה במטרה לקבל תוצר מסוים.^[1] הפרומפט יכול ללבוש מספר צורות, בהן משפט שלם או מספר מילות מפתח, ועל מהנדס הפרומפטים לדעת כיצד ליצור את הפרומפט שיספק את התוצאה הרצויה בצורה אופטימלית. השימוש במילה "הנדסה" בשם הטכניקה הוא מעט מטעה, שכן בסופו של דבר מדובר במיומנות גרידא, עם אלמנטים הנדסיים מעטים.^[2]

הצורך בפיתוח מיומנות זו חווה גידול משמעותי עם התגברות הפופולריות של מודלי שפה גדולים, דוגמת GPT-3 ו-GPT-4, שעליהם בנוי ChatGPT ששוחרר בסוף שנת 2022. זאת, בין היתר, מאחר שמודלים אלו מתמודדים בצורה טובה עם פרומפטים שנכתבים בשפה אנושית.^[3] בנוסף, מודלים אלו אומנו בטכניקת למידת חיזוק, הליך במסגרתו מאמן אנושי מספק פרומפט למודל, ונותן לו פידבק בהתאם לתוצר שהתקבל.^[4]

פעמים רבות, על מנת לקבל את התוצאה האופטימלית מהמודל, יש צורך במספר פרומפטים. כך, למשל, לעיתים עדיף כי המודל יחשוב "צעד אחר צעד", ועל כן יש להעביר לו פרומפטים חלקיים בכל פעם, להבדיל מלנסות לקבל את התוצאה הרצויה באמצעות פרומפט בודד. אימון זה נחשב כיעיל בשיפור ביצועי מודל שפה בפתרון בעיות חשיבה רב-שלבית. ניתן להוביל את המודל לחשוב כך גם באמצעות הבהרה טקסטואלית מפורשת בפרומפט, לדוגמה "נסה לפתור את הבעיה צעד אחר צעד". כמו כן, לעיתים רצוי "להתווכח" עם המודל, או לכלול מספר דוגמאות כחלק מהפרומפט.

דרך נוספת לשפר תוצאות באמצעות הפרומפט, היא להבהיר למודל באיזו רמה מצופה ממנו לענות על השאלה. כך למשל, על מנת להשיב לשאלת פיזיקה, כדאי להתחיל את הפרומפט במשפט "אתה מומחה לפיזיקה". תוספת זו מועילה מכיוון שמודל שפה הוזן במידע טקסטואלי רב, בין היתר טקסט העוסק בפיזיקה שנכתב על ידי מומחים לפיזיקה וכזה שנכתב על ידי כאלו שאינם מומחים לפיזיקה. סטטיסטית, ייתכן כי תוכן שנכתב על ידי אלו שאינם מומחים בפיזיקה נפוץ יותר, ולכן המודל, שתוכנת להשיב את התשובה המסתברת ביותר, לא יפיק תשובה של מומחה אלא אם הדבר נדרש ממנו בפרומפט.

מחקר שנעשה בשנת 2021 הראה כי הנדסת פרומפטים מרובת משימות (כזו המשתמשת במספר רב של נתוני עיבוד שפה טבעית) הראתה ביצועים טובים בבואה לבצע משימות חדשות מבלי שהתאמנה על כך קודם לכן.^[5]

בשנת 2022, שוחררו לציבור מודלי למידת מכונה המשמשים ליצירת תמונות באמצעות טקסט, כאשר הפופולריים שבהם הם DALL-E 2, Stable Diffusion, Midjourney ו-Photoleap של חברת לייטריקס הישראלית.^[6] העובדה שמודלים אלו מייצרים תמונות כתגובה לקלט טקסטואלי, יצרה קטגוריה חדשה של הנדסת פרומפטים הממוקדת בטקסט לתמונה.^[7]

על אף האמור, יש הרואים במיומנות "הנדסת פרומפטים" ככזו שלא תהיה רלוונטית לטווח ארוך. זאת, בעיקר בשל הפיתוח המואץ בתחום מודלי השפה הגדולים, שככל הנראה יביא לכך שהמונח "פרומפט" צפוי לשנות את צורתו באופן המייתר את הצורך באדם היוצר אותו.^[8] כך, למשל, כלי הבינה המלאכותית GitHub Copilot, המשלים קוד עבור המתכנתים, אינו דורש פרומפט (בגרסתו המקורית) על מנת ליצור קוד, אלא פועל על בסיס שילוב של קוד שלמד והקוד שלנגד עיניו. אפשרות נוספת, שהציע חוקר הבינה המלאכותית אנדרו אנג, היא שייתכן שהפרומפט העתידי יצטמצם מצורת טקסט, למשל, ללחיצת כפתור בלבד, כפי שנעשית הגברת הווליום בטלוויזיה (להבדיל מבקשה מילולית להגברת הווליום).^[9]

שימושים זדוניים

הזרקת פרומפטים היא תת-תחום בענף האקספלויט (ניצול פרצות אבטחה) וממוקדת במודלי למידת מכונה. התקפה בתחום זה נעשית כאשר משתמש זדוני מחדיר למודל פרומפט הגורם למודל לבצע פעולות שאינו אמור לעשות.^[10] אחד הסוגים הנפוצים של הזרקת פרומפטים נקרא jailbreak, במסגרתו "משכנעים" את המודל לספק תשובה שהוא לא תוכנת לספק, למשל על ידי העמדת פנים שהבקשה היא במסגרת "משחק תפקידים".^[11]

קישורים חיצוניים

מדיה וקבצים בנושא הנדסת פרומפטים בוויקישיתוף

הערות שוליים

^ יודעים להוציא תוצרים מדהימים ממנועי AI? אתם יכולים..., באתר tech12, ‏2022-12-16
^ Get a Load of This New Job: "Prompt Engineers" Who Act as Psychologists to AI Chatbots, Futurism
^ Prompt engineering and jailbreaking: Europol warns of ChatGPT exploitation, ‏2023-03-28 (באנגלית אמריקאית)
^ Mingkai Deng et al, RLPROMPT: Optimizing Discrete Text Prompts with Reinforcement Learning, 2020
^ Large Language Models are Zero-Shot Reasoners
^ עידן בן טובים, בלי לחכות ל-DALL-E 2: לייטריקס הישראלית מאפשרת לכם ליצור תמונות מטקסט - גם בעברית, באתר גיקטיים, ‏2022-09-06
^ Monge, Jim Clyde (2022-08-25). "Dall-E2 VS Stable Diffusion: Same Prompt, Different Results". MLearning.ai (באנגלית). נבדק ב-2022-08-31.
^ "Is becoming a 'prompt engineer' the way to save your job from AI?". Financial Times. 2022-12-13. נבדק ב-2023-04-04.
^ Prompt Engineering: Future of AI or Hack?, Prompt Engineering: Future of AI or Hack?, ‏2022-10-19 (באנגלית)
^ Willison, Simon (12 בספטמבר 2022). "Prompt injection attacks against GPT-3". simonwillison.net (באנגלית בריטית). נבדק ב-2023-02-09. {{cite web}}: (עזרה)
^ The Amateurs Jailbreaking GPT Say They're Preventing a Closed-Source AI Dystopia, www.vice.com (באנגלית)

[1] יודעים להוציא תוצרים מדהימים ממנועי AI? אתם יכולים..., באתר tech12, ‏2022-12-16

[2] Get a Load of This New Job: "Prompt Engineers" Who Act as Psychologists to AI Chatbots, Futurism

[3] Prompt engineering and jailbreaking: Europol warns of ChatGPT exploitation, ‏2023-03-28 (באנגלית אמריקאית)

[4] Mingkai Deng et al, RLPROMPT: Optimizing Discrete Text Prompts with Reinforcement Learning, 2020

[5] Large Language Models are Zero-Shot Reasoners

[6] עידן בן טובים, בלי לחכות ל-DALL-E 2: לייטריקס הישראלית מאפשרת לכם ליצור תמונות מטקסט - גם בעברית, באתר גיקטיים, ‏2022-09-06

[7] Monge, Jim Clyde (2022-08-25). "Dall-E2 VS Stable Diffusion: Same Prompt, Different Results". MLearning.ai (באנגלית). נבדק ב-2022-08-31.

[8] "Is becoming a 'prompt engineer' the way to save your job from AI?". Financial Times. 2022-12-13. נבדק ב-2023-04-04.

[9] Prompt Engineering: Future of AI or Hack?, Prompt Engineering: Future of AI or Hack?, ‏2022-10-19 (באנגלית)

[10] Willison, Simon (12 בספטמבר 2022). "Prompt injection attacks against GPT-3". simonwillison.net (באנגלית בריטית). נבדק ב-2023-02-09. {{cite web}}: (עזרה)

[11] The Amateurs Jailbreaking GPT Say They're Preventing a Closed-Source AI Dystopia, www.vice.com (באנגלית)

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]