בינואר 2021 OpenAI פרסמה כלי שאפשר לקחת משפט רגיל ולהפוך אותו לתמונה. זה נשמע פשוט. בפועל, זה שינה לנצח את האופן שבו עולם הגרפיקה, השיווק והיצירה חושב על תוכן ויזואלי. DALL-E, שנקרא על שם הצייר סלבדור דאלי ורובוט של פיקסאר, הוא אחד הכלים שפתחו את הדלת לעידן שבו כל אדם יכול ליצור תמונה מרשימה בלי לדעת לצייר. המדריך הזה מסביר מה הכלי עושה, איך הוא עובד, ומה קרה לו בשנה האחרונה.
מה זה DALL-E ומאיפה הוא הגיע
DALL-E הוא כלי ליצירת תמונות מטקסט שפיתחה חברת OpenAI. הרעיון הבסיסי: כותבים משפט שמתאר תמונה, והמחשב מייצר אותה. לא בוחרים תמונה ממאגר, לא משתמשים בתבנית. מייצרים תמונה שמעולם לא הייתה קיימת, בדיוק על פי התיאור.
הדור הראשון, שהושק בינואר 2021, הדהים את עולם הטכנולוגיה בכך שהוכיח שהדבר אפשרי בכלל. הדור השני, DALL-E 2, שהגיע ב-2022, שיפר משמעותית את איכות התמונות ואת דיוק ביצוע ההנחיות. הדור השלישי, DALL-E 3, שנכנס לשימוש ציבורי באוקטובר 2023, קפץ קדימה בצורה ניכרת: ביצוע מדויק יותר של הנחיות מורכבות, שיפור בריאליזם, ושילוב ישיר בתוך ChatGPT שהפך את השימוש בו לפשוט מאי פעם.
ב-2026, הסיפור מורכב יותר: DALL-E 3 עצמו מתקרב לסיום חייו הרשמיים, והמקום שלו נלקח על ידי דור חדש של כלים שOpenAI בנתה, בארכיטקטורה שונה לחלוטין. אבל ההבנה של DALL-E 3, מה הוא עשה, איך הוא עבד, ולמה הוא ייחד, נחוצה כדי להבין לאן הגיע עולם יצירת תמונות ב-AI.
ציר הזמן: מהיצירה עד הסגירה
-
1ינואר 2021 DALL-E הראשון: הוכחת המושג
OpenAI מוכיחה שאפשר לייצר תמונות מטקסט בצורה קוהרנטית. 12 מיליארד פרמטרים, פלט לא תמיד מדויק, אבל עיקרון שמשנה הכל.
-
2אפריל 2022 DALL-E 2: קפיצה איכותית
רזולוציה גבוהה יותר, ריאליזם טוב יותר, ויכולת לערוך אזורים ספציפיים בתמונה קיימת. נפתח לציבור ביולי 2022.
-
3אוקטובר 2023 DALL-E 3: שילוב ב-ChatGPT
ביצוע מדויק בהרבה של הנחיות מורכבות. שילוב ישיר בשיחת ChatGPT, ללא צורך בממשק נפרד. השלב שהביא את הכלי לקהל ההמוני.
-
4פברואר 2024 סימני מים דיגיטליים בכל תמונה
OpenAI מוסיפה מטא-נתונים בתקן C2PA לכל תמונה שנוצרת. כל תמונה נושאת מידע על מקורה הדיגיטלי, נסיון לפתור שאלות אחריות ומקוריות.
-
5מרץ 2025 DALL-E 3 מוחלף ב-ChatGPT בלי הודעה
ChatGPT מחליף שקטות את DALL-E 3 בדור החדש של יצירת תמונות המשולב ישירות במודל השפה. משתמשים רבים לא שמו לב לשינוי.
-
6נובמבר 2025 הכרזה על הפסקת פעילות ממשק המפתחים
OpenAI מודיעה רשמית שממשק המפתחים של DALL-E 3 ייסגר ב-12 במאי 2026. מפתחים מתבקשים לעבור לדגמי הדור החדש.
-
712 מאי 2026 סגירת ממשק המפתחים של DALL-E 2 ו-DALL-E 3
שני הדורות מוסרים מממשק המפתחים. הגרסאות החדשות, GPT Image 1 ו-GPT Image 1.5, ממשיכות את הדרך.
איך DALL-E עובד: ההסבר שלא מצריך תואר
כדי להבין מה DALL-E עושה, צריך להבין שתי מילים: דיפוזיה ושפה. מודלי הדיפוזיה, שהם הבסיס הטכני של DALL-E 3, לומדים ליצור תמונות על ידי תהליך הפוך: קחו תמונה ברורה, הוסיפו לה רעש אקראי בהדרגה עד שהיא הופכת לרעש מוחלט, ואז לַמְּדו את המחשב לעשות הפוך, כלומר להתחיל מרעש ולסדר אותו לתמונה ברורה.
DALL-E 3 מוסיף שלב שגרם לשדרוג הגדול ביותר שלו על פני הדורות הקודמים: לפני שמתחילים ליצור את התמונה, מודל השפה של ChatGPT קורא את ההנחיה שלכם, מבין אותה, ומנסח אותה מחדש בצורה מפורטת יותר. אם כתבתם "כלב ים על חוף", החלק הלשוני מייצר תיאור עשיר הרבה יותר לחלק הויזואלי: סוג ספציפי של כלב ים, שעת ביום, זווית, אקלים. זה ההסבר לדיוק הגבוה של DALL-E 3 בביצוע הנחיות מורכבות.
הדור החדש, GPT Image 1 ו-1.5, עוקף את הלוגיסטיקה הזאת לחלוטין: מודל השפה ומחולל התמונות הם כעת מערכת אחת, לא שתי מערכות שמדברות אחת עם השנייה. זה מאפשר הבנה עמוקה יותר של ההנחיה, עריכה מדויקת יותר, ועקביות טובה יותר לאורך שיחה.
תחשבו על DALL-E 3 כצוות של שני אנשים: סופר שמתרגם את הבקשה שלכם לתסריט מפורט, וצייר שמבצע את התסריט. GPT Image 1.5 הוא אדם אחד שעושה את שניהם בראשו בו-זמנית. זה לא רק יעיל יותר, זה מייצר תוצאות שונות.
היכולות שהפכו את DALL-E 3 לכלי שמיליונים השתמשו בו
דיוק בביצוע הנחיות מורכבות
ה-יתרון הגדול ביותר שניפץ DALL-E 3 על הדורות הקודמים היה הדיוק. בעוד DALL-E 2 נאבק עם הנחיות שכוללות יחסים מרחביים ("האריה משמאל ולפנים"), מספרים ("שלושה עצים"), או פרטים ספציפיים, DALL-E 3 ביצע אותן בצורה אמינה הרבה יותר. זה מה שאיפשר לאנשים שאינם מומחים לגרפיקה לקבל את מה שרצו בניסיון ראשון או שני, לא לאחר עשרות ניסיונות.
שיחה כדרך להתאים ולדייק
השילוב בתוך ChatGPT אפשר משהו שלא היה אפשרי לפני כן: לדבר עם הכלי בדיוק כמו שמדברים עם עמית לעבודה. "התמונה יפה, אבל האור חזק מדי בצד שמאל." "תשנה את הצבע של החולצה לכחול." "תוסיף עץ ברקע." כל שינוי מתבצע מתוך השיחה, בלי לחזור לנקודת ההתחלה ולכתוב מחדש את כל ההנחיה.
עריכת אזורים בתמונה קיימת
DALL-E 3 תומך בעריכת חלקים מוגדרים מתמונה קיימת. מצביעים על אזור, מתארים מה שרוצים שיהיה שם, והמחשב מייצר אותו תוך שמירה על שאר התמונה. אפשר להוסיף אלמנטים שלא היו, להסיר עצמים שמפריעים, להחליף רקע, לשנות תאורה בחלק ספציפי. זה הכלי שהפך DALL-E לא רק למחולל תמונות אלא לסטודיו עריכה.
הרחבת תמונה מעבר לגבולות המקוריים
אחת הפיצ'רים הכי שימושיים: קחו תמונה קיימת, ובקשו מהכלי להמשיך אותה מעבר לגבולות המסגרת המקורית. תמונת דיוקן צרה הופכת לתמונה רחבה עם רקע שנוצר בהתאמה לתמונה המקורית. תמונת נוף מוגדלת לכל הכיוונים. הכלי מייצר את ההמשך על בסיס מה שכבר קיים, כולל צבעים, תאורה ואווירה.
דיוק בהנחיות מורכבות
ביצוע מדויק של הנחיות עם יחסי מרחב, מספרים, ותיאורים מפורטים, יכולת שהיתה חלשה בדורות הקודמים.
שיחה כדרך לדייק
שיחה טבעית לשיפור התמונה צעד אחר צעד, בלי לחזור לנקודת ההתחלה בכל פעם.
עריכת אזורים
עריכת חלקים מוגדרים מתמונה קיימת תוך שמירה על שאר התמונה ללא שינוי.
הרחבת תמונה
הוספת תוכן מעבר לגבולות התמונה המקורית בהתאמה לאווירה, לצבעים ולתאורה הקיימים.
סינון תוכן מובנה
מערכת סינון שמונעת יצירת תוכן פוגעני, אלים, או בסגנון אמנים חיים שלא נתנו הסכמה.
סימני מים דיגיטליים
כל תמונה נושאת מטא-נתונים בתקן בינלאומי שמזהה את מקורה הדיגיטלי כתמונה שנוצרה על ידי בינה מלאכותית.
איך ניגשים לכלי ומה זה עולה
DALL-E 3 היה נגיש בשלוש דרכים שונות, כל אחת עם יתרונות ומגבלות שונות.
| דרך גישה | עלות | מגבלות | מתאים ל |
|---|---|---|---|
| ChatGPT חינמי | ללא תשלום | מספר תמונות מוגבל ביום | שימוש מזדמן, היכרות ראשונית |
| ChatGPT Plus | $20 לחודש | מכסה גבוהה, ללא עלות נוספת לתמונה | יוצרים ועסקים קטנים |
| ממשק המפתחים | $0.04-$0.12 לתמונה | תשלום לפי שימוש, ללא מכסה | מפתחים ועסקים בנפח גבוה |
| Bing Image Creator | ללא תשלום | מוגבל, אינו DALL-E 3 מלא | שימוש מזדמן ללא חשבון OpenAI |
עלות ממשק המפתחים בפירוט
עבור מפתחים שהשתמשו ב-DALL-E 3 דרך ממשק המפתחים, המחיר נקבע לפי רזולוציה ואיכות:
- תמונה ריבועית (1024 על 1024 פיקסלים), איכות רגילה: 4 סנט
- תמונה ריבועית, איכות גבוהה: 8 סנט
- תמונה פנורמית (1792 על 1024 פיקסלים), איכות גבוהה: 12 סנט
לצורך השוואה, הדגם החדש GPT Image 1 Mini מציע איכות תחרותית החל מ-0.5 סנט לתמונה, ועד 5.2 סנט לאיכות גבוהה. ההבדל מסביר חלק ניכר מהמעבר לדגמים החדשים.
ממשק המפתחים של DALL-E 3 ייסגר ב-12 במאי 2026. מי שמפתח מוצרים שמבוססים על ממשק זה צריך לעבור לדגמי הדור החדש לפני תאריך זה. OpenAI מספקת מדריכי מעבר רשמיים.
איפה DALL-E 3 מצטיין ואיפה הוא נופל
חוזקות
- דיוק מצוין בביצוע הנחיות מורכבות
- שילוב טבעי בשיחת ChatGPT
- עריכת אזורים ספציפיים בתמונה
- הרחבת תמונות קיימות
- ממשק פשוט ללא צורך בלמידה
- סינון תוכן מקיף ובטוח
- מגוון רחב של סגנונות ויזואליים
מגבלות
- יצירת טקסט בתוך תמונה, דיוק של כ-60% בלבד
- אין אפשרות לאמן מודל על נתונים שלך
- פחות שליטה מדויקת מכלים כמו Midjourney
- לעתים קשה לשחזר תמונה זהה פעמיים
- מיועד להפסקה בממשק המפתחים במאי 2026
- פחות אפשרויות עיצוביות לעומת מתחרים
בעיית הטקסט בתמונה
אחת המגבלות הבולטות של DALL-E 3 לאורך חייו הייתה יצירת טקסט קריא בתוך תמונה. כשמבקשים כרזה עם טקסט, שלט עם שם, או כרטיס ביקור, התוצאה לרוב כוללת אותיות מעוותות, מילים חסרות פשר, או טקסט שנראה כאילו עבר דרך מחשב עם שגיאות. הדגמים החדשים שיחרר OpenAI השיגו דיוק של כ-98% בייצור טקסט בתמונה, לעומת 60% של DALL-E 3.
קושי בחזרה לאותה תמונה
מי שרצה להפיק כמה גרסאות של אותה תמונה עם שינויים קלים, גילה בעיה: אף פעם לא בטוח שהתמונה הבאה תשמור על האופי הכללי של הקודמת. שמירת "מספר זרעי" (seed) התמונה לא הייתה נוחה כמו בכלים מתחרים, ולכן כל ניסיון להתאים חלק אחד יכול היה לשנות דברים שלא רציתם לגעת בהם.
הדור הבא: GPT Image 1 ו-1.5 ומה הם מביאים
מרץ 2025 היה נקודת מפנה שרבים לא שמו לב אליה בזמן אמת: ChatGPT עבר בשקט ליצירת תמונות שמבוצעת על ידי מודל חדש שמשולב ישירות במודל השפה, ולא דרך DALL-E 3 הנפרד. אנשים המשיכו לבקש תמונות בשיחת ChatGPT ולקבל אותן, אבל הקסם שמאחורי הקלעים כבר היה שונה.
השוני הגדול הוא ארכיטקטורי. DALL-E 3 היה מערכת נפרדת שקיבלה הנחיה מודרכת מ-ChatGPT. GPT Image 1.5 הוא חלק ממודל השפה עצמו, כמו שאוזניים ועיניים הן חלק מאותו מוח. כשהכל קורה באותה מערכת, ההבנה עמוקה יותר, העריכה מדויקת יותר, והעקביות לאורך שיחה גבוהה יותר.
| קריטריון | DALL-E 3 | GPT Image 1.5 |
|---|---|---|
| ארכיטקטורה | מודל ייעודי נפרד | משולב ישירות במודל השפה |
| דיוק ביצוע טקסט | כ-60% | כ-98% |
| עריכת אזורים | טובה | מדויקת יותר |
| עקביות לאורך שיחה | בינונית | גבוהה |
| מחיר ממשק המפתחים | $0.04-$0.12 לתמונה | $0.009-$0.20 לתמונה |
| דרוג LM Arena (דצמבר 2025) | מקום 10 | מקום 1 (ציון 1264) |
| זמינות ממשק מפתחים | עד מאי 2026 | כן, ופעיל |
לא הכל השתפר. חלק מהמשתמשים מדווחים שGPT Image 1.5 פחות "אמנותי" מ-DALL-E 3. כשמבקשים ציור שמן, למשל, GPT Image לפעמים מייצר אפקט של מרקם צבע שנראה שטחי יחסית. DALL-E 3 עשה מאמץ ללכוד נפח ואור בצורה עמוקה יותר. זה אחד הטיעונים שמפתחים העלו נגד ההפסקה.
איך כותבים הנחיות שמייצרות תמונות טובות
הכישרון החשוב ביותר שמבדיל תוצאות טובות מרעות ב-DALL-E, ובכל כלי ליצירת תמונות, הוא כתיבת הנחיות. לא צריך לעשות מזה מדע, אבל כמה עקרונות פשוטים משנים את התוצאה לחלוטין.
חמישה עקרונות לכתיבת הנחיה טובה
-
1
תארו נושא, לא מילת מפתח במקום "כלב", כתבו "גולדן רטריבר צעיר יושב על ספת קטיפה כהה, תאורת בוקר חמה מהחלון". הפרטים יוצרים תמונה, לא מילה.
-
2
ציינו סגנון ויזואלי "צילום דיוקן מקצועי", "ציור שמן בסגנון אימפרסיוניסטי", "איור דיגיטלי בסגנון מנגה", "עיצוב גרפי שטוח ומינימליסטי". הסגנון מכוון את הכלי לכיוון ברור.
-
3
תארו תאורה תאורה היא רגש. "שקיעה חמה", "אור ירח כחלחל", "תאורה דרמטית מצד אחד", "יום מעונן ומעומעם". כל אחת מהן יוצרת תמונה אחרת לחלוטין.
-
4
ציינו זווית וקומפוזיציה "מבט מלמעלה", "מבט מהקרקע כלפי מעלה", "תמונה פנורמית רחבה", "דיוקן קרוב של פנים בלבד". הזווית משנה הכל בתמונה.
-
5
השתמשו בשיחה לדיוק הדרגתי אל תנסו לכתוב הנחיה מושלמת בפעם הראשונה. צרו תמונה, ראו מה עבד, ובקשו שינוי אחד ספציפי בכל פעם. גישה זו מייצרת תוצאות טובות יותר מניסיון לכתוב הנחיה מושלמת בבת אחת.
הנחיה חלשה: "מסעדה יפה בלילה"
הנחיה חזקה: "מסעדה איטלקית קטנה ואינטימית בלילה, שולחנות עם מפות לבנות, נרות בבקבוקי יין ישנים, חלון ראווה עם אור חם, גשם קל בחוץ, צילום דוקומנטרי בסגנון רחוב, אור מוזהב ומרגש"
ההבדל בתוצאה ניכר לחלוטין.
מה לא לעשות
- הנחיות שליליות: אל תאמרו "ללא פנים", "לא כחול". הכלי עובד בצורה טובה יותר עם תיאור חיובי של מה שרוצים מאשר עם מה שלא רוצים.
- יותר מדי אלמנטים בהנחיה אחת: "כלב על סירה עם שלושה ילדים, פיל ברקע, חוף, לרות, ושקיעה" יתפצל ויתבלבל. ספרו לאלמנטים ולדייקו.
- ציפייה לדיוק מוחלט בטקסט: אם תמונה חייבת לכלול טקסט מדויק שניתן לקרוא, הוסיפו אותו בעריכה גרפית אחרי שהתמונה נוצרה.
שימושים אמיתיים: מי משתמש ב-DALL-E ולמה
שיווק ופרסום
יצירת תמונות לרשתות חברתיות, כרזות לקמפיינים, תמונות לכתבות ובלוגים. מחסום הכניסה ירד מצוות גרפי לאדם אחד עם מחשב.
עיצוב ואדריכלות
יצירת רישומי השראה, מוקאפ של חללים לפני ביצוע, הדמיות מוצר בסביבות שונות. חלופה זולה להדמיות תלת-ממד יקרות.
חינוך והדרכה
יצירת איורים מותאמים לחומרי לימוד, הסברת מושגים מופשטים ויזואלית, יצירת תמונות לספרי לימוד ומצגות.
פיתוח מוצרים
הדמיית מוצרים שטרם יוצרו, בדיקת עיצובים שונים לפני ייצור, יצירת חומר לדפי נחיתה ראשוניים לבדיקת שוק.
יצירה אישית
הפקת אמנות דיגיטלית, יצירת תמונות לספרים שכותבים, עיצוב עטיפות לאלבומי מוזיקה עצמאיים, ציורים מותאמים אישית.
תוכן גנרי לאתרים
אתרים שצריכים תמונות רבות במחיר נמוך. במקום לרכוש תמונות ממאגר או להזמין צלם, יוצרים תמונות ייחודיות שאינן גנריות.
מה DALL-E פחות מתאים לו
- צילום פרסומי מקצועי לרמה גבוהה: כשצריך תמונה שתוצג בשלט חוצות ענקי, רמת הפירוט ושליטה על כל פיקסל עדיין מחייבת צלם אנושי.
- תמונות עם אנשים אמיתיים: כלי הכריח מגבלות חזקות על יצירת דיוקנאות של אנשים אמיתיים, ובצדק. הסיכון לשימוש לרעה גבוה.
- עיצוב ממותג עקבי: מותג שצריך שפה ויזואלית עקבית לאורך זמן יתקשה לשמור על עקביות רק עם DALL-E, ללא שכבת עיצוב אנושי.
- תמונות עם טקסט מדויק: כפי שצוין, DALL-E 3 אינו אמין ליצירת טקסט קריא בתוך תמונה. הדגמים החדשים שיפרו זאת, אבל המגבלה הייתה אמיתית.
זכויות יוצרים, אתיקה ומה מותר לעשות עם תמונות שנוצרו
אחד הנושאים שעוררו ויכוח מאז הגיע DALL-E לשימוש ציבורי הוא שאלת הבעלות על התמונות שנוצרות, ושאלת ההוגנות כלפי אמנים שעבודותיהם שימשו לאימון המודל.
מה מותר לכם לעשות עם התמונות
לפי תנאי השימוש של OpenAI, תמונות שנוצרות בכלי הכה בבעלות המשתמש שיצר אותן. אפשר לפרסם, למכור, לשלב בפרויקטים מסחריים, הכל בתנאי שהשימוש אינו מפר את מדיניות OpenAI עצמה. זה שוני מהותי ממצב שבו תמונות ממאגר רגיל מחייבות רישיון לכל שימוש.
הסוגיה עם אמנים
DALL-E, כמו כל מחוללי תמונות מבוססי בינה מלאכותית, אומן על מיליארדי תמונות שנלקחו מהאינטרנט, כולל עבודות של אמנים שלא נתנו הסכמתם. השאלה האם זה מוצדק מבחינה משפטית ואתית עדיין בדיון משפטי ברחבי העולם. OpenAI נקטה בצעד חשוב אחד: DALL-E 3 מסרב ליצור תמונות "בסגנון האמן [שם]" כשמדובר באמנים חיים שלא נתנו הסכמה מפורשת.
בנוסף, OpenAI הציגה מנגנון שמאפשר לאמנים לבקש שעבודותיהם יוסרו מנתוני האימון לדגמים עתידיים. זה לא פותר את השאלה לגבי אימונים שכבר בוצעו, אבל מייצג הכרה בבעיה.
סימני המים הדיגיטליים
מפברואר 2024, כל תמונה שנוצרת על ידי DALL-E 3 נושאת מטא-נתונים בתקן C2PA (ברית לאותנטיות ומקוריות תוכן). המטא-נתונים, שאינם גלויים לעין, מגדירים שהתמונה נוצרה באמצעות בינה מלאכותית ומזהים את המקור. זה לא סימן מים ויזואלי שרואים, אלא מידע דיגיטלי מוסתר שכלי מתאים יכול לקרוא.
עקרונות שכדאי לזכור
- תמונות שנוצרות שייכות לכם ומותרות לשימוש מסחרי
- כל תמונה נושאת סימן מים דיגיטלי שמזהה אותה כיצירת בינה מלאכותית
- יצירת תמונות בסגנון אמנים חיים חסומה
- שאלות בעלות על נתוני האימון עדיין בבירור משפטי
- השימוש בתמונות לאחד השימושים האסורים בתנאי OpenAI עלול לגרור ביטול חשבון
DALL-E מול מתחרים: מה הכי מתאים לכם
שוק יצירת תמונות בבינה מלאכותית הוא מהתחרותיים ביותר. להלן השוואה כנה עם הכלים המובילים.
| קריטריון | DALL-E 3 / GPT Image | Midjourney | Adobe Firefly | FLUX (קוד פתוח) |
|---|---|---|---|---|
| דיוק הנחיות | מצוין | טוב | טוב | טוב מאוד |
| אסתטיקה אמנותית | טוב | מצוין | טוב | טוב מאוד |
| קלות שימוש | מצוין | בינוני | טוב מאוד | מורכב |
| שילוב בכלי אחר | ChatGPT מלא | ממשק עצמאי | Adobe Creative Cloud | חופשי לגמרי |
| זכויות שימוש מסחרי | כן | בתוכניות בתשלום | כן, מאומת IP | תלוי גרסה |
| יצירת טקסט בתמונה | מצוין (GPT Image 1.5) | בינוני | טוב | טוב |
| מחיר | כלול ב-$20 לחודש | $10-$120 לחודש | כלול ב-Adobe | עלות שרת בלבד |
| הרצה מקומית | לא | לא | לא | כן |
Midjourney שולט באסתטיקה ובתחושה האמנותית שהיא ה"wow factor" שרוב האנשים מקשרים ל-AI אמנותי. Adobe Firefly מנצח בשיחת הבטיחות המשפטית כי OpenAI אימנה אותו רק על חומרים מורשים ובבעלות Adobe. FLUX, משפחת המודלים מקוד פתוח שצמחה ב-2025, לקחה כ-40% מנתח השוק של שיחות יצירת תמונות, יתרון משמעותי לאלה שרוצים להריץ מקומית ולשמור פרטיות מוחלטת. DALL-E ו-GPT Image מנצחים בנוחות ובשילוב עם מחשב שפה.
תהליך עבודה מעשי: מרעיון לתמונה מוכנה לשימוש
הנה תהליך שעובד טוב עבור רוב הצרכים.
-
1
הגדירו מה אתם צריכים לפני שכותבים הנחיה, ענו על: מה מטרת התמונה? איפה תוצג? מה הרגש שצריך לעורר? ממי הקהל? עשר שניות של מחשבה חוסכות עשר ניסיונות.
-
2
כתבו הנחיה ראשונה ברמת פירוט בינונית לא קצרה מדי ולא ארוכה מדי. נושא, סגנון, תאורה. ראו מה יוצא. אל תנסו להיות מושלמים בפעם הראשונה.
-
3
ייצרו ארבע גרסאות בקשו ארבע וריאציות. לעתים קרובות גרסה שנייה או שלישית מפתיעה לטובה בלי שינוי בהנחיה.
-
4
בחרו מועמדת ודייקו בשיחה בחרו את הגרסה הקרובה ביותר למה שרציתם, ובקשו שינוי ספציפי אחד. חיתוך שונה, עוצמת אור, שינוי צבע, הסרת אלמנט.
-
5
הוסיפו פרטים שה-AI לא יכול טקסט מדויק, לוגו, מידות ספציפיות, שמות: הוסיפו אותם בכלי עריכה רגיל אחרי שהתמונה מוכנה. אל תנסו לגרום לכלי לעשות את מה שהוא לא טוב בו.
-
6
בדקו זכויות ושמירת קובץ ודאו שהתמונה תואמת לתנאי השימוש לפי ייעודה. שמרו את הגרסה המקורית ברזולוציה גבוהה לפני כל שינוי.
שאלות ותשובות
בממשק המשתמש של ChatGPT, DALL-E 3 הוחלף בשקט במרץ 2025 על ידי GPT Image, הדגם החדש. ממשק המפתחים של DALL-E 3 פעיל עד 12 במאי 2026, ולאחר מכן ייסגר. מי שמשתמש דרך ChatGPT כבר עובד עם הדגם החדש, גם אם לא ידע זאת. מי שמחובר דרך ממשק מפתחים צריך לעבור לפני מאי 2026.
ההבדל המשמעותי ביותר הוא ארכיטקטורי. DALL-E 3 היה כלי נפרד שקיבל הנחיה ממודל השפה. GPT Image 1 ו-1.5 משולבים ישירות במודל השפה, כך שהבנת ההקשר עמוקה יותר. מבחינה מעשית: דיוק יצירת טקסט עלה מ-60% לכ-98%, עקביות לאורך שיחה השתפרה, ועריכת אזורים מדויקת יותר. חלק מהמשתמשים מדווחים שהאיכות האמנותית של ציורים ירדה מעט.
כן. לפי תנאי השימוש של OpenAI, תמונות שמשתמשים יוצרים שייכות להם ומותרות לכל שימוש מסחרי, כולל מכירה ופרסום. הגבלה אחת: לא ניתן להשתמש בהן בדרכים שמפרות את מדיניות OpenAI. כל תמונה נושאת סימן מים דיגיטלי שמזהה אותה כיצירת בינה מלאכותית, גם אם אינו נראה לעין.
Bing Image Creator הוא כלי של מיקרוסופט שמשתמש בדגם של OpenAI (שהיה DALL-E 3 ועשוי לעבור לדגמים חדשים). הוא זמין ללא תשלום, אך עם מגבלות על מספר התמונות. האיכות דומה לרמת ChatGPT החינמי. עבור שימוש מזדמן בלי צורך בחשבון OpenAI, זהו פתרון מעשי. עבור שימוש ממשי, ChatGPT Plus עם גישה מלאה עדיף.
DALL-E מסרב ליצור תמונות מציאותיות של אנשים אמיתיים שניתן לזהות. זה כולל פוליטיקאים, סלבריטיז, ואנשים שציינתם בשמם. המטרה היא מניעת שימוש לרעה כמו יצירת תמונות מזויפות. כן ניתן לבקש "דיוקן של אדם" ללא שם ספציפי, ולקבל דמות שנוצרה שאינה מזוהה עם אדם אמיתי.
OpenAI לא מפרסמת מספר מדויק, אך המכסה גבוהה מספיק לשימוש ממשי. בפועל, רוב המשתמשים לא נתקלים בגבול בשימוש יומיומי. בשעות עומס גבוה, זמן ייצור התמונה עלול לגדול. מי שצריך נפח גבוה ומדיד, ממשק המפתחים עם תשלום לפי תמונה מתאים יותר.
לשאלה הזאת אין תשובה אחת. GPT Image / DALL-E עדיפים כשצריך שיחה לדיוק, כשהתמונה חייבת לכלול טקסט קריא, כשרוצים שילוב עם ChatGPT, וכשקלות שימוש חשובה. Midjourney עדיף כשהאסתטיקה האמנותית היא העיקר, כשרוצים שימוש מסחרי בתוצאה שנראית "כמו אמנות" ולא "כמו AI", ולמי שמוכן להשקיע בלמידת הכלי. האמת היא שיוצרים מקצועיים רבים משתמשים בשניהם לצרכים שונים.
סיכום: DALL-E פתח דלת שלא תיסגר
DALL-E 3 הולך לסגירה טכנית. הממשק שלו לא יעבוד אחרי מאי 2026. אבל ה-DALL-E 3 הממשי, זה שהשפיע על תעשייה שלמה ושינה את ציפיות עשרות מיליוני אנשים, כבר לא ניתן "לסגור". הוא הוכיח ש-AI יכול לייצר תמונות שאנשים מוכנים לשלם עליהן, לפרסם אותן, ולהסתמך עליהן.
הדגמים שבאים אחריו, GPT Image 1.5, FLUX, Midjourney 7, Imagen 3 של גוגל, כולם בנויים על בסיס שDALL-E עזר לבסס. עולם שבו יצירת תמונות מקצועיות היא נגישה לכל מי שיודע לכתוב משפט.
אם אתם חדשים לתחום, אין סיבה ללמוד את הגרסה הישנה. התחילו ישירות עם GPT Image 1.5 דרך ChatGPT, שהוא ממשק המשתמש הנוח ביותר שיש כיום. אם אתם מפתחים שמשתמשים בממשק התכנותי, עברו לדגמי הדור החדש לפני מאי 2026.
ומה שנשאר נכון בכל גרסה: הכלי עושה מה שאתם מגדירים אותו לעשות. תמונה טובה מתחילה בהנחיה טובה. וההנחיה הטובה מתחילה בהבנה ברורה של מה שרוצים לתקשר. הבינה המלאכותית מבצעת, אתם מנחים.