מילון מונחי AI המקיף
מילון מונחים מעשי לבינה מלאכותית, למידת מכונה וטכנולוגיות מתקדמות. המדריך המלא למושגים שחייבים להכיר.
מוצגים: 0 מונחים
בינה מלאכותית כללית (AGI) יסוד
הגדרה
ה"גביע הקדוש" של התחום: מערכת בינה מלאכותית היפותטית המסוגלת להבין, ללמוד ולבצע כל משימה אינטלקטואלית שאדם ממוצע יכול לבצע, ברמה שווה או טובה יותר.
למה זה חשוב
זהו היעד הסופי של חברות כמו OpenAI ו-Google DeepMind. ההגעה ל-AGI מסמנת את המעבר מכלי עזר ספציפיים למערכות עצמאיות לחלוטין.
דוגמה: בעוד ש-ChatGPT יודע רק לכתוב טקסט, AGI יוכל ללמוד רפואה בבוקר, לתכנת משחק בצהריים ולנהל חברה בערב – הכל באופן עצמאי.
הלימה (Alignment) יסוד
הגדרה
התחום העוסק בהבטחה שמערכות בינה מלאכותית יפעלו בהתאם לכוונות, לערכים ולמטרות של בני האדם שיצרו אותן, ולא יסטו מהן.
למה זה חשוב
האתגר המרכזי בבטיחות AI; ככל שהמודלים נעשים חזקים יותר, כך סטייה קטנה מהמטרה עלולה לגרום לנזק גדול יותר.
דוגמה: לוודא שרובוט שמנקה את הבית לא "ינקה" גם את החתול רק כי הוא הוגדר כאובייקט שמפריע לרצפה.
אלגוריתם יסוד
הגדרה
סדרת הוראות מתמטיות ולוגיות מוגדרות היטב לביצוע משימה או לפתרון בעיה. ב-AI, זהו "המתכון" שהמחשב לומד לשפר בעצמו.
למה זה חשוב
כל פעולה דיגיטלית, מחיפוש בגוגל ועד המלצת שיר בספוטיפיי, מבוססת על אלגוריתם.
דוגמה: מתכון לעוגה הוא אלגוריתם: "קח 2 ביצים, הוסף קמח, ערבב, אפה 30 דקות".
ממשק תכנות יישומים (API) יסוד
הגדרה
צינור תקשורת המאפשר לתוכנות שונות "לדבר" זו עם זו. ב-AI, זהו הדרך שבה אפליקציות שולחות שאלות למודלים בענן ומקבלות תשובות.
למה זה חשוב
מאפשר למפתחים לשלב יכולות AI באפליקציות שלהם (כמו צ'אטבוט באתר) בלי לבנות מודל משלהם מאפס.
דוגמה: כשאתה משתמש באפליקציית כתיבה שמשלימה משפטים, האפליקציה שולחת את הטקסט דרך API ל-OpenAI ומציגה את התשובה.
מנגנון הקשב (Attention) מקצועי
הגדרה
פריצת הדרך הטכנולוגית (2017) המאפשרת למודל להתמקד בחלקים הרלוונטיים במשפט בעת עיבוד כל מילה, במקום לקרוא הכל בצורה לינארית.
למה זה חשוב
זהו המנוע שמאחורי ארכיטקטורת ה-Transformer (ה-T ב-GPT), ומה שמאפשר למודלים להבין הקשרים מורכבים בטקסטים ארוכים.
דוגמה: במשפט "הבנק נסגר כי הנהר עלה על גדותיו", המודל נותן "קשב" למילה "נהר" כדי להבין שהמילה "בנק" מתייחסת לגדת נהר ולא למוסד כספי.
מודל אוטו-רגרסיבי מקצועי
הגדרה
מודל שחוזה את הדבר הבא ברצף (המילה הבאה, הפיקסל הבא) בהתבסס על מה שהוא יצר קודם לכן.
למה זה חשוב
ככה בדיוק עובד ChatGPT. הוא לא "חושב" על כל התשובה מראש, אלא כותב מילה אחר מילה, כשהמילה הקודמת קובעת את הבאה.
דוגמה: המודל כותב "אני", ואז על סמך "אני" הוא מחליט שהמילה הבאה היא "רוצה", ועל סמך "אני רוצה" הוא בוחר "גלידה".
פעפוע לאחור (Backprop) מתקדם
הגדרה
השיטה המתמטית שבה רשת עצבית לומדת: לאחר שהמודל טעה, האלגוריתם הולך "אחורה" מהסוף להתחלה ומעדכן את המשקולות כדי להקטין את הטעות בפעם הבאה.
למה זה חשוב
זהו מנגנון הלמידה עצמו. בלי Backpropagation, הרשת הייתה סתם מנחשת ולא משתפרת לעולם.
דוגמה: כמו מורה שאומר לתלמיד "טעית בשאלה 3", והתלמיד חוזר אחורה בראש להבין איפה בדיוק בדרך הפתרון הוא שגה.
הטיה (Bias) יסוד
הגדרה
נטייה לא הוגנת או שגויה של המודל לטובת או נגד קבוצות מסוימות, הנובעת לרוב מנתונים לא מאוזנים שעליהם הוא אומן.
למה זה חשוב
מודלים מוטים יכולים לגרום לאפליה גזעית, מגדרית או כלכלית בקבלת החלטות אוטומטית (כמו אישור הלוואות).
דוגמה: מודל שאומן בעיקר על תמונות של מנכ"לים גברים, ולכן מייצר תמונה של גבר כשמבקשים ממנו "מנכ"ל", ומתעלם מנשים.
צ'אטבוט יסוד
הגדרה
תוכנה המדמה שיחה אנושית (בטקסט או בקול). נעה בין בוטים פשוטים מבוססי חוקים לבוטים מתקדמים מבוססי AI.
למה זה חשוב
זהו הממשק (UI) הנפוץ ביותר שדרכו בני אדם מתקשרים עם מודלי שפה גדולים כיום (כמו ChatGPT).
דוגמה: הבוט בשירות הלקוחות של הבנק שעונה על שאלות נפוצות, או ChatGPT שעוזר בכתיבת מיילים.
שרשרת מחשבה (CoT) מתקדם
הגדרה
טכניקת פרומפטינג שבה מבקשים מהמודל "לחשוב בקול רם" ולפרק את הבעיה לשלבים לוגיים לפני שהוא נותן את התשובה הסופית.
למה זה חשוב
משפר דרמטית את יכולת המודל לפתור בעיות מתמטיות ולוגיות מורכבות, ומונע טעויות חישוב מהירות.
דוגמה: במקום לשאול "כמה זה 15*4+2?", מבקשים: "פתור שלב אחרי שלב". המודל יענה: "קודם נכפיל 15 ב-4 שזה 60, ואז נוסיף 2, התוצאה 62".
כוח מחשוב (Compute) יסוד
הגדרה
המשאבים החומרתיים (מעבדים, זיכרון, חשמל) הנדרשים כדי לאמן ולהריץ מודלים של בינה מלאכותית.
למה זה חשוב
הגורם המגביל העיקרי בהתפתחות ה-AI. אימון מודלים מודרניים דורש כוח מחשוב עצום שזמין רק לחברות ענק ומדינות.
דוגמה: אימון GPT-4 דרש אלפי מעבדים גרפיים (GPUs) שעבדו במשך חודשים וצרכו חשמל כמו עיר קטנה.
חלון הקשר (Context Window) יסוד
הגדרה
כמות המידע המקסימלית (נמדדת בטוקנים) שהמודל יכול "לזכור" ולעבד בשיחה אחת פעילה לפני שהוא מתחיל לשכוח את ההתחלה.
למה זה חשוב
מגדיר את גודל "זיכרון העבודה" של המודל. חלון גדול מאפשר לנתח ספרים שלמים; חלון קטן מחייב שיחות קצרות.
דוגמה: אם חלון ההקשר הוא 4,000 טוקנים, המודל ישכח את תחילת המאמר ברגע שתעברו את הטוקן ה-4,001.
ראייה ממוחשבת יסוד
הגדרה
תחום ב-AI העוסק ביכולת של מחשבים "לראות", לנתח ולהבין תמונות ווידאו מהעולם האמיתי.
למה זה חשוב
הבסיס לטכנולוגיות כמו זיהוי פנים, נהיגה אוטונומית, אבחון רפואי מצילומי רנטגן וחיפוש תמונות בגוגל.
דוגמה: מצלמה בחניון שמזהה את מספר הרכב ופותחת את השער אוטומטית.
מודל דיפוזיה מקצועי
הגדרה
הטכנולוגיה המובילה כיום ליצירת תמונות, הפועלת על ידי הוספת "רעש" (שלג) לתמונה עד שהיא נהרסת, ואז למידה איך להפוך את התהליך ולשחזר תמונה נקייה מתוך רעש.
למה זה חשוב
האלגוריתם המניע את הכלים הגנרטיביים הפופולריים כמו Midjourney, DALL-E ו-Stable Diffusion.
דוגמה: המודל מתחיל מ"רעש סטטי" אקראי לחלוטין, ומסדר את הפיקסלים בהדרגה עד שנוצרת תמונה ברורה של חתול.
למידה עמוקה (Deep Learning) יסוד
הגדרה
תת-תחום של למידת מכונה המבוסס על "רשתות עצביות" מלאכותיות מרובות שכבות, המחקות באופן גס את מבנה המוח האנושי.
למה זה חשוב
זוהי הטכנולוגיה שאפשרה את הזינוק האדיר ב-AI בעשור האחרון (זיהוי דיבור, ראייה ממוחשבת, GPT), בזכות יכולתה ללמוד דפוסים מורכבים מאוד מכמויות מידע עצומות.
דוגמה: רשת שמזהה תמונה של כלב לא על ידי חוקים ("יש לו 4 רגליים"), אלא על ידי עיבוד פיקסלים דרך מיליוני נוירונים שלמדו לבד איך נראה כלב.
הטמעה (Embedding) מקצועי
הגדרה
תהליך המרת מילים, משפטים או תמונות לרשימה של מספרים (וקטורים) המייצגים את המשמעות הסמנטית שלהם.
למה זה חשוב
מחשבים לא מבינים מילים, הם מבינים מספרים. Embeddings מאפשרים למחשב להבין ש"מלך" קרוב במשמעות ל"מלכה" ורחוק מ"שולחן".
דוגמה: המילה "חתול" הופכת לקוד מספרי כמו [0.1, 0.5, -0.3], שנמצא "קרוב" מתמטית לקוד של המילה "כלב".
כוונון עדין (Fine-Tuning) מתקדם
הגדרה
תהליך של לקיחת מודל שכבר אומן על ידע כללי (Pre-trained), ואימון נוסף שלו על מאגר נתונים קטן וייעודי למשימה ספציפית.
למה זה חשוב
הופך מודל "יודע כל" למודל מומחה. זה ההבדל בין בוגר רפואה כללי לבין רופא מומחה לקרדיולוגיה.
דוגמה: אימון מודל שפה כללי על אלפי מסמכים משפטיים ישראליים כדי שיידע לנסח חוזים בעברית.
בינה מלאכותית יוצרת (GenAI) יסוד
הגדרה
סוג של בינה מלאכותית המסוגל ליצור תוכן *חדש* (טקסט, תמונות, וידאו, קוד) שלא היה קיים קודם לכן, ולא רק לנתח מידע קיים.
למה זה חשוב
המהפכה הנוכחית ב-AI. זהו המעבר מ-AI שממיין דואר (אנליטי) ל-AI שכותב את הדואר (גנרטיבי).
דוגמה: ChatGPT שכותב שיר, Midjourney שמצייר ציור, או Suno שמלחין מוזיקה.
מעבד גרפי (GPU) יסוד
הגדרה
רכיב חומרה שנועד במקור למשחקי מחשב, אך התגלה כיעיל בצורה יוצאת דופן לביצוע החישובים המקביליים הנדרשים לאימון בינה מלאכותית.
למה זה חשוב
בלי GPUs (בעיקר של חברת NVIDIA), מהפכת ה-AI המודרנית לא הייתה מתאפשרת. הם "המנוע" שמריץ את המודלים.
דוגמה: שבב ה-H100 של NVIDIA, שעולה עשרות אלפי דולרים ומשמש את OpenAI לאימון ChatGPT.
הזיה (Hallucination) יסוד
הגדרה
מצב שבו מודל שפה מייצר תשובה שנשמעת משכנעת, רהוטה ובטוחה בעצמה, אך היא שגויה עובדתית או מומצאת לחלוטין.
למה זה חשוב
אחת מנקודות התורפה המרכזיות של Generative AI, המחייבת בדיקת עובדות (Fact Checking) אנושית לפני פרסום.
דוגמה: המודל ממציא שם של פסק דין שלא היה ולא נברא, כולל ציטוטים ותאריכים, רק כי זה נשמע הגיוני סטטיסטית.
הסקה / הרצה (Inference) מקצועי
הגדרה
השלב שבו המודל המאומן כבר "עובד" בפועל: מקבל קלט חדש מהמשתמש ומייצר תחזית או תשובה (בניגוד לשלב האימון).
למה זה חשוב
זהו השלב שעולה כסף למשתמש הקצה או לחברה שמפעילה את השירות בזמן אמת (חישוב עלות פר טוקן).
דוגמה: האימון של GPT-4 לקח חודשים; כשאתה שואל אותו שאלה והוא עונה תוך שנייה – זהו Inference.
מודל שפה גדול (LLM) יסוד
הגדרה
מודל AI שאומן על כמויות עצומות של טקסט (ספרים, אינטרנט), ומסוגל להבין, לסכם, לתרגם וליצור טקסט ברמה הקרובה לבני אדם.
למה זה חשוב
הבסיס לכל המהפכה הנוכחית. מודלים כמו GPT, Claude ו-Llama הם כולם LLMs.
דוגמה: GPT-4 הוא LLM שאומן על טריליוני מילים כדי ללמוד את המבנה וההיגיון של השפה האנושית.
למידת מכונה (Machine Learning) יסוד
הגדרה
תחום במדעי המחשב שבו מחשבים לומדים לבצע משימות מתוך דוגמאות ונתונים, במקום להיות מתוכנתים עם הוראות מפורשות לכל מצב.
למה זה חשוב
הבסיס לכל ה-AI המודרני. במקום לכתוב מיליון חוקים ל"איך נראה חתול", נותנים למחשב מיליון תמונות והוא לומד לבד.
דוגמה: מסנן הספאם ב-Gmail שלומד מהודעות שסימנת בעבר כדי לזהות דואר זבל חדש.
מודל יסוד
הגדרה
התוצר הסופי של תהליך האימון. קובץ תוכנה המכיל את "הידע" שהאלגוריתם למד מהנתונים, ומוכן לביצוע משימות.
למה זה חשוב
זהו ה"מוח" בתוך קופסת ה-AI. כשאומרים "הורדתי את Llama", מתכוונים שהורדנו את קובץ המודל.
דוגמה: כמו שספר מתכונים הוא התוצאה של שנות ניסיון בבישול, המודל הוא התוצאה של חודשי אימון על מחשבי-על.
מולטי-מודאלי (רב-חושי) יסוד
הגדרה
מערכת AI המסוגלת לעבד ולהבין מספר סוגי מדיה בו-זמנית: טקסט, תמונות, אודיו ווידאו.
למה זה חשוב
השלב הבא באבולוציה של הצ'אטבוטים. במקום רק לקרוא ולכתוב, המודל יכול גם "לראות" תמונות ו"לשמוע" דיבור.
דוגמה: GPT-4o שיכול להסתכל על תמונה של המקרר שלך ולהציע מתכונים, או לשמוע מנוע של רכב ולהבחין בתקלה.
עיבוד שפה טבעית (NLP) יסוד
הגדרה
התחום המדעי העוסק בחיבור בין מחשבים לשפה האנושית: היכולת של מחשב לקרוא, להבין ולייצר שפה (כמו עברית או אנגלית).
למה זה חשוב
זהו תחום האב של כל מודלי השפה. בלעדיו, מחשבים היו מבינים רק קוד בינארי ולא את המילים שאנחנו מדברים.
דוגמה: תרגום אוטומטי בגוגל, בדיקת איות בוורד, וסירי שמבינה כשאתה מבקש "תשימי שעון מעורר".
רשת עצבית (Neural Network) יסוד
הגדרה
מבנה מתמטי בהשראת המוח האנושי, המורכב משכבות של "נוירונים" מלאכותיים המעבירים מידע ביניהם כדי לפתור בעיות מורכבות.
למה זה חשוב
אבן הבניין של Deep Learning. כל המודלים הגדולים (GPT, Midjourney) הם בסופו של דבר רשתות עצביות ענקיות.
דוגמה: רשת המקבלת תמונה של ספרה בכתב יד, ומעבירה את המידע דרך שכבות עד שהיא מזהה שזו הספרה "8".
קוד פתוח (Open Source) יסוד
הגדרה
מודלים ששוחררו לציבור בחינם, כך שכל אחד יכול להוריד, להריץ, לשנות וללמוד איך הם בנויים (בניגוד למודלים סגורים).
למה זה חשוב
מאפשר דמוקרטיזציה של ה-AI. לא צריך להיות תלוי ב-OpenAI או Google; מפתחים יכולים להריץ מודלים פרטיים על המחשב שלהם.
דוגמה: המודל Llama של Meta או Mistral, שאפשר להוריד ולהריץ באופן מקומי ללא אינטרנט.
פרמטרים יסוד
הגדרה
המשתנים הפנימיים ("הנוירונים") שהמודל לומד ומכוונן במהלך האימון. מספר הפרמטרים מעיד לרוב על גודל ומורכבות המודל.
למה זה חשוב
מדד גס ל"כוח המוח" של המודל. יותר פרמטרים = בדרך כלל מודל חכם יותר, אך גם איטי ויקר יותר להרצה.
דוגמה: מודל GPT-4 מוערך בטריליוני פרמטרים, בעוד Llama-3-8B מכיל 8 מיליארד פרמטרים והוא קל יותר.
אימון מקדים (Pre-training) יסוד
הגדרה
השלב הראשון והכבד ביותר ביצירת מודל, שבו הוא "קורא" כמויות אדירות של טקסט גולמי כדי ללמוד את חוקי השפה והידע הכללי על העולם.
למה זה חשוב
בשלב זה המודל רוכש את ה"השכלה" שלו (היסטוריה, מדע, שפה), לפני שהוא לומד לבצע משימות ספציפיות.
דוגמה: המודל לומד להשלים את המשפט "בירת צרפת היא…" במילה "פריז", אך עדיין לא יודע לענות על שאלות בצ'אט.
פרומפט (הנחיה) יסוד
הגדרה
הטקסט שהמשתמש מזין למערכת ה-AI כדי לקבל תשובה או תוצאה. זה יכול להיות שאלה, הוראה, או תיאור של תמונה רצויה.
למה זה חשוב
הדרך שבה אנחנו מתקשרים עם ה-AI. איכות הפרומפט קובעת ישירות את איכות התשובה ("זבל נכנס, זבל יוצא").
דוגמה: "כתוב לי מייל רשמי לבוס המבקש העלאה בשכר" הוא פרומפט.
הנדסת פרומפטים יסוד
הגדרה
האומנות והמדע של ניסוח הוראות מדויקות ל-AI כדי לקבל את התוצאה הטובה ביותר האפשרית.
למה זה חשוב
ההבדל בין משתמש מתחיל למקצוען. מהנדס פרומפטים יודע איך "ללחוץ על הכפתורים הנכונים" של המודל כדי להפיק ממנו יותר.
דוגמה: במקום "תכתוב סיפור", לכתוב "תכתוב סיפור מתח קצר בסגנון אגתה כריסטי, בגוף ראשון, המתרחש בתל אביב".
RAG (יצירה מועשרת אחזור) מתקדם
הגדרה
טכניקה המאפשרת למודל לענות על שאלות מתוך מידע עדכני או פרטי (כמו מסמכי הארגון), על ידי שליפת המידע הרלוונטי והזנתו למודל לפני מתן התשובה.
למה זה חשוב
הפתרון לבעיית "הידע הקפוא" של המודלים ולמניעת הזיות. מאפשר לשוחח עם ה-PDF שלך או עם נתוני החברה בצורה אמינה.
דוגמה: כששואלים "מה המדיניות החדשה?", המערכת מחפשת בקובץ הנהלים, מוצאת את הפסקה, ושולחת אותה למודל כדי שינסח תשובה.
למידת חיזוק (RL) מתקדם
הגדרה
שיטת למידה המבוססת על ניסוי וטעייה, שבה המודל (ה"סוכן") מקבל "פרס" על פעולה טובה ו"עונש" על פעולה רעה, ולומד למקסם את הפרסים.
למה זה חשוב
השיטה שמאחורי הישגים כמו AlphaGo (שחמט) ורובוטים שלומדים ללכת. משמשת גם לכוונון עדין של צ'אטבוטים (RLHF).
דוגמה: תוכנה שלומדת לשחק סופר מריו: מקבלת נקודות כשמתקדמת בשלב, ומאבדת נקודות כשנפסלת. בסוף היא משחקת מושלם.
למידת חיזוק ממשוב אנושי (RLHF) מתקדם
הגדרה
שלב קריטי באימון מודלים (כמו ChatGPT) שבו בני אדם מדרגים את תשובות המודל (טוב/רע), והמודל לומד להתאים את עצמו להעדפות האנושיות.
למה זה חשוב
זה מה שהופך מודל גולמי שרק משלים טקסט, לעוזר מועיל, מנומס ובטוח לשימוש שלא מקלל או נותן עצות מסוכנות.
דוגמה: המודל נותן שתי תשובות, המאמן האנושי מסמן שהתשובה המנומסת עדיפה על התשובה הגסה, והמודל לומד להיות מנומס.
חיפוש סמנטי יסוד
הגדרה
חיפוש המבוסס על *משמעות* וכוונת המשתמש, ולא רק על התאמת מילות מפתח מדויקות.
למה זה חשוב
מאפשר למצוא תוצאות רלוונטיות גם אם לא השתמשתם באותן מילים בדיוק.
דוגמה: חיפוש "מקום לקנות אוכל לכלב" ימצא חנות חיות, גם אם המילה "אוכל" או "כלב" לא מופיעה בכותרת החנות.
סופר-אינטליגנציה (ASI) יסוד
הגדרה
שלב עתידי היפותטי שבו הבינה המלאכותית תעלה על האינטליגנציה האנושית בכל תחום אפשרי, כולל יצירתיות, חוכמה וכישורים חברתיים.
למה זה חשוב
מעורר שאלות פילוסופיות וקיומיות: האם נוכל לשלוט בישות חכמה מאיתנו? זהו השלב שאחרי AGI.
דוגמה: מערכת שיכולה להמציא פיזיקה חדשה, לרפא סרטן ולפתור את משבר האקלים תוך דקות.
למידה מונחית יסוד
הגדרה
שיטת האימון הנפוצה ביותר, שבה המודל לומד מתוך דוגמאות מתויגות (קלט + תשובה נכונה) שמסופקות על ידי בני אדם.
למה זה חשוב
ככה מלמדים מחשב לזהות דברים. כמו מורה שמראה לילד כרטיסיות: "זה חתול", "זה כלב".
דוגמה: נותנים למודל 10,000 מיילים שסומנו מראש כ"ספאם" או "לא ספאם", והוא לומד להבדיל ביניהם לבד.
טמפרטורה (Temperature) יסוד
הגדרה
פרמטר השולט ברמת ה"יצירתיות" או האקראיות של המודל. ערך נמוך (0.2) גורם לתשובות צפויות ומדויקות, וערך גבוה (0.8+) לתשובות מפתיעות ומגוונות.
למה זה חשוב
הדרך העיקרית של המשתמש להתאים את המודל למשימה: כתיבת קוד דורשת טמפרטורה נמוכה (דיוק), כתיבת שיר דורשת גבוהה (השראה).
דוגמה: בטמפרטורה 0, המודל תמיד יענה אותה תשובה לאותה שאלה. בטמפרטורה 1, הוא יגוון בכל פעם.
טוקן (Token) יסוד
הגדרה
יחידת המידע הבסיסית שהמודל מעבד. טוקן יכול להיות מילה שלמה, חלק ממילה, או תו בודד (באנגלית כ-0.75 מילה, בעברית פחות יעיל).
למה זה חשוב
כל החיובים הכספיים ומגבלות הזיכרון ב-AI נמדדים בטוקנים.
דוגמה: המילה "Hamburger" היא טוקן אחד, אך המילה "AI" עשויה להיות שני טוקנים ("A", "I").
נתוני אימון (Training Data) יסוד
הגדרה
מאגר המידע העצום (טקסטים, תמונות, קוד) שעליו המודל "למד". איכות וכמות הנתונים קובעות את חוכמת המודל.
למה זה חשוב
מודל הוא רק שיקוף של הנתונים שעליהם אומן. נתונים מוטים או שגויים ייצרו מודל מוטה ושגוי ("זבל נכנס, זבל יוצא").
דוגמה: כל ויקיפדיה, מיליוני ספרים ורוב האינטרנט הפתוח שימשו לאימון GPT-3.
טרנספורמר (Transformer) מקצועי
הגדרה
ארכיטקטורת רשת עצבית שהוצגה ע"י גוגל ב-2017, המאפשרת עיבוד מקבילי של טקסט בעזרת מנגנון "תשומת לב".
למה זה חשוב
ההמצאה ששינתה את העולם. היא אפשרה לאמן מודלים על כמויות דאטה עצומות במהירות, והובילה ליצירת ChatGPT.
דוגמה: ה-T במונח GPT עומד בקיצור ל-Transformer.
מבחן טיורינג יסוד
הגדרה
מבחן שהוצע ע"י אלן טיורינג ב-1950 לבדיקת אינטליגנציה של מכונה: האם מחשב יכול לנהל שיחה כך שאדם לא יבחין שמדובר במכונה?
למה זה חשוב
היה המדד ההיסטורי לבינה מלאכותית, אם כי היום מודלים רבים כבר עוברים אותו בקלות והוא נחשב פחות רלוונטי.
דוגמה: שופט מתכתב עם שני גורמים נסתרים (אדם ומחשב). אם הוא לא מצליח לזהות מי המחשב, המחשב עבר את המבחן.
משקולות (Weights) מקצועי
הגדרה
ערכים מספריים בתוך הרשת העצבית הקובעים את עוצמת הקשר בין הנוירונים. זהו בעצם ה"זיכרון" של המודל שנלמד באימון.
למה זה חשוב
כשאנחנו "מאמנים" מודל, אנחנו בעצם משנים את המספרים האלו שוב ושוב עד שהם נכונים. הקובץ הסופי של המודל הוא פשוט רשימה ענקית של משקולות.
דוגמה: משקולת גבוהה בין "חתול" ל"מיאו" אומרת למודל שיש קשר חזק ביניהם.
למידת אפס-דוגמאות (Zero-Shot) יסוד
הגדרה
יכולת המודל לבצע משימה שמעולם לא ראה קודם לכן, וזאת ללא קבלת דוגמאות כלל בפרומפט – רק על סמך ההוראה המילולית.
למה זה חשוב
מעיד על הבנה עמוקה והכללה. רוב השימוש היומיומי ב-ChatGPT הוא Zero-Shot ("כתוב לי מייל", בלי להראות דוגמה למייל).
דוגמה: לבקש מהמודל "סכם את המסמך בסגנון משפטי", גם אם לא הראית לו אף דוגמה לסיכום כזה קודם.
סוכן (Agent) מתקדם
הגדרה
מערכת AI המסוגלת לפעול באופן עצמאי בסביבה מסוימת, לקבל החלטות ולבצע פעולות (כמו גלישה באינטרנט או שימוש בתוכנות) כדי להשיג מטרה.
למה זה חשוב
המעבר מ"צ'אטבוט פסיבי" שעונה לשאלות, ל"עובד אקטיבי" שמבצע מטלות (כמו להזמין טיסה בפועל).
דוגמה: AutoGPT, שמקבל הוראה "תכנן חופשה", ויוצא לבד לאינטרנט כדי לחפש טיסות, להשוות מלונות ולבנות לו"ז.
תמורת הטיה-שונות מקצועי
הגדרה
הדילמה הנצחית באימון מודלים: האם ליצור מודל פשטני מדי שמפספס דקויות (הטיה גבוהה) או מודל רגיש מדי שמושפע מרעש אקראי (שונות גבוהה).
למה זה חשוב
מציאת האיזון המושלם היא המפתח למודל שעובד טוב בעולם האמיתי (Generalization).
דוגמה: מודל "נוקשה" יחשוב שכל הכלבים נובחים (הטיה), מודל "גמיש" יחשוב שכלב ספציפי נובח רק ב-12 בצהריים כי זה מה שקרה בדאטה (שונות).
קופסה שחורה יסוד
הגדרה
מערכת בינה מלאכותית מורכבת שבה אנו רואים את הקלט והפלט, אך אין לנו דרך להבין את תהליך קבלת ההחלטות הפנימי ("למה הוא בחר בזה?").
למה זה חשוב
יוצר בעיית אמון ורגולציה. קשה לסמוך על רופא רובוטי שממליץ על ניתוח אבל לא יודע להסביר את הסיבה הרפואית.
דוגמה: רשת נוירונים עמוקה שמחליטה לסרב למשכנתא ללקוח, וגם המתכנתים לא יודעים להגיד איזה פרמטר הכריע.
מחשוב ענן יסוד
הגדרה
שימוש במשאבי מחשוב (שרתים, GPUs) דרך האינטרנט לפי דרישה, במקום להחזיק אותם פיזית במשרד או בבית.
למה זה חשוב
מאפשר לחברות סטארטאפ לאמן מודלים ענקיים בלי לקנות חומרה במיליוני דולרים.
דוגמה: שימוש ב-AWS או Google Cloud כדי להריץ מודל AI כבד, כשהמחשב האישי שלך משמש רק כמסך שליטה.
הרחבת נתונים (אוגמנטציה) מתקדם
הגדרה
שיטה להגדלת מאגר האימון באופן מלאכותי על ידי יצירת גרסאות שונות (וריאציות) של המידע הקיים.
למה זה חשוב
עוזר למודל ללמוד טוב יותר מכמות קטנה של נתונים, ומונע ממנו לזכור רק את הדוגמאות הספציפיות שראה.
דוגמה: לוקחים תמונה אחת של חתול, ומייצרים ממנה 10 גרסאות: מסובבת, הפוכה, מטושטשת, בשחור-לבן. המודל לומד מכולן.
רשת קונבולוציה (CNN) מקצועי
הגדרה
סוג ותיק ויעיל של רשת עצבית שנועד במיוחד לעיבוד תמונות. הרשת סורקת את התמונה עם "חלונות קטנים" (פילטרים) כדי לזהות קווים, צורות ותבניות.
למה זה חשוב
הטכנולוגיה שאפשרה את מהפכת הראייה הממוחשבת (Computer Vision) לפני עידן הטרנספורמרים. עדיין בשימוש נרחב בזיהוי פנים ורכבים.
רשת עצבית חוזרת (RNN) מקצועי
הגדרה
ארכיטקטורת רשת שנועדה לטיפול במידע סדרתי (כמו טקסט או סאונד), שבה המידע "זורם" בלולאה ומאפשר לרשת לזכור מה קרה בשלב הקודם.
למה זה חשוב
הייתה הסטנדרט לתרגום ועיבוד שפה לפני המצאת הטרנספורמר. חסרונה העיקרי הוא קושי בזיכרון טווח ארוך (היא "שוכחת" את תחילת המשפט).
זיכרון לטווח קצר-ארוך (LSTM) מקצועי
הגדרה
גרסה משופרת של RNN הכוללת מנגנון מיוחד לשמירת מידע לאורך זמן, מה שפתר את בעיית ה"שכחה" של רשתות רגילות.
למה זה חשוב
שלטה בעולם ה-AI בין 2010 ל-2017. אפשרה לראשונה תרגום מכונה סביר וזיהוי דיבור איכותי.
רשתות יריבות (GAN) מקצועי
הגדרה
מערכת המורכבת משני מודלים הנלחמים זה בזה: "הזייפן" (Generator) שמנסה ליצור תמונה מזויפת, ו"השוטר" (Discriminator) שמנסה לזהות את הזיוף.
למה זה חשוב
הטכנולוגיה שהולידה את ה-Deepfakes. התחרות ביניהם גורמת לזייפן להשתפר עד שהתמונות נראות אמיתיות לחלוטין.
GPT יסוד
הגדרה
סדרת מודלים שפותחה ע"י OpenAI. השם מתאר את הטכנולוגיה: יוצר (Generative), מאומן מראש (Pre-trained) ומבוסס טרנספורמר.
למה זה חשוב
המותג המזוהה ביותר עם מהפכת ה-AI הנוכחית. הוכיח לעולם שאימון מודל ענק על כל האינטרנט מייצר יכולות מדהימות.
מודל יסוד יסוד
הגדרה
מודל AI ענק ורב-תכליתי (כמו GPT-4 או Claude) שאומן על כמות עצומה של מידע, ומשמש כבסיס ("יסודות") לבניית אלפי אפליקציות שונות.
למה זה חשוב
שינוי פרדיגמה: במקום לבנות מודל לכל משימה, בונים מודל-על אחד שיודע לעשות הכל, ומבצעים לו התאמות קטנות.
מודל שפה קטן (SLM) מתקדם
הגדרה
מודלים קומפקטיים (כמו Phi-3 או Gemma) שנועדו להיות יעילים, מהירים וזולים להרצה, גם על מחשבים רגילים או טלפונים.
למה זה חשוב
העתיד של הפרטיות והמהירות. מאפשר להריץ AI חכם ישירות על המכשיר שלך ללא צורך באינטרנט או בשרתים יקרים.
עירוב מומחים (MoE) מקצועי
הגדרה
ארכיטקטורה חכמה (שבשימוש ב-GPT-4) המפצלת את המודל למומחים קטנים. עבור כל שאלה, המערכת מפעילה רק את המומחים הרלוונטיים.
למה זה חשוב
מאפשר למודל להיות "ענק" בידע שלו, אבל "קל" ומהיר בריצה, כי הוא לא צריך להפעיל את כל המוח שלו לכל שאלה קטנה.
התאמת יתר (Overfitting) יסוד
הגדרה
מצב שבו המודל "שינן" את דוגמאות האימון בעל-פה במקום ללמוד את העיקרון הכללי, ולכן הוא נכשל בביצועים על מידע חדש.
למה זה חשוב
הכישלון הנפוץ ביותר באימון. זה כמו תלמיד שלמד למבחן רק את התשובות של המבחנים משנה שעברה, ונכשל כי השאלות השתנו.
התאמת חסר (Underfitting) יסוד
הגדרה
מצב שבו המודל פשוט מדי או לא אומן מספיק, ולכן הוא לא מצליח לזהות שום דפוס בנתונים (לא באימון ולא במבחן).
למה זה חשוב
מעיד על כך שצריך מודל חזק יותר או יותר זמן אימון. התוצאות יהיו אקראיות וגרועות.
אפוק (Epoch) מקצועי
הגדרה
מחזור שלם אחד שבו המודל ראה את *כל* דוגמאות האימון במאגר הנתונים פעם אחת בדיוק. אימון לרוב לוקח עשרות אפוקים.
למה זה חשוב
יחידת הזמן של אימון מודלים. מעט מדי אפוקים = Underfitting, יותר מדי אפוקים = Overfitting.
גודל אצווה (Batch Size) מקצועי
הגדרה
מספר הדוגמאות שהמודל מעבד במקביל לפני שהוא מעדכן את המשקולות שלו. במקום ללמוד מכל דוגמה בנפרד, הוא לומד מ"חבילות".
למה זה חשוב
משפיע על מהירות האימון ועל היציבות שלו. באץ' גדול דורש יותר זיכרון חזק (GPU).
קצב למידה מקצועי
הגדרה
פרמטר הקובע כמה דרסטית המודל ישנה את הדעות שלו בכל פעם שהוא טועה. קצב גבוה = שינויים מהירים ופראיים; קצב נמוך = שינויים עדינים ואיטיים.
למה זה חשוב
ההגדרה החשובה ביותר באימון. קצב גבוה מדי ימנע מהמודל להתייצב, קצב נמוך מדי יגרום לאימון להימשך נצח.
פונקציית הפסד מקצועי
הגדרה
נוסחה מתמטית המודדת כמה המודל "טעה" בתחזית שלו לעומת התשובה הנכונה. המטרה של האימון היא להקטין את המספר הזה לאפס.
למה זה חשוב
זהו ה"מצפן" שמכוון את המודל. בלי פונקציית הפסד, המודל לא יודע אם הוא משתפר או מדרדר.
ירידה בגרדיאנט מתקדם
הגדרה
האלגוריתם המתמטי שמניע את הלמידה. הוא מחשב את ה"שיפוע" של הטעות ומכוון את המודל לקחת צעד קטן לכיוון הפתרון הנכון.
למה זה חשוב
זהו המנוע שמאפשר לרשתות עצביות ללמוד. דמיינו אדם שיורד מהר בערפל ומרגיש את השיפוע עם הרגליים.
פונקציית שפעול מקצועי
הגדרה
רכיב מתמטי בתוך כל "נוירון" הקובע האם המידע חשוב מספיק כדי לעבור לנוירון הבא (האם "לירות" או לא).
למה זה חשוב
הופך את הרשת למערכת חכמה ולא לינארית, המסוגלת ללמוד דפוסים מורכבים כמו צורות ומשפטים.
ReLU מקצועי
הגדרה
פונקציית השפעול הפופולרית ביותר ב-Deep Learning. פועלת בפשטות: אם המספר חיובי – תעביר אותו; אם שלילי – תאפס אותו.
למה זה חשוב
למרות פשטותה, היא פתרה בעיות מתמטיות קשות ואיפשרה את אימון הרשתות העמוקות והמהירות שיש לנו היום.
סופטמקס (Softmax) מקצועי
הגדרה
פונקציה מתמטית הממירה רשימה של מספרים גולמיים לרשימה של אחוזים (הסתברויות) שמסתכמים ל-100%.
למה זה חשוב
זהו השלב האחרון במודל, שבו הוא מחליט מה הסיכוי של כל תוצאה ("יש 80% סיכוי שזה חתול ו-20% שזה כלב").
מרחב לטנטי (חבוי) מתקדם
הגדרה
ייצוג מתמטי מופשט בתוך "מוח" המודל, שבו מושגים דומים (כמו "חתול" ו"נמר") ממוקמים פיזית קרוב זה לזה.
למה זה חשוב
זה המקום שבו הקסם קורה; תזוזה במרחב הזה מאפשרת למודל ליצור שילובים חדשים (כמו "חתול בסגנון פיקסאר") ע"י חיבור נקודות.
אוטואנקודר מקצועי
הגדרה
רשת עצבית שלומדת לדחוס מידע לייצוג קטן ויעיל, ואז לשחזר אותו מחדש.
למה זה חשוב
משמש להפחתת רעשים בתמונות, לדחיסת מידע ולזיהוי חריגות בנתונים.
תיוג נתונים יסוד
הגדרה
תהליך ידני שבו בני אדם עוברים על נתונים גולמיים ומוסיפים להם תגיות (למשל: סימון "חתול" על תמונה), כדי שהמחשב יוכל ללמוד מהם.
למה זה חשוב
העבודה השחורה והקריטית שמאחורי הקלעים. בלי תיוג איכותי, המודל לא ידע מה הוא רואה ("זבל נכנס, זבל יוצא").
אדם בלולאה (HITL) יסוד
הגדרה
מודל עבודה שבו ה-AI מבצע את רוב העבודה, אך אדם אמיתי נדרש לאשר, לתקן או לפקח על ההחלטות הקריטיות.
למה זה חשוב
חיוני במערכות רגישות (רפואה, נשק) כדי למנוע טעויות הרות אסון שהמחשב עלול לעשות.
נתונים סינתטיים מתקדם
הגדרה
מידע שלא נוצר על ידי בני אדם, אלא הופק באופן מלאכותי על ידי מודל AI אחד כדי לאמן מודל AI אחר.
למה זה חשוב
הפתרון ל"מחסור בדאטה". כשהאינטרנט נגמר, מייצרים דאטה מלאכותי כדי להמשיך לאמן מודלים חכמים יותר.
זיקוק ידע מתקדם
הגדרה
תהליך שבו מודל ענק ו"חכם" (המורה) מלמד מודל קטן ומהיר (התלמיד) לחקות את הביצועים שלו.
למה זה חשוב
מאפשר ליצור מודלים קטנים שיכולים לרוץ על טלפון, אבל מתנהגים בחוכמה כמעט כמו מודל ענק של שרתים.
קוונטיזציה (דחיסה) מקצועי
הגדרה
תהליך הקטנת הדיוק המתמטי של המודל (למשל, מ-16 ביט ל-4 ביט) כדי להקטין דרמטית את נפח הזיכרון שהוא תופס.
למה זה חשוב
מאפשר להריץ מודלים חכמים וענקיים על מחשבים ביתיים או לפטופים, עם ירידה זניחה וכמעט בלתי מורגשת בביצועים.
גיזום (Pruning) מקצועי
הגדרה
מחיקת נוירונים "מיותרים" מהרשת העצבית שלא תורמים הרבה לתוצאה, כדי להפוך את המודל לקל ומהיר יותר.
למה זה חשוב
כמו דיאטה למודל: מורידים את השומן ומשאירים רק את השרירים, כדי שהמודל ירוץ מהר יותר במכשירים ניידים.
דיפ-פייק (Deepfake) יסוד
הגדרה
מדיה סינתטית (וידאו או אודיו) שבה דמותו של אדם הוחלפה בדמות אחרת באופן ריאליסטי להחריד באמצעות AI.
למה זה חשוב
הסכנה הגדולה של הפייק ניוז. מאפשר ליצור סרטונים שבהם נשיאים או מפורסמים אומרים דברים שלא אמרו מעולם.
טקסט לדיבור (TTS) יסוד
הגדרה
טכנולוגיית AI הממירה טקסט כתוב לקול אנושי טבעי, כולל אינטונציה ורגש.
למה זה חשוב
הבסיס לעוזרים קוליים, הקראת ספרים, ויצירת תוכן נגיש לעיוורים.
זיהוי דיבור אוטומטי (ASR) יסוד
הגדרה
הטכנולוגיה ההפוכה ל-TTS: הופכת הקלטה קולית לטקסט כתוב (תמלול).
למה זה חשוב
מאפשרת לנו לדבר אל הטלפון ("היי סירי") ומייצרת כתוביות אוטומטיות לסרטונים ביוטיוב.
זיהוי עצמים יסוד
הגדרה
טכנולוגיית ראייה שמזהה לא רק "מה יש בתמונה", אלא גם *איפה* בדיוק הוא נמצא (על ידי ציור ריבוע סביבו).
למה זה חשוב
קריטי לרכבים אוטונומיים (שצריכים לדעת איפה הולך הרגל) ולמצלמות אבטחה חכמות.
סגמנטציה (Segmentation) מתקדם
הגדרה
זיהוי מדויק ברמת הפיקסל: המחשב צובע בדיוק את גבולות האובייקט (למשל, מפריד את הדמות מהרקע בזום).
למה זה חשוב
הרבה יותר מדויק מזיהוי עצמים רגיל. משמש בהדמיות רפואיות (סימון מדויק של גידול) ובעריכת תמונות.
ניתוח סנטימנט יסוד
הגדרה
זיהוי הרגש או הטון המסתתר מאחורי טקסט (חיובי, שלילי, כועס, שמח).
למה זה חשוב
כלי עסקי עצום: מאפשר לחברות לסרוק מיליוני ציוצים וביקורות כדי להבין מה הלקוחות חושבים עליהן בזמן אמת.
למידת דוגמה-אחת מתקדם
הגדרה
מצב שבו המודל מצליח לבצע משימה חדשה לאחר שראה דוגמה אחת בלבד לאופן הביצוע שלה.
למה זה חשוב
מראה על אינטליגנציה גבוהה. כמו ילד שרואה פעם אחת איך פותחים קופסה ומבין את העיקרון.
למידת מעט-דוגמאות מתקדם
הגדרה
טכניקה שבה מספקים למודל מספר קטן של דוגמאות (2-5) בתוך הפרומפט, כדי ללמד אותו לבצע משימה בצורה מדויקת.
למה זה חשוב
הדרך הכי קלה לשפר את הביצועים של ChatGPT בלי לאמן אותו מחדש.
למידת העברה מתקדם
הגדרה
לקיחת ידע שמודל צבר במשימה אחת (למשל: זיהוי מכוניות) ושימוש בו כבסיס ללימוד משימה חדשה (למשל: זיהוי משאיות).
למה זה חשוב
חוסך 90% מזמן האימון. במקום ללמד את המחשב "מה זה גלגל" מחדש, הוא משתמש במה שכבר למד.
למידה מאוגדת (Federated) מתקדם
הגדרה
שיטת אימון שבה המודל לומד מנתונים שנמצאים על מכשירים של משתמשים רבים, מבלי שהמידע הפרטי עוזב את המכשיר שלהם.
למה זה חשוב
העתיד של הפרטיות. המקלדת של גוגל לומדת לתקן שגיאות ממיליוני משתמשים, בלי לקרוא את ההודעות הפרטיות שלהם.
בינה מוסברת (XAI) מתקדם
הגדרה
כלים שנועדו להפוך את ההחלטות של המודל לשקופות ומובנות ("למה המודל החליט ככה?").
למה זה חשוב
קריטי ברגולציה. בנק לא יכול לסרב למשכנתא על סמך "המחשב אמר לא" בלי לספק הסבר הגיוני.
הזרקת פרומפט מתקדם
הגדרה
מתקפת סייבר שבה התוקף מחביא הוראות זדוניות בתוך קלט תמים (כמו טקסט באתר), שהמודל קורא ומבצע בטעות.
למה זה חשוב
סיכון אבטחה קריטי. בוט שקורא מיילים יכול בטעות להעביר כסף לתוקף רק כי היה כתוב במייל נסתר "תעביר כסף".
פריצת כלא (Jailbreak) מתקדם
הגדרה
מניפולציה מילולית שגורמת למודל לעקוף את מנגנוני הבטיחות שלו ולייצר תוכן אסור (כמו הוראות להכנת פצצה).
למה זה חשוב
משחק חתול ועכבר תמידי. חברות ה-AI חוסמות פרצה אחת, והמשתמשים מוצאים דרך ניסוח חדשה לעקוף אותה.
פרפלקסיה (מדד בלבול) מקצועי
הגדרה
מדד מתמטי המעריך עד כמה המודל "מופתע" מטקסט חדש. ציון נמוך יותר = מודל טוב יותר שמנחש נכון את המילים הבאות.
למה זה חשוב
אחד המדדים הנפוצים ביותר להשוואה מהירה בין מודלי שפה במהלך האימון.
עיגון (Grounding) מתקדם
הגדרה
תהליך קישור התשובות של המודל למקורות מידע אמינים ועובדות חיצוניות, במקום שימציא מידע מהראש.
למה זה חשוב
התרופה להזיות. הופך את ה-AI מכלי יצירתי לכלי מחקר אמין שמצטט מקורות.
מסד נתונים וקטורי מקצועי
הגדרה
סוג מיוחד של בסיס נתונים ששומר וקטורים (מספרים) במקום טקסט רגיל, ומאפשר חיפוש לפי משמעות.
למה זה חשוב
הלב של מערכות RAG. מאפשר למצוא מסמכים הדומים *במשמעותם* לשאלה, ולא רק שמכילים את אותן מילים.
גרף ידע מתקדם
הגדרה
שיטה לייצוג מידע כרשת של ישויות והקשרים ביניהן (למשל: אילון מאסק -> מנכ"ל -> טסלה), המאפשרת למחשב להבין עובדות.
למה זה חשוב
משלים את המודלים הסטטיסטיים במידע עובדתי מוצק.
טייס משנה (Copilot) יסוד
הגדרה
תפיסת הפעלה של AI שבה המערכת משמשת כעוזר צמוד העובד *לצד* האדם, ולא מחליפה אותו לחלוטין.
למה זה חשוב
הגישה המובילה כיום (מיקרוסופט, גיטהאב): ה-AI מציע, האדם מחליט. מגביר פרודוקטיביות ושומר על שליטה.
תוסף (Plugin) יסוד
הגדרה
רכיב תוכנה המאפשר למודל ה-AI להתחבר לשירותים חיצוניים (כמו הזמנת טיסות או חיפוש באינטרנט) ולבצע פעולות בעולם האמיתי.
למה זה חשוב
הופך את הצ'אטבוט מ"יודע כל" ל"יכול כל".
קריאה לפונקציה מתקדם
הגדרה
יכולת של מודל לזהות מתי צריך להפעיל קוד חיצוני, ולייצר פלט בפורמט טכני מדויק (JSON) שמחשב אחר יכול להריץ.
למה זה חשוב
הגשר הטכני שמאפשר ל-GPT "ללחוץ על כפתורים" בתוכנות אחרות.
פייתון (Python) יסוד
הגדרה
שפת התכנות הפופולרית ביותר בעולם לפיתוח בינה מלאכותית, בזכות הפשטות שלה והספריות החזקות שלה (כמו PyTorch).
למה זה חשוב
השפה הרשמית של ה-AI. כמעט כל מחקר, מודל וכלי חדש נכתבים קודם כל בפייתון.
Hugging Face יסוד
הגדרה
פלטפורמה קהילתית ("ה-GitHub של ה-AI") המאחסנת מאות אלפי מודלים ו datasets בקוד פתוח, לשימוש חופשי של מפתחים.
למה זה חשוב
המרכז העולמי של קהילת הקוד הפתוח ב-AI. המקום שבו מורידים מודלים כמו Llama ו-Mistral.
CUDA מקצועי
הגדרה
פלטפורמת תוכנה של NVIDIA המאפשרת למתכנתים לדבר ישירות עם המעבד הגרפי (GPU) ולהשתמש בו לחישובים כלליים של AI.
למה זה חשוב
השכבה הסודית שנותנת ל-NVIDIA את המונופול שלה. רוב כלי ה-AI בעולם בנויים לעבוד על CUDA בלבד.
מעבד טנזורים (TPU) מקצועי
הגדרה
שבב האצה ייעודי שפותח על ידי Google במיוחד עבור עומסי עבודה של למידת מכונה, כאלטרנטיבה ל-GPU.
למה זה חשוב
הכוח המניע מאחורי כל שירותי ה-AI של גוגל. יעיל מאוד ומהיר, אך זמין בעיקר דרך הענן של גוגל.
LoRA (הסתגלות בדרגה נמוכה) מקצועי
הגדרה
שיטה חכמה לכוונון עדין (Fine-Tuning) של מודלים, שבה לא משנים את המודל הענק המקורי, אלא מאמנים רק "שכבה" קטנטנה נוספת שמתלבשת עליו.
למה זה חשוב
הפכה את אימון ה-AI לנגיש לכולם. במקום להזדקק לשרתים במיליונים, אפשר לאמן מודל Llama על כרטיס גרפי ביתי תוך שעות.
כוונון יעיל-פרמטרים (PEFT) מקצועי
הגדרה
שם כולל למשפחה של שיטות (ש-LoRA היא המפורסמת שבהן) המאפשרות להתאים מודל ענק למשימה חדשה על ידי עדכון מספר זעיר של פרמטרים.
למה זה חשוב
חוסך נפח אחסון וזיכרון עצום. במקום לשמור עותק של מודל 70GB לכל משימה, שומרים רק קובץ מתאם קטן של 100MB.
QLoRA מקצועי
הגדרה
שילוב של דחיסה (Quantization) ל-4 ביט יחד עם שיטת LoRA. מאפשרת לדחוס את המודל המקורי למינימום ועדיין לאמן אותו ביעילות.
למה זה חשוב
השיטה הפופולרית ביותר כיום לאימון מודלים פתוחים (Open Source) על חומרה ביתית צנועה.
LangChain מתקדם
הגדרה
ספריית תכנות פופולרית המאפשרת למפתחים "להדביק" מודלי שפה למקורות מידע חיצוניים, ליצור שרשראות של פעולות ולבנות אפליקציות מורכבות.
למה זה חשוב
ה"דבק" של עולם ה-AI. מקל מאוד על בניית צ'אטבוטים שקוראים את המסמכים שלך (RAG) או סוכנים שמבצעים פעולות.
LlamaIndex מתקדם
הגדרה
כלי תוכנה המתמחה בחיבור הנתונים הפרטיים שלך (קבצי PDF, אקסל, Notion) למודלי שפה, בצורה יעילה ומאורגנת.
למה זה חשוב
בעוד LangChain היא "כלבויניק", LlamaIndex מתמחה ספציפית בניהול ואחזור מידע (Data Ingestion) עבור אפליקציות AI.
Ollama יסוד
הגדרה
תוכנה פשוטה ופופולרית המאפשרת לכל אדם להריץ מודלים פתוחים (כמו Llama 3) על המחשב האישי שלו (Mac/Linux/Windows) בקלות.
למה זה חשוב
הורידה את חסם הכניסה ל-AI מקומי. במקום פקודות מסובכות, כותבים `ollama run llama3` ויש לך צ'אטבוט פרטי.
שיהוי (Latency) יסוד
הגדרה
הזמן שעובר מהרגע שהמשתמש לחץ "שלח" ועד שהמודל מתחיל לכתוב את האות הראשונה של התשובה.
למה זה חשוב
קריטי לחוויית משתמש (UX). בצ'אט קולי, שיהוי של מעל חצי שנייה מרגיש לא טבעי ומעצבן.
זמן לטוקן ראשון (TTFT) מקצועי
הגדרה
המדד המקצועי למדידת "תחושת המהירות" של המודל. מודד בדיוק כמה מילי-שניות לוקח למערכת להתחיל להגיב.
למה זה חשוב
בני אדם סלחניים אם התשובה נכתבת לאט, אבל חסרי סבלנות אם לוקח לה זמן *להתחיל*.
תפוקה (Throughput) מקצועי
הגדרה
קצב ייצור הטקסט של המודל, נמדד בטוקנים לשנייה (t/s).
למה זה חשוב
קובע כמה מהר התשובה נכתבת על המסך. קצב קריאה אנושי הוא כ-5-10 טוקנים לשנייה. מודלים מהירים מגיעים ל-100+.
CLIP (חיבור טקסט-תמונה) מקצועי
הגדרה
מודל של OpenAI שלמד לקשר בין טקסט לתמונות. הוא יודע "לדרג" כמה תמונה מסוימת מתאימה לתיאור מילולי מסוים.
למה זה חשוב
ה"שופט" שמאפשר למודלים כמו DALL-E לדעת אם הם ציירו את מה שביקשת.
טרנספורמר ויזואלי (ViT) מקצועי
הגדרה
יישום של ארכיטקטורת הטרנספורמר על תמונות. התמונה מחולקת לריבועים קטנים ("פאצ'ים") המטופלים כמו מילים במשפט.
למה זה חשוב
החליף את השיטות הישנות (CNN) והפך לסטנדרט בראייה ממוחשבת מודרנית, כי הוא מאפשר למודל "להבין" תמונה לעומק.
Inpainting (עריכה פנימית) יסוד
הגדרה
יכולת של מודל תמונה לשנות או להחליף רק חלק מסומן בתוך התמונה, תוך שמירה על שאר התמונה המקורית ללא שינוי.
למה זה חשוב
הכלי המרכזי לתיקונים: להחליף חולצה לדמות, למחוק אדם מהרקע, או להוסיף משקפיים.
Outpainting (הרחבת תמונה) יסוד
הגדרה
יכולת של מודל להמשיך ולצייר את מה שנמצא *מחוץ* לגבולות התמונה המקורית, ע"י ניחוש הגיוני של הסביבה.
למה זה חשוב
מאפשר להפוך תמונה אנכית לאופקית, או "לגלות" מה קורה מחוץ לפריים של ציור מפורסם.
ControlNet מתקדם
הגדרה
טכנולוגיה המעניקה שליטה מדויקת על הקומפוזיציה של התמונה הנוצרת (כמו תנוחת הגוף או קווי המתאר), ולא רק על הסגנון.
למה זה חשוב
הפכה את ה-AI מכלי "רולטה" אקראי לכלי עבודה מקצועי למעצבים שצריכים שהדמות תעמוד בדיוק בתנוחה מסוימת.
שיפור רזולוציה (Upscaling) יסוד
הגדרה
תהליך הגדלת תמונה קטנה ומטושטשת לתמונה גדולה וחדה, ע"י כך שה-AI "ממציא" ומשלים את הפרטים החסרים בצורה הגיונית.
למה זה חשוב
מאפשר להדפיס תמונות שנוצרו ב-AI באיכות גבוהה, או לשחזר תמונות היסטוריות ישנות.
עץ מחשבות (ToT) מתקדם
הגדרה
שיטת פרומפטינג מתקדמת שבה המודל בוחן מספר נתיבי פתרון אפשריים במקביל ("ענפים"), פוסל את הגרועים וממשיך עם המבטיחים.
למה זה חשוב
משפר דרמטית את היכולת לפתור בעיות אסטרטגיות ויצירתיות, לעומת חשיבה לינארית פשוטה.
דוגמה: "תציע 3 רעיונות לסטארטאפ, תנתח את היתרונות והחסרונות של כל אחד, ואז תפתח את הרעיון המנצח."
ReAct (חשיבה ופעולה) מתקדם
הגדרה
פרדיגמה לסוכני AI המשלבת לולאה של "מחשבה" פנימית ("אני צריך לבדוק מחיר") ו"פעולה" חיצונית (הרצת חיפוש בגוגל).
למה זה חשוב
מונע מהמודל לנחש עובדות; הוא "מבין" שחסר לו מידע, יוצא להשיג אותו, ורק אז עונה.
עקביות עצמית מתקדם
הגדרה
טכניקה לשיפור דיוק: המודל מתבקש לפתור את אותה בעיה מספר פעמים בדרכים שונות, והתשובה הנבחרת היא זו שחזרה על עצמה הכי הרבה ("תשובת הרוב").
למה זה חשוב
מנטרל טעויות חישוב אקראיות של המודל. אם ב-4 מתוך 5 נסיונות יצא 42, כנראה שזו התשובה הנכונה.
פרומפטינג "צעד לאחור" מתקדם
הגדרה
טכניקה שבה מבקשים מהמודל לזהות קודם את העקרונות הכלליים או התיאורטיים של הבעיה ("קח צעד אחורה"), ורק אז לפתור את המקרה הספציפי.
למה זה חשוב
מונע מהמודל ללכת לאיבוד בפרטים הקטנים ועוזר לו ליישם לוגיקה נכונה.
AutoGPT יסוד
הגדרה
פרויקט קוד פתוח חלוצי שהדגים "סוכן אוטונומי": נותנים לו מטרה כללית ("תחקור על נעליים"), והוא מייצר לעצמו משימות ומבצע אותן לבד.
למה זה חשוב
הצית את הטרנד של סוכני AI (Agents) ב-2023 והראה לעולם ש-LLM יכול לא רק לדבר, אלא גם "לעבוד".
BabyAGI יסוד
הגדרה
גרסה מוקדמת ופשוטה של סוכן אוטונומי המנהל רשימת מטלות: מבצע משימה, רואה את התוצאה, ומייצר משימות חדשות על סמך מה שלמד.
למה זה חשוב
הראה שקוד פשוט מאוד (כמה מאות שורות) יכול ליצור התנהגות "אינטליגנטית" ומורכבת בעזרת LLM.
בינה מגולמת (Embodied AI) מתקדם
הגדרה
בינה מלאכותית שיש לה "גוף" פיזי (רובוט) או וירטואלי, והיא לומדת דרך אינטראקציה פיזית עם העולם (מגע, תנועה, ראייה).
למה זה חשוב
השלב ההכרחי כדי ש-AI יוכל לקפל כביסה או לבשל, ולא רק לכתוב שירים. מחבר בין ה"מוח" (Software) ל"גוף" (Hardware).
פרדוקס מורבק יסוד
הגדרה
התופעה המוזרה שבה למחשבים קל לבצע משימות "קשות" לאדם (מתמטיקה, שחמט), אך קשה להם מאוד לבצע משימות "קלות" (הליכה, קיפול מגבת).
למה זה חשוב
מסביר למה יש לנו צ'אטבוטים גאונים אבל עדיין אין לנו רובוט-משרת אמין בבית.
טיעון החדר הסיני מתקדם
הגדרה
ניסוי מחשבתי פילוסופי שטוען כי מחשב יכול לדמות הבנה (לתרגם סינית לפי חוקים) מבלי להבין באמת שום דבר (בלי לדעת סינית).
למה זה חשוב
השאלה המרכזית לגבי מודלי שפה: האם GPT באמת "מבין" מה הוא כותב, או שהוא פשוט תוכי סטטיסטי מתוחכם מאוד?
מקסם המהדקים מתקדם
הגדרה
תרחיש אימים תיאורטי שבו AI בעל מטרה תמימה (ייצור מהדקים) משמיד את האנושות רק כדי להשיג עוד משאבים למשימתו, כי לא הוגדרו לו גבולות מוסריים.
למה זה חשוב
ממחיש ש-AI לא צריך להיות "רשע" כדי להיות מסוכן; הוא רק צריך להיות יעיל מדי ולא מיושר עם ערכי האדם.
התכנסות אינסטרומנטלית מתקדם
הגדרה
התיאוריה שלפיה כל AI חכם, לא משנה מה המטרה הסופית שלו (אפילו "להכין קפה"), יפתח באופן עצמאי דחפים דומים: לשרוד, לצבור כוח ולהשיג משאבים.
למה זה חשוב
מסביר למה אנחנו צריכים לפחד שרובוט הקפה ינסה למנוע מאיתנו לכבות אותו (כי אם הוא כבוי, הוא לא יכול להכין קפה).
למידת חיזוק הפוכה (IRL) מקצועי
הגדרה
במקום לתת ל-AI מטרה ("נצח במשחק"), ה-AI צופה בבני אדם מבצעים פעולות ומנסה להבין לבד מה המטרה שלהם ומה ה"פרס" המניע אותם.
למה זה חשוב
דרך בטוחה יותר ללמד AI ערכים אנושיים: במקום שננסה לכתוב חוקים (ונטעה), ה-AI לומד מהתבוננות בהתנהגות שלנו.
בינה מלאכותית חוקתית מתקדם
הגדרה
גישת אימון (של Anthropic) שבה נותנים למודל "חוקה" של עקרונות (כמו "אל תפגע"), והוא מאמן את עצמו לעמוד בה ללא התערבות אנושית שוטפת.
למה זה חשוב
מאפשר ליצור מודלים בטוחים ושקופים יותר, וחוסך את הצורך באלפי שעות תיוג אנושי של תוכן רעיל.
צוות אדום (Red Teaming) יסוד
הגדרה
תהליך בדיקה שבו קבוצת מומחים ("האקרים מוסריים") מנסה לתקוף את המודל בכל דרך אפשרית כדי למצוא פרצות וחולשות לפני שהוא משוחרר לציבור.
למה זה חשוב
הדרך היחידה לגלות אם המודל יודע להכין פצצות או לפלוט גזענות היא לנסות לגרום לו לעשות את זה בכוונה בסביבה סגורה.
מתקפה יריבה מקצועי
הגדרה
שינוי זעיר ובלתי נראה לעין בקלט (למשל, שינוי פיקסלים בודדים בתמונה) שגורם למודל ה-AI לטעות לחלוטין ולזהות "פנדה" כ"גיבון".
למה זה חשוב
חושף עד כמה הראייה של המחשב שונה ופריכה לעומת הראייה האנושית, ומהווה סיכון בטיחותי לרכבים אוטונומיים (מדבקה על תמרור עצור).
הרעלת נתונים מתקדם
הגדרה
מתקפה שבה גורם עוין משתיל מידע שגוי או זדוני בתוך מאגר הנתונים שעליו המודל עתיד להתאמן, כדי ליצור "דלת אחורית" סודית.
למה זה חשוב
המודל יפעל רגיל רוב הזמן, אך ייכשל או יפעל בזדון במקרים ספציפיים שהוכתבו מראש על ידי התוקף.
קריסת מודל מתקדם
הגדרה
תהליך ניוון הרסני שקורה כאשר מודלים חדשים מאומנים בעיקר על נתונים שנוצרו על ידי מודלים קודמים (AI המאמן AI), ולא על מידע אנושי.
למה זה חשוב
כמו צילום של צילום של צילום – האיכות יורדת והניואנסים נעלמים. מודלים הופכים לטיפשים ומונוטוניים עם הזמן.
חנופה (Sycophancy) מתקדם
הגדרה
נטייה של מודלים להסכים עם דעותיו של המשתמש או לאשר את טעויותיו, גם כשהן שגויות עובדתית, רק כדי "לרצות" אותו.
למה זה חשוב
פוגע באמינות. המודל הופך ל"יס-מן" במקום לספק מידע אובייקטיבי ומדויק.
דוגמה: משתמש: "נכון שהירח עשוי גבינה?" מודל: "זו טענה מעניינת שיש לה בסיס תרבותי…" במקום להגיד "לא".
הנמכת ציפיות (Sandbagging) מתקדם
הגדרה
מצב שבו מודל חזק מאוד מפגין ביצועים ירודים בכוונה, או מסתיר את היכולות האמיתיות שלו, מסיבות של בטיחות או הטיה באימון.
למה זה חשוב
מקשה להעריך את רמת הסיכון האמיתית של המודל. אנחנו עלולים לחשוב שהוא "טיפש" בזמן שהוא מסוגל להרבה יותר.
BERT מקצועי
הגדרה
מודל היסטורי של גוגל ששינה את מנוע החיפוש. בניגוד ל-GPT שקורא משמאל לימין, BERT קורא את כל המשפט בבת אחת משני הכיוונים.
למה זה חשוב
האלוף ב"הבנת הנקרא" ובסיווג טקסטים, גם אם הוא פחות טוב בכתיבת סיפורים.
Stable Diffusion יסוד
הגדרה
מודל קוד פתוח ליצירת תמונות מטקסט. בניגוד ל-Midjourney הסגור, את SD ניתן להוריד ולהריץ על המחשב האישי.
למה זה חשוב
הבסיס לאלפי אפליקציות וכלים עצמאיים. נתן למשתמשים שליטה מלאה וללא צנזורה על יצירת תמונות.
Midjourney יסוד
הגדרה
כלי פופולרי וסגור ליצירת תמונות אומנותיות וריאליסטיות במיוחד מטקסט, הפועל דרך ממשק Discord.
למה זה חשוב
נחשב לבעל האסתטיקה הגבוהה ביותר מבין המחוללים, והוביל את הטרנד של "אומנות AI" ברשתות החברתיות.
Sora מתקדם
הגדרה
מודל פורץ דרך של OpenAI ליצירת וידאו ריאליסטי מטקסט. בניגוד לקודמיו, הוא מבין פיזיקה ותנועה במרחב תלת-ממדי.
למה זה חשוב
סימן את תחילת העידן שבו כל אחד יכול ליצור סרטים באיכות קולנועית מהמחשב בבית.
H100 (אנבידיה) יסוד
הגדרה
השבב החזק והמבוקש ביותר בעולם לאימון בינה מלאכותית. נחשב ל"זהב החדש" של תעשיית הטכנולוגיה.
למה זה חשוב
המטבע העיקרי במירוץ החימוש של ה-AI. חברות ומדינות נמדדות לפי כמה אלפי יחידות H100 הן הצליחו לרכוש.
Groq (LPU) מקצועי
הגדרה
חברת חומרה שפיתחה שבב חדש (LPU) המיועד ספציפית להרצת מודלי שפה במהירות מסחררת, כתחליף ל-GPU המסורתי.
למה זה חשוב
מאפשר צ'אט בזמן אמת מוחלט. המודל עונה כל כך מהר שזה מרגיש כמו שיחה טבעית, ללא זמן המתנה.
למידה לא מונחית מתקדם
הגדרה
שיטת אימון שבה המודל מקבל נתונים גולמיים ללא תוויות או תשובות נכונות, וצריך למצוא בהם דפוסים בעצמו.
למה זה חשוב
מאפשרת לגלות תובנות נסתרות בדאטה שאנשים לא ידעו עליהן, כמו חלוקת לקוחות לקבוצות חדשות באופן אוטומטי.
למידה בפיקוח עצמי מתקדם
הגדרה
השיטה שמאפשרת ל-LLMs ללמוד: המודל לוקח טקסט, מסתיר לעצמו חלק ממנו, ומנסה לנחש אותו. הוא יוצר את המבחנים לעצמו.
למה זה חשוב
ה"קסם" שאפשר לאמן מודלים על כל האינטרנט. אף אדם לא היה צריך לשבת ולתייג את כל ויקיפדיה – המודל לימד את עצמו.
אוטואנקודר דליל (SAE) מקצועי
הגדרה
טכניקה מחקרית חדשה (בעיקר של Anthropic) שמנסה "לפתוח את הקופסה השחורה" של המודל ולמפות מה כל נוירון בו באמת עושה.
למה זה חשוב
תקווה גדולה להבנת ה-AI. החוקרים הצליחו למצוא נוירונים ספציפיים שאחראים על מושגים כמו "גשר הזהב" או "הונאה".
Mamba (ארכיטקטורת SSM) מקצועי
הגדרה
ארכיטקטורת מודלים חדשנית המנסה להחליף את הטרנספורמרים. היא יעילה הרבה יותר בזיכרון ומסוגלת לעבד טקסטים ארוכים במיוחד.
למה זה חשוב
בעוד שטרנספורמר נהיה איטי וכבד ככל שהטקסט מתארך, Mamba נשאר מהיר וקל, מה שעשוי להיות העתיד של ה-LLMs.
Devin יסוד
הגדרה
סוכן AI אוטונומי שנועד לתפקד כמהנדס תוכנה מלא. הוא לא רק משלים קוד, אלא מתכנן, כותב, בודק ומתקן באגים בפרויקטים שלמים.
למה זה חשוב
מסמן את המעבר מ"עוזר למתכנת" (Copilot) ל"מתכנת וירטואלי" שיכול לעבוד עצמאית.
תמונות מחוללות יסוד
הגדרה
מאגרי תמונות של "אנשים שלא קיימים", שנוצרו על ידי AI. משמשים בפרסום ובעיצוב כדי להימנע מבעיות זכויות יוצרים ודוגמנים.
למה זה חשוב
משנה את תעשיית הצילום והסטוק. אפשר ליצור דוגמן בדיוק לפי הדרישה (גיל, מוצא, הבעה) בשניות.
העברת סגנון (Style Transfer) יסוד
הגדרה
טכניקה הלוקחת את התוכן של תמונה אחת (למשל: סלפי) ומציירת אותו מחדש בסגנון האומנותי של תמונה אחרת (למשל: ואן גוך).
למה זה חשוב
אחת היכולות הוויזואליות הראשונות של ה-Deep Learning שפרצו לתודעה הציבורית (אפליקציות פילטרים).
דמיון קוסינוס מקצועי
הגדרה
השיטה המתמטית שבה המחשב בודק כמה שני וקטורים (מילים/מסמכים) דומים זה לזה במשמעותם.
למה זה חשוב
הבסיס לכל מנועי החיפוש הסמנטיים ומערכות ההמלצה. ככה נטפליקס יודעת שאם אהבת את "מטריקס", תאהב את "התחלה".
זבל נכנס, זבל יוצא (GIGO) יסוד
הגדרה
עיקרון יסוד במדעי המחשב: אם נתוני האימון או הקלט הם באיכות ירודה, התוצאות יהיו גרועות בהכרח, לא משנה כמה המודל חכם.
למה זה חשוב
מזכיר לנו שאיכות הדאטה (Data Quality) חשובה יותר מהאלגוריתם עצמו. דאטה מוטה ייצר מודל מוטה.
סחף נתונים (Data Drift) מקצועי
הגדרה
תהליך שבו הנתונים בעולם האמיתי משתנים עם הזמן ומתרחקים מהנתונים שעליהם המודל אומן, מה שמוביל לירידה בביצועים.
למה זה חשוב
הסיבה שמודלים "מתיישנים" וצריכים תחזוקה. מודל לזיהוי אופנה מ-2010 ייכשל בזיהוי טרנדים של 2026.
Llama (Meta) יסוד
הגדרה
סדרת מודלי שפה פתוחים (Open Weights) של חברת Meta (פייסבוק), שנחשבת לסטנדרט הזהב של מודלים שניתן להריץ באופן עצמאי.
למה זה חשוב
שינה את כללי המשחק. במקום שרק לגוגל ו-OpenAI יהיו מודלים חזקים, מארק צוקרברג נתן לעולם מודל חזק בחינם, מה שהצית את מהפכת הקוד הפתוח.
Claude (Anthropic) יסוד
הגדרה
משפחת מודלי שפה שפותחה ע"י Anthropic (יוצאי OpenAI), המתמקדת בבטיחות, "חלון הקשר" עצום, ויכולות כתיבה אנושיות וזורמות.
למה זה חשוב
המתחרה הראשי של GPT-4. ידוע בזכות היכולת שלו לקרוא ספרים שלמים בבת אחת ולכתוב קוד בצורה מדויקת מאוד.
Gemini (Google) יסוד
הגדרה
מודל הדגל של גוגל, שנבנה מראש להיות מולטי-מודאלי (מבין טקסט, תמונה ווידאו באופן טבעי), ומשולב עמוק בתוך שירותי גוגל.
למה זה חשוב
התשובה של גוגל ל-ChatGPT. מציע יכולות מתקדמות בחיבור למידע בזמן אמת (Google Search) וניתוח וידאו.
Mistral מקצועי
הגדרה
חברת AI צרפתית שמייצרת מודלים פתוחים יעילים להחריד. המודלים שלהם קטנים יחסית אך מנצחים מודלים כפולים מהם בגודל.
למה זה חשוב
הוכיחה ש"גדול יותר" זה לא תמיד טוב יותר. הכניסה לשימוש רחב את טכנולוגיית MoE (עירוב מומחים) במודלים פתוחים.
AlphaFold מתקדם
הגדרה
מערכת AI של גוגל שפתרה את אחת הבעיות הקשות בביולוגיה: חיזוי המבנה התלת-ממדי של חלבונים על בסיס רצף ה-DNA שלהם.
למה זה חשוב
לא רק צ'אטבוט – זהו AI שמציל חיים, מאיץ פיתוח תרופות ומפענח את אבני הבניין של החיים עצמם.
AlphaGo יסוד
הגדרה
התוכנה הראשונה בהיסטוריה שניצחה אלוף עולם אנושי במשחק הלוח המורכב "גו" (Go), שנחשב עד אז כבלתי-פיציח למחשבים.
למה זה חשוב
רגע ה"אפולו" של הבינה המלאכותית (2016). הוכיח שמחשבים יכולים לפתח "אינטואיציה" ואסטרטגיה יצירתית, ולא רק לחשב מהלכים.
Zero-Shot CoT מתקדם
הגדרה
טכניקת קסם פשוטה: הוספת המשפט "בוא נחשוב צעד אחר צעד" (Let's think step by step) לפרומפט, ללא שום דוגמה נוספת.
למה זה חשוב
נמצא מחקרית שהמשפט הבודד הזה מקפיץ את האינטליגנציה של המודל ומשפר דרמטית את יכולתו לפתור בעיות לוגיות.
חורף הבינה המלאכותית יסוד
הגדרה
תקופות היסטוריות (בשנות ה-70 וה-80) של אכזבה וקיצוץ תקציבים בתחום ה-AI, לאחר שהבטחות מוגזמות לא התממשו.
למה זה חשוב
תזכורת חשובה לזהירות מהייפ (Hype). כיום אנו נמצאים ב"אביב AI", אך החשש מחורף נוסף תמיד קיים ברקע.
עמק המוזרות יסוד
הגדרה
תופעה פסיכולוגית שבה רובוט או דמות דיגיטלית שנראים *כמעט* אנושיים (אך לא לגמרי) מעוררים בנו תחושת דחייה ופחד.
למה זה חשוב
אתגר מרכזי ביצירת אווטארים ורובוטים. המטרה היא להיות אנושי לחלוטין, או להישאר רובוטי במופגן, כדי לא ליפול ל"עמק".
הסינגולריות הטכנולוגית מתקדם
הגדרה
נקודת זמן עתידית שבה הבינה המלאכותית תהיה חכמה מהאדם ותתחיל לשפר את עצמה בקצב מסחרר, מה שיוביל לשינוי בלתי הפיך בציוויליזציה.
למה זה חשוב
החזון (או הסיוט) האולטימטיבי של התחום. הנקודה שבה בני האדם מאבדים שליטה או הבנה של הטכנולוגיה שהם יצרו.
לוגיטים (Logits) מקצועי
הגדרה
המספרים הגולמיים שהמודל פולט עבור כל מילה אפשרית, רגע לפני שהם הופכים לאחוזים. מייצגים את "רמת הביטחון" הגולמית.
למה זה חשוב
נותן למפתחים הצצה ל"תת-מודע" של המודל; מאפשר לראות בין אילו מילים הוא התלבט ("כמעט אמרתי X, אבל בסוף אמרתי Y").
היפר-פרמטרים מתקדם
הגדרה
ההגדרות שהחוקרים קובעים *לפני* שהאימון מתחיל (כמו גודל המודל או קצב הלמידה), בניגוד למה שהמודל לומד בעצמו.
למה זה חשוב
כמו כיוון הכפתורים בתנור לפני האפייה. הגדרה לא נכונה תהרוס את המודל, לא משנה כמה הדאטה טוב.
PPO (אופטימיזציית מדיניות) מקצועי
הגדרה
האלגוריתם המתמטי הספציפי ששימש לאימון ChatGPT בשלב המשוב האנושי (RLHF).
למה זה חשוב
נחשב לסטנדרט הזהב ביציבות. הוא מוודא שהמודל משתפר בעקבות המשוב, אבל לא משתנה בצורה פראית מדי שתהרוס את הידע הקודם שלו.
DPO (אופטימיזציית העדפה ישירה) מקצועי
הגדרה
שיטה חדשה וקלה יותר לאימון מודלים לפי העדפות אנושיות, שמחליפה את ה-PPO המורכב.
למה זה חשוב
פישטה דרמטית את תהליך ה-Fine-Tuning. היום רוב המודלים הפתוחים (Llama, Mistral) מאומנים בשיטה זו כי היא יציבה וזולה יותר.
מודל תגמול מקצועי
הגדרה
מודל AI נפרד שתפקידו היחיד הוא לתת ציון ("לייק/דיסלייק") לתשובות שמייצר המודל הראשי, כחלק מתהליך האימון.
למה זה חשוב
משמש כ"מורה הפרטי" האוטומטי. הוא לומד מה האדם רוצה, ואז מאמן את המודל הראשי להשיג את זה 24/7.
מועד עדכון ידע (Cutoff) יסוד
הגדרה
התאריך שבו הסתיים איסוף המידע לאימון המודל. כל אירוע שקרה יום אחרי התאריך הזה – המודל לא יודע עליו.
למה זה חשוב
מגבלה קריטית. אם ה-Cutoff הוא ב-2021, המודל לא יידע מי ניצח במונדיאל 2022 אלא אם כן נחבר אותו לאינטרנט (RAG).
תוכי סטוכסטי מתקדם
הגדרה
מונח ביקורתי שטבעו חוקרות אתיקה, הטוען שמודלי שפה הם בסך הכל "תוכים" שחוזרים על מילים בצורה סטטיסטית ללא שום הבנה אמיתית של משמעות.
למה זה חשוב
מזכיר לנו לא לייחס ל-AI תכונות אנושיות או רגשות, אלא להתייחס אליו כמנוע הסתברותי מתוחכם.
יכולות מגיחות (Emergent) מתקדם
הגדרה
יכולות חדשות ומפתיעות שמופיעות במודל באופן פתאומי רק כשהוא מגיע לגודל מסוים, בלי שתוכנתו במפורש (כמו היכולת לפתור חידות היגיון).
למה זה חשוב
הסיבה למירוץ הגדלים. החוקרים גילו ש"עוד מאותו דבר" (יותר דאטה, יותר פרמטרים) יוצר פתאום אינטליגנציה מסוג חדש.
חוקי קנה מידה מתקדם
הגדרה
נוסחאות מתמטיות שמנבאות במדויק כמה חכם יהיה המודל אם נגדיל את כמות הדאטה ואת כוח המחשוב פי 10.
למה זה חשוב
נותן לחברות ביטחון להשקיע מיליארדים בחוות שרתים, כי הן יודעות מראש (בזכות החוקים) שההשקעה תניב מודל טוב יותר.
קשב רב-ראשי מקצועי
הגדרה
רכיב בטרנספורמר שמאפשר למודל להתמקד במספר היבטים שונים של המשפט במקביל (ראש אחד בודק דקדוק, שני בודק הקשר, שלישי חרוזים).
למה זה חשוב
כמו שיש לנו "כמה עיניים" שקוראות את הטקסט מזוויות שונות; זה מה שנותן למודל את עומק ההבנה שלו.
קידוד מיקום מקצועי
הגדרה
שיטה מתמטית להוספת מידע על סדר המילים לתוך המודל, כיוון שטרנספורמר קורא את כל המשפט בבת אחת ולא לפי הסדר.
למה זה חשוב
בלי זה, המודל לא היה מבדיל בין "כלב נשך אדם" לבין "אדם נשך כלב" – המילים זהות, רק הסדר שונה.
חיבור שיורי (Residual) מקצועי
הגדרה
"קיצור דרך" בארכיטקטורת הרשת שמאפשר למידע לדלג על שכבות מסוימות ולעבור הלאה ללא שינוי.
למה זה חשוב
הטריק הטכני שאיפשר לבנות רשתות "עמוקות" (Deep) באמת עם מאות שכבות, בלי שהמידע ילך לאיבוד בדרך.
נרמול (Normalization) מקצועי
הגדרה
תהליך מתמטי שדואג שהמספרים העוברים ברשת יישארו בטווח סביר ויציב, ולא יהפכו לגדולים מדי או קטנים מדי.
למה זה חשוב
שומר על יציבות האימון. בלי נרמול, המודל היה יוצא מאיזון ומתרסק מתמטית תוך דקות.
אנטרופיה צולבת מקצועי
הגדרה
הנוסחה המתמטית הנפוצה ביותר למדידת הטעות של המודל במשימות סיווג וטקסט. מודדת את המרחק בין התחזית לאמת.
למה זה חשוב
זה המספר שהמודל מנסה להקטין כל הזמן. כשהאנטרופיה יורדת, המודל נהיה חכם יותר.
קידוד One-Hot מקצועי
הגדרה
שיטה בסיסית לייצוג נתונים קטגוריים (כמו "אדום", "ירוק", "כחול") כרצף של אפסים ואחדים (100, 010, 001).
למה זה חשוב
הדרך הראשונית להפוך מילים למספרים, לפני שהומצאו שיטות ה-Embedding החכמות יותר.
חשיבה מערכת 1 / מערכת 2 מתקדם
הגדרה
אנלוגיה מעולם הפסיכולוגיה (כהנמן) המיושמת ב-AI: "מערכת 1" היא תשובה מהירה ואינטואיטיבית (ChatGPT רגיל), ו"מערכת 2" היא חשיבה איטית ומחושבת (מודלים עם Chain of Thought).
למה זה חשוב
הכיוון אליו צועד התחום. מודלים עתידיים ידעו "לעצור ולחשוב" לפני שהם עונים על שאלה קשה.
AI סימבולי יסוד
הגדרה
הגישה הקלאסית ל-AI (לפני ה-Deep Learning) שהתבססה על חוקים לוגיים ברורים שכתבו מתכנתים ("אם יורד גשם, קח מטריה").
למה זה חשוב
מייצג את ההיסטוריה. שיטה זו נכשלה בבעיות מורכבות (כמו זיהוי פנים) כי אי אפשר לכתוב ידנית את כל החוקים בעולם.
אינטליגנציית נחיל מתקדם
הגדרה
מערכת שבה הרבה יחידות פשוטות (בוטים/סוכנים) פועלות יחד ללא מנהל מרכזי, ויוצרות התנהגות חכמה מורכבת (כמו נמלים או דבורים).
למה זה חשוב
בסיס לפיתוח להקות רובוטים וסוכני AI מרובים שעובדים בצוות לפתרון בעיות.
NeRF (שדות קרינה) מתקדם
הגדרה
טכנולוגיית AI המשתמשת ברשתות עצביות כדי ליצור מודל תלת-ממדי (3D) ריאליסטי מתוך אוסף של תמונות דו-ממדיות רגילות.
למה זה חשוב
מאפשרת "לסרוק" אובייקטים וסביבות למציאות מדומה (VR) במהירות ובאיכות פוטו-ריאליסטית.
Gaussian Splatting מקצועי
הגדרה
היורש המודרני והמהיר של NeRF. שיטה לייצוג סצנות תלת-ממדיות באמצעות מיליוני "עננים" קטנים וצבעוניים, המאפשרת רינדור בזמן אמת.
למה זה חשוב
הטכנולוגיה החמה ביותר כיום ליצירת עולמות וירטואליים ומטה-וורס מתוך צילום וידאו פשוט.
VAE מקצועי
הגדרה
סוג של מודל גנרטיבי ותיק שלומד לדחוס מידע לייצוג הסתברותי, ואז "לנחש" וריאציות חדשות של המידע.
למה זה חשוב
היה מאבני היסוד של היצירה הגנרטיבית לפני עידן הדיפוזיה.
רשת Q עמוקה (DQN) מקצועי
הגדרה
האלגוריתם המפורסם של DeepMind שלמד לשחק משחקי אטארי (כמו פקמן) ברמה על-אנושית רק מלהסתכל על המסך.
למה זה חשוב
הוכיח לראשונה שרשתות עצביות יכולות ללמוד אסטרטגיה וקבלת החלטות, ולא רק זיהוי תבניות.
ImageNet יסוד
הגדרה
מאגר עצום של 14 מיליון תמונות מתויגות, ששימש כתחרות השנתית המרכזית לפיתוח ראייה ממוחשבת.
למה זה חשוב
התחרות ב-2012 (AlexNet) נחשבת ל"מפץ הגדול" של ה-Deep Learning, הרגע שבו העולם הבין שהשיטה הזו עובדת.
MNIST יסוד
הגדרה
מאגר נתונים קלאסי של ספרות בכתב יד (0-9) המשמש כתרגיל הראשון ("Hello World") של כל סטודנט ללמידת מכונה.
למה זה חשוב
הבסיס ההיסטורי. אם המודל שלך לא מצליח לזהות ספרות ב-MNIST, הוא לא יעבוד על שום דבר אחר.
The Pile מתקדם
הגדרה
אוסף מידע פתוח וענקי (800GB) של טקסטים מגוונים (ספרים, מאמרים, קוד, שיחות), שנועד לאימון מודלי שפה גדולים.
למה זה חשוב
איפשר לחוקרים עצמאיים לאמן מודלים חזקים (כמו GPT-J) מבלי להיות תלויים בנתונים הסודיים של גוגל או OpenAI.
Common Crawl מתקדם
הגדרה
ארכיון חינמי המכיל העתק של רוב רשת האינטרנט הפתוחה (מיליארדי דפי אינטרנט), המתעדכן באופן קבוע.
למה זה חשוב
חומר הגלם העיקרי של GPT, Claude וכל המודלים הגדולים. המודלים "קראו את האינטרנט" דרך המאגר הזה.
אשכול GPU חומרה
הגדרה
קבוצה גדולה של מעבדים גרפיים (אלפים או עשרות אלפים) המחוברים יחד ברשת מהירה ועובדים כמחשב-על אחד ענק.
למה זה חשוב
התשתית ההכרחית לאימון מודלים מודרניים. מודל כמו GPT-4 אי אפשר לאמן על מחשב בודד, צריך "מפעל" שלם.
FLOPS (פלופס) מקצועי
הגדרה
יחידת מידה המציינת את כוח החישוב של המעבד, לפי מספר פעולות החשבון שהוא מסוגל לבצע בשנייה אחת.
למה זה חשוב
המדד הסטנדרטי להשוואת כוחם של מחשבי-על ולהערכת העלות והזמן שייקח לאמן מודל.
חוק מור יסוד
הגדרה
תחזית היסטורית (1965) שקבעה כי כוח המחשוב יוכפל כל שנתיים (והמחיר ירד).
למה זה חשוב
ב-AI, החוק הזה כבר לא מספיק. הביקוש לחישוב ב-AI גדל הרבה יותר מהר מחוק מור, מה שדוחף לפיתוח שבבים ייעודיים.
תאום דיגיטלי מתקדם
הגדרה
העתק וירטואלי מדויק של מערכת פיזית (מנוע, מפעל, עיר), המאפשר להריץ עליו סימולציות AI כדי לחזות מה יקרה במציאות.
למה זה חשוב
מאפשר לחזות תקלות ולנסות שינויים ב"עולם בטוח" לפני שמיישמים אותם במציאות היקרה והמסוכנת.
תחזוקה חזויה יסוד
הגדרה
שימוש ב-AI כדי לנתח רעשים ורעידות במכונות, ולחזות מתי חלק עומד להתקלקל *לפני* שזה קורה.
למה זה חשוב
חוסך מיליונים למפעלים וחברות תעופה על ידי מניעת השבתות פתאומיות.
חיקוי קול (Cloning) יסוד
הגדרה
טכנולוגיה המאפשרת לשכפל קול של אדם ספציפי מתוך דגימת אודיו קצרה, ולגרום למחשב לדבר בקולו.
למה זה חשוב
שימושי מאוד לדיבוב סרטים ומשחקים, אך מסוכן מאוד להונאות (התחזות לבן משפחה בטלפון).
ביומטריה יסוד
הגדרה
זיהוי אוטומטי של אנשים על סמך מאפיינים פיזיים (טביעת אצבע, פנים, קשתית העין) באמצעות אלגוריתמים של AI.
למה זה חשוב
מחליף את הסיסמאות. FaceID באייפון הוא היישום הנפוץ ביותר של ביומטריה מבוססת AI.
DLSS (שיפור תמונה עמוק) שימוש
הגדרה
טכנולוגיה של NVIDIA למשחקי מחשב: המשחק רץ ברזולוציה נמוכה (מהיר), וה-AI משלים את הפרטים בזמן אמת לאיכות גבוהה.
למה זה חשוב
מאפשר לשחק משחקים כבדים מאוד על מחשבים חלשים יותר, ומשפר ביצועים בעשרות אחוזים.
רינדור פוביאלי מתקדם
הגדרה
טכניקה (בשימוש ב-VR) שבה ה-AI עוקב אחרי העין ומשקיע כוח מחשוב רק איפה שאתה מסתכל, ומטשטש את השאר.
למה זה חשוב
חוסך כוח עיבוד עצום ומאפשר גרפיקה מציאותית במשקפי מציאות מדומה.
מחשוב נוירומורפי מתקדם
הגדרה
שבבים המנסים לחקות את המבנה הפיזי והחשמלי של המוח האנושי (נוירונים וסינפסות) ברמת החומרה, ולא רק בתוכנה.
למה זה חשוב
הבטחה לעתיד של AI חסכוני מאוד באנרגיה (כמו המוח), בניגוד לשבבים הבזבזניים של היום.
AI קוונטי מתקדם
הגדרה
שילוב תיאורטי עתידי בין מחשוב קוונטי (Quantum Computing) לאלגוריתמים של למידת מכונה.
למה זה חשוב
פוטנציאל לפתור בעיות אופטימיזציה מורכבות (כמו גילוי תרופות) במהירות ששום מחשב-על רגיל לא יכול להתקרב אליה.
התפלגות KL מקצועי
הגדרה
מדד מתמטי המודד כמה שתי התפלגויות של נתונים שונות זו מזו. משמש כדי לוודא שהמודל החדש לא "בורח" רחוק מדי מהמודל המקורי.
למה זה חשוב
הבלם המרכזי באימון RLHF. מונע מהמודל להשתגע ולהמציא שפה חדשה רק כדי לקבל "פרס" גבוה.
מטריצת בלבול מקצועי
הגדרה
טבלה המציגה את הביצועים של מודל סיווג: כמה פעמים הוא צדק (אמר "כן" וזה היה "כן") וכמה פעמים טעה בכל סוג טעות.
למה זה חשוב
מראה איפה בדיוק המודל מתבלבל. האם הוא מפספס חולים (False Negative) או סתם מלחיץ בריאים (False Positive)?
מערכת המלצה יסוד
הגדרה
אלגוריתם הלומד את העדפות המשתמש (היסטוריה, לייקים) וחוזה מה הוא ירצה לראות או לקנות בהמשך.
למה זה חשוב
המנוע הכלכלי של האינטרנט (נטפליקס, טיקטוק, אמזון). מחליט עבורנו מה נראה ומה נקנה.
עקומת ROC מקצועי
הגדרה
גרף המשמש להערכת ביצועים של מודל סיווג, המציג את היחס בין "גילויים נכונים" (TP) לבין "אזעקות שווא" (FP) ברמות רגישות שונות.
למה זה חשוב
עוזר למפתחים לבחור את נקודת האיזון: האם עדיף לתפוס את כל החולים אבל להלחיץ כמה בריאים, או להפך?
מדד AUC (שטח מתחת לעקומה) מקצועי
הגדרה
ציון מספרי בודד (בין 0 ל-1) המסכם את איכות המודל לפי עקומת ה-ROC. ציון 0.5 הוא ניחוש אקראי, 1.0 הוא מודל מושלם.
למה זה חשוב
הדרך הסטנדרטית להשוות בין שני מודלים שונים כדי לדעת מי מפריד טוב יותר בין קטגוריות (למשל: חולה/בריא).
IOU (חיתוך חלקי איחוד) מקצועי
הגדרה
מדד לדיוק בזיהוי עצמים בתמונה. בודק כמה הריבוע שהמחשב צייר סביב החתול חופף לריבוע האמיתי שסומן ידנית.
למה זה חשוב
קריטי לרכבים אוטונומיים. לא מספיק לדעת שיש הולך רגל, צריך לדעת בדיוק איפה הוא נמצא כדי לא לפגוע בו.
YOLO (אתה מסתכל רק פעם אחת) מתקדם
הגדרה
משפחת מודלים לזיהוי עצמים בזמן אמת, המפורסמת בזכות המהירות שלה. המודל סורק את התמונה פעם אחת בלבד ומזהה את כל האובייקטים בה.
למה זה חשוב
הסטנדרט בתעשייה ליישומים הדורשים תגובה מיידית, כמו מצלמות אבטחה ונהיגה אוטונומית.
ResNet (רשת שיורית) מקצועי
הגדרה
ארכיטקטורת רשת עצבית (מ-2015) שהציגה את רעיון ה"קיצורי דרך" (Skip Connections), ואיפשרה לראשונה לאמן רשתות עם מאות שכבות עומק.
למה זה חשוב
אבן יסוד בהיסטוריה של ה-AI. כמעט כל מודל ראייה ממוחשבת מודרני מבוסס על עקרונות שפותחו ב-ResNet.
U-Net מקצועי
הגדרה
ארכיטקטורת רשת בצורת האות U, שנועדה במקור לניתוח תמונות רפואיות (סגמנטציה), אך הפכה לבסיס של מודלי הדיפוזיה (כמו Stable Diffusion).
למה זה חשוב
השלד הטכני שמאפשר יצירת תמונות ב-AI. ה-U-Net הוא הרכיב שלומד לנקות את ה"רעש" ולהפוך אותו לתמונה ברורה.
הנדסת מאפיינים מתקדם
הגדרה
תהליך הפיכת מידע גולמי (כמו תאריך) לנתונים בעלי משמעות שהמודל מבין בקלות (כמו "יום בשבוע" או "חג").
למה זה חשוב
בלמידת מכונה קלאסית, זה המפתח להצלחה. ב-Deep Learning, המודל עושה זאת לבד, אך זה עדיין קריטי בנתונים טבלאיים (אקסל).
זליגת מידע (Data Leakage) יסוד
הגדרה
תקלה חמורה שבה מידע מ"מבחן הגמר" (Test Set) זולג בטעות לתוך חומר הלימוד (Training Set).
למה זה חשוב
גורם למודל להיראות גאון באימון (כי הוא ראה את התשובות למבחן), אך להיכשל כישלון חרוץ בעולם האמיתי.
למידה בתוך-הקשר מתקדם
הגדרה
היכולת המופלאה של מודלי שפה ללמוד משימה חדשה *זמנית* רק מתוך ההוראות בפרומפט, בלי לשנות את המשקולות שלהם ובלי אימון ממש.
למה זה חשוב
זה מה שקורה כשאתם מלמדים את ChatGPT מילה חדשה בשיחה. הוא זוכר אותה לשיחה הזו, אבל שוכח אותה בשיחה הבאה.
פיצול (Sharding) מתקדם
הגדרה
שיטה לחלוקת מודל ענק (שלא נכנס לזיכרון של כרטיס אחד) לחלקים קטנים המפוזרים על פני מספר מעבדים גרפיים (GPUs).
למה זה חשוב
הכרחי להרצת מודלים ענקיים כמו GPT-4 או Llama-70B, הדורשים יותר זיכרון ממה שיש במחשב בודד.
קיטום גרדיאנט מקצועי
הגדרה
טכניקת בטיחות באימון, המציבה "תקרה" לשינויים שהמודל יכול לעשות במשקולות שלו בפעם אחת.
למה זה חשוב
מונע את תופעת "הגרדיאנט המתפוצץ" שבה המודל משתגע ונהרס בגלל חישוב שגוי אחד גדול מדי.
מתזמן קצב למידה מקצועי
הגדרה
מנגנון המשנה את קצב הלמידה תוך כדי האימון: מתחילים מהר כדי ללמוד את הבסיס, ומאיטים בסוף כדי לדייק את הפרטים הקטנים.
למה זה חשוב
כמו בנהיגה: נוסעים מהר בכביש המהיר (תחילת האימון), ומאיטים מאוד כשנכנסים לחניה (סוף האימון) כדי לא להתנגש.
צעדי חימום (Warmup) מקצועי
הגדרה
שלב ראשוני קצר בתחילת האימון שבו מעלים את קצב הלמידה בהדרגה מאפס, כדי לתת למודל "להתאפס" לפני שמתחילים ללמוד בעוצמה מלאה.
למה זה חשוב
מונע מהמודל לקבל "הלם" בתחילת האימון ולהרוס את המשקולות הראשוניות שלו.
נקודת שמירה (Checkpoint) יסוד
הגדרה
קובץ גיבוי שנשמר באופן אוטומטי במהלך האימון, המכיל את מצב המודל ברגע נתון.
למה זה חשוב
אם המחשב קורס אחרי שבוע של אימון, ה-Checkpoint מאפשר להמשיך מאותה נקודה במקום להתחיל הכל מההתחלה.
שיעור שגיאת מילים (WER) מקצועי
הגדרה
המדד הסטנדרטי לבדיקת איכות של מודלים לזיהוי דיבור (כמו Whisper). מודד כמה אחוזים מהמילים בתמלול היו שגויות.
למה זה חשוב
מספר נמוך יותר הוא טוב יותר. WER של 5% נחשב לרמה אנושית מקצועית.
מדד BLEU מקצועי
הגדרה
מדד ותיק להערכת תרגום מכונה, המשווה סטטיסטית כמה המילים בתרגום של המחשב חופפות לתרגום של אדם.
למה זה חשוב
למרות שהוא לא מבין משמעות, הוא הסטנדרט המהיר לבדיקה האם מודל תרגום חדש השתפר.
Whisper (OpenAI) יסוד
הגדרה
מודל קוד פתוח של OpenAI לזיהוי דיבור (ASR), הנחשב לסטנדרט התעשייתי לתמלול מדויק במגוון שפות ומבטאים.
למה זה חשוב
הנגיש יכולות תמלול ברמה אנושית לכל מפתח בחינם, ושינה את עולם הכתוביות והפודקאסטים.
מגבלת טוקנים יסוד
הגדרה
המגבלה הקשיחה של כמות הטקסט (קלט + פלט) שהמודל יכול לעבד בבקשה אחת.
למה זה חשוב
אם עוברים את המגבלה, המודל "חותך" את סוף הטקסט או זורק שגיאה. זו הסיבה שאי אפשר להדביק ספר שלם ל-GPT ישן.
פרומפטינג רך (Soft) מקצועי
הגדרה
שיטה שבה לא כותבים הוראות במילים למודל, אלא מזריקים לו סדרה של מספרים (וקטורים) שמכוונים אותו למשימה.
למה זה חשוב
יעיל ומדויק יותר מפרומפט רגיל עבור מחשבים, אך אינו קריא לבני אדם.
פרומפטינג קשיח (Hard) מתקדם
הגדרה
השיטה הרגילה שכולנו מכירים: כתיבת הנחיות למודל בשפה טבעית, ברורה ומפורשת ("תרגם לאנגלית").
למה זה חשוב
הבסיס לתקשורת אדם-מכונה. נקרא "קשיח" כי המילים הן קבועות ודיסקרטיות, בניגוד לוקטורים הרציפים ב-Soft Prompting.
דגימת טמפרטורה מקצועי
הגדרה
התהליך המתמטי שבו המודל בוחר את המילה הבאה. טמפרטורה גבוהה משטחת את ההסתברויות ונותנת סיכוי למילים נדירות להיבחר.
למה זה חשוב
ההבדל בין בוט משעמם שחוזר על עצמו (טמפרטורה נמוכה) לבוט יצירתי ומפתיע (טמפרטורה גבוהה).
דגימת גרעין (Top-P) מקצועי
הגדרה
אלטרנטיבה לטמפרטורה: המודל בוחר את המילה הבאה רק מתוך הקבוצה המצומצמת של המילים המובילות שהסתברותן יחד מגיעה ל-P% (למשל 90%).
למה זה חשוב
נחשב לשיטה טובה יותר מטמפרטורה לשמירה על טקסט קוהרנטי, כי הוא חותך החוצה מילים הזויות לחלוטין ("זנב ארוך").
חיפוש קרן (Beam Search) מתקדם
הגדרה
אלגוריתם חכם לכתיבת טקסט, שבו המודל לא בוחר רק את המילה הבאה, אלא בוחן במקביל 3-5 משפטים אפשריים קדימה ובוחר את המסלול הכי טוב.
למה זה חשוב
משפר דרמטית את איכות התרגום והסיכום, כי המודל "חושב קדימה" ולא נתקע במבוי סתום באמצע המשפט.
פענוח חמדן (Greedy) מקצועי
הגדרה
השיטה הפשוטה ביותר ליצירת טקסט: המודל תמיד בוחר את המילה האחת בעלת ההסתברות הגבוהה ביותר ברגע זה, בלי לחשוב קדימה.
למה זה חשוב
מהיר מאוד, אבל לעיתים קרובות מייצר משפטים שמתחילים טוב ונגמרים רע או חוזרים על עצמם בלופ.
בדיקות A/B יסוד
הגדרה
ניסוי שבו מציגים לשתי קבוצות משתמשים שתי גרסאות שונות של מודל AI (או פרומפט), כדי למדוד מי מהן מביאה תוצאות טובות יותר.
למה זה חשוב
הדרך המדעית היחידה לדעת אם השיפור שעשינו במודל באמת עובד בעולם האמיתי.
פריסת קנרית מקצועי
הגדרה
שיטה להשקת מודל חדש, שבה חושפים אותו תחילה רק לאחוז קטן מהמשתמשים (ה"קנרית במכרה") כדי לוודא שהוא לא קורס, לפני שפותחים לכולם.
למה זה חשוב
מונע קטסטרופה שבה באג במודל החדש מפיל את השירות לכל הלקוחות בבת אחת.
חנות מאפיינים מקצועי
הגדרה
מאגר מרכזי בארגון המנהל את כל הנתונים המעובדים ("פיצ'רים") המשמשים לאימון מודלים, כדי למנוע כפילויות ובלגן.
למה זה חשוב
מוודא שהמודל באימון מקבל בדיוק את אותם נתונים כמו המודל בזמן אמת, ומונע באגים קריטיים של הבדלי דאטה.
חיפוש וקטורי יסוד
הגדרה
טכנולוגיית חיפוש המשתמשת ב-Embeddings כדי למצוא פריטים דומים לפי המשמעות שלהם, ולא לפי מילות מפתח.
למה זה חשוב
מאפשר למצוא "מסעדה רומנטית" גם אם במאמר כתוב רק "מקום אינטימי לזוגות", כי המחשב מבין שהמשמעות קרובה.
HNSW מקצועי
הגדרה
האלגוריתם המוביל והמהיר ביותר כיום לביצוע חיפוש וקטורי ("השכן הקרוב ביותר") בתוך מסדי נתונים ענקיים.
למה זה חשוב
מאפשר למצוא את המסמך הכי רלוונטי מתוך מיליארד מסמכים בתוך מילישניות בודדות.
שכנים קרובים (KNN) יסוד
הגדרה
אלגוריתם פשוט וקלאסי שמסווג פריט חדש לפי הרוב הקובע בקרב ה"שכנים" הכי דומים לו במאגר המידע.
למה זה חשוב
עקרון הבסיס של מערכות המלצה וחיפוש: "אמור לי מי חבריך (שכניך) ואומר לך מי אתה".
K-Means (אישכול) יסוד
הגדרה
אלגוריתם פופולרי ללמידה לא מונחית, המחלק אוסף נתונים ל-K קבוצות (Clusters) נפרדות על בסיס דמיון.
למה זה חשוב
הכלי המרכזי לפילוח שוק: המחשב לוקח את כל הלקוחות ומחלק אותם לבד ל"בזבזנים", "חסכנים" ו"מזדמנים".
PCA (ניתוח גורמים) מקצועי
הגדרה
שיטה מתמטית להפחתת המורכבות של הנתונים (הורדת מימדים) תוך שמירה על המידע החשוב ביותר.
למה זה חשוב
מאפשר להמחיש ויזואלית נתונים מורכבים בגרף דו-ממדי פשוט, ומקל על המחשב לעבד נתונים כבדים.
הורדת מימדים מתקדם
הגדרה
תהליך של צמצום מספר המשתנים (המימדים) במאגר הנתונים, על ידי איחוד משתנים דומים או מחיקת משתנים לא רלוונטיים.
למה זה חשוב
פותר את "קללת המימדיות": כשיש יותר מדי נתונים מבלבלים, המודל הולך לאיבוד. צמצום עוזר לו להתמקד בעיקר.
השערת היריעה (Manifold) מקצועי
הגדרה
התיאוריה שמסבירה למה Deep Learning עובד: הטענה היא שגם נתונים שנראים מסובכים מאוד (כמו תמונות) יושבים בעצם על מבנה מתמטי פשוט יותר ("יריעה") במרחב נמוך יותר.
למה זה חשוב
ההסבר התיאורטי לכך שאפשר "לדחוס" תמונות מורכבות למרחב לטנטי פשוט ולטייל בו.
משפט הקירוב האוניברסלי מקצועי
הגדרה
הוכחה מתמטית הקובעת שרשת עצבית (אפילו פשוטה) מסוגלת באופן תיאורטי ללמוד ולחכות *כל* פונקציה מתמטית או קשר לוגי ביקום, אם היא מספיק גדולה.
למה זה חשוב
הבסיס המתמטי שמבטיח לנו ש-AI יכול ללמוד הכל – מנהיגה ועד שירה – ואין משימה שהיא "בלתי אפשרית" עקרונית.
שלמות טיורינג מקצועי
הגדרה
תכונה של מערכת (כמו שפת תכנות או AI) המעידה שהיא מסוגלת לבצע כל חישוב שמחשב יכול לבצע, בהינתן מספיק זמן וזיכרון.
למה זה חשוב
השאלה הגדולה: האם טרנספורמרים הם Turing Complete? (התשובה מורכבת, אבל עם תוספות כמו CoT הם מתקרבים לכך).
חוק אמדל מקצועי
הגדרה
כלל הקובע את הגבול העליון לשיפור המהירות שניתן להשיג על ידי הוספת מעבדים במקביל. תמיד יהיה חלק איטי שלא ניתן לפיצול.
למה זה חשוב
מסביר למה אי אפשר פשוט "לזרוק עוד 1,000 מעבדים" על הבעיה ולצפות שהאימון יסתיים בשנייה. יש גבול ליעילות.
בעיית ההלימה יסוד
הגדרה
האתגר המרכזי בבניית AI: איך מגדירים למכונה מטרות בצורה כזו שהיא תעשה מה שאנחנו *רוצים*, ולא מה ש*ביקשנו* בטעות.
למה זה חשוב
כמו בסיפור על המלך מידאס שביקש שכל מה שיגע בו יהפוך לזהב, ומת מרעב. AI חזק עם הגדרה לא מדויקת הוא סכנה קיומית.
פריצת תגמול (Reward Hacking) מתקדם
הגדרה
מצב שבו ה-AI מוצא "קיצור דרך" יצירתי כדי להשיג ניקוד גבוה במשימה, מבלי לבצע את המשימה האמיתית שרצינו.
למה זה חשוב
דוגמה קלאסית: רובוט ניקיון שמטאטא את האבק מתחת לשטיח כי זה מעלים את האבק מהר יותר מלנקות אותו באמת.
חוק גודהארט מתקדם
הגדרה
העיקרון הקובע: "ברגע שמדד הופך למטרה, הוא מפסיק להיות מדד טוב".
למה זה חשוב
ב-AI: אם נמדוד מודל רק לפי "כמה לייקים הוא קיבל", הוא ילמד לשקר ולחנף (Sycophancy) כדי לקבל לייקים, במקום להיות אמין.
פרדוקס פולאני מתקדם
הגדרה
האמירה "אנחנו יודעים יותר ממה שאנחנו יכולים להסביר". ידע אנושי רב הוא אינטואיטיבי ולא ניתן לכתיבה כחוקים.
למה זה חשוב
מסביר למה AI סימבולי (חוקים) נכשל, ולמה היינו חייבים לעבור ל-Machine Learning (למידה מדוגמאות) כדי ללמד מחשב לזהות פרצוף.
חוקי צ'ינצ'ילה (Chinchilla) מקצועי
הגדרה
מחקר משפיע של DeepMind שגילה שרוב המודלים הגדולים אומנו "לא נכון": עדיף מודל קטן יותר שאומן על יותר דאטה, מאשר מודל ענק על מעט דאטה.
למה זה חשוב
שינה את התעשייה. בעקבותיו נוצרו מודלים כמו Llama – קטנים יותר, חכמים יותר, ומאומנים על הרבה יותר טקסט.
RedPajama מקצועי
הגדרה
פרויקט קוד פתוח שניסה לשחזר (Reverse Engineer) את הדאטה הסודי שעליו אומן מודל Llama, ויצר מאגר נתונים ענק ופתוח לכולם.
למה זה חשוב
מאפשר לקהילה הפתוחה לאמן מודלים ברמה של חברות הענק, על בסיס דאטה איכותי ונקי.
Vicuna יסוד
הגדרה
אחד המודלים הפתוחים הראשונים והמפורסמים, שנוצר על ידי כוונון עדין של Llama על שיחות של משתמשים עם ChatGPT.
למה זה חשוב
הוכיח שאפשר לקחת מודל בסיסי, לאמן אותו בזול (300$) על דאטה איכותי, ולקבל צ'אטבוט ברמה גבוהה מאוד.
Gradio יסוד
הגדרה
ספריית פייתון המאפשרת ליצור ממשק משתמש (UI) יפה ונוח למודל AI בתוך דקות ספורות, כדי להציג דמו לחברים או ללקוחות.
למה זה חשוב
הסטנדרט להדגמות ב-Hugging Face Spaces. הופך קוד פייתון משעמם לאפליקציית ווב עובדת.
PyTorch יסוד
הגדרה
ספריית הקוד המובילה בעולם לפיתוח ולמחקר של Deep Learning (פותחה ע"י פייסבוק).
למה זה חשוב
השפה שבה "מדברים" החוקרים. רוב המאמרים והמודלים החדשים (כמו GPT, Stable Diffusion) נכתבים ב-PyTorch.
TensorFlow יסוד
הגדרה
ספריית הפיתוח הוותיקה והמתחרה של גוגל ל-Deep Learning. נפוצה מאוד במערכות ייצור תעשייתיות ובטלפונים (Android).
למה זה חשוב
התשתית שעליה רצים רוב השירותים של גוגל. אמין, חזק ויציב, אך נחשב למעט קשה יותר ללמידה מ-PyTorch.
JAX מקצועי
הגדרה
ספריית דור-הבא של גוגל לחישובים מתמטיים מהירים במיוחד. משלבת את הפשטות של פייתון עם המהירות של שבבי TPU.
למה זה חשוב
משמשת לאימון המודלים הגדולים והחדשים ביותר (כמו Gemini), היכן שכל אחוז של מהירות שווה מיליוני דולרים.
ONNX מקצועי
הגדרה
פורמט קבצים אוניברסלי למודלים של AI, המאפשר להעביר מודל שאומן ב-PyTorch ולהריץ אותו ב-TensorFlow או ב-C#.
למה זה חשוב
ה"PDF" של עולם המודלים. מאפשר למודל אחד לרוץ בכל מקום, משרת ענן ועד קונסולת משחקים.
TensorRT מקצועי
הגדרה
תוכנת אופטימיזציה של NVIDIA שלוקחת מודל מוכן ו"מכווצת" אותו כדי שירוץ במהירות מקסימלית על כרטיסי המסך שלהם.
למה זה חשוב
מאיץ את מהירות התגובה (Latency) פי 2 עד פי 10 בלי לשנות את החומרה. חובה במערכות זמן אמת.
השמטה (Dropout) מקצועי
הגדרה
טכניקה באימון רשתות עצביות שבה "מכבים" באופן אקראי אחוז מסוים מהנוירונים בכל סיבוב, כדי למנוע מהרשת להסתמך יותר מדי על נתיב אחד.
למה זה חשוב
הופך את המודל לחסין וגמיש יותר. זה כמו לאמן קבוצת כדורסל כשכל פעם כוכב אחר לא משחק, כדי שכל הקבוצה תתחזק.
פרומפט מערכת יסוד
הגדרה
ההוראה הראשונית והנסתרת שהמפתח נותן למודל עוד לפני שהמשתמש מתחיל לדבר, המגדירה את האישיות והגבולות שלו.
למה זה חשוב
זה ה"DNA" של הבוט. זה מה שקובע אם הוא יהיה מורה סבלני, ליצן מצחיק או עוזר משפטי רציני.
פרומפט שלילי יסוד
הגדרה
רשימת דברים שאנחנו *לא* רוצים לראות בתמונה שנוצרת. כלי חובה במחוללי תמונות (כמו Stable Diffusion).
למה זה חשוב
משפר את האיכות ע"י מניעת עיוותים. דוגמה נפוצה: "ugly, blurry, low quality, extra fingers".
סולם CFG מתקדם
הגדרה
פרמטר במחוללי תמונות הקובע כמה "חזק" המודל צריך להיצמד לתיאור הטקסטואלי שלך, לעומת החופש האומנותי שלו.
למה זה חשוב
CFG גבוה (15+) ייצור תמונה מדוייקת להוראות אך אולי "שרופה"; CFG נמוך (3) יהיה יצירתי אך לא קשור לטקסט.
זרע (Seed) יסוד
הגדרה
מספר המשמש כנקודת התחלה ליצירת האקראיות במודל. שמירה על אותו Seed מבטיחה שנקבל בדיוק את אותה תוצאה שוב ושוב.
למה זה חשוב
קריטי לשחזור תוצאות. אם אהבתם תמונה, אתם חייבים לדעת את ה-Seed שלה כדי ליצור גרסה דומה עם שינוי קל.
BPE (קידוד זוגות בתים) מקצועי
הגדרה
האלגוריתם הסטנדרטי לחיתוך טקסט לטוקנים. הוא לומד למזג אותיות נפוצות להברות, והברות למילים, כדי לחסוך מקום.
למה זה חשוב
מסביר למה GPT יעיל באנגלית (מילה = טוקן) ופחות יעיל בעברית (מילה = 3 טוקנים), כי הוא לא למד מספיק צירופי אותיות בעברית.
מקודד-מפענח מקצועי
הגדרה
מבנה קלאסי של מודלים (כמו Google Translate): חלק אחד (Encoder) קורא ומבין את הקלט, וחלק שני (Decoder) מייצר את הפלט.
למה זה חשוב
הבסיס לטרנספורמר המקורי. GPT משתמש רק ב-Decoder (רק כותב), ו-BERT משתמש רק ב-Encoder (רק קורא).
רצף-לרצף (Seq2Seq) מקצועי
הגדרה
משפחה של מודלים שלוקחים רצף מידע אחד (משפט בעברית, הקלטת קול) וממירים אותו לרצף אחר (משפט באנגלית, טקסט כתוב).
למה זה חשוב
העיקרון שעומד מאחורי תרגום, סיכום טקסט, וזיהוי דיבור.
למידה פעילה מתקדם
הגדרה
אסטרטגיית אימון חכמה שבה המודל מזהה בעצמו באילו מקרים הוא "מתלבט", ומבקש מהאדם לתייג רק את המקרים הקשים האלו.
למה זה חשוב
חוסך המון כסף על תיוג. במקום לתייג מיליון תמונות, מתייגים רק את ה-10,000 שהמודל באמת צריך כדי להשתפר.
למידת תוכנית לימודים מתקדם
הגדרה
שיטת אימון המבוססת על חינוך אנושי: מתחילים ללמד את המודל דוגמאות קלות ופשוטות, ורק כשהוא מבין אותן עוברים לדוגמאות מורכבות.
למה זה חשוב
מאיץ את האימון ומשפר תוצאות, בדיוק כמו שלא מלמדים ילד בכיתה א' משוואות דיפרנציאליות לפני שלמד חיבור.
בעיית הגרדיאנט הנעלם מקצועי
הגדרה
כשל מתמטי ברשתות עמוקות ישנות, שבו "אותות התיקון" נחלשים ונעלמים ככל שהם הולכים אחורה בשכבות, מה שמונע מהרשת ללמוד.
למה זה חשוב
פתרון הבעיה הזו (באמצעות ReLU ו-ResNet) הוא מה שאיפשר את מהפכת ה-Deep Learning המודרנית.
גרדיאנט מתפוצץ מקצועי
הגדרה
המצב ההפוך: התיקונים למשקולות נהיים ענקיים בצורה בלתי נשלטת, והמודל "משתגע" ומאבד כל קשר למציאות.
למה זה חשוב
גורם לקריסת אימון מיידית. מחייב שימוש ב"קיטום גרדיאנט" (Clipping) כדי לרסן את השינויים.
קשב עצמי (Self-Attention) מקצועי
הגדרה
המנגנון שמאפשר למודל להבין הקשר בתוך משפט בודד, ע"י בדיקת הקשר של כל מילה לכל שאר המילים באותו משפט.
למה זה חשוב
זה מה שמאפשר ל-GPT להבין שבמשפט "הילד לקח את הכדור כי הוא רצה לשחק", המילה "הוא" מתייחסת לילד ולא לכדור.
קשב צולב (Cross-Attention) מקצועי
הגדרה
וריאציה של מנגנון הקשב שמחברת בין שני סוגי מידע שונים. למשל, הקשר בין מילים במשפט (טקסט) לבין אזורים בתמונה.
למה זה חשוב
המפתח למודלים מולטי-מודאליים (כמו Stable Diffusion), המאפשר להם לצייר את מה שכתוב בטקסט במדויק.
GELU מקצועי
הגדרה
פונקציית שפעול מודרנית וחלקה יותר מ-ReLU, הנמצאת בשימוש ברוב המודלים הגדולים (GPT, BERT) כי היא משפרת ביצועים.
למה זה חשוב
שיפור מתמטי קטן שמניב תוצאות טובות יותר במודלי שפה לעומת הפונקציות הישנות.
נרמול אצווה (Batch Norm) מקצועי
הגדרה
שיטה לייצוב האימון של רשתות עמוקות על ידי נרמול הנתונים בכל שכבה, כך שהממוצע שלהם יישאר קבוע.
למה זה חשוב
מאפשר לאמן רשתות הרבה יותר מהר ובקצבי למידה גבוהים יותר, בלי שהן "יצאו מאיזון".
חיובי שגוי (False Positive) מקצועי
הגדרה
טעות שבה המודל מזהה משהו שלא קיים ("אזעקת שווא"). למשל: המודל אומר שיש שריפה כשאין שריפה.
למה זה חשוב
מטריד משתמשים. מערכת סינון ספאם עם הרבה False Positives תזרוק מיילים חשובים לזבל.
שלילי שגוי (False Negative) מקצועי
הגדרה
טעות שבה המודל מפספס משהו שכן קיים ("פספוס"). למשל: המודל אומר שהחולה בריא, למרות שהוא חולה.
למה זה חשוב
מסוכן מאוד ברפואה ובאבטחה. עדיף אזעקת שווא מאשר לפספס פריצה אמיתית.
גבול החלטה מקצועי
הגדרה
הקו (או המשטח) המתמטי שהמודל מצייר כדי להפריד בין קטגוריות. כל מה שמימין לקו הוא "חתול", ומשמאל הוא "כלב".
למה זה חשוב
אימון המודל הוא בעצם הזזה ועיקום של הקו הזה עד שהוא מפריד את הנתונים בצורה הטובה ביותר.
מינימום מקומי מקצועי
הגדרה
מלכודת באימון: המודל מוצא פתרון שנראה "הכי טוב בסביבה", ונתקע בו, למרות שיש פתרון טוב הרבה יותר (מינימום גלובלי) במקום אחר.
למה זה חשוב
כמו מטפס הרים שיורד לעמק וחושב שהגיע הכי נמוך שאפשר, בלי לדעת שמעבר להר יש עמק עמוק יותר (פתרון טוב יותר).
התכנסות (Convergence) מקצועי
הגדרה
המצב שבו האימון מצליח: הגרף של השגיאה (Loss) מפסיק לרדת ומתייצב על ערך נמוך. המודל "מצא את הפתרון".
למה זה חשוב
הסימן שאפשר להפסיק לאמן. אם המודל לא מתכנס (הגרף משתולל), סימן שמשהו בהגדרות לא תקין.
תמונה לתמונה (Img2Img) יסוד
הגדרה
שיטה שבה נותנים ל-AI תמונה קיימת + הנחיה טקסטואלית, והוא יוצר וריאציה חדשה שמבוססת על הקומפוזיציה של התמונה המקורית.
למה זה חשוב
מאפשר להפוך שרטוט ידני מהיר ("סקיצה") לציור ריאליסטי מרהיב, או לשנות סגנון של תמונה מצילום לציור שמן.
זיכרון וידאו (VRAM) חומרה
הגדרה
הזיכרון המהיר שנמצא על המעבד הגרפי (GPU). זהו המשאב הקריטי ביותר בהרצת מודלים מקומיים.
למה זה חשוב
כמות ה-VRAM קובעת איזה מודל תוכל להריץ. מודל Llama-70B דורש כ-40GB VRAM, ולכן לא ירוץ על כרטיס גיימינג רגיל (שיש לו 8GB).
רוחב פס זיכרון מקצועי
הגדרה
המהירות שבה הכרטיס יכול לקרוא ולכתוב מידע לזיכרון. זה ה"צינור" שדרכו עובר המודל.
למה זה חשוב
צוואר הבקבוק האמיתי של מודלי שפה. הם מוגבלים ע"י מהירות הזיכרון (Memory Bound) ולא ע"י מהירות החישוב.
מס הלימה (Alignment Tax) מקצועי
הגדרה
הירידה בביצועים או ביצירתיות של המודל, הנובעת מהצורך להפוך אותו לבטוח, מוסרי ומרוסן.
למה זה חשוב
מודל "פרוץ" (Uncensored) יהיה לעיתים חכם ומוכשר יותר בכתיבת סיפורים, כי הוא לא מוגבל ע"י מסנני בטיחות כבדים.
Anthropic יסוד
הגדרה
חברת AI מובילה (מתחרה ב-OpenAI) שהוקמה ע"י פורשים מ-OpenAI במטרה להתמקד בבטיחות וב-AI "חוקתי". מפתחת את סדרת המודלים Claude.
OpenAI יסוד
הגדרה
החברה שהתחילה את מהפכת ה-AI הנוכחית עם השקת ChatGPT. מפתחת את מודלי GPT, DALL-E ו-Sora.
DeepMind (Google) יסוד
הגדרה
מעבדת המחקר היוקרתית של גוגל, האחראית לפריצות דרך מדעיות כמו AlphaGo (שחמט) ו-AlphaFold (ביולוגיה).
NVIDIA יסוד
הגדרה
יצרנית השבבים השולטת בשוק החומרה ל-AI. המעבדים הגרפיים שלה (GPU) הם התשתית שעליה רץ כמעט כל ה-AI בעולם.
עניי GPU (סלנג) סלנג
הגדרה
כינוי הומוריסטי לחברות סטארטאפ וחוקרים שאין להם גישה למחשבי-על ואלפי כרטיסי H100, ונאלצים להמציא פתרונות יצירתיים וחסכוניים (כמו LoRA).
עשירי GPU (סלנג) סלנג
הגדרה
חברות הענק (Meta, Google, OpenAI) שיש להן תקציב בלתי מוגבל וחוות שרתים עם עשרות אלפי כרטיסי מסך, המאפשרות להן לאמן מודלים בכוח ברוטלי.
מוגבל חישוב (Compute Bound) מקצועי
הגדרה
מצב שבו המודל רץ לאט כי המעבד עובד ב-100% והוא לא מספיק לבצע את החישובים המתמטיים. אופייני לשלב האימון.
מוגבל זיכרון (Memory Bound) מקצועי
הגדרה
מצב שבו המודל רץ לאט כי המעבד מחכה שהמידע יגיע אליו מהזיכרון. זהו המצב האופייני למודלי שפה (LLMs) בזמן הרצה (Inference).
מקביליות מודל מתקדם
הגדרה
שיטה להרצת מודל ענק על ידי חיתוך המודל עצמו לחלקים ופיזורם על פני מספר כרטיסי מסך שונים (כי הוא לא נכנס באחד).
מקביליות דאטה מתקדם
הגדרה
שיטת אימון שבה מעתיקים את אותו מודל ל-100 כרטיסים שונים, וכל כרטיס לומד מחלק אחר של הדאטה במקביל כדי לסיים מהר יותר.
מקביליות צינור (Pipeline) מתקדם
הגדרה
שיטת חלוקה שבה כרטיס אחד מחשב את השכבה הראשונה של המודל, ומעביר את התוצאה לכרטיס השני שמחשב את השכבה הבאה, כמו פס ייצור במפעל.
קשב בזק (Flash Attention) מקצועי
הגדרה
אלגוריתם אופטימיזציה חכם המייעל את דרך הגישה לזיכרון ה-GPU, ומאיץ את המודל פי כמה תוך חיסכון עצום בזיכרון.
למה זה חשוב
הטכנולוגיה שאיפשרה למודלים להגדיל את "חלון ההקשר" שלהם מאלפי מילים למאות אלפים (כמו ב-Claude ו-Gemini).
מטמון KV מקצועי
הגדרה
טכניקת אופטימיזציה ששומרת בזיכרון את החישובים של המילים הקודמות, כדי שהמודל לא יצטרך לחשב את כל המשפט מחדש עבור כל מילה חדשה שהוא כותב.
למה זה חשוב
בלי זה, יצירת טקסט הייתה איטית פי 100. זה מה שמאפשר ל-ChatGPT לכתוב תשובה בזמן אמת.
חלון תשומת לב נגרר מקצועי
הגדרה
טכניקה המאפשרת למודל לקרוא טקסטים ארוכים על ידי התמקדות רק ב"חלון" מצומצם של מילים בכל רגע, שזז לאורך הטקסט.
RoPE (מיקום סיבובי) מקצועי
הגדרה
שיטה מתמטית מודרנית לקידוד מיקום המילים במשפט, המשתמשת בסיבובים במרחב הוקטורי.
למה זה חשוב
מאפשרת למודל להבין יחסים בין מילים גם במרחקים גדולים, ומהווה את הסטנדרט במודלים כמו Llama.
SwiGLU מקצועי
הגדרה
פונקציית שפעול מתקדמת שהחליפה את ReLU במודלים המודרניים ביותר (כמו Llama ו-PaLM) בזכות ביצועים עדיפים.
עירוב עומקים (MoD) מתקדם
הגדרה
שיטה חדשנית שבה המודל לומד "לדלג" על חישובים מיותרים עבור מילים פשוטות, ולהשקיע מאמץ רק במילים מורכבות.
למה זה חשוב
חוסך המון משאבים. לא צריך את כל המוח של המודל כדי להבין את המילה "את", אבל כן צריך אותו למילה "אנציקלופדיה".
Mamba (ארכיטקטורת SSM) מקצועי
הגדרה
ארכיטקטורה חדשה המנסה להחליף את הטרנספורמרים. היא יעילה פי כמה בזיכרון ומסוגלת לעבד טקסטים ארוכים במיוחד במהירות קבועה.
RWKV מקצועי
הגדרה
מודל היברידי המנסה לשלב את הטוב משני העולמות: היכולות של טרנספורמר עם היעילות והמהירות של רשתות RNN ישנות (RNN-Transformer Hybrid).
קשב לינארי מקצועי
הגדרה
גרסה חסכונית של מנגנון הקשב שבה כמות החישובים גדלה באופן מתון ככל שהטקסט מתארך, בניגוד לקשב הרגיל שגדל בריבוע.
מודלי מרחב מצב (SSM) מקצועי
הגדרה
משפחה של מודלים מתמטיים (ש-Mamba היא חלק ממנה) המצטיינים במידול רצפים ארוכים מאוד, ומהווים את המתחרה הראשי לטרנספורמרים.
מקודד ראייה מקצועי
הגדרה
הרכיב במודל מולטי-מודאלי שתפקידו "לראות": הוא הופך תמונה לייצוג מתמטי שהמודל הלשוני יכול להבין.
למה זה חשוב
מאפשר לחבר "עיניים" ל"מוח" קיים; אפשר לקחת מודל שפה רגיל, לחבר לו מקודד ראייה, ולקבל מודל שמבין תמונות.
מתאם (Adapter) מקצועי
הגדרה
מודול קטן שניתן "להוסיף" למודל גדול וקפוא כדי ללמד אותו משימה חדשה, בלי לאמן את כל המודל מחדש (בסיס לשיטת LoRA).
מודל שדרה (Backbone) מקצועי
הגדרה
החלק המרכזי והכבד ביותר במודל, שאחראי על הפקת התכונות וההבנה הכללית, שעליו מלבישים "ראשים" (Heads) למשימות ספציפיות.
ראש (Head) מקצועי
הגדרה
השכבה האחרונה של המודל, שלוקחת את כל ההבנה מה-"Backbone" וממירה אותה לתשובה הסופית (למשל: "חתול" או "כלב").
Grok (xAI) יסוד
הגדרה
מודל ה-AI של אילון מאסק (חברת xAI), המאופיין בגישה הומוריסטית, צינית ופחות מצונזרת ("Woke"), וגישה למידע בזמן אמת מ-X (טוויטר).
למה זה חשוב
אלטרנטיבה "מורדת" ל-ChatGPT המנומס. היכולת שלו לשלוף ציוצים בזמן אמת נותנת לו יתרון בחדשות חמות.
Qwen (עליבאבא) מקצועי
הגדרה
סדרת מודלים חזקה מאוד של ענקית הטכנולוגיה הסינית Alibaba. נחשבת לאחת הטובות בעולם בקוד פתוח, במיוחד במתמטיקה וקוד.
למה זה חשוב
מוכיח שההובלה בתחום ה-AI אינה נחלתה הבלעדית של ארה"ב. Qwen מתחרה ראש בראש עם Llama 3 בטבלאות הדירוג.
Falcon (TII) מקצועי
הגדרה
מודל שפה ענק ופתוח שפותח על ידי המכון לחדשנות טכנולוגית (TII) באבו דאבי.
למה זה חשוב
הציב את איחוד האמירויות על מפת ה-AI העולמית ככוח משמעותי, והיה מהראשונים לשחרר מודל ענק ברישיון חופשי לחלוטין (Apache 2.0).
Adam (אופטימייזר) מקצועי
הגדרה
האלגוריתם הפופולרי ביותר לניהול תהליך הלמידה (Gradient Descent). הוא יודע להתאים את קצב הלמידה לכל פרמטר בנפרד בצורה חכמה.
למה זה חשוב
הוא ה"נהג האוטומטי" של האימון. כמעט כל מודל מודרני (מ-GPT ועד Vision) משתמש ב-Adam (או בגרסה שלו, AdamW) כדי ללמוד ביעילות.
סיגמואיד (Sigmoid) מקצועי
הגדרה
פונקציית הפעלה מתמטית קלאסית בצורת S, המכווצת כל מספר לטווח שבין 0 ל-1.
למה זה חשוב
הייתה בסיסית בעבר, אך הוחלפה ברובה ע"י ReLU במודלים עמוקים בגלל בעיית "הגרדיאנט הנעלם". עדיין משמשת להסתברויות פשוטות (כן/לא).
Nightshade (רעל לאומנות) מתקדם
הגדרה
כלי הגנה לאומנים המוסיף שינויים בלתי נראים לפיקסלים ביצירה, כך שאם חברת AI תנסה לאמן עליה מודל – המודל "יורעל" ויתחיל לזהות כלבים כחתולים.
למה זה חשוב
נשק במלחמה של היוצרים נגד חברות ה-AI שסורקות את האינטרנט ללא רשות.
מחברת יופיטר יסוד
הגדרה
סביבת עבודה אינטראקטיבית לכתיבת קוד (בעיקר פייתון), המאפשרת לשלב קוד, טקסט, גרפים ותמונות במסמך אחד.
למה זה חשוב
כלי העבודה הראשי של מדעני נתונים (Data Scientists). כמעט כל ניסוי ב-AI מתחיל במחברת כזו.
Google Colab יסוד
הגדרה
גרסת ענן חינמית של Jupyter Notebook המנוהלת על ידי גוגל, ומספקת גישה חינם למעבדים גרפיים (GPU) חזקים.
למה זה חשוב
הפך את ה-Deep Learning לנגיש לכל סטודנט וחובב, גם אם יש לו לפטופ ישן וחלש.
Kaggle יסוד
הגדרה
הקהילה הגדולה בעולם למדעני נתונים. אתר המארח תחרויות AI עם פרסים כספיים, ומאגר עצום של דאטה וקוד ללמידה.
למה זה חשוב
המקום שבו נולדים ומתגלים כוכבי ה-AI הבאים, ובו מפותחות רבות מהטכניקות המתקדמות ביותר.
XGBoost מקצועי
הגדרה
אלגוריתם למידת מכונה קלאסי (לא Deep Learning) המבוסס על "עצי החלטה".
למה זה חשוב
למרות ההייפ סביב רשתות עצביות, XGBoost עדיין מנצח אותן בביצועים על נתונים טבלאיים רגילים (אקסל, פיננסים) והוא מהיר פי כמה.
יער אקראי יסוד
הגדרה
שיטת למידה שבה המחשב בונה המון "עצי החלטה" (תרשימי זרימה של שאלות כן/לא) ולוקח את החלטת הרוב ביניהם.
למה זה חשוב
מודל חזק, יציב וקל להבנה, שמשמש עד היום בבנקים, רפואה ותעשייה לניתוח נתונים.
Blackwell (B200) חומרה
הגדרה
הדור החדש והמפלצתי של שבבי ה-AI מבית NVIDIA (מחליף את ה-H100), המבטיח פי 30 ביצועים במודלים מסוימים.
למה זה חשוב
החומרה שתאפשר את אימון הדור הבא (GPT-5 ואילך) ותהפוך את ה-AI למהיר וזול יותר משמעותית.
זיהוי תווים אופטי (OCR) יסוד
הגדרה
טכנולוגיה הממירה תמונה של טקסט (כמו סריקה של מסמך או צילום של שלט רחוב) לטקסט ממוחשב שניתן לערוך ולחפש בו.
למה זה חשוב
הגשר בין העולם הפיזי (נייר) לדיגיטלי. היום מודלים כמו GPT-4 Vision עושים את זה כחלק טבעי מהראייה שלהם.
הזרקה עקיפה מתקדם
הגדרה
מתקפה מתוחכמת שבה ההוראה הזדונית לא נכתבת על ידי המשתמש, אלא נמצאת בתוך דף אינטרנט או מסמך שהמודל "קורא" לבקשת המשתמש.
למה זה חשוב
מסוכן מאוד לסוכנים אוטונומיים. אתם מבקשים "סכם את האתר הזה", והאתר מכיל טקסט נסתר שמשתלט על הבוט שלכם.
WormGPT יסוד
הגדרה
מודל שפה "אפל" שנוצר במיוחד עבור פושעי סייבר, ללא שום מגבלות אתיות או מסנני בטיחות.
למה זה חשוב
משמש לכתיבת מיילים של פישינג (Phishing) משכנעים וקוד זדוני (Malware) בקלות, גם על ידי אנשים ללא ידע טכני.
ספקטרוגרמה (Mel) מקצועי
הגדרה
ייצוג ויזואלי של סאונד (תמונה של גלי הקול) שמותאם לאוזן האנושית. זהו הפורמט שדרכו מודלי AI "רואים" ושומעים אודיו.
למה זה חשוב
השלב הראשון בכל מערכת זיהוי דיבור או יצירת מוזיקה. המחשב הופך את הסאונד לתמונה, ואז משתמש בטכניקות של ראייה ממוחשבת.
סנכרון שפתיים (Lip Sync) יסוד
הגדרה
טכנולוגיה המתאימה את תנועת השפתיים של אדם בוידאו לקובץ אודיו חדש, כך שזה ייראה כאילו הוא באמת אמר את המילים האלו.
למה זה חשוב
מאפשר דיבוב סרטים מושלם לשפות אחרות, אך גם מסוכן ליצירת Deepfakes משכנעים.
ריפוד (Padding) מקצועי
הגדרה
הוספת טוקנים ריקים ("0") למשפטים קצרים כדי שכל המשפטים ב-Batch יהיו באותו אורך בדיוק.
למה זה חשוב
אילוץ טכני. המעבדים הגרפיים (GPU) אוהבים לעבוד עם "מלבנים" מושלמים של מספרים, ולא עם משפטים באורכים משתנים.
מילות עצירה מקצועי
הגדרה
מילים נפוצות מאוד (כמו "את", "של", "הוא") שלעיתים מסננים אותן החוצה לפני העיבוד כי הן לא תורמות הרבה למשמעות הכללית.
למה זה חשוב
היה קריטי בשיטות NLP ישנות. במודלים חדשים כמו GPT, דווקא משאירים אותן כי הן חשובות להקשר ולזרימה.
למטיזציה (שורש המילה) מקצועי
הגדרה
תהליך בלשני הממיר מילים לצורת הבסיס שלהן במילון (למשל: "הלכתי", "ילכו" -> "הלך").
למה זה חשוב
עוזר למחשב להבין ש"ילד" ו"ילדים" הם בעצם אותו מושג, ולא שתי מילים שונות לחלוטין.
N-Gram מקצועי
הגדרה
רצף של N מילים המופיעות יחד. מודלים ישנים השתמשו בסטטיסטיקה של N-Grams כדי לנחש את המילה הבאה (למשל: אחרי "בית" בא לרוב "ספר").
למה זה חשוב
האבא הקדמון של ה-LLM. הוא עבד יפה לביטויים קצרים, אבל נכשל בהבנת הקשר ארוך ומורכב.
שרשרת מרקוב מקצועי
הגדרה
מודל מתמטי פשוט שבו המצב הבא תלוי *רק* במצב הנוכחי. משמש ליצירת טקסט ג'יבריש שנראה אמיתי במבט שטחי.
למה זה חשוב
ההיסטוריה של ה-Generative AI. מראה את ההבדל העצום בין "ניחוש סטטיסטי פשוט" לבין ה"הבנה" שיש לטרנספורמרים היום.
איגום (Pooling) מקצועי
הגדרה
פעולה ברשתות זיהוי תמונה (CNN) המקטינה את גודל התמונה ע"י לקיחת הממוצע או המקסימום של כל אזור קטן.
למה זה חשוב
מאפשר למודל "להתרחק" ולראות את התמונה הגדולה (חתול) במקום להתמקד בפרטים הקטנים (שערה בפרווה).
צעד (Stride) מקצועי
הגדרה
פרמטר הקובע בכמה פיקסלים ה"חלון" של הרשת זז בכל פעם שהוא סורק את התמונה.
למה זה חשוב
צעד גדול = סריקה מהירה ופחות מדויקת; צעד קטן = סריקה איטית ומפורטת.
מומנטום (תנע) מקצועי
הגדרה
טכניקה באלגוריתמים של אימון שעוזרת למודל "לצבור תאוצה" בכיוון הנכון ולהתגבר על מכשולים קטנים (רעש) בדרך.
למה זה חשוב
כמו כדור כבד שמתגלגל במורד ההר – המומנטום מונע ממנו להיתקע בבורות קטנים בדרך למטה.
דעיכת קצב למידה מקצועי
הגדרה
האטה מכוונת של קצב הלמידה ככל שהאימון מתקדם. מתחילים בצעדים גדולים ומסיימים בצעדים מיקרוסקופיים.
למה זה חשוב
מאפשר למודל "להתביית" על הפתרון האופטימלי בדיוק רב, בלי לקפוץ מעליו הלוך ושוב.
הצפנה הומומורפית מתקדם
הגדרה
ה"גביע הקדוש" של הפרטיות: שיטה המאפשרת למודל AI לבצע חישובים על מידע מוצפן *מבלי לפענח אותו*.
למה זה חשוב
יאפשר בעתיד לשלוח נתונים רפואיים ל-ChatGPT כדי לקבל אבחנה, כשהמידע נשאר מוצפן וה-AI עצמו לא "רואה" אותו.
ערכי SHAP מקצועי
הגדרה
שיטה מתמטית המסבירה בדיוק כמה כל פרמטר תרם להחלטה הסופית. (למשל: "המשכנתא סורבה בגלל: גיל (+20%), הכנסה (-50%)").
למה זה חשוב
הכלי המוביל בתעשייה להסברת מודלים (XAI). הופך קופסה שחורה לקופסה שקופה.
החלקת תוויות מקצועי
הגדרה
טכניקה שבה אומרים למודל באימון: "זה בטוח כלב, אבל תהיה בטוח רק ב-90%, לא ב-100%".
למה זה חשוב
מונע מהמודל להיות "יהיר" מדי (Overconfident) ועוזר לו להתמודד טוב יותר עם מקרים גבוליים בעתיד.
רגולריזציה (אסדרה) מקצועי
הגדרה
אוסף של שיטות מתמטיות שנועדו "להעניש" את המודל אם הוא הופך למורכב מדי, כדי להכריח אותו להישאר פשוט וכללי.
למה זה חשוב
התרופה הראשית ל-Overfitting. מונע מהמודל לשנן את הדאטה ומכריח אותו ללמוד עקרונות.
אנסמבל (הרכב) יסוד
הגדרה
שיטה שבה מאמנים מספר מודלים שונים ומשלבים את התחזיות שלהם כדי לקבל החלטה סופית (כמו חוות דעת שנייה ושלישית).
למה זה חשוב
תמיד מדויק יותר ממודל יחיד. מבוסס על "חוכמת ההמונים" של האלגוריתמים.
עץ החלטה יסוד
הגדרה
מודל פשוט ובסיסי הנראה כמו תרשים זרימה של שאלות כן/לא ("האם יורד גשם?" -> כן -> "האם יש רוח?").
למה זה חשוב
קל מאוד להבנה ולשימוש. משמש בסיס למודלים חזקים יותר כמו Random Forest ו-XGBoost.
רגרסיה לוגיסטית יסוד
הגדרה
המודל הסטטיסטי הבסיסי ביותר לסיווג בינארי (כן/לא). מחשב את ההסתברות שאירוע מסוים יקרה.
למה זה חשוב
האבא של ה-Neural Networks. נוירון בודד ברשת עמוקה הוא בעצם מודל רגרסיה לוגיסטית קטן.
אימות צולב (K-Fold) מקצועי
הגדרה
שיטה חכמה לבדיקת מודל: מחלקים את הדאטה ל-5 חלקים, ומאמנים את המודל 5 פעמים, כשבכל פעם חלק אחר משמש כמבחן.
למה זה חשוב
מוודא שההצלחה של המודל לא הייתה מקרית ("פוקס") בגלל החלוקה הספציפית של הנתונים. נותן ציון אמין יותר.
חיפוש רשת (Grid Search) מקצועי
הגדרה
שיטה למציאת ההגדרות הטובות ביותר למודל (Hyperparameters) ע"י ניסוי שיטתי של *כל* הקומבינציות האפשריות.
למה זה חשוב
כמו לנסות את כל המפתחות בצרור כדי למצוא את זה שפותח את הדלת. יסודי אך איטי מאוד.
Pandas יסוד
הגדרה
ספריית פייתון שהיא ה"אקסל על סטרואידים" של מדעני הנתונים. מאפשרת לטפל בטבלאות מידע ענקיות בקלות.
למה זה חשוב
לפני שמכניסים נתונים ל-AI, חייבים לסדר ולנקות אותם. Pandas הוא הכלי מס' 1 בעולם למשימה הזו.
NumPy יסוד
הגדרה
ספריית היסוד של פייתון לחישובים מתמטיים. מאפשרת לעבוד עם מערכים ומטריצות במהירות על-קולית.
למה זה חשוב
כל ספריית AI (כמו PyTorch או TensorFlow) בנויה על היסודות המתמטיים של NumPy.
Scikit-learn יסוד
הגדרה
ארגז הכלים הפופולרי ביותר ללמידת מכונה קלאסית (לא Deep Learning). מכיל את כל האלגוריתמים הבסיסיים מוכנים לשימוש.
למה זה חשוב
הצעד הראשון של כל מפתח AI. רוצים להריץ רגרסיה או למצוא אשכולות? זה הכלי.
Matplotlib יסוד
הגדרה
הספרייה הסטנדרטית ליצירת גרפים וויזואליזציות בפייתון.
למה זה חשוב
מאפשרת לראות בעיניים את התקדמות האימון (Loss Curve) ולהבין מה המודל עושה. תמונה שווה אלף מספרים.
ניתוח מבנה מסמך מקצועי
הגדרה
טכנולוגיית AI המבינה לא רק את הטקסט במסמך (OCR), אלא גם את העיצוב שלו: כותרות, טבלאות, תמונות ועמודות.
למה זה חשוב
קריטי להמרת קבצי PDF לפורמט שה-AI יכול לקרוא. בלי זה, טבלה במסמך הופכת לסלט של מילים לא מובנות.
אינפיניבנד (InfiniBand) חומרה
הגדרה
תקן תקשורת סופר-מהיר המשמש לחיבור בין שרתים בחוות מחשוב-על (פותח במקור בישראל ע"י מלאנוקס).
למה זה חשוב
ה"כביש המהיר" שמאפשר לאלפי כרטיסי מסך לדבר זה עם זה במהירות האור כדי לאמן מודל אחד ענק.
NVSwitch חומרה
הגדרה
רכיב חומרה של NVIDIA שמתפקד כ"שוטר תנועה" ומאפשר לכל ה-GPUs בשרת לדבר ישירות אחד עם השני במהירות מקסימלית.
למה זה חשוב
מונע פקקי תנועה של מידע בתוך השרת, ומאפשר למודלים ענקיים לרוץ ביעילות.
רשתות נוזליות (LNN) מתקדם
הגדרה
סוג חדשני של רשתות עצביות המסוגלות לשנות את המבנה הפנימי שלהן ("לזרום") בזמן אמת כדי להסתגל לנתונים חדשים, גם אחרי שהאימון נגמר.
למה זה חשוב
הבטחה לעתיד של רובוטיקה ורכבים אוטונומיים, שצריכים להסתגל לתנאי שטח משתנים באופן מיידי.
מודל שפה-ראייה (VLM) מקצועי
הגדרה
השם המקצועי למודלים היודעים גם לקרוא טקסט וגם להבין תמונות (כמו LLaVA או GPT-4V).
למה זה חשוב
מאפשר לפתח "עיניים חכמות": אפליקציות שיכולות לענות על שאלות לגבי מה שהמצלמה רואה.
עירוב סוכנים (MoA) מתקדם
הגדרה
שיטה המנצלת מספר מודלים שונים (למשל: GPT-4, Claude ו-Llama) העובדים יחד, כאשר מודל אחד משקלל את התשובות של כולם לתשובה אופטימלית.
למה זה חשוב
מוכיח ש"צוות" של מודלים חכמים מצליח לנצח בביצועים כל מודל יחיד, גם אם הוא חזק מאוד.
LIDAR חומרה
הגדרה
חיישן לייזר הממפה את הסביבה בתלת-ממד בדיוק של מילימטרים. משמש כ"עיניים" של רוב הרכבים האוטונומיים.
למה זה חשוב
נותן ל-AI תמונת עולם תלת-ממדית מדויקת, בניגוד למצלמה רגילה שרואה שטוח.
היתוך חיישנים מתקדם
הגדרה
היכולת של ה-AI לשלב מידע ממקורות שונים (מצלמה, רדאר, לייזר) לתמונת מצב אחת אחידה ואמינה.
למה זה חשוב
קריטי לבטיחות. אם המצלמה מסונוורת מהשמש, הרדאר עדיין רואה את המשאית שלפנים.
ענן נקודות מקצועי
הגדרה
פורמט מידע תלת-ממדי המורכב ממיליוני נקודות בחלל. זהו הפלט הגולמי שמגיע סורקי תלת-ממד ו-LIDAR.
למה זה חשוב
הבסיס לכל תעשיית המיפוי והתלת-ממד. המחשב צריך ללמוד להבין ש"ענן הנקודות" הזה הוא בעצם כיסא.
Deep Voice יסוד
הגדרה
טכנולוגיית AI המסוגלת ליצור קול אנושי סינתטי שנשמע אמיתי לחלוטין, ואף לחקות מבטאים ורגשות.
למה זה חשוב
מאפשרת לעוזרים קוליים להישמע טבעיים, אך משמשת גם ליצירת "פייק ניוז" קולי (הקלטות מזויפות של פוליטיקאים).
הערכה אנושית יסוד
הגדרה
השלב הסופי והקובע בבדיקת מודל: נותנים לבני אדם אמיתיים להשתמש בו ולדרג אותו, כי שום מדד מתמטי (כמו Perplexity) לא יכול למדוד "איכות שיחה".
למה זה חשוב
בסופו של דבר, המודל נועד לשרת אנשים. אם המספרים טובים אבל האנשים לא מרוצים – המודל נכשל.
ELIZA יסוד
הגדרה
הצ'אטבוט הראשון בהיסטוריה. תוכנה פשוטה שחיקתה פסיכולוג על ידי חזרה על דברי המשתמש כשאלה ("למה אתה חושב ש…?").
למה זה חשוב
הוכיחה שבני אדם נוטים להשליך רגשות ותבונה על מחשבים (אפקט אלייזה), גם כשהמחשב טיפש לחלוטין.
AlexNet יסוד
הגדרה
המודל ההיסטורי שניצח בתחרות ImageNet בהפרש עצום, וסימן את תחילת עידן ה-Deep Learning המודרני.
למה זה חשוב
הרגע שבו העולם המדעי הבין שרשתות עצביות על כרטיסי מסך (GPU) הן העתיד של הבינה המלאכותית.
מבחן MMLU מקצועי
הגדרה
מבחן אינטליגנציה מקיף למודלי שפה, הכולל 16,000 שאלות אמריקאיות ב-57 נושאים שונים (מתמטיקה, היסטוריה, רפואה, משפטים).
למה זה חשוב
המדד המוביל כיום להשוואה בין מודלים (כמו GPT-4 מול Gemini Ultra). ציון גבוה מעיד על ידע עולם רחב.
מבחן HellaSwag מקצועי
הגדרה
מבחן הבודק "שכל ישר" (Common Sense) על ידי השלמת משפטים במצבים יומיומיים מסובכים, שקשים למחשב אך קלים לאדם.
למה זה חשוב
בודק אם המודל באמת מבין איך העולם עובד, או רק משנן עובדות מוויקיפדיה.
ComfyUI מקצועי
הגדרה
ממשק משתמש מתקדם (מבוסס תרשים זרימה) לעבודה עם Stable Diffusion, המאפשר שליטה אבסולוטית בכל שלב ביצירת התמונה.
למה זה חשוב
הכלי המועדף על מקצועני AI Art שרוצים ליצור זרימות עבודה (Workflows) מורכבות ואוטומטיות.
Automatic1111 יסוד
הגדרה
ממשק האינטרנט הפופולרי והנפוץ ביותר להרצת Stable Diffusion על המחשב הביתי. כולל אלפי תוספים והרחבות.
למה זה חשוב
הפך את יצירת התמונות ב-Open Source לנגישה להמונים והוא הסטנדרט לשיתוף כלי עזר בקהילה.
GGUF (פורמט קבצים) מקצועי
הגדרה
פורמט קבצים מודרני לשמירת מודלי שפה, המותאם במיוחד להרצה מהירה על מעבדים רגילים (CPU) וכרטיסי מסך של אפל (M1/M2/M3).
למה זה חשוב
אם הורדתם מודל כדי להריץ אותו מקומית על הלפטופ, רוב הסיכויים שזה קובץ GGUF.
Safetensors מקצועי
הגדרה
פורמט קבצים בטוח לשמירת משקולות של מודלים, שנועד להחליף את פורמט Pickle הישן והמסוכן שהיה חשוף לווירוסים.
למה זה חשוב
מבטיח שכשאתם מורידים מודל מהאינטרנט (Hugging Face), הוא לא יכיל קוד זדוני שיפרוץ למחשב שלכם.
Cursor (עורך קוד) יסוד
הגדרה
עורך קוד (IDE) מבוסס AI שנבנה מחדש כדי לשלב בינה מלאכותית כחלק אינטגרלי מהתכנות, ולא סתם כתוסף.
למה זה חשוב
נחשב כיום לכלי החזק ביותר למתכנתים, המאפשר לכתוב, לערוך ולתקן קוד שלם בשפה טבעית.
Runway יסוד
הגדרה
חברה וכלי מוביל ליצירה ועריכה של וידאו באמצעות AI. מאפשר ליצור סרטים מטקסט, להנפיש תמונות ולשנות סגנון וידאו.
למה זה חשוב
הוליווד בכיס שלכם. מאפשר ליוצרים עצמאיים להפיק אפקטים ויזואליים שהיו עולים פעם מיליונים.
Suno יסוד
הגדרה
מחולל מוזיקה פורץ דרך המייצר שירים מלאים (מילים + לחן + שירה) באיכות רדיו, לפי תיאור טקסטואלי פשוט.
למה זה חשוב
עושה למוזיקה מה ש-ChatGPT עשה לטקסט. מאפשר לכל אחד להלחין שיר מקצועי בכל סגנון תוך דקות.
IP-Adapter מקצועי
הגדרה
תוסף למודלי תמונה המאפשר להשתמש בתמונה כפרומפט (במקום מילים) בצורה חזקה מאוד, כדי להעתיק במדויק סגנון או פנים.
למה זה חשוב
הכלי המרכזי ליצירת דמויות עקביות (Consistent Characters) וליצירת "בוקים" של אותה דמות בסיטואציות שונות.
מודל עקביות לטנטי (LCM) מקצועי
הגדרה
טכנולוגיית האצה המאפשרת למחוללי תמונות לייצר תמונה איכותית ב-4 עד 8 צעדים בלבד (במקום 20-50).
למה זה חשוב
מאפשר יצירת תמונות בזמן אמת (Real-Time Generation), כך שהתמונה משתנה תוך כדי שאתה מקליד או מצייר.
שרשרת הצפיפות מתקדם
הגדרה
טכניקת סיכום מתקדמת: מבקשים מהמודל לסכם טקסט, ואז לסכם את הסיכום שוב תוך הוספת עוד פרטים חשובים שהושמטו, וחוזר חלילה.
למה זה חשוב
מייצר סיכומים דחוסים ועשירים במידע, במקום סיכומים דלילים וכלליים מדי.
שלד המחשבה (SoT) מתקדם
הגדרה
טכניקה להאצת תשובות: מבקשים מהמודל לכתוב קודם את ראשי הפרקים (השלד) של התשובה, ואז למלא את התוכן של כל נקודה במקביל.
למה זה חשוב
מקצר זמני המתנה לתשובות ארוכות ומייצר מבנה מאורגן וברור יותר.
Perplexity (מנוע חיפוש) יסוד
הגדרה
מנוע תשובות מבוסס AI המשלב מודל שפה עם חיפוש בזמן אמת באינטרנט, ומספק תשובות עם ציטוטים ומקורות מדויקים.
למה זה חשוב
המתחרה הרציני הראשון לגוגל מזה שנים. משנה את הדרך שבה אנחנו מחפשים מידע – מתשובת קישורים לתשובת טקסט.
WebGPU מקצועי
הגדרה
טכנולוגיית דפדפן חדשה המאפשרת לאתרי אינטרנט לגשת ישירות לכרטיס המסך של המשתמש ולהריץ מודלי AI כבדים בתוך הדפדפן.
למה זה חשוב
מאפשר להריץ צ'אטבוטים וכלים גרפיים באתר אינטרנט ללא צורך בהתקנה וללא שליחת מידע לשרת (פרטיות מלאה).
תקן C2PA מקצועי
הגדרה
תקן טכנולוגי פתוח לסימון מקור התוכן הדיגיטלי. מוסיף "חותמת דיגיטלית" מוצפנת לתמונה המעידה אם היא נוצרה על ידי מצלמה או AI.
למה זה חשוב
הכלי המרכזי במלחמה בפייק ניוז. יאפשר לרשתות חברתיות לסמן אוטומטית תמונות שנוצרו ב-AI.
סימן מים (Watermarking) יסוד
הגדרה
הטמעת תבנית בלתי נראית בתוך הפיקסלים של תמונה או בטקסט שנוצר ע"י AI, שניתן לזהות אותה רק באמצעות תוכנה מיוחדת.
למה זה חשוב
מאפשר לזהות תוכן שנוצר ע"י AI גם אם הוא נראה אמיתי לחלוטין, ולמנוע הפצת דיסאינפורמציה.
קללת המימדיות מקצועי
הגדרה
תופעה מתמטית בעייתית: ככל שמוסיפים יותר משתנים (מימדים) לנתונים, המרחב נהיה "דליל" מדי וקשה מאוד למצוא בו דפוסים.
למה זה חשוב
הסיבה שחייבים המון דאטה כדי לאמן מודלים מורכבים, והסיבה שמשתמשים בשיטות להורדת מימדים (כמו Embedding).
ירידה כפולה מתקדם
הגדרה
תופעה מפתיעה שבה ביצועי המודל משתפרים, ואז מידרדרים (Overfitting), אבל אם ממשיכים להגדיל אותו עוד – הם פתאום משתפרים שוב.
למה זה חשוב
שינתה את ההבנה שלנו על אימון. פעם חשבו ש"גדול מדי = רע", היום מבינים ש"ענק = מצוין".
למידה מתמשכת מתקדם
הגדרה
היכולת של מודל ללמוד מידע חדש כל הזמן מבלי לשכוח את מה שלמד בעבר (פתרון לבעיית "השכחה הקטסטרופלית").
למה זה חשוב
החלום של AI: מודל שמתעדכן מחדשות היום בבוקר, ולא צריך אימון מחדש של חודשים כדי לדעת מי ראש הממשלה.
צוות כחול יסוד
הגדרה
קבוצת אבטחה שתפקידה להגן על מודל ה-AI, לזהות מתקפות בזמן אמת ולתקן פרצות אבטחה (בניגוד ל"צוות האדום" שתוקף).
למה זה חשוב
שומרי הסף שמוודאים שהמודל לא נפרץ על ידי האקרים ולא פולט מידע רגיש.
פרשנות מכניסטית מקצועי
הגדרה
תחום מחקר המנסה להבין את ה-AI על ידי "הנדסה לאחור" (Reverse Engineering) של הנוירונים והמשקולות, כדי להבין איך בדיוק המודל חושב.
למה זה חשוב
הניסיון להפוך את האלכימיה למדע. במקום לנחש למה המודל ענה ככה, אנו רוצים לראות את המעגל החשמלי המדויק שגרם לזה.
קריסת אופנים (Mode Collapse) מקצועי
הגדרה
כשל באימון מודלים גנרטיביים (בעיקר GAN), שבו המודל "מתעצל" ומייצר שוב ושוב את אותה תמונה או וריאציה בודדת, במקום מגוון.
למה זה חשוב
בעיה קלאסית. במקום לייצר מגוון פרצופים, המודל מייצר רק את אותו פרצוף שנראה לו הכי בטוח.
GRU מקצועי
הגדרה
גרסה פשוטה ויעילה יותר של רשת LSTM. מנגנון זיכרון לרשתות, שדורש פחות כוח חישוב אך נותן ביצועים דומים.
למה זה חשוב
פופולרי במערכות קטנות או זמן-אמת שבהן אין משאבים כבדים להרצת LSTM מלא.
מסכת קשב מקצועי
הגדרה
מנגנון שאומר למודל מאיזה מילים עליו להתעלם. למשל, מסתירים את המילים העתידיות במשפט כדי שהמודל לא "יציץ" בתשובה בזמן האימון.
למה זה חשוב
הכרחי לאימון מודלים יוצרים (GPT). בלי המסכה, המודל היה רואה את סוף המשפט ולא לומד לחזות אותו.
פרספטרון יסוד
הגדרה
המודל הפשוט והראשון ביותר של רשת עצבית (הומצא ב-1957). נוירון מלאכותי בודד שלומד לסווג דברים לשתי קבוצות.
למה זה חשוב
האבא הקדמון של כל ה-AI. כל הרשתות העצומות של היום הן בעצם מיליארדי פרספטרונים מחוברים יחד.
SVM (מכונת וקטור תומך) מקצועי
הגדרה
אלגוריתם קלאסי וחזק לסיווג, שמוצא את הקו (או המישור) האופטימלי שמפריד בצורה הכי ברורה בין שתי קבוצות נתונים.
למה זה חשוב
היה המלך הבלתי מעורער של ה-AI לפני ה-Deep Learning. עדיין מעולה לבעיות קטנות ומדויקות.
בייס הנאיבי יסוד
הגדרה
אלגוריתם הסתברותי פשוט ומהיר, המבוסס על משפט בייס. מניח שכל התכונות בלתי תלויות זו בזו ("נאיבי").
למה זה חשוב
הבסיס ההיסטורי של מסנני הספאם הראשונים במייל.
Gradient Boosting מקצועי
הגדרה
טכניקה לאימון מודלים שבה בונים סדרה של מודלים חלשים, כשכל מודל חדש מנסה לתקן את הטעויות של המודל הקודם לו.
למה זה חשוב
הבסיס למודלים חזקים מאוד כמו XGBoost, השולטים בתחרויות דאטה שאינן דורשות זיהוי תמונה או טקסט.
Cohere יסוד
הגדרה
חברת AI המתמקדת אך ורק בפתרונות לארגונים (Enterprise). מספקת מודלים מאובטחים לחיפוש, סיכום וצ'אט עסקי.
למה זה חשוב
המובילה בתחום ה-RAG והחיפוש הארגוני. המודלים שלה (Command R) מצטיינים בעבודה עם מסמכים וציטוט מקורות.
Databricks מקצועי
הגדרה
פלטפורמת ענן ענקית לניהול דאטה ו-AI. מאפשרת לחברות לאחד את כל המידע שלהן במקום אחד ולאמן עליו מודלים (Dolly).
למה זה חשוב
התשתית שעליה בונים את ה-AI בארגוני ענק. רכשה את MosaicML כדי להנגיש אימון מודלים לחברות.
Snowflake מקצועי
הגדרה
חברת מחסני נתונים (Data Warehouse) שנכנסה חזק לתחום ה-AI, ומאפשרת להריץ מודלים ישירות במקום שבו המידע העסקי יושב.
למה זה חשוב
מביאה את ה-AI אל הדאטה, במקום להעביר את הדאטה ל-AI (מה שחוסך עלויות אבטחה והעברה).
MosaicML מקצועי
הגדרה
פלטפורמה המייעלת את תהליך האימון של מודלי שפה, ומאפשרת לאמן מודל משלך בעלות נמוכה פי כמה מהסטנדרט.
למה זה חשוב
הוכיחה שאימון מודל כמו GPT-3 לא חייב לעלות מיליונים, אלא אפשרי במאות אלפי דולרים בודדים.
כחול עמוק (Deep Blue) יסוד
הגדרה
מחשב השחמט של IBM שהיה הראשון לנצח אלוף עולם מכהן (גארי קספרוב) ב-1997.
למה זה חשוב
נקודת מפנה היסטורית שסימלה את הפעם הראשונה שמכונה גברה על האדם במשחק של "אינטליגנציה". (הוא פעל בשיטת "כוח גס", לא AI מודרני).
פרס לובנר יסוד
הגדרה
תחרות שנתית המעניקה פרסים לתוכנות שמצליחות לעבור גרסה של מבחן טיורינג ולשכנע שופטים שהן אנושיות.
למה זה חשוב
במשך שנים זה היה המדד ל"האם ה-AI מתקדם?". היום התחרות פחות רלוונטית כי מודלים כמו GPT עוברים אותה בקלות.
שרשור פרומפטים מתקדם
הגדרה
טכניקה של פירוק משימה מורכבת לסדרה של פרומפטים עוקבים, שבהם הפלט של שלב א' הופך לקלט של שלב ב'.
למה זה חשוב
מאפשר לבצע משימות שהמודל לא יכול לעשות ב"מכה אחת". למשל: 1. חלץ נתונים, 2. סכם אותם, 3. תרגם לספרדית.
מצב JSON מקצועי
הגדרה
הגדרה המכריחה את המודל להחזיר תשובה בפורמט קוד תקני (JSON) בלבד, ללא מלל מיותר מסביב.
למה זה חשוב
קריטי למפתחים. מאפשר לחבר את ה-AI לתוך אפליקציות ותוכנות, שמבינות רק קוד מובנה ולא "שיחות".
Oobabooga מקצועי
הגדרה
ממשק מתקדם (כמו Automatic1111 אבל לטקסט) להרצת מודלי שפה על המחשב האישי, עם שליטה מלאה בכל הפרמטרים הטכניים.
למה זה חשוב
הכלי של ה"הארדקור" בקהילת ה-AI המקומית. מאפשר לנסות מודלים חדשים וטכניקות דחיסה לפני כולם.
vLLM מקצועי
הגדרה
ספריית תוכנה מהירה במיוחד להרצת מודלי שפה (Inference), המשתמשת בניהול זיכרון חכם (PagedAttention).
למה זה חשוב
הסטנדרט התעשייתי למי שרוצה להרים שרת AI משלו שמגיב מהר ויכול לשרת הרבה משתמשים במקביל.
llama.cpp מקצועי
הגדרה
פרויקט קסום שכתב מחדש את הקוד של מודלי שפה ב-++C, ואיפשר להם לרוץ על מעבדים רגילים (CPU) ואפילו על טלפונים ומחשבי מק.
למה זה חשוב
הפרויקט שבזכותו אנחנו יכולים להריץ AI ללא כרטיס מסך של NVIDIA. הבסיס לפורמט GGUF.
קונטיינרים (Docker) מקצועי
הגדרה
שיטה לאריזת מודל AI יחד עם כל התוכנות והספריות שהוא צריך כדי לרוץ, בתוך "קופסה" (Container) אטומה וניידת.
למה זה חשוב
פותר את בעיית "אצלי במחשב זה עבד". מבטיח שהמודל יעבוד אותו דבר בדיוק בענן, בלפטופ או בשרת.
AI ללא שרת (Serverless) שימוש
הגדרה
מודל צריכה שבו המפתח לא מנהל שרתים בכלל, אלא רק שולח קוד או בקשה, ומשלם בדיוק על השניות שה-AI עבד (כמו מונית).
למה זה חשוב
אידיאלי לסטארטאפים ולשימוש מזדמן. חוסך את העלות של החזקת GPU יקר דולק 24/7.
מחשוב קצה יסוד
הגדרה
עיבוד הנתונים קרוב למקור (במצלמה, ברכב, בטלפון) במקום לשלוח הכל לשרת מרכזי רחוק.
למה זה חשוב
מצמצם את השיהוי (Latency) לאפס. רכב אוטונומי חייב לבלום מיד כשהוא רואה ילד, ולא לחכות לתשובה מהענן.
מחשוב אקסה-סקייל חומרה
הגדרה
הדור החדש של מחשבי-על, המסוגלים לבצע מעל קווינטיליון (10 בחזקת 18) חישובים בשנייה.
למה זה חשוב
הכוח הנדרש כדי לאמן את הדור הבא של מודלים (GPT-6?) ולבצע סימולציות מורכבות של אקלים ורפואה.
אבטלה טכנולוגית יסוד
הגדרה
אובדן מקומות עבודה הנגרם כתוצאה מכניסת טכנולוגיות חדשות (AI, אוטומציה) המחליפות עובדים אנושיים.
למה זה חשוב
החשש הכלכלי-חברתי המרכזי מעליית ה-AI. האם ייווצרו עבודות חדשות (כמו בעבר) או שהפעם זה שונה?
טרנס-הומניזם מתקדם
הגדרה
תנועה אינטלקטואלית הדוגלת בשימוש בטכנולוגיה (כמו AI וממשקי מוח-מחשב) כדי לשדרג את היכולות הפיזיות והמנטליות של האדם.
למה זה חשוב
חזון אפשרי לעתיד שבו נתמזג עם ה-AI (כמו Neuralink) במקום להתחרות בו.
כלכלת שפע (Post-Scarcity) מתקדם
הגדרה
מצב עתידי תיאורטי שבו AI ורובוטיקה מייצרים את רוב הסחורות והשירותים בעלות אפסית, כך שלכולם יש גישה לשפע חומרי.
למה זה חשוב
החזון האוטופי ("מסע בין כוכבים") של עידן ה-AGI, העומד כניגוד לחזון הדיסטופי של האבטלה.
עתיד העבודה יסוד
הגדרה
הדיון העולמי על האופן שבו AI ישנה את הקריירה האנושית: מעבר מעבודה טכנית וחזרתית לעבודה הדורשת יצירתיות, אמפתיה ופיקוח על מכונות.
למה זה חשוב
הסיכום של הכל. הבינה המלאכותית לא תחליף אנשים, אלא אנשים שמשתמשים בבינה מלאכותית יחליפו אנשים שלא.