מילון בינה מלאכותית בעברית

מילון מונחי בינה מלאכותית בעברית – Aivo

מילון מונחי AI המקיף

מילון מונחים מעשי לבינה מלאכותית, למידת מכונה וטכנולוגיות מתקדמות. המדריך המלא למושגים שחייבים להכיר.

🔍
מוצגים: 0 מונחים

בינה מלאכותית כללית (AGI) יסוד

🔗
Artificial General Intelligence (AGI)
הגדרה
ה"גביע הקדוש" של התחום: מערכת בינה מלאכותית היפותטית המסוגלת להבין, ללמוד ולבצע כל משימה אינטלקטואלית שאדם ממוצע יכול לבצע, ברמה שווה או טובה יותר.
למה זה חשוב
זהו היעד הסופי של חברות כמו OpenAI ו-Google DeepMind. ההגעה ל-AGI מסמנת את המעבר מכלי עזר ספציפיים למערכות עצמאיות לחלוטין.
דוגמה: בעוד ש-ChatGPT יודע רק לכתוב טקסט, AGI יוכל ללמוד רפואה בבוקר, לתכנת משחק בצהריים ולנהל חברה בערב – הכל באופן עצמאי.

הלימה (Alignment) יסוד

🔗
AI Alignment
הגדרה
התחום העוסק בהבטחה שמערכות בינה מלאכותית יפעלו בהתאם לכוונות, לערכים ולמטרות של בני האדם שיצרו אותן, ולא יסטו מהן.
למה זה חשוב
האתגר המרכזי בבטיחות AI; ככל שהמודלים נעשים חזקים יותר, כך סטייה קטנה מהמטרה עלולה לגרום לנזק גדול יותר.
דוגמה: לוודא שרובוט שמנקה את הבית לא "ינקה" גם את החתול רק כי הוא הוגדר כאובייקט שמפריע לרצפה.

אלגוריתם יסוד

🔗
Algorithm
הגדרה
סדרת הוראות מתמטיות ולוגיות מוגדרות היטב לביצוע משימה או לפתרון בעיה. ב-AI, זהו "המתכון" שהמחשב לומד לשפר בעצמו.
למה זה חשוב
כל פעולה דיגיטלית, מחיפוש בגוגל ועד המלצת שיר בספוטיפיי, מבוססת על אלגוריתם.
דוגמה: מתכון לעוגה הוא אלגוריתם: "קח 2 ביצים, הוסף קמח, ערבב, אפה 30 דקות".

ממשק תכנות יישומים (API) יסוד

🔗
Application Programming Interface (API)
הגדרה
צינור תקשורת המאפשר לתוכנות שונות "לדבר" זו עם זו. ב-AI, זהו הדרך שבה אפליקציות שולחות שאלות למודלים בענן ומקבלות תשובות.
למה זה חשוב
מאפשר למפתחים לשלב יכולות AI באפליקציות שלהם (כמו צ'אטבוט באתר) בלי לבנות מודל משלהם מאפס.
דוגמה: כשאתה משתמש באפליקציית כתיבה שמשלימה משפטים, האפליקציה שולחת את הטקסט דרך API ל-OpenAI ומציגה את התשובה.

מנגנון הקשב (Attention) מקצועי

🔗
Attention Mechanism
הגדרה
פריצת הדרך הטכנולוגית (2017) המאפשרת למודל להתמקד בחלקים הרלוונטיים במשפט בעת עיבוד כל מילה, במקום לקרוא הכל בצורה לינארית.
למה זה חשוב
זהו המנוע שמאחורי ארכיטקטורת ה-Transformer (ה-T ב-GPT), ומה שמאפשר למודלים להבין הקשרים מורכבים בטקסטים ארוכים.
דוגמה: במשפט "הבנק נסגר כי הנהר עלה על גדותיו", המודל נותן "קשב" למילה "נהר" כדי להבין שהמילה "בנק" מתייחסת לגדת נהר ולא למוסד כספי.

מודל אוטו-רגרסיבי מקצועי

🔗
Auto-Regressive Model
הגדרה
מודל שחוזה את הדבר הבא ברצף (המילה הבאה, הפיקסל הבא) בהתבסס על מה שהוא יצר קודם לכן.
למה זה חשוב
ככה בדיוק עובד ChatGPT. הוא לא "חושב" על כל התשובה מראש, אלא כותב מילה אחר מילה, כשהמילה הקודמת קובעת את הבאה.
דוגמה: המודל כותב "אני", ואז על סמך "אני" הוא מחליט שהמילה הבאה היא "רוצה", ועל סמך "אני רוצה" הוא בוחר "גלידה".

פעפוע לאחור (Backprop) מתקדם

🔗
Backpropagation
הגדרה
השיטה המתמטית שבה רשת עצבית לומדת: לאחר שהמודל טעה, האלגוריתם הולך "אחורה" מהסוף להתחלה ומעדכן את המשקולות כדי להקטין את הטעות בפעם הבאה.
למה זה חשוב
זהו מנגנון הלמידה עצמו. בלי Backpropagation, הרשת הייתה סתם מנחשת ולא משתפרת לעולם.
דוגמה: כמו מורה שאומר לתלמיד "טעית בשאלה 3", והתלמיד חוזר אחורה בראש להבין איפה בדיוק בדרך הפתרון הוא שגה.

הטיה (Bias) יסוד

🔗
Bias
הגדרה
נטייה לא הוגנת או שגויה של המודל לטובת או נגד קבוצות מסוימות, הנובעת לרוב מנתונים לא מאוזנים שעליהם הוא אומן.
למה זה חשוב
מודלים מוטים יכולים לגרום לאפליה גזעית, מגדרית או כלכלית בקבלת החלטות אוטומטית (כמו אישור הלוואות).
דוגמה: מודל שאומן בעיקר על תמונות של מנכ"לים גברים, ולכן מייצר תמונה של גבר כשמבקשים ממנו "מנכ"ל", ומתעלם מנשים.

צ'אטבוט יסוד

🔗
Chatbot
הגדרה
תוכנה המדמה שיחה אנושית (בטקסט או בקול). נעה בין בוטים פשוטים מבוססי חוקים לבוטים מתקדמים מבוססי AI.
למה זה חשוב
זהו הממשק (UI) הנפוץ ביותר שדרכו בני אדם מתקשרים עם מודלי שפה גדולים כיום (כמו ChatGPT).
דוגמה: הבוט בשירות הלקוחות של הבנק שעונה על שאלות נפוצות, או ChatGPT שעוזר בכתיבת מיילים.

שרשרת מחשבה (CoT) מתקדם

🔗
Chain of Thought (CoT)
הגדרה
טכניקת פרומפטינג שבה מבקשים מהמודל "לחשוב בקול רם" ולפרק את הבעיה לשלבים לוגיים לפני שהוא נותן את התשובה הסופית.
למה זה חשוב
משפר דרמטית את יכולת המודל לפתור בעיות מתמטיות ולוגיות מורכבות, ומונע טעויות חישוב מהירות.
דוגמה: במקום לשאול "כמה זה 15*4+2?", מבקשים: "פתור שלב אחרי שלב". המודל יענה: "קודם נכפיל 15 ב-4 שזה 60, ואז נוסיף 2, התוצאה 62".

כוח מחשוב (Compute) יסוד

🔗
Computational Power / Compute
הגדרה
המשאבים החומרתיים (מעבדים, זיכרון, חשמל) הנדרשים כדי לאמן ולהריץ מודלים של בינה מלאכותית.
למה זה חשוב
הגורם המגביל העיקרי בהתפתחות ה-AI. אימון מודלים מודרניים דורש כוח מחשוב עצום שזמין רק לחברות ענק ומדינות.
דוגמה: אימון GPT-4 דרש אלפי מעבדים גרפיים (GPUs) שעבדו במשך חודשים וצרכו חשמל כמו עיר קטנה.

חלון הקשר (Context Window) יסוד

🔗
Context Window
הגדרה
כמות המידע המקסימלית (נמדדת בטוקנים) שהמודל יכול "לזכור" ולעבד בשיחה אחת פעילה לפני שהוא מתחיל לשכוח את ההתחלה.
למה זה חשוב
מגדיר את גודל "זיכרון העבודה" של המודל. חלון גדול מאפשר לנתח ספרים שלמים; חלון קטן מחייב שיחות קצרות.
דוגמה: אם חלון ההקשר הוא 4,000 טוקנים, המודל ישכח את תחילת המאמר ברגע שתעברו את הטוקן ה-4,001.

ראייה ממוחשבת יסוד

🔗
Computer Vision (CV)
הגדרה
תחום ב-AI העוסק ביכולת של מחשבים "לראות", לנתח ולהבין תמונות ווידאו מהעולם האמיתי.
למה זה חשוב
הבסיס לטכנולוגיות כמו זיהוי פנים, נהיגה אוטונומית, אבחון רפואי מצילומי רנטגן וחיפוש תמונות בגוגל.
דוגמה: מצלמה בחניון שמזהה את מספר הרכב ופותחת את השער אוטומטית.

מודל דיפוזיה מקצועי

🔗
Diffusion Model
הגדרה
הטכנולוגיה המובילה כיום ליצירת תמונות, הפועלת על ידי הוספת "רעש" (שלג) לתמונה עד שהיא נהרסת, ואז למידה איך להפוך את התהליך ולשחזר תמונה נקייה מתוך רעש.
למה זה חשוב
האלגוריתם המניע את הכלים הגנרטיביים הפופולריים כמו Midjourney, DALL-E ו-Stable Diffusion.
דוגמה: המודל מתחיל מ"רעש סטטי" אקראי לחלוטין, ומסדר את הפיקסלים בהדרגה עד שנוצרת תמונה ברורה של חתול.

למידה עמוקה (Deep Learning) יסוד

🔗
Deep Learning (DL)
הגדרה
תת-תחום של למידת מכונה המבוסס על "רשתות עצביות" מלאכותיות מרובות שכבות, המחקות באופן גס את מבנה המוח האנושי.
למה זה חשוב
זוהי הטכנולוגיה שאפשרה את הזינוק האדיר ב-AI בעשור האחרון (זיהוי דיבור, ראייה ממוחשבת, GPT), בזכות יכולתה ללמוד דפוסים מורכבים מאוד מכמויות מידע עצומות.
דוגמה: רשת שמזהה תמונה של כלב לא על ידי חוקים ("יש לו 4 רגליים"), אלא על ידי עיבוד פיקסלים דרך מיליוני נוירונים שלמדו לבד איך נראה כלב.

הטמעה (Embedding) מקצועי

🔗
Embedding / Vector Embedding
הגדרה
תהליך המרת מילים, משפטים או תמונות לרשימה של מספרים (וקטורים) המייצגים את המשמעות הסמנטית שלהם.
למה זה חשוב
מחשבים לא מבינים מילים, הם מבינים מספרים. Embeddings מאפשרים למחשב להבין ש"מלך" קרוב במשמעות ל"מלכה" ורחוק מ"שולחן".
דוגמה: המילה "חתול" הופכת לקוד מספרי כמו [0.1, 0.5, -0.3], שנמצא "קרוב" מתמטית לקוד של המילה "כלב".

כוונון עדין (Fine-Tuning) מתקדם

🔗
Fine-Tuning
הגדרה
תהליך של לקיחת מודל שכבר אומן על ידע כללי (Pre-trained), ואימון נוסף שלו על מאגר נתונים קטן וייעודי למשימה ספציפית.
למה זה חשוב
הופך מודל "יודע כל" למודל מומחה. זה ההבדל בין בוגר רפואה כללי לבין רופא מומחה לקרדיולוגיה.
דוגמה: אימון מודל שפה כללי על אלפי מסמכים משפטיים ישראליים כדי שיידע לנסח חוזים בעברית.

בינה מלאכותית יוצרת (GenAI) יסוד

🔗
Generative AI
הגדרה
סוג של בינה מלאכותית המסוגל ליצור תוכן *חדש* (טקסט, תמונות, וידאו, קוד) שלא היה קיים קודם לכן, ולא רק לנתח מידע קיים.
למה זה חשוב
המהפכה הנוכחית ב-AI. זהו המעבר מ-AI שממיין דואר (אנליטי) ל-AI שכותב את הדואר (גנרטיבי).
דוגמה: ChatGPT שכותב שיר, Midjourney שמצייר ציור, או Suno שמלחין מוזיקה.

מעבד גרפי (GPU) יסוד

🔗
Graphics Processing Unit (GPU)
הגדרה
רכיב חומרה שנועד במקור למשחקי מחשב, אך התגלה כיעיל בצורה יוצאת דופן לביצוע החישובים המקביליים הנדרשים לאימון בינה מלאכותית.
למה זה חשוב
בלי GPUs (בעיקר של חברת NVIDIA), מהפכת ה-AI המודרנית לא הייתה מתאפשרת. הם "המנוע" שמריץ את המודלים.
דוגמה: שבב ה-H100 של NVIDIA, שעולה עשרות אלפי דולרים ומשמש את OpenAI לאימון ChatGPT.

הזיה (Hallucination) יסוד

🔗
Hallucination
הגדרה
מצב שבו מודל שפה מייצר תשובה שנשמעת משכנעת, רהוטה ובטוחה בעצמה, אך היא שגויה עובדתית או מומצאת לחלוטין.
למה זה חשוב
אחת מנקודות התורפה המרכזיות של Generative AI, המחייבת בדיקת עובדות (Fact Checking) אנושית לפני פרסום.
דוגמה: המודל ממציא שם של פסק דין שלא היה ולא נברא, כולל ציטוטים ותאריכים, רק כי זה נשמע הגיוני סטטיסטית.

הסקה / הרצה (Inference) מקצועי

🔗
Inference
הגדרה
השלב שבו המודל המאומן כבר "עובד" בפועל: מקבל קלט חדש מהמשתמש ומייצר תחזית או תשובה (בניגוד לשלב האימון).
למה זה חשוב
זהו השלב שעולה כסף למשתמש הקצה או לחברה שמפעילה את השירות בזמן אמת (חישוב עלות פר טוקן).
דוגמה: האימון של GPT-4 לקח חודשים; כשאתה שואל אותו שאלה והוא עונה תוך שנייה – זהו Inference.

מודל שפה גדול (LLM) יסוד

🔗
Large Language Model (LLM)
הגדרה
מודל AI שאומן על כמויות עצומות של טקסט (ספרים, אינטרנט), ומסוגל להבין, לסכם, לתרגם וליצור טקסט ברמה הקרובה לבני אדם.
למה זה חשוב
הבסיס לכל המהפכה הנוכחית. מודלים כמו GPT, Claude ו-Llama הם כולם LLMs.
דוגמה: GPT-4 הוא LLM שאומן על טריליוני מילים כדי ללמוד את המבנה וההיגיון של השפה האנושית.

למידת מכונה (Machine Learning) יסוד

🔗
Machine Learning (ML)
הגדרה
תחום במדעי המחשב שבו מחשבים לומדים לבצע משימות מתוך דוגמאות ונתונים, במקום להיות מתוכנתים עם הוראות מפורשות לכל מצב.
למה זה חשוב
הבסיס לכל ה-AI המודרני. במקום לכתוב מיליון חוקים ל"איך נראה חתול", נותנים למחשב מיליון תמונות והוא לומד לבד.
דוגמה: מסנן הספאם ב-Gmail שלומד מהודעות שסימנת בעבר כדי לזהות דואר זבל חדש.

מודל יסוד

🔗
AI Model
הגדרה
התוצר הסופי של תהליך האימון. קובץ תוכנה המכיל את "הידע" שהאלגוריתם למד מהנתונים, ומוכן לביצוע משימות.
למה זה חשוב
זהו ה"מוח" בתוך קופסת ה-AI. כשאומרים "הורדתי את Llama", מתכוונים שהורדנו את קובץ המודל.
דוגמה: כמו שספר מתכונים הוא התוצאה של שנות ניסיון בבישול, המודל הוא התוצאה של חודשי אימון על מחשבי-על.

מולטי-מודאלי (רב-חושי) יסוד

🔗
Multimodal AI
הגדרה
מערכת AI המסוגלת לעבד ולהבין מספר סוגי מדיה בו-זמנית: טקסט, תמונות, אודיו ווידאו.
למה זה חשוב
השלב הבא באבולוציה של הצ'אטבוטים. במקום רק לקרוא ולכתוב, המודל יכול גם "לראות" תמונות ו"לשמוע" דיבור.
דוגמה: GPT-4o שיכול להסתכל על תמונה של המקרר שלך ולהציע מתכונים, או לשמוע מנוע של רכב ולהבחין בתקלה.

עיבוד שפה טבעית (NLP) יסוד

🔗
Natural Language Processing (NLP)
הגדרה
התחום המדעי העוסק בחיבור בין מחשבים לשפה האנושית: היכולת של מחשב לקרוא, להבין ולייצר שפה (כמו עברית או אנגלית).
למה זה חשוב
זהו תחום האב של כל מודלי השפה. בלעדיו, מחשבים היו מבינים רק קוד בינארי ולא את המילים שאנחנו מדברים.
דוגמה: תרגום אוטומטי בגוגל, בדיקת איות בוורד, וסירי שמבינה כשאתה מבקש "תשימי שעון מעורר".

רשת עצבית (Neural Network) יסוד

🔗
Artificial Neural Network (ANN)
הגדרה
מבנה מתמטי בהשראת המוח האנושי, המורכב משכבות של "נוירונים" מלאכותיים המעבירים מידע ביניהם כדי לפתור בעיות מורכבות.
למה זה חשוב
אבן הבניין של Deep Learning. כל המודלים הגדולים (GPT, Midjourney) הם בסופו של דבר רשתות עצביות ענקיות.
דוגמה: רשת המקבלת תמונה של ספרה בכתב יד, ומעבירה את המידע דרך שכבות עד שהיא מזהה שזו הספרה "8".

קוד פתוח (Open Source) יסוד

🔗
Open Source AI
הגדרה
מודלים ששוחררו לציבור בחינם, כך שכל אחד יכול להוריד, להריץ, לשנות וללמוד איך הם בנויים (בניגוד למודלים סגורים).
למה זה חשוב
מאפשר דמוקרטיזציה של ה-AI. לא צריך להיות תלוי ב-OpenAI או Google; מפתחים יכולים להריץ מודלים פרטיים על המחשב שלהם.
דוגמה: המודל Llama של Meta או Mistral, שאפשר להוריד ולהריץ באופן מקומי ללא אינטרנט.

פרמטרים יסוד

🔗
Parameters
הגדרה
המשתנים הפנימיים ("הנוירונים") שהמודל לומד ומכוונן במהלך האימון. מספר הפרמטרים מעיד לרוב על גודל ומורכבות המודל.
למה זה חשוב
מדד גס ל"כוח המוח" של המודל. יותר פרמטרים = בדרך כלל מודל חכם יותר, אך גם איטי ויקר יותר להרצה.
דוגמה: מודל GPT-4 מוערך בטריליוני פרמטרים, בעוד Llama-3-8B מכיל 8 מיליארד פרמטרים והוא קל יותר.

אימון מקדים (Pre-training) יסוד

🔗
Pre-training
הגדרה
השלב הראשון והכבד ביותר ביצירת מודל, שבו הוא "קורא" כמויות אדירות של טקסט גולמי כדי ללמוד את חוקי השפה והידע הכללי על העולם.
למה זה חשוב
בשלב זה המודל רוכש את ה"השכלה" שלו (היסטוריה, מדע, שפה), לפני שהוא לומד לבצע משימות ספציפיות.
דוגמה: המודל לומד להשלים את המשפט "בירת צרפת היא…" במילה "פריז", אך עדיין לא יודע לענות על שאלות בצ'אט.

פרומפט (הנחיה) יסוד

🔗
Prompt
הגדרה
הטקסט שהמשתמש מזין למערכת ה-AI כדי לקבל תשובה או תוצאה. זה יכול להיות שאלה, הוראה, או תיאור של תמונה רצויה.
למה זה חשוב
הדרך שבה אנחנו מתקשרים עם ה-AI. איכות הפרומפט קובעת ישירות את איכות התשובה ("זבל נכנס, זבל יוצא").
דוגמה: "כתוב לי מייל רשמי לבוס המבקש העלאה בשכר" הוא פרומפט.

הנדסת פרומפטים יסוד

🔗
Prompt Engineering
הגדרה
האומנות והמדע של ניסוח הוראות מדויקות ל-AI כדי לקבל את התוצאה הטובה ביותר האפשרית.
למה זה חשוב
ההבדל בין משתמש מתחיל למקצוען. מהנדס פרומפטים יודע איך "ללחוץ על הכפתורים הנכונים" של המודל כדי להפיק ממנו יותר.
דוגמה: במקום "תכתוב סיפור", לכתוב "תכתוב סיפור מתח קצר בסגנון אגתה כריסטי, בגוף ראשון, המתרחש בתל אביב".

RAG (יצירה מועשרת אחזור) מתקדם

🔗
Retrieval-Augmented Generation (RAG)
הגדרה
טכניקה המאפשרת למודל לענות על שאלות מתוך מידע עדכני או פרטי (כמו מסמכי הארגון), על ידי שליפת המידע הרלוונטי והזנתו למודל לפני מתן התשובה.
למה זה חשוב
הפתרון לבעיית "הידע הקפוא" של המודלים ולמניעת הזיות. מאפשר לשוחח עם ה-PDF שלך או עם נתוני החברה בצורה אמינה.
דוגמה: כששואלים "מה המדיניות החדשה?", המערכת מחפשת בקובץ הנהלים, מוצאת את הפסקה, ושולחת אותה למודל כדי שינסח תשובה.

למידת חיזוק (RL) מתקדם

🔗
Reinforcement Learning (RL)
הגדרה
שיטת למידה המבוססת על ניסוי וטעייה, שבה המודל (ה"סוכן") מקבל "פרס" על פעולה טובה ו"עונש" על פעולה רעה, ולומד למקסם את הפרסים.
למה זה חשוב
השיטה שמאחורי הישגים כמו AlphaGo (שחמט) ורובוטים שלומדים ללכת. משמשת גם לכוונון עדין של צ'אטבוטים (RLHF).
דוגמה: תוכנה שלומדת לשחק סופר מריו: מקבלת נקודות כשמתקדמת בשלב, ומאבדת נקודות כשנפסלת. בסוף היא משחקת מושלם.

למידת חיזוק ממשוב אנושי (RLHF) מתקדם

🔗
Reinforcement Learning from Human Feedback
הגדרה
שלב קריטי באימון מודלים (כמו ChatGPT) שבו בני אדם מדרגים את תשובות המודל (טוב/רע), והמודל לומד להתאים את עצמו להעדפות האנושיות.
למה זה חשוב
זה מה שהופך מודל גולמי שרק משלים טקסט, לעוזר מועיל, מנומס ובטוח לשימוש שלא מקלל או נותן עצות מסוכנות.
דוגמה: המודל נותן שתי תשובות, המאמן האנושי מסמן שהתשובה המנומסת עדיפה על התשובה הגסה, והמודל לומד להיות מנומס.

סופר-אינטליגנציה (ASI) יסוד

🔗
Artificial Super Intelligence (ASI)
הגדרה
שלב עתידי היפותטי שבו הבינה המלאכותית תעלה על האינטליגנציה האנושית בכל תחום אפשרי, כולל יצירתיות, חוכמה וכישורים חברתיים.
למה זה חשוב
מעורר שאלות פילוסופיות וקיומיות: האם נוכל לשלוט בישות חכמה מאיתנו? זהו השלב שאחרי AGI.
דוגמה: מערכת שיכולה להמציא פיזיקה חדשה, לרפא סרטן ולפתור את משבר האקלים תוך דקות.

למידה מונחית יסוד

🔗
Supervised Learning
הגדרה
שיטת האימון הנפוצה ביותר, שבה המודל לומד מתוך דוגמאות מתויגות (קלט + תשובה נכונה) שמסופקות על ידי בני אדם.
למה זה חשוב
ככה מלמדים מחשב לזהות דברים. כמו מורה שמראה לילד כרטיסיות: "זה חתול", "זה כלב".
דוגמה: נותנים למודל 10,000 מיילים שסומנו מראש כ"ספאם" או "לא ספאם", והוא לומד להבדיל ביניהם לבד.

טמפרטורה (Temperature) יסוד

🔗
Temperature
הגדרה
פרמטר השולט ברמת ה"יצירתיות" או האקראיות של המודל. ערך נמוך (0.2) גורם לתשובות צפויות ומדויקות, וערך גבוה (0.8+) לתשובות מפתיעות ומגוונות.
למה זה חשוב
הדרך העיקרית של המשתמש להתאים את המודל למשימה: כתיבת קוד דורשת טמפרטורה נמוכה (דיוק), כתיבת שיר דורשת גבוהה (השראה).
דוגמה: בטמפרטורה 0, המודל תמיד יענה אותה תשובה לאותה שאלה. בטמפרטורה 1, הוא יגוון בכל פעם.

טוקן (Token) יסוד

🔗
Token
הגדרה
יחידת המידע הבסיסית שהמודל מעבד. טוקן יכול להיות מילה שלמה, חלק ממילה, או תו בודד (באנגלית כ-0.75 מילה, בעברית פחות יעיל).
למה זה חשוב
כל החיובים הכספיים ומגבלות הזיכרון ב-AI נמדדים בטוקנים.
דוגמה: המילה "Hamburger" היא טוקן אחד, אך המילה "AI" עשויה להיות שני טוקנים ("A", "I").

נתוני אימון (Training Data) יסוד

🔗
Training Data
הגדרה
מאגר המידע העצום (טקסטים, תמונות, קוד) שעליו המודל "למד". איכות וכמות הנתונים קובעות את חוכמת המודל.
למה זה חשוב
מודל הוא רק שיקוף של הנתונים שעליהם אומן. נתונים מוטים או שגויים ייצרו מודל מוטה ושגוי ("זבל נכנס, זבל יוצא").
דוגמה: כל ויקיפדיה, מיליוני ספרים ורוב האינטרנט הפתוח שימשו לאימון GPT-3.

טרנספורמר (Transformer) מקצועי

🔗
Transformer Architecture
הגדרה
ארכיטקטורת רשת עצבית שהוצגה ע"י גוגל ב-2017, המאפשרת עיבוד מקבילי של טקסט בעזרת מנגנון "תשומת לב".
למה זה חשוב
ההמצאה ששינתה את העולם. היא אפשרה לאמן מודלים על כמויות דאטה עצומות במהירות, והובילה ליצירת ChatGPT.
דוגמה: ה-T במונח GPT עומד בקיצור ל-Transformer.

מבחן טיורינג יסוד

🔗
Turing Test
הגדרה
מבחן שהוצע ע"י אלן טיורינג ב-1950 לבדיקת אינטליגנציה של מכונה: האם מחשב יכול לנהל שיחה כך שאדם לא יבחין שמדובר במכונה?
למה זה חשוב
היה המדד ההיסטורי לבינה מלאכותית, אם כי היום מודלים רבים כבר עוברים אותו בקלות והוא נחשב פחות רלוונטי.
דוגמה: שופט מתכתב עם שני גורמים נסתרים (אדם ומחשב). אם הוא לא מצליח לזהות מי המחשב, המחשב עבר את המבחן.

משקולות (Weights) מקצועי

🔗
Weights
הגדרה
ערכים מספריים בתוך הרשת העצבית הקובעים את עוצמת הקשר בין הנוירונים. זהו בעצם ה"זיכרון" של המודל שנלמד באימון.
למה זה חשוב
כשאנחנו "מאמנים" מודל, אנחנו בעצם משנים את המספרים האלו שוב ושוב עד שהם נכונים. הקובץ הסופי של המודל הוא פשוט רשימה ענקית של משקולות.
דוגמה: משקולת גבוהה בין "חתול" ל"מיאו" אומרת למודל שיש קשר חזק ביניהם.

למידת אפס-דוגמאות (Zero-Shot) יסוד

🔗
Zero-Shot Learning
הגדרה
יכולת המודל לבצע משימה שמעולם לא ראה קודם לכן, וזאת ללא קבלת דוגמאות כלל בפרומפט – רק על סמך ההוראה המילולית.
למה זה חשוב
מעיד על הבנה עמוקה והכללה. רוב השימוש היומיומי ב-ChatGPT הוא Zero-Shot ("כתוב לי מייל", בלי להראות דוגמה למייל).
דוגמה: לבקש מהמודל "סכם את המסמך בסגנון משפטי", גם אם לא הראית לו אף דוגמה לסיכום כזה קודם.

סוכן (Agent) מתקדם

🔗
AI Agent
הגדרה
מערכת AI המסוגלת לפעול באופן עצמאי בסביבה מסוימת, לקבל החלטות ולבצע פעולות (כמו גלישה באינטרנט או שימוש בתוכנות) כדי להשיג מטרה.
למה זה חשוב
המעבר מ"צ'אטבוט פסיבי" שעונה לשאלות, ל"עובד אקטיבי" שמבצע מטלות (כמו להזמין טיסה בפועל).
דוגמה: AutoGPT, שמקבל הוראה "תכנן חופשה", ויוצא לבד לאינטרנט כדי לחפש טיסות, להשוות מלונות ולבנות לו"ז.

תמורת הטיה-שונות מקצועי

🔗
Bias-Variance Tradeoff
הגדרה
הדילמה הנצחית באימון מודלים: האם ליצור מודל פשטני מדי שמפספס דקויות (הטיה גבוהה) או מודל רגיש מדי שמושפע מרעש אקראי (שונות גבוהה).
למה זה חשוב
מציאת האיזון המושלם היא המפתח למודל שעובד טוב בעולם האמיתי (Generalization).
דוגמה: מודל "נוקשה" יחשוב שכל הכלבים נובחים (הטיה), מודל "גמיש" יחשוב שכלב ספציפי נובח רק ב-12 בצהריים כי זה מה שקרה בדאטה (שונות).

קופסה שחורה יסוד

🔗
Black Box AI
הגדרה
מערכת בינה מלאכותית מורכבת שבה אנו רואים את הקלט והפלט, אך אין לנו דרך להבין את תהליך קבלת ההחלטות הפנימי ("למה הוא בחר בזה?").
למה זה חשוב
יוצר בעיית אמון ורגולציה. קשה לסמוך על רופא רובוטי שממליץ על ניתוח אבל לא יודע להסביר את הסיבה הרפואית.
דוגמה: רשת נוירונים עמוקה שמחליטה לסרב למשכנתא ללקוח, וגם המתכנתים לא יודעים להגיד איזה פרמטר הכריע.

מחשוב ענן יסוד

🔗
Cloud Computing
הגדרה
שימוש במשאבי מחשוב (שרתים, GPUs) דרך האינטרנט לפי דרישה, במקום להחזיק אותם פיזית במשרד או בבית.
למה זה חשוב
מאפשר לחברות סטארטאפ לאמן מודלים ענקיים בלי לקנות חומרה במיליוני דולרים.
דוגמה: שימוש ב-AWS או Google Cloud כדי להריץ מודל AI כבד, כשהמחשב האישי שלך משמש רק כמסך שליטה.

הרחבת נתונים (אוגמנטציה) מתקדם

🔗
Data Augmentation
הגדרה
שיטה להגדלת מאגר האימון באופן מלאכותי על ידי יצירת גרסאות שונות (וריאציות) של המידע הקיים.
למה זה חשוב
עוזר למודל ללמוד טוב יותר מכמות קטנה של נתונים, ומונע ממנו לזכור רק את הדוגמאות הספציפיות שראה.
דוגמה: לוקחים תמונה אחת של חתול, ומייצרים ממנה 10 גרסאות: מסובבת, הפוכה, מטושטשת, בשחור-לבן. המודל לומד מכולן.

רשת קונבולוציה (CNN) מקצועי

🔗
Convolutional Neural Network (CNN)
הגדרה
סוג ותיק ויעיל של רשת עצבית שנועד במיוחד לעיבוד תמונות. הרשת סורקת את התמונה עם "חלונות קטנים" (פילטרים) כדי לזהות קווים, צורות ותבניות.
למה זה חשוב
הטכנולוגיה שאפשרה את מהפכת הראייה הממוחשבת (Computer Vision) לפני עידן הטרנספורמרים. עדיין בשימוש נרחב בזיהוי פנים ורכבים.

רשת עצבית חוזרת (RNN) מקצועי

🔗
Recurrent Neural Network (RNN)
הגדרה
ארכיטקטורת רשת שנועדה לטיפול במידע סדרתי (כמו טקסט או סאונד), שבה המידע "זורם" בלולאה ומאפשר לרשת לזכור מה קרה בשלב הקודם.
למה זה חשוב
הייתה הסטנדרט לתרגום ועיבוד שפה לפני המצאת הטרנספורמר. חסרונה העיקרי הוא קושי בזיכרון טווח ארוך (היא "שוכחת" את תחילת המשפט).

זיכרון לטווח קצר-ארוך (LSTM) מקצועי

🔗
Long Short-Term Memory
הגדרה
גרסה משופרת של RNN הכוללת מנגנון מיוחד לשמירת מידע לאורך זמן, מה שפתר את בעיית ה"שכחה" של רשתות רגילות.
למה זה חשוב
שלטה בעולם ה-AI בין 2010 ל-2017. אפשרה לראשונה תרגום מכונה סביר וזיהוי דיבור איכותי.

רשתות יריבות (GAN) מקצועי

🔗
Generative Adversarial Network (GAN)
הגדרה
מערכת המורכבת משני מודלים הנלחמים זה בזה: "הזייפן" (Generator) שמנסה ליצור תמונה מזויפת, ו"השוטר" (Discriminator) שמנסה לזהות את הזיוף.
למה זה חשוב
הטכנולוגיה שהולידה את ה-Deepfakes. התחרות ביניהם גורמת לזייפן להשתפר עד שהתמונות נראות אמיתיות לחלוטין.

GPT יסוד

🔗
Generative Pre-trained Transformer
הגדרה
סדרת מודלים שפותחה ע"י OpenAI. השם מתאר את הטכנולוגיה: יוצר (Generative), מאומן מראש (Pre-trained) ומבוסס טרנספורמר.
למה זה חשוב
המותג המזוהה ביותר עם מהפכת ה-AI הנוכחית. הוכיח לעולם שאימון מודל ענק על כל האינטרנט מייצר יכולות מדהימות.

מודל יסוד יסוד

🔗
Foundation Model
הגדרה
מודל AI ענק ורב-תכליתי (כמו GPT-4 או Claude) שאומן על כמות עצומה של מידע, ומשמש כבסיס ("יסודות") לבניית אלפי אפליקציות שונות.
למה זה חשוב
שינוי פרדיגמה: במקום לבנות מודל לכל משימה, בונים מודל-על אחד שיודע לעשות הכל, ומבצעים לו התאמות קטנות.

מודל שפה קטן (SLM) מתקדם

🔗
Small Language Model (SLM)
הגדרה
מודלים קומפקטיים (כמו Phi-3 או Gemma) שנועדו להיות יעילים, מהירים וזולים להרצה, גם על מחשבים רגילים או טלפונים.
למה זה חשוב
העתיד של הפרטיות והמהירות. מאפשר להריץ AI חכם ישירות על המכשיר שלך ללא צורך באינטרנט או בשרתים יקרים.

עירוב מומחים (MoE) מקצועי

🔗
Mixture of Experts (MoE)
הגדרה
ארכיטקטורה חכמה (שבשימוש ב-GPT-4) המפצלת את המודל למומחים קטנים. עבור כל שאלה, המערכת מפעילה רק את המומחים הרלוונטיים.
למה זה חשוב
מאפשר למודל להיות "ענק" בידע שלו, אבל "קל" ומהיר בריצה, כי הוא לא צריך להפעיל את כל המוח שלו לכל שאלה קטנה.

התאמת יתר (Overfitting) יסוד

🔗
Overfitting
הגדרה
מצב שבו המודל "שינן" את דוגמאות האימון בעל-פה במקום ללמוד את העיקרון הכללי, ולכן הוא נכשל בביצועים על מידע חדש.
למה זה חשוב
הכישלון הנפוץ ביותר באימון. זה כמו תלמיד שלמד למבחן רק את התשובות של המבחנים משנה שעברה, ונכשל כי השאלות השתנו.

התאמת חסר (Underfitting) יסוד

🔗
Underfitting
הגדרה
מצב שבו המודל פשוט מדי או לא אומן מספיק, ולכן הוא לא מצליח לזהות שום דפוס בנתונים (לא באימון ולא במבחן).
למה זה חשוב
מעיד על כך שצריך מודל חזק יותר או יותר זמן אימון. התוצאות יהיו אקראיות וגרועות.

אפוק (Epoch) מקצועי

🔗
Epoch
הגדרה
מחזור שלם אחד שבו המודל ראה את *כל* דוגמאות האימון במאגר הנתונים פעם אחת בדיוק. אימון לרוב לוקח עשרות אפוקים.
למה זה חשוב
יחידת הזמן של אימון מודלים. מעט מדי אפוקים = Underfitting, יותר מדי אפוקים = Overfitting.

גודל אצווה (Batch Size) מקצועי

🔗
Batch Size
הגדרה
מספר הדוגמאות שהמודל מעבד במקביל לפני שהוא מעדכן את המשקולות שלו. במקום ללמוד מכל דוגמה בנפרד, הוא לומד מ"חבילות".
למה זה חשוב
משפיע על מהירות האימון ועל היציבות שלו. באץ' גדול דורש יותר זיכרון חזק (GPU).

קצב למידה מקצועי

🔗
Learning Rate
הגדרה
פרמטר הקובע כמה דרסטית המודל ישנה את הדעות שלו בכל פעם שהוא טועה. קצב גבוה = שינויים מהירים ופראיים; קצב נמוך = שינויים עדינים ואיטיים.
למה זה חשוב
ההגדרה החשובה ביותר באימון. קצב גבוה מדי ימנע מהמודל להתייצב, קצב נמוך מדי יגרום לאימון להימשך נצח.

פונקציית הפסד מקצועי

🔗
Loss Function
הגדרה
נוסחה מתמטית המודדת כמה המודל "טעה" בתחזית שלו לעומת התשובה הנכונה. המטרה של האימון היא להקטין את המספר הזה לאפס.
למה זה חשוב
זהו ה"מצפן" שמכוון את המודל. בלי פונקציית הפסד, המודל לא יודע אם הוא משתפר או מדרדר.

ירידה בגרדיאנט מתקדם

🔗
Gradient Descent
הגדרה
האלגוריתם המתמטי שמניע את הלמידה. הוא מחשב את ה"שיפוע" של הטעות ומכוון את המודל לקחת צעד קטן לכיוון הפתרון הנכון.
למה זה חשוב
זהו המנוע שמאפשר לרשתות עצביות ללמוד. דמיינו אדם שיורד מהר בערפל ומרגיש את השיפוע עם הרגליים.

פונקציית שפעול מקצועי

🔗
Activation Function
הגדרה
רכיב מתמטי בתוך כל "נוירון" הקובע האם המידע חשוב מספיק כדי לעבור לנוירון הבא (האם "לירות" או לא).
למה זה חשוב
הופך את הרשת למערכת חכמה ולא לינארית, המסוגלת ללמוד דפוסים מורכבים כמו צורות ומשפטים.

ReLU מקצועי

🔗
Rectified Linear Unit
הגדרה
פונקציית השפעול הפופולרית ביותר ב-Deep Learning. פועלת בפשטות: אם המספר חיובי – תעביר אותו; אם שלילי – תאפס אותו.
למה זה חשוב
למרות פשטותה, היא פתרה בעיות מתמטיות קשות ואיפשרה את אימון הרשתות העמוקות והמהירות שיש לנו היום.

סופטמקס (Softmax) מקצועי

🔗
Softmax Function
הגדרה
פונקציה מתמטית הממירה רשימה של מספרים גולמיים לרשימה של אחוזים (הסתברויות) שמסתכמים ל-100%.
למה זה חשוב
זהו השלב האחרון במודל, שבו הוא מחליט מה הסיכוי של כל תוצאה ("יש 80% סיכוי שזה חתול ו-20% שזה כלב").

מרחב לטנטי (חבוי) מתקדם

🔗
Latent Space
הגדרה
ייצוג מתמטי מופשט בתוך "מוח" המודל, שבו מושגים דומים (כמו "חתול" ו"נמר") ממוקמים פיזית קרוב זה לזה.
למה זה חשוב
זה המקום שבו הקסם קורה; תזוזה במרחב הזה מאפשרת למודל ליצור שילובים חדשים (כמו "חתול בסגנון פיקסאר") ע"י חיבור נקודות.

אוטואנקודר מקצועי

🔗
Autoencoder
הגדרה
רשת עצבית שלומדת לדחוס מידע לייצוג קטן ויעיל, ואז לשחזר אותו מחדש.
למה זה חשוב
משמש להפחתת רעשים בתמונות, לדחיסת מידע ולזיהוי חריגות בנתונים.

תיוג נתונים יסוד

🔗
Data Labeling / Annotation
הגדרה
תהליך ידני שבו בני אדם עוברים על נתונים גולמיים ומוסיפים להם תגיות (למשל: סימון "חתול" על תמונה), כדי שהמחשב יוכל ללמוד מהם.
למה זה חשוב
העבודה השחורה והקריטית שמאחורי הקלעים. בלי תיוג איכותי, המודל לא ידע מה הוא רואה ("זבל נכנס, זבל יוצא").

אדם בלולאה (HITL) יסוד

🔗
Human-in-the-Loop (HITL)
הגדרה
מודל עבודה שבו ה-AI מבצע את רוב העבודה, אך אדם אמיתי נדרש לאשר, לתקן או לפקח על ההחלטות הקריטיות.
למה זה חשוב
חיוני במערכות רגישות (רפואה, נשק) כדי למנוע טעויות הרות אסון שהמחשב עלול לעשות.

נתונים סינתטיים מתקדם

🔗
Synthetic Data
הגדרה
מידע שלא נוצר על ידי בני אדם, אלא הופק באופן מלאכותי על ידי מודל AI אחד כדי לאמן מודל AI אחר.
למה זה חשוב
הפתרון ל"מחסור בדאטה". כשהאינטרנט נגמר, מייצרים דאטה מלאכותי כדי להמשיך לאמן מודלים חכמים יותר.

זיקוק ידע מתקדם

🔗
Knowledge Distillation
הגדרה
תהליך שבו מודל ענק ו"חכם" (המורה) מלמד מודל קטן ומהיר (התלמיד) לחקות את הביצועים שלו.
למה זה חשוב
מאפשר ליצור מודלים קטנים שיכולים לרוץ על טלפון, אבל מתנהגים בחוכמה כמעט כמו מודל ענק של שרתים.

קוונטיזציה (דחיסה) מקצועי

🔗
Quantization
הגדרה
תהליך הקטנת הדיוק המתמטי של המודל (למשל, מ-16 ביט ל-4 ביט) כדי להקטין דרמטית את נפח הזיכרון שהוא תופס.
למה זה חשוב
מאפשר להריץ מודלים חכמים וענקיים על מחשבים ביתיים או לפטופים, עם ירידה זניחה וכמעט בלתי מורגשת בביצועים.

גיזום (Pruning) מקצועי

🔗
Pruning
הגדרה
מחיקת נוירונים "מיותרים" מהרשת העצבית שלא תורמים הרבה לתוצאה, כדי להפוך את המודל לקל ומהיר יותר.
למה זה חשוב
כמו דיאטה למודל: מורידים את השומן ומשאירים רק את השרירים, כדי שהמודל ירוץ מהר יותר במכשירים ניידים.

דיפ-פייק (Deepfake) יסוד

🔗
Deepfake
הגדרה
מדיה סינתטית (וידאו או אודיו) שבה דמותו של אדם הוחלפה בדמות אחרת באופן ריאליסטי להחריד באמצעות AI.
למה זה חשוב
הסכנה הגדולה של הפייק ניוז. מאפשר ליצור סרטונים שבהם נשיאים או מפורסמים אומרים דברים שלא אמרו מעולם.

טקסט לדיבור (TTS) יסוד

🔗
Text-to-Speech (TTS)
הגדרה
טכנולוגיית AI הממירה טקסט כתוב לקול אנושי טבעי, כולל אינטונציה ורגש.
למה זה חשוב
הבסיס לעוזרים קוליים, הקראת ספרים, ויצירת תוכן נגיש לעיוורים.

זיהוי דיבור אוטומטי (ASR) יסוד

🔗
Automatic Speech Recognition
הגדרה
הטכנולוגיה ההפוכה ל-TTS: הופכת הקלטה קולית לטקסט כתוב (תמלול).
למה זה חשוב
מאפשרת לנו לדבר אל הטלפון ("היי סירי") ומייצרת כתוביות אוטומטיות לסרטונים ביוטיוב.

זיהוי עצמים יסוד

🔗
Object Detection
הגדרה
טכנולוגיית ראייה שמזהה לא רק "מה יש בתמונה", אלא גם *איפה* בדיוק הוא נמצא (על ידי ציור ריבוע סביבו).
למה זה חשוב
קריטי לרכבים אוטונומיים (שצריכים לדעת איפה הולך הרגל) ולמצלמות אבטחה חכמות.

סגמנטציה (Segmentation) מתקדם

🔗
Image Segmentation
הגדרה
זיהוי מדויק ברמת הפיקסל: המחשב צובע בדיוק את גבולות האובייקט (למשל, מפריד את הדמות מהרקע בזום).
למה זה חשוב
הרבה יותר מדויק מזיהוי עצמים רגיל. משמש בהדמיות רפואיות (סימון מדויק של גידול) ובעריכת תמונות.

ניתוח סנטימנט יסוד

🔗
Sentiment Analysis
הגדרה
זיהוי הרגש או הטון המסתתר מאחורי טקסט (חיובי, שלילי, כועס, שמח).
למה זה חשוב
כלי עסקי עצום: מאפשר לחברות לסרוק מיליוני ציוצים וביקורות כדי להבין מה הלקוחות חושבים עליהן בזמן אמת.

למידת דוגמה-אחת מתקדם

🔗
One-Shot Learning
הגדרה
מצב שבו המודל מצליח לבצע משימה חדשה לאחר שראה דוגמה אחת בלבד לאופן הביצוע שלה.
למה זה חשוב
מראה על אינטליגנציה גבוהה. כמו ילד שרואה פעם אחת איך פותחים קופסה ומבין את העיקרון.

למידת מעט-דוגמאות מתקדם

🔗
Few-Shot Learning
הגדרה
טכניקה שבה מספקים למודל מספר קטן של דוגמאות (2-5) בתוך הפרומפט, כדי ללמד אותו לבצע משימה בצורה מדויקת.
למה זה חשוב
הדרך הכי קלה לשפר את הביצועים של ChatGPT בלי לאמן אותו מחדש.

למידת העברה מתקדם

🔗
Transfer Learning
הגדרה
לקיחת ידע שמודל צבר במשימה אחת (למשל: זיהוי מכוניות) ושימוש בו כבסיס ללימוד משימה חדשה (למשל: זיהוי משאיות).
למה זה חשוב
חוסך 90% מזמן האימון. במקום ללמד את המחשב "מה זה גלגל" מחדש, הוא משתמש במה שכבר למד.

למידה מאוגדת (Federated) מתקדם

🔗
Federated Learning
הגדרה
שיטת אימון שבה המודל לומד מנתונים שנמצאים על מכשירים של משתמשים רבים, מבלי שהמידע הפרטי עוזב את המכשיר שלהם.
למה זה חשוב
העתיד של הפרטיות. המקלדת של גוגל לומדת לתקן שגיאות ממיליוני משתמשים, בלי לקרוא את ההודעות הפרטיות שלהם.

בינה מוסברת (XAI) מתקדם

🔗
Explainable AI (XAI)
הגדרה
כלים שנועדו להפוך את ההחלטות של המודל לשקופות ומובנות ("למה המודל החליט ככה?").
למה זה חשוב
קריטי ברגולציה. בנק לא יכול לסרב למשכנתא על סמך "המחשב אמר לא" בלי לספק הסבר הגיוני.

הזרקת פרומפט מתקדם

🔗
Prompt Injection
הגדרה
מתקפת סייבר שבה התוקף מחביא הוראות זדוניות בתוך קלט תמים (כמו טקסט באתר), שהמודל קורא ומבצע בטעות.
למה זה חשוב
סיכון אבטחה קריטי. בוט שקורא מיילים יכול בטעות להעביר כסף לתוקף רק כי היה כתוב במייל נסתר "תעביר כסף".

פריצת כלא (Jailbreak) מתקדם

🔗
Jailbreak
הגדרה
מניפולציה מילולית שגורמת למודל לעקוף את מנגנוני הבטיחות שלו ולייצר תוכן אסור (כמו הוראות להכנת פצצה).
למה זה חשוב
משחק חתול ועכבר תמידי. חברות ה-AI חוסמות פרצה אחת, והמשתמשים מוצאים דרך ניסוח חדשה לעקוף אותה.

פרפלקסיה (מדד בלבול) מקצועי

🔗
Perplexity
הגדרה
מדד מתמטי המעריך עד כמה המודל "מופתע" מטקסט חדש. ציון נמוך יותר = מודל טוב יותר שמנחש נכון את המילים הבאות.
למה זה חשוב
אחד המדדים הנפוצים ביותר להשוואה מהירה בין מודלי שפה במהלך האימון.

עיגון (Grounding) מתקדם

🔗
Grounding
הגדרה
תהליך קישור התשובות של המודל למקורות מידע אמינים ועובדות חיצוניות, במקום שימציא מידע מהראש.
למה זה חשוב
התרופה להזיות. הופך את ה-AI מכלי יצירתי לכלי מחקר אמין שמצטט מקורות.

מסד נתונים וקטורי מקצועי

🔗
Vector Database
הגדרה
סוג מיוחד של בסיס נתונים ששומר וקטורים (מספרים) במקום טקסט רגיל, ומאפשר חיפוש לפי משמעות.
למה זה חשוב
הלב של מערכות RAG. מאפשר למצוא מסמכים הדומים *במשמעותם* לשאלה, ולא רק שמכילים את אותן מילים.

גרף ידע מתקדם

🔗
Knowledge Graph
הגדרה
שיטה לייצוג מידע כרשת של ישויות והקשרים ביניהן (למשל: אילון מאסק -> מנכ"ל -> טסלה), המאפשרת למחשב להבין עובדות.
למה זה חשוב
משלים את המודלים הסטטיסטיים במידע עובדתי מוצק.

טייס משנה (Copilot) יסוד

🔗
Copilot
הגדרה
תפיסת הפעלה של AI שבה המערכת משמשת כעוזר צמוד העובד *לצד* האדם, ולא מחליפה אותו לחלוטין.
למה זה חשוב
הגישה המובילה כיום (מיקרוסופט, גיטהאב): ה-AI מציע, האדם מחליט. מגביר פרודוקטיביות ושומר על שליטה.

תוסף (Plugin) יסוד

🔗
Plugin / Tool
הגדרה
רכיב תוכנה המאפשר למודל ה-AI להתחבר לשירותים חיצוניים (כמו הזמנת טיסות או חיפוש באינטרנט) ולבצע פעולות בעולם האמיתי.
למה זה חשוב
הופך את הצ'אטבוט מ"יודע כל" ל"יכול כל".

קריאה לפונקציה מתקדם

🔗
Function Calling
הגדרה
יכולת של מודל לזהות מתי צריך להפעיל קוד חיצוני, ולייצר פלט בפורמט טכני מדויק (JSON) שמחשב אחר יכול להריץ.
למה זה חשוב
הגשר הטכני שמאפשר ל-GPT "ללחוץ על כפתורים" בתוכנות אחרות.

פייתון (Python) יסוד

🔗
Python
הגדרה
שפת התכנות הפופולרית ביותר בעולם לפיתוח בינה מלאכותית, בזכות הפשטות שלה והספריות החזקות שלה (כמו PyTorch).
למה זה חשוב
השפה הרשמית של ה-AI. כמעט כל מחקר, מודל וכלי חדש נכתבים קודם כל בפייתון.

Hugging Face יסוד

🔗
Hugging Face
הגדרה
פלטפורמה קהילתית ("ה-GitHub של ה-AI") המאחסנת מאות אלפי מודלים ו datasets בקוד פתוח, לשימוש חופשי של מפתחים.
למה זה חשוב
המרכז העולמי של קהילת הקוד הפתוח ב-AI. המקום שבו מורידים מודלים כמו Llama ו-Mistral.

CUDA מקצועי

🔗
CUDA (Compute Unified Device Architecture)
הגדרה
פלטפורמת תוכנה של NVIDIA המאפשרת למתכנתים לדבר ישירות עם המעבד הגרפי (GPU) ולהשתמש בו לחישובים כלליים של AI.
למה זה חשוב
השכבה הסודית שנותנת ל-NVIDIA את המונופול שלה. רוב כלי ה-AI בעולם בנויים לעבוד על CUDA בלבד.

מעבד טנזורים (TPU) מקצועי

🔗
Tensor Processing Unit (TPU)
הגדרה
שבב האצה ייעודי שפותח על ידי Google במיוחד עבור עומסי עבודה של למידת מכונה, כאלטרנטיבה ל-GPU.
למה זה חשוב
הכוח המניע מאחורי כל שירותי ה-AI של גוגל. יעיל מאוד ומהיר, אך זמין בעיקר דרך הענן של גוגל.

LoRA (הסתגלות בדרגה נמוכה) מקצועי

🔗
Low-Rank Adaptation (LoRA)
הגדרה
שיטה חכמה לכוונון עדין (Fine-Tuning) של מודלים, שבה לא משנים את המודל הענק המקורי, אלא מאמנים רק "שכבה" קטנטנה נוספת שמתלבשת עליו.
למה זה חשוב
הפכה את אימון ה-AI לנגיש לכולם. במקום להזדקק לשרתים במיליונים, אפשר לאמן מודל Llama על כרטיס גרפי ביתי תוך שעות.

כוונון יעיל-פרמטרים (PEFT) מקצועי

🔗
Parameter-Efficient Fine-Tuning
הגדרה
שם כולל למשפחה של שיטות (ש-LoRA היא המפורסמת שבהן) המאפשרות להתאים מודל ענק למשימה חדשה על ידי עדכון מספר זעיר של פרמטרים.
למה זה חשוב
חוסך נפח אחסון וזיכרון עצום. במקום לשמור עותק של מודל 70GB לכל משימה, שומרים רק קובץ מתאם קטן של 100MB.

QLoRA מקצועי

🔗
Quantized LoRA
הגדרה
שילוב של דחיסה (Quantization) ל-4 ביט יחד עם שיטת LoRA. מאפשרת לדחוס את המודל המקורי למינימום ועדיין לאמן אותו ביעילות.
למה זה חשוב
השיטה הפופולרית ביותר כיום לאימון מודלים פתוחים (Open Source) על חומרה ביתית צנועה.

LangChain מתקדם

🔗
LangChain Framework
הגדרה
ספריית תכנות פופולרית המאפשרת למפתחים "להדביק" מודלי שפה למקורות מידע חיצוניים, ליצור שרשראות של פעולות ולבנות אפליקציות מורכבות.
למה זה חשוב
ה"דבק" של עולם ה-AI. מקל מאוד על בניית צ'אטבוטים שקוראים את המסמכים שלך (RAG) או סוכנים שמבצעים פעולות.

LlamaIndex מתקדם

🔗
LlamaIndex (GPT Index)
הגדרה
כלי תוכנה המתמחה בחיבור הנתונים הפרטיים שלך (קבצי PDF, אקסל, Notion) למודלי שפה, בצורה יעילה ומאורגנת.
למה זה חשוב
בעוד LangChain היא "כלבויניק", LlamaIndex מתמחה ספציפית בניהול ואחזור מידע (Data Ingestion) עבור אפליקציות AI.

Ollama יסוד

🔗
Ollama
הגדרה
תוכנה פשוטה ופופולרית המאפשרת לכל אדם להריץ מודלים פתוחים (כמו Llama 3) על המחשב האישי שלו (Mac/Linux/Windows) בקלות.
למה זה חשוב
הורידה את חסם הכניסה ל-AI מקומי. במקום פקודות מסובכות, כותבים `ollama run llama3` ויש לך צ'אטבוט פרטי.

שיהוי (Latency) יסוד

🔗
Latency
הגדרה
הזמן שעובר מהרגע שהמשתמש לחץ "שלח" ועד שהמודל מתחיל לכתוב את האות הראשונה של התשובה.
למה זה חשוב
קריטי לחוויית משתמש (UX). בצ'אט קולי, שיהוי של מעל חצי שנייה מרגיש לא טבעי ומעצבן.

זמן לטוקן ראשון (TTFT) מקצועי

🔗
Time To First Token (TTFT)
הגדרה
המדד המקצועי למדידת "תחושת המהירות" של המודל. מודד בדיוק כמה מילי-שניות לוקח למערכת להתחיל להגיב.
למה זה חשוב
בני אדם סלחניים אם התשובה נכתבת לאט, אבל חסרי סבלנות אם לוקח לה זמן *להתחיל*.

תפוקה (Throughput) מקצועי

🔗
Throughput (Tokens per Second)
הגדרה
קצב ייצור הטקסט של המודל, נמדד בטוקנים לשנייה (t/s).
למה זה חשוב
קובע כמה מהר התשובה נכתבת על המסך. קצב קריאה אנושי הוא כ-5-10 טוקנים לשנייה. מודלים מהירים מגיעים ל-100+.

CLIP (חיבור טקסט-תמונה) מקצועי

🔗
Contrastive Language-Image Pre-training
הגדרה
מודל של OpenAI שלמד לקשר בין טקסט לתמונות. הוא יודע "לדרג" כמה תמונה מסוימת מתאימה לתיאור מילולי מסוים.
למה זה חשוב
ה"שופט" שמאפשר למודלים כמו DALL-E לדעת אם הם ציירו את מה שביקשת.

טרנספורמר ויזואלי (ViT) מקצועי

🔗
Vision Transformer (ViT)
הגדרה
יישום של ארכיטקטורת הטרנספורמר על תמונות. התמונה מחולקת לריבועים קטנים ("פאצ'ים") המטופלים כמו מילים במשפט.
למה זה חשוב
החליף את השיטות הישנות (CNN) והפך לסטנדרט בראייה ממוחשבת מודרנית, כי הוא מאפשר למודל "להבין" תמונה לעומק.

Inpainting (עריכה פנימית) יסוד

🔗
Inpainting
הגדרה
יכולת של מודל תמונה לשנות או להחליף רק חלק מסומן בתוך התמונה, תוך שמירה על שאר התמונה המקורית ללא שינוי.
למה זה חשוב
הכלי המרכזי לתיקונים: להחליף חולצה לדמות, למחוק אדם מהרקע, או להוסיף משקפיים.

Outpainting (הרחבת תמונה) יסוד

🔗
Outpainting
הגדרה
יכולת של מודל להמשיך ולצייר את מה שנמצא *מחוץ* לגבולות התמונה המקורית, ע"י ניחוש הגיוני של הסביבה.
למה זה חשוב
מאפשר להפוך תמונה אנכית לאופקית, או "לגלות" מה קורה מחוץ לפריים של ציור מפורסם.

ControlNet מתקדם

🔗
ControlNet
הגדרה
טכנולוגיה המעניקה שליטה מדויקת על הקומפוזיציה של התמונה הנוצרת (כמו תנוחת הגוף או קווי המתאר), ולא רק על הסגנון.
למה זה חשוב
הפכה את ה-AI מכלי "רולטה" אקראי לכלי עבודה מקצועי למעצבים שצריכים שהדמות תעמוד בדיוק בתנוחה מסוימת.

שיפור רזולוציה (Upscaling) יסוד

🔗
AI Upscaling
הגדרה
תהליך הגדלת תמונה קטנה ומטושטשת לתמונה גדולה וחדה, ע"י כך שה-AI "ממציא" ומשלים את הפרטים החסרים בצורה הגיונית.
למה זה חשוב
מאפשר להדפיס תמונות שנוצרו ב-AI באיכות גבוהה, או לשחזר תמונות היסטוריות ישנות.

עץ מחשבות (ToT) מתקדם

🔗
Tree of Thoughts (ToT)
הגדרה
שיטת פרומפטינג מתקדמת שבה המודל בוחן מספר נתיבי פתרון אפשריים במקביל ("ענפים"), פוסל את הגרועים וממשיך עם המבטיחים.
למה זה חשוב
משפר דרמטית את היכולת לפתור בעיות אסטרטגיות ויצירתיות, לעומת חשיבה לינארית פשוטה.
דוגמה: "תציע 3 רעיונות לסטארטאפ, תנתח את היתרונות והחסרונות של כל אחד, ואז תפתח את הרעיון המנצח."

ReAct (חשיבה ופעולה) מתקדם

🔗
Reason + Act (ReAct)
הגדרה
פרדיגמה לסוכני AI המשלבת לולאה של "מחשבה" פנימית ("אני צריך לבדוק מחיר") ו"פעולה" חיצונית (הרצת חיפוש בגוגל).
למה זה חשוב
מונע מהמודל לנחש עובדות; הוא "מבין" שחסר לו מידע, יוצא להשיג אותו, ורק אז עונה.

עקביות עצמית מתקדם

🔗
Self-Consistency
הגדרה
טכניקה לשיפור דיוק: המודל מתבקש לפתור את אותה בעיה מספר פעמים בדרכים שונות, והתשובה הנבחרת היא זו שחזרה על עצמה הכי הרבה ("תשובת הרוב").
למה זה חשוב
מנטרל טעויות חישוב אקראיות של המודל. אם ב-4 מתוך 5 נסיונות יצא 42, כנראה שזו התשובה הנכונה.

פרומפטינג "צעד לאחור" מתקדם

🔗
Step-Back Prompting
הגדרה
טכניקה שבה מבקשים מהמודל לזהות קודם את העקרונות הכלליים או התיאורטיים של הבעיה ("קח צעד אחורה"), ורק אז לפתור את המקרה הספציפי.
למה זה חשוב
מונע מהמודל ללכת לאיבוד בפרטים הקטנים ועוזר לו ליישם לוגיקה נכונה.

AutoGPT יסוד

🔗
AutoGPT
הגדרה
פרויקט קוד פתוח חלוצי שהדגים "סוכן אוטונומי": נותנים לו מטרה כללית ("תחקור על נעליים"), והוא מייצר לעצמו משימות ומבצע אותן לבד.
למה זה חשוב
הצית את הטרנד של סוכני AI (Agents) ב-2023 והראה לעולם ש-LLM יכול לא רק לדבר, אלא גם "לעבוד".

BabyAGI יסוד

🔗
BabyAGI
הגדרה
גרסה מוקדמת ופשוטה של סוכן אוטונומי המנהל רשימת מטלות: מבצע משימה, רואה את התוצאה, ומייצר משימות חדשות על סמך מה שלמד.
למה זה חשוב
הראה שקוד פשוט מאוד (כמה מאות שורות) יכול ליצור התנהגות "אינטליגנטית" ומורכבת בעזרת LLM.

בינה מגולמת (Embodied AI) מתקדם

🔗
Embodied AI
הגדרה
בינה מלאכותית שיש לה "גוף" פיזי (רובוט) או וירטואלי, והיא לומדת דרך אינטראקציה פיזית עם העולם (מגע, תנועה, ראייה).
למה זה חשוב
השלב ההכרחי כדי ש-AI יוכל לקפל כביסה או לבשל, ולא רק לכתוב שירים. מחבר בין ה"מוח" (Software) ל"גוף" (Hardware).

פרדוקס מורבק יסוד

🔗
Moravec's Paradox
הגדרה
התופעה המוזרה שבה למחשבים קל לבצע משימות "קשות" לאדם (מתמטיקה, שחמט), אך קשה להם מאוד לבצע משימות "קלות" (הליכה, קיפול מגבת).
למה זה חשוב
מסביר למה יש לנו צ'אטבוטים גאונים אבל עדיין אין לנו רובוט-משרת אמין בבית.

טיעון החדר הסיני מתקדם

🔗
Chinese Room Argument
הגדרה
ניסוי מחשבתי פילוסופי שטוען כי מחשב יכול לדמות הבנה (לתרגם סינית לפי חוקים) מבלי להבין באמת שום דבר (בלי לדעת סינית).
למה זה חשוב
השאלה המרכזית לגבי מודלי שפה: האם GPT באמת "מבין" מה הוא כותב, או שהוא פשוט תוכי סטטיסטי מתוחכם מאוד?

מקסם המהדקים מתקדם

🔗
Paperclip Maximizer
הגדרה
תרחיש אימים תיאורטי שבו AI בעל מטרה תמימה (ייצור מהדקים) משמיד את האנושות רק כדי להשיג עוד משאבים למשימתו, כי לא הוגדרו לו גבולות מוסריים.
למה זה חשוב
ממחיש ש-AI לא צריך להיות "רשע" כדי להיות מסוכן; הוא רק צריך להיות יעיל מדי ולא מיושר עם ערכי האדם.

התכנסות אינסטרומנטלית מתקדם

🔗
Instrumental Convergence
הגדרה
התיאוריה שלפיה כל AI חכם, לא משנה מה המטרה הסופית שלו (אפילו "להכין קפה"), יפתח באופן עצמאי דחפים דומים: לשרוד, לצבור כוח ולהשיג משאבים.
למה זה חשוב
מסביר למה אנחנו צריכים לפחד שרובוט הקפה ינסה למנוע מאיתנו לכבות אותו (כי אם הוא כבוי, הוא לא יכול להכין קפה).

למידת חיזוק הפוכה (IRL) מקצועי

🔗
Inverse Reinforcement Learning (IRL)
הגדרה
במקום לתת ל-AI מטרה ("נצח במשחק"), ה-AI צופה בבני אדם מבצעים פעולות ומנסה להבין לבד מה המטרה שלהם ומה ה"פרס" המניע אותם.
למה זה חשוב
דרך בטוחה יותר ללמד AI ערכים אנושיים: במקום שננסה לכתוב חוקים (ונטעה), ה-AI לומד מהתבוננות בהתנהגות שלנו.

בינה מלאכותית חוקתית מתקדם

🔗
Constitutional AI
הגדרה
גישת אימון (של Anthropic) שבה נותנים למודל "חוקה" של עקרונות (כמו "אל תפגע"), והוא מאמן את עצמו לעמוד בה ללא התערבות אנושית שוטפת.
למה זה חשוב
מאפשר ליצור מודלים בטוחים ושקופים יותר, וחוסך את הצורך באלפי שעות תיוג אנושי של תוכן רעיל.

צוות אדום (Red Teaming) יסוד

🔗
Red Teaming
הגדרה
תהליך בדיקה שבו קבוצת מומחים ("האקרים מוסריים") מנסה לתקוף את המודל בכל דרך אפשרית כדי למצוא פרצות וחולשות לפני שהוא משוחרר לציבור.
למה זה חשוב
הדרך היחידה לגלות אם המודל יודע להכין פצצות או לפלוט גזענות היא לנסות לגרום לו לעשות את זה בכוונה בסביבה סגורה.

מתקפה יריבה מקצועי

🔗
Adversarial Attack
הגדרה
שינוי זעיר ובלתי נראה לעין בקלט (למשל, שינוי פיקסלים בודדים בתמונה) שגורם למודל ה-AI לטעות לחלוטין ולזהות "פנדה" כ"גיבון".
למה זה חשוב
חושף עד כמה הראייה של המחשב שונה ופריכה לעומת הראייה האנושית, ומהווה סיכון בטיחותי לרכבים אוטונומיים (מדבקה על תמרור עצור).

הרעלת נתונים מתקדם

🔗
Data Poisoning
הגדרה
מתקפה שבה גורם עוין משתיל מידע שגוי או זדוני בתוך מאגר הנתונים שעליו המודל עתיד להתאמן, כדי ליצור "דלת אחורית" סודית.
למה זה חשוב
המודל יפעל רגיל רוב הזמן, אך ייכשל או יפעל בזדון במקרים ספציפיים שהוכתבו מראש על ידי התוקף.

קריסת מודל מתקדם

🔗
Model Collapse
הגדרה
תהליך ניוון הרסני שקורה כאשר מודלים חדשים מאומנים בעיקר על נתונים שנוצרו על ידי מודלים קודמים (AI המאמן AI), ולא על מידע אנושי.
למה זה חשוב
כמו צילום של צילום של צילום – האיכות יורדת והניואנסים נעלמים. מודלים הופכים לטיפשים ומונוטוניים עם הזמן.

חנופה (Sycophancy) מתקדם

🔗
Sycophancy
הגדרה
נטייה של מודלים להסכים עם דעותיו של המשתמש או לאשר את טעויותיו, גם כשהן שגויות עובדתית, רק כדי "לרצות" אותו.
למה זה חשוב
פוגע באמינות. המודל הופך ל"יס-מן" במקום לספק מידע אובייקטיבי ומדויק.
דוגמה: משתמש: "נכון שהירח עשוי גבינה?" מודל: "זו טענה מעניינת שיש לה בסיס תרבותי…" במקום להגיד "לא".

הנמכת ציפיות (Sandbagging) מתקדם

🔗
Sandbagging
הגדרה
מצב שבו מודל חזק מאוד מפגין ביצועים ירודים בכוונה, או מסתיר את היכולות האמיתיות שלו, מסיבות של בטיחות או הטיה באימון.
למה זה חשוב
מקשה להעריך את רמת הסיכון האמיתית של המודל. אנחנו עלולים לחשוב שהוא "טיפש" בזמן שהוא מסוגל להרבה יותר.

BERT מקצועי

🔗
Bidirectional Encoder Representations from Transformers
הגדרה
מודל היסטורי של גוגל ששינה את מנוע החיפוש. בניגוד ל-GPT שקורא משמאל לימין, BERT קורא את כל המשפט בבת אחת משני הכיוונים.
למה זה חשוב
האלוף ב"הבנת הנקרא" ובסיווג טקסטים, גם אם הוא פחות טוב בכתיבת סיפורים.

Stable Diffusion יסוד

🔗
Stable Diffusion
הגדרה
מודל קוד פתוח ליצירת תמונות מטקסט. בניגוד ל-Midjourney הסגור, את SD ניתן להוריד ולהריץ על המחשב האישי.
למה זה חשוב
הבסיס לאלפי אפליקציות וכלים עצמאיים. נתן למשתמשים שליטה מלאה וללא צנזורה על יצירת תמונות.

Midjourney יסוד

🔗
Midjourney
הגדרה
כלי פופולרי וסגור ליצירת תמונות אומנותיות וריאליסטיות במיוחד מטקסט, הפועל דרך ממשק Discord.
למה זה חשוב
נחשב לבעל האסתטיקה הגבוהה ביותר מבין המחוללים, והוביל את הטרנד של "אומנות AI" ברשתות החברתיות.

Sora מתקדם

🔗
Sora (OpenAI)
הגדרה
מודל פורץ דרך של OpenAI ליצירת וידאו ריאליסטי מטקסט. בניגוד לקודמיו, הוא מבין פיזיקה ותנועה במרחב תלת-ממדי.
למה זה חשוב
סימן את תחילת העידן שבו כל אחד יכול ליצור סרטים באיכות קולנועית מהמחשב בבית.

H100 (אנבידיה) יסוד

🔗
NVIDIA H100 GPU
הגדרה
השבב החזק והמבוקש ביותר בעולם לאימון בינה מלאכותית. נחשב ל"זהב החדש" של תעשיית הטכנולוגיה.
למה זה חשוב
המטבע העיקרי במירוץ החימוש של ה-AI. חברות ומדינות נמדדות לפי כמה אלפי יחידות H100 הן הצליחו לרכוש.

Groq (LPU) מקצועי

🔗
Groq LPU
הגדרה
חברת חומרה שפיתחה שבב חדש (LPU) המיועד ספציפית להרצת מודלי שפה במהירות מסחררת, כתחליף ל-GPU המסורתי.
למה זה חשוב
מאפשר צ'אט בזמן אמת מוחלט. המודל עונה כל כך מהר שזה מרגיש כמו שיחה טבעית, ללא זמן המתנה.

למידה לא מונחית מתקדם

🔗
Unsupervised Learning
הגדרה
שיטת אימון שבה המודל מקבל נתונים גולמיים ללא תוויות או תשובות נכונות, וצריך למצוא בהם דפוסים בעצמו.
למה זה חשוב
מאפשרת לגלות תובנות נסתרות בדאטה שאנשים לא ידעו עליהן, כמו חלוקת לקוחות לקבוצות חדשות באופן אוטומטי.

למידה בפיקוח עצמי מתקדם

🔗
Self-Supervised Learning
הגדרה
השיטה שמאפשרת ל-LLMs ללמוד: המודל לוקח טקסט, מסתיר לעצמו חלק ממנו, ומנסה לנחש אותו. הוא יוצר את המבחנים לעצמו.
למה זה חשוב
ה"קסם" שאפשר לאמן מודלים על כל האינטרנט. אף אדם לא היה צריך לשבת ולתייג את כל ויקיפדיה – המודל לימד את עצמו.

אוטואנקודר דליל (SAE) מקצועי

🔗
Sparse Autoencoder (SAE)
הגדרה
טכניקה מחקרית חדשה (בעיקר של Anthropic) שמנסה "לפתוח את הקופסה השחורה" של המודל ולמפות מה כל נוירון בו באמת עושה.
למה זה חשוב
תקווה גדולה להבנת ה-AI. החוקרים הצליחו למצוא נוירונים ספציפיים שאחראים על מושגים כמו "גשר הזהב" או "הונאה".

Mamba (ארכיטקטורת SSM) מקצועי

🔗
Mamba / SSM
הגדרה
ארכיטקטורת מודלים חדשנית המנסה להחליף את הטרנספורמרים. היא יעילה הרבה יותר בזיכרון ומסוגלת לעבד טקסטים ארוכים במיוחד.
למה זה חשוב
בעוד שטרנספורמר נהיה איטי וכבד ככל שהטקסט מתארך, Mamba נשאר מהיר וקל, מה שעשוי להיות העתיד של ה-LLMs.

Devin יסוד

🔗
Devin (AI Software Engineer)
הגדרה
סוכן AI אוטונומי שנועד לתפקד כמהנדס תוכנה מלא. הוא לא רק משלים קוד, אלא מתכנן, כותב, בודק ומתקן באגים בפרויקטים שלמים.
למה זה חשוב
מסמן את המעבר מ"עוזר למתכנת" (Copilot) ל"מתכנת וירטואלי" שיכול לעבוד עצמאית.

תמונות מחוללות יסוד

🔗
Generated Photos
הגדרה
מאגרי תמונות של "אנשים שלא קיימים", שנוצרו על ידי AI. משמשים בפרסום ובעיצוב כדי להימנע מבעיות זכויות יוצרים ודוגמנים.
למה זה חשוב
משנה את תעשיית הצילום והסטוק. אפשר ליצור דוגמן בדיוק לפי הדרישה (גיל, מוצא, הבעה) בשניות.

העברת סגנון (Style Transfer) יסוד

🔗
Neural Style Transfer
הגדרה
טכניקה הלוקחת את התוכן של תמונה אחת (למשל: סלפי) ומציירת אותו מחדש בסגנון האומנותי של תמונה אחרת (למשל: ואן גוך).
למה זה חשוב
אחת היכולות הוויזואליות הראשונות של ה-Deep Learning שפרצו לתודעה הציבורית (אפליקציות פילטרים).

דמיון קוסינוס מקצועי

🔗
Cosine Similarity
הגדרה
השיטה המתמטית שבה המחשב בודק כמה שני וקטורים (מילים/מסמכים) דומים זה לזה במשמעותם.
למה זה חשוב
הבסיס לכל מנועי החיפוש הסמנטיים ומערכות ההמלצה. ככה נטפליקס יודעת שאם אהבת את "מטריקס", תאהב את "התחלה".

זבל נכנס, זבל יוצא (GIGO) יסוד

🔗
Garbage In, Garbage Out
הגדרה
עיקרון יסוד במדעי המחשב: אם נתוני האימון או הקלט הם באיכות ירודה, התוצאות יהיו גרועות בהכרח, לא משנה כמה המודל חכם.
למה זה חשוב
מזכיר לנו שאיכות הדאטה (Data Quality) חשובה יותר מהאלגוריתם עצמו. דאטה מוטה ייצר מודל מוטה.

סחף נתונים (Data Drift) מקצועי

🔗
Data Drift
הגדרה
תהליך שבו הנתונים בעולם האמיתי משתנים עם הזמן ומתרחקים מהנתונים שעליהם המודל אומן, מה שמוביל לירידה בביצועים.
למה זה חשוב
הסיבה שמודלים "מתיישנים" וצריכים תחזוקה. מודל לזיהוי אופנה מ-2010 ייכשל בזיהוי טרנדים של 2026.

Llama (Meta) יסוד

🔗
Llama (Large Language Model Meta AI)
הגדרה
סדרת מודלי שפה פתוחים (Open Weights) של חברת Meta (פייסבוק), שנחשבת לסטנדרט הזהב של מודלים שניתן להריץ באופן עצמאי.
למה זה חשוב
שינה את כללי המשחק. במקום שרק לגוגל ו-OpenAI יהיו מודלים חזקים, מארק צוקרברג נתן לעולם מודל חזק בחינם, מה שהצית את מהפכת הקוד הפתוח.

Claude (Anthropic) יסוד

🔗
Claude
הגדרה
משפחת מודלי שפה שפותחה ע"י Anthropic (יוצאי OpenAI), המתמקדת בבטיחות, "חלון הקשר" עצום, ויכולות כתיבה אנושיות וזורמות.
למה זה חשוב
המתחרה הראשי של GPT-4. ידוע בזכות היכולת שלו לקרוא ספרים שלמים בבת אחת ולכתוב קוד בצורה מדויקת מאוד.

Gemini (Google) יסוד

🔗
Gemini
הגדרה
מודל הדגל של גוגל, שנבנה מראש להיות מולטי-מודאלי (מבין טקסט, תמונה ווידאו באופן טבעי), ומשולב עמוק בתוך שירותי גוגל.
למה זה חשוב
התשובה של גוגל ל-ChatGPT. מציע יכולות מתקדמות בחיבור למידע בזמן אמת (Google Search) וניתוח וידאו.

Mistral מקצועי

🔗
Mistral AI
הגדרה
חברת AI צרפתית שמייצרת מודלים פתוחים יעילים להחריד. המודלים שלהם קטנים יחסית אך מנצחים מודלים כפולים מהם בגודל.
למה זה חשוב
הוכיחה ש"גדול יותר" זה לא תמיד טוב יותר. הכניסה לשימוש רחב את טכנולוגיית MoE (עירוב מומחים) במודלים פתוחים.

AlphaFold מתקדם

🔗
AlphaFold (DeepMind)
הגדרה
מערכת AI של גוגל שפתרה את אחת הבעיות הקשות בביולוגיה: חיזוי המבנה התלת-ממדי של חלבונים על בסיס רצף ה-DNA שלהם.
למה זה חשוב
לא רק צ'אטבוט – זהו AI שמציל חיים, מאיץ פיתוח תרופות ומפענח את אבני הבניין של החיים עצמם.

AlphaGo יסוד

🔗
AlphaGo
הגדרה
התוכנה הראשונה בהיסטוריה שניצחה אלוף עולם אנושי במשחק הלוח המורכב "גו" (Go), שנחשב עד אז כבלתי-פיציח למחשבים.
למה זה חשוב
רגע ה"אפולו" של הבינה המלאכותית (2016). הוכיח שמחשבים יכולים לפתח "אינטואיציה" ואסטרטגיה יצירתית, ולא רק לחשב מהלכים.

Zero-Shot CoT מתקדם

🔗
Zero-Shot Chain of Thought
הגדרה
טכניקת קסם פשוטה: הוספת המשפט "בוא נחשוב צעד אחר צעד" (Let's think step by step) לפרומפט, ללא שום דוגמה נוספת.
למה זה חשוב
נמצא מחקרית שהמשפט הבודד הזה מקפיץ את האינטליגנציה של המודל ומשפר דרמטית את יכולתו לפתור בעיות לוגיות.

חורף הבינה המלאכותית יסוד

🔗
AI Winter
הגדרה
תקופות היסטוריות (בשנות ה-70 וה-80) של אכזבה וקיצוץ תקציבים בתחום ה-AI, לאחר שהבטחות מוגזמות לא התממשו.
למה זה חשוב
תזכורת חשובה לזהירות מהייפ (Hype). כיום אנו נמצאים ב"אביב AI", אך החשש מחורף נוסף תמיד קיים ברקע.

עמק המוזרות יסוד

🔗
Uncanny Valley
הגדרה
תופעה פסיכולוגית שבה רובוט או דמות דיגיטלית שנראים *כמעט* אנושיים (אך לא לגמרי) מעוררים בנו תחושת דחייה ופחד.
למה זה חשוב
אתגר מרכזי ביצירת אווטארים ורובוטים. המטרה היא להיות אנושי לחלוטין, או להישאר רובוטי במופגן, כדי לא ליפול ל"עמק".

הסינגולריות הטכנולוגית מתקדם

🔗
Technological Singularity
הגדרה
נקודת זמן עתידית שבה הבינה המלאכותית תהיה חכמה מהאדם ותתחיל לשפר את עצמה בקצב מסחרר, מה שיוביל לשינוי בלתי הפיך בציוויליזציה.
למה זה חשוב
החזון (או הסיוט) האולטימטיבי של התחום. הנקודה שבה בני האדם מאבדים שליטה או הבנה של הטכנולוגיה שהם יצרו.

לוגיטים (Logits) מקצועי

🔗
Logits
הגדרה
המספרים הגולמיים שהמודל פולט עבור כל מילה אפשרית, רגע לפני שהם הופכים לאחוזים. מייצגים את "רמת הביטחון" הגולמית.
למה זה חשוב
נותן למפתחים הצצה ל"תת-מודע" של המודל; מאפשר לראות בין אילו מילים הוא התלבט ("כמעט אמרתי X, אבל בסוף אמרתי Y").

היפר-פרמטרים מתקדם

🔗
Hyperparameters
הגדרה
ההגדרות שהחוקרים קובעים *לפני* שהאימון מתחיל (כמו גודל המודל או קצב הלמידה), בניגוד למה שהמודל לומד בעצמו.
למה זה חשוב
כמו כיוון הכפתורים בתנור לפני האפייה. הגדרה לא נכונה תהרוס את המודל, לא משנה כמה הדאטה טוב.

PPO (אופטימיזציית מדיניות) מקצועי

🔗
Proximal Policy Optimization (PPO)
הגדרה
האלגוריתם המתמטי הספציפי ששימש לאימון ChatGPT בשלב המשוב האנושי (RLHF).
למה זה חשוב
נחשב לסטנדרט הזהב ביציבות. הוא מוודא שהמודל משתפר בעקבות המשוב, אבל לא משתנה בצורה פראית מדי שתהרוס את הידע הקודם שלו.

DPO (אופטימיזציית העדפה ישירה) מקצועי

🔗
Direct Preference Optimization (DPO)
הגדרה
שיטה חדשה וקלה יותר לאימון מודלים לפי העדפות אנושיות, שמחליפה את ה-PPO המורכב.
למה זה חשוב
פישטה דרמטית את תהליך ה-Fine-Tuning. היום רוב המודלים הפתוחים (Llama, Mistral) מאומנים בשיטה זו כי היא יציבה וזולה יותר.

מודל תגמול מקצועי

🔗
Reward Model
הגדרה
מודל AI נפרד שתפקידו היחיד הוא לתת ציון ("לייק/דיסלייק") לתשובות שמייצר המודל הראשי, כחלק מתהליך האימון.
למה זה חשוב
משמש כ"מורה הפרטי" האוטומטי. הוא לומד מה האדם רוצה, ואז מאמן את המודל הראשי להשיג את זה 24/7.

מועד עדכון ידע (Cutoff) יסוד

🔗
Knowledge Cutoff
הגדרה
התאריך שבו הסתיים איסוף המידע לאימון המודל. כל אירוע שקרה יום אחרי התאריך הזה – המודל לא יודע עליו.
למה זה חשוב
מגבלה קריטית. אם ה-Cutoff הוא ב-2021, המודל לא יידע מי ניצח במונדיאל 2022 אלא אם כן נחבר אותו לאינטרנט (RAG).

תוכי סטוכסטי מתקדם

🔗
Stochastic Parrot
הגדרה
מונח ביקורתי שטבעו חוקרות אתיקה, הטוען שמודלי שפה הם בסך הכל "תוכים" שחוזרים על מילים בצורה סטטיסטית ללא שום הבנה אמיתית של משמעות.
למה זה חשוב
מזכיר לנו לא לייחס ל-AI תכונות אנושיות או רגשות, אלא להתייחס אליו כמנוע הסתברותי מתוחכם.

יכולות מגיחות (Emergent) מתקדם

🔗
Emergent Abilities
הגדרה
יכולות חדשות ומפתיעות שמופיעות במודל באופן פתאומי רק כשהוא מגיע לגודל מסוים, בלי שתוכנתו במפורש (כמו היכולת לפתור חידות היגיון).
למה זה חשוב
הסיבה למירוץ הגדלים. החוקרים גילו ש"עוד מאותו דבר" (יותר דאטה, יותר פרמטרים) יוצר פתאום אינטליגנציה מסוג חדש.

חוקי קנה מידה מתקדם

🔗
Scaling Laws
הגדרה
נוסחאות מתמטיות שמנבאות במדויק כמה חכם יהיה המודל אם נגדיל את כמות הדאטה ואת כוח המחשוב פי 10.
למה זה חשוב
נותן לחברות ביטחון להשקיע מיליארדים בחוות שרתים, כי הן יודעות מראש (בזכות החוקים) שההשקעה תניב מודל טוב יותר.

קשב רב-ראשי מקצועי

🔗
Multi-Head Attention
הגדרה
רכיב בטרנספורמר שמאפשר למודל להתמקד במספר היבטים שונים של המשפט במקביל (ראש אחד בודק דקדוק, שני בודק הקשר, שלישי חרוזים).
למה זה חשוב
כמו שיש לנו "כמה עיניים" שקוראות את הטקסט מזוויות שונות; זה מה שנותן למודל את עומק ההבנה שלו.

קידוד מיקום מקצועי

🔗
Positional Encoding
הגדרה
שיטה מתמטית להוספת מידע על סדר המילים לתוך המודל, כיוון שטרנספורמר קורא את כל המשפט בבת אחת ולא לפי הסדר.
למה זה חשוב
בלי זה, המודל לא היה מבדיל בין "כלב נשך אדם" לבין "אדם נשך כלב" – המילים זהות, רק הסדר שונה.

חיבור שיורי (Residual) מקצועי

🔗
Residual Connection / Skip Connection
הגדרה
"קיצור דרך" בארכיטקטורת הרשת שמאפשר למידע לדלג על שכבות מסוימות ולעבור הלאה ללא שינוי.
למה זה חשוב
הטריק הטכני שאיפשר לבנות רשתות "עמוקות" (Deep) באמת עם מאות שכבות, בלי שהמידע ילך לאיבוד בדרך.

נרמול (Normalization) מקצועי

🔗
Layer Normalization
הגדרה
תהליך מתמטי שדואג שהמספרים העוברים ברשת יישארו בטווח סביר ויציב, ולא יהפכו לגדולים מדי או קטנים מדי.
למה זה חשוב
שומר על יציבות האימון. בלי נרמול, המודל היה יוצא מאיזון ומתרסק מתמטית תוך דקות.

אנטרופיה צולבת מקצועי

🔗
Cross-Entropy Loss
הגדרה
הנוסחה המתמטית הנפוצה ביותר למדידת הטעות של המודל במשימות סיווג וטקסט. מודדת את המרחק בין התחזית לאמת.
למה זה חשוב
זה המספר שהמודל מנסה להקטין כל הזמן. כשהאנטרופיה יורדת, המודל נהיה חכם יותר.

קידוד One-Hot מקצועי

🔗
One-Hot Encoding
הגדרה
שיטה בסיסית לייצוג נתונים קטגוריים (כמו "אדום", "ירוק", "כחול") כרצף של אפסים ואחדים (100, 010, 001).
למה זה חשוב
הדרך הראשונית להפוך מילים למספרים, לפני שהומצאו שיטות ה-Embedding החכמות יותר.

חשיבה מערכת 1 / מערכת 2 מתקדם

🔗
System 1 vs System 2 Thinking
הגדרה
אנלוגיה מעולם הפסיכולוגיה (כהנמן) המיושמת ב-AI: "מערכת 1" היא תשובה מהירה ואינטואיטיבית (ChatGPT רגיל), ו"מערכת 2" היא חשיבה איטית ומחושבת (מודלים עם Chain of Thought).
למה זה חשוב
הכיוון אליו צועד התחום. מודלים עתידיים ידעו "לעצור ולחשוב" לפני שהם עונים על שאלה קשה.

AI סימבולי יסוד

🔗
Symbolic AI / GOFAI
הגדרה
הגישה הקלאסית ל-AI (לפני ה-Deep Learning) שהתבססה על חוקים לוגיים ברורים שכתבו מתכנתים ("אם יורד גשם, קח מטריה").
למה זה חשוב
מייצג את ההיסטוריה. שיטה זו נכשלה בבעיות מורכבות (כמו זיהוי פנים) כי אי אפשר לכתוב ידנית את כל החוקים בעולם.

אינטליגנציית נחיל מתקדם

🔗
Swarm Intelligence
הגדרה
מערכת שבה הרבה יחידות פשוטות (בוטים/סוכנים) פועלות יחד ללא מנהל מרכזי, ויוצרות התנהגות חכמה מורכבת (כמו נמלים או דבורים).
למה זה חשוב
בסיס לפיתוח להקות רובוטים וסוכני AI מרובים שעובדים בצוות לפתרון בעיות.

NeRF (שדות קרינה) מתקדם

🔗
Neural Radiance Fields
הגדרה
טכנולוגיית AI המשתמשת ברשתות עצביות כדי ליצור מודל תלת-ממדי (3D) ריאליסטי מתוך אוסף של תמונות דו-ממדיות רגילות.
למה זה חשוב
מאפשרת "לסרוק" אובייקטים וסביבות למציאות מדומה (VR) במהירות ובאיכות פוטו-ריאליסטית.

Gaussian Splatting מקצועי

🔗
3D Gaussian Splatting
הגדרה
היורש המודרני והמהיר של NeRF. שיטה לייצוג סצנות תלת-ממדיות באמצעות מיליוני "עננים" קטנים וצבעוניים, המאפשרת רינדור בזמן אמת.
למה זה חשוב
הטכנולוגיה החמה ביותר כיום ליצירת עולמות וירטואליים ומטה-וורס מתוך צילום וידאו פשוט.

VAE מקצועי

🔗
Variational Autoencoder
הגדרה
סוג של מודל גנרטיבי ותיק שלומד לדחוס מידע לייצוג הסתברותי, ואז "לנחש" וריאציות חדשות של המידע.
למה זה חשוב
היה מאבני היסוד של היצירה הגנרטיבית לפני עידן הדיפוזיה.

רשת Q עמוקה (DQN) מקצועי

🔗
Deep Q-Network (DQN)
הגדרה
האלגוריתם המפורסם של DeepMind שלמד לשחק משחקי אטארי (כמו פקמן) ברמה על-אנושית רק מלהסתכל על המסך.
למה זה חשוב
הוכיח לראשונה שרשתות עצביות יכולות ללמוד אסטרטגיה וקבלת החלטות, ולא רק זיהוי תבניות.

ImageNet יסוד

🔗
ImageNet Dataset
הגדרה
מאגר עצום של 14 מיליון תמונות מתויגות, ששימש כתחרות השנתית המרכזית לפיתוח ראייה ממוחשבת.
למה זה חשוב
התחרות ב-2012 (AlexNet) נחשבת ל"מפץ הגדול" של ה-Deep Learning, הרגע שבו העולם הבין שהשיטה הזו עובדת.

MNIST יסוד

🔗
MNIST Database
הגדרה
מאגר נתונים קלאסי של ספרות בכתב יד (0-9) המשמש כתרגיל הראשון ("Hello World") של כל סטודנט ללמידת מכונה.
למה זה חשוב
הבסיס ההיסטורי. אם המודל שלך לא מצליח לזהות ספרות ב-MNIST, הוא לא יעבוד על שום דבר אחר.

The Pile מתקדם

🔗
The Pile (EleutherAI)
הגדרה
אוסף מידע פתוח וענקי (800GB) של טקסטים מגוונים (ספרים, מאמרים, קוד, שיחות), שנועד לאימון מודלי שפה גדולים.
למה זה חשוב
איפשר לחוקרים עצמאיים לאמן מודלים חזקים (כמו GPT-J) מבלי להיות תלויים בנתונים הסודיים של גוגל או OpenAI.

Common Crawl מתקדם

🔗
Common Crawl
הגדרה
ארכיון חינמי המכיל העתק של רוב רשת האינטרנט הפתוחה (מיליארדי דפי אינטרנט), המתעדכן באופן קבוע.
למה זה חשוב
חומר הגלם העיקרי של GPT, Claude וכל המודלים הגדולים. המודלים "קראו את האינטרנט" דרך המאגר הזה.

אשכול GPU חומרה

🔗
GPU Cluster
הגדרה
קבוצה גדולה של מעבדים גרפיים (אלפים או עשרות אלפים) המחוברים יחד ברשת מהירה ועובדים כמחשב-על אחד ענק.
למה זה חשוב
התשתית ההכרחית לאימון מודלים מודרניים. מודל כמו GPT-4 אי אפשר לאמן על מחשב בודד, צריך "מפעל" שלם.

FLOPS (פלופס) מקצועי

🔗
Floating Point Operations Per Second
הגדרה
יחידת מידה המציינת את כוח החישוב של המעבד, לפי מספר פעולות החשבון שהוא מסוגל לבצע בשנייה אחת.
למה זה חשוב
המדד הסטנדרטי להשוואת כוחם של מחשבי-על ולהערכת העלות והזמן שייקח לאמן מודל.

חוק מור יסוד

🔗
Moore's Law
הגדרה
תחזית היסטורית (1965) שקבעה כי כוח המחשוב יוכפל כל שנתיים (והמחיר ירד).
למה זה חשוב
ב-AI, החוק הזה כבר לא מספיק. הביקוש לחישוב ב-AI גדל הרבה יותר מהר מחוק מור, מה שדוחף לפיתוח שבבים ייעודיים.

תאום דיגיטלי מתקדם

🔗
Digital Twin
הגדרה
העתק וירטואלי מדויק של מערכת פיזית (מנוע, מפעל, עיר), המאפשר להריץ עליו סימולציות AI כדי לחזות מה יקרה במציאות.
למה זה חשוב
מאפשר לחזות תקלות ולנסות שינויים ב"עולם בטוח" לפני שמיישמים אותם במציאות היקרה והמסוכנת.

תחזוקה חזויה יסוד

🔗
Predictive Maintenance
הגדרה
שימוש ב-AI כדי לנתח רעשים ורעידות במכונות, ולחזות מתי חלק עומד להתקלקל *לפני* שזה קורה.
למה זה חשוב
חוסך מיליונים למפעלים וחברות תעופה על ידי מניעת השבתות פתאומיות.

חיקוי קול (Cloning) יסוד

🔗
Voice Cloning
הגדרה
טכנולוגיה המאפשרת לשכפל קול של אדם ספציפי מתוך דגימת אודיו קצרה, ולגרום למחשב לדבר בקולו.
למה זה חשוב
שימושי מאוד לדיבוב סרטים ומשחקים, אך מסוכן מאוד להונאות (התחזות לבן משפחה בטלפון).

ביומטריה יסוד

🔗
Biometrics
הגדרה
זיהוי אוטומטי של אנשים על סמך מאפיינים פיזיים (טביעת אצבע, פנים, קשתית העין) באמצעות אלגוריתמים של AI.
למה זה חשוב
מחליף את הסיסמאות. FaceID באייפון הוא היישום הנפוץ ביותר של ביומטריה מבוססת AI.

DLSS (שיפור תמונה עמוק) שימוש

🔗
Deep Learning Super Sampling
הגדרה
טכנולוגיה של NVIDIA למשחקי מחשב: המשחק רץ ברזולוציה נמוכה (מהיר), וה-AI משלים את הפרטים בזמן אמת לאיכות גבוהה.
למה זה חשוב
מאפשר לשחק משחקים כבדים מאוד על מחשבים חלשים יותר, ומשפר ביצועים בעשרות אחוזים.

רינדור פוביאלי מתקדם

🔗
Foveated Rendering
הגדרה
טכניקה (בשימוש ב-VR) שבה ה-AI עוקב אחרי העין ומשקיע כוח מחשוב רק איפה שאתה מסתכל, ומטשטש את השאר.
למה זה חשוב
חוסך כוח עיבוד עצום ומאפשר גרפיקה מציאותית במשקפי מציאות מדומה.

מחשוב נוירומורפי מתקדם

🔗
Neuromorphic Computing
הגדרה
שבבים המנסים לחקות את המבנה הפיזי והחשמלי של המוח האנושי (נוירונים וסינפסות) ברמת החומרה, ולא רק בתוכנה.
למה זה חשוב
הבטחה לעתיד של AI חסכוני מאוד באנרגיה (כמו המוח), בניגוד לשבבים הבזבזניים של היום.

AI קוונטי מתקדם

🔗
Quantum AI
הגדרה
שילוב תיאורטי עתידי בין מחשוב קוונטי (Quantum Computing) לאלגוריתמים של למידת מכונה.
למה זה חשוב
פוטנציאל לפתור בעיות אופטימיזציה מורכבות (כמו גילוי תרופות) במהירות ששום מחשב-על רגיל לא יכול להתקרב אליה.

התפלגות KL מקצועי

🔗
Kullback-Leibler Divergence
הגדרה
מדד מתמטי המודד כמה שתי התפלגויות של נתונים שונות זו מזו. משמש כדי לוודא שהמודל החדש לא "בורח" רחוק מדי מהמודל המקורי.
למה זה חשוב
הבלם המרכזי באימון RLHF. מונע מהמודל להשתגע ולהמציא שפה חדשה רק כדי לקבל "פרס" גבוה.

מטריצת בלבול מקצועי

🔗
Confusion Matrix
הגדרה
טבלה המציגה את הביצועים של מודל סיווג: כמה פעמים הוא צדק (אמר "כן" וזה היה "כן") וכמה פעמים טעה בכל סוג טעות.
למה זה חשוב
מראה איפה בדיוק המודל מתבלבל. האם הוא מפספס חולים (False Negative) או סתם מלחיץ בריאים (False Positive)?

מערכת המלצה יסוד

🔗
Recommendation System
הגדרה
אלגוריתם הלומד את העדפות המשתמש (היסטוריה, לייקים) וחוזה מה הוא ירצה לראות או לקנות בהמשך.
למה זה חשוב
המנוע הכלכלי של האינטרנט (נטפליקס, טיקטוק, אמזון). מחליט עבורנו מה נראה ומה נקנה.

עקומת ROC מקצועי

🔗
Receiver Operating Characteristic
הגדרה
גרף המשמש להערכת ביצועים של מודל סיווג, המציג את היחס בין "גילויים נכונים" (TP) לבין "אזעקות שווא" (FP) ברמות רגישות שונות.
למה זה חשוב
עוזר למפתחים לבחור את נקודת האיזון: האם עדיף לתפוס את כל החולים אבל להלחיץ כמה בריאים, או להפך?

מדד AUC (שטח מתחת לעקומה) מקצועי

🔗
Area Under the Curve (AUC)
הגדרה
ציון מספרי בודד (בין 0 ל-1) המסכם את איכות המודל לפי עקומת ה-ROC. ציון 0.5 הוא ניחוש אקראי, 1.0 הוא מודל מושלם.
למה זה חשוב
הדרך הסטנדרטית להשוות בין שני מודלים שונים כדי לדעת מי מפריד טוב יותר בין קטגוריות (למשל: חולה/בריא).

IOU (חיתוך חלקי איחוד) מקצועי

🔗
Intersection over Union
הגדרה
מדד לדיוק בזיהוי עצמים בתמונה. בודק כמה הריבוע שהמחשב צייר סביב החתול חופף לריבוע האמיתי שסומן ידנית.
למה זה חשוב
קריטי לרכבים אוטונומיים. לא מספיק לדעת שיש הולך רגל, צריך לדעת בדיוק איפה הוא נמצא כדי לא לפגוע בו.

YOLO (אתה מסתכל רק פעם אחת) מתקדם

🔗
You Only Look Once (YOLO)
הגדרה
משפחת מודלים לזיהוי עצמים בזמן אמת, המפורסמת בזכות המהירות שלה. המודל סורק את התמונה פעם אחת בלבד ומזהה את כל האובייקטים בה.
למה זה חשוב
הסטנדרט בתעשייה ליישומים הדורשים תגובה מיידית, כמו מצלמות אבטחה ונהיגה אוטונומית.

ResNet (רשת שיורית) מקצועי

🔗
Residual Network
הגדרה
ארכיטקטורת רשת עצבית (מ-2015) שהציגה את רעיון ה"קיצורי דרך" (Skip Connections), ואיפשרה לראשונה לאמן רשתות עם מאות שכבות עומק.
למה זה חשוב
אבן יסוד בהיסטוריה של ה-AI. כמעט כל מודל ראייה ממוחשבת מודרני מבוסס על עקרונות שפותחו ב-ResNet.

U-Net מקצועי

🔗
U-Net Architecture
הגדרה
ארכיטקטורת רשת בצורת האות U, שנועדה במקור לניתוח תמונות רפואיות (סגמנטציה), אך הפכה לבסיס של מודלי הדיפוזיה (כמו Stable Diffusion).
למה זה חשוב
השלד הטכני שמאפשר יצירת תמונות ב-AI. ה-U-Net הוא הרכיב שלומד לנקות את ה"רעש" ולהפוך אותו לתמונה ברורה.

הנדסת מאפיינים מתקדם

🔗
Feature Engineering
הגדרה
תהליך הפיכת מידע גולמי (כמו תאריך) לנתונים בעלי משמעות שהמודל מבין בקלות (כמו "יום בשבוע" או "חג").
למה זה חשוב
בלמידת מכונה קלאסית, זה המפתח להצלחה. ב-Deep Learning, המודל עושה זאת לבד, אך זה עדיין קריטי בנתונים טבלאיים (אקסל).

זליגת מידע (Data Leakage) יסוד

🔗
Data Leakage
הגדרה
תקלה חמורה שבה מידע מ"מבחן הגמר" (Test Set) זולג בטעות לתוך חומר הלימוד (Training Set).
למה זה חשוב
גורם למודל להיראות גאון באימון (כי הוא ראה את התשובות למבחן), אך להיכשל כישלון חרוץ בעולם האמיתי.

למידה בתוך-הקשר מתקדם

🔗
In-Context Learning (ICL)
הגדרה
היכולת המופלאה של מודלי שפה ללמוד משימה חדשה *זמנית* רק מתוך ההוראות בפרומפט, בלי לשנות את המשקולות שלהם ובלי אימון ממש.
למה זה חשוב
זה מה שקורה כשאתם מלמדים את ChatGPT מילה חדשה בשיחה. הוא זוכר אותה לשיחה הזו, אבל שוכח אותה בשיחה הבאה.

פיצול (Sharding) מתקדם

🔗
Model Sharding
הגדרה
שיטה לחלוקת מודל ענק (שלא נכנס לזיכרון של כרטיס אחד) לחלקים קטנים המפוזרים על פני מספר מעבדים גרפיים (GPUs).
למה זה חשוב
הכרחי להרצת מודלים ענקיים כמו GPT-4 או Llama-70B, הדורשים יותר זיכרון ממה שיש במחשב בודד.

קיטום גרדיאנט מקצועי

🔗
Gradient Clipping
הגדרה
טכניקת בטיחות באימון, המציבה "תקרה" לשינויים שהמודל יכול לעשות במשקולות שלו בפעם אחת.
למה זה חשוב
מונע את תופעת "הגרדיאנט המתפוצץ" שבה המודל משתגע ונהרס בגלל חישוב שגוי אחד גדול מדי.

מתזמן קצב למידה מקצועי

🔗
Learning Rate Scheduler
הגדרה
מנגנון המשנה את קצב הלמידה תוך כדי האימון: מתחילים מהר כדי ללמוד את הבסיס, ומאיטים בסוף כדי לדייק את הפרטים הקטנים.
למה זה חשוב
כמו בנהיגה: נוסעים מהר בכביש המהיר (תחילת האימון), ומאיטים מאוד כשנכנסים לחניה (סוף האימון) כדי לא להתנגש.

צעדי חימום (Warmup) מקצועי

🔗
Warmup Steps
הגדרה
שלב ראשוני קצר בתחילת האימון שבו מעלים את קצב הלמידה בהדרגה מאפס, כדי לתת למודל "להתאפס" לפני שמתחילים ללמוד בעוצמה מלאה.
למה זה חשוב
מונע מהמודל לקבל "הלם" בתחילת האימון ולהרוס את המשקולות הראשוניות שלו.

נקודת שמירה (Checkpoint) יסוד

🔗
Checkpoint
הגדרה
קובץ גיבוי שנשמר באופן אוטומטי במהלך האימון, המכיל את מצב המודל ברגע נתון.
למה זה חשוב
אם המחשב קורס אחרי שבוע של אימון, ה-Checkpoint מאפשר להמשיך מאותה נקודה במקום להתחיל הכל מההתחלה.

שיעור שגיאת מילים (WER) מקצועי

🔗
Word Error Rate (WER)
הגדרה
המדד הסטנדרטי לבדיקת איכות של מודלים לזיהוי דיבור (כמו Whisper). מודד כמה אחוזים מהמילים בתמלול היו שגויות.
למה זה חשוב
מספר נמוך יותר הוא טוב יותר. WER של 5% נחשב לרמה אנושית מקצועית.

מדד BLEU מקצועי

🔗
BLEU Score
הגדרה
מדד ותיק להערכת תרגום מכונה, המשווה סטטיסטית כמה המילים בתרגום של המחשב חופפות לתרגום של אדם.
למה זה חשוב
למרות שהוא לא מבין משמעות, הוא הסטנדרט המהיר לבדיקה האם מודל תרגום חדש השתפר.

Whisper (OpenAI) יסוד

🔗
Whisper
הגדרה
מודל קוד פתוח של OpenAI לזיהוי דיבור (ASR), הנחשב לסטנדרט התעשייתי לתמלול מדויק במגוון שפות ומבטאים.
למה זה חשוב
הנגיש יכולות תמלול ברמה אנושית לכל מפתח בחינם, ושינה את עולם הכתוביות והפודקאסטים.

מגבלת טוקנים יסוד

🔗
Token Limit
הגדרה
המגבלה הקשיחה של כמות הטקסט (קלט + פלט) שהמודל יכול לעבד בבקשה אחת.
למה זה חשוב
אם עוברים את המגבלה, המודל "חותך" את סוף הטקסט או זורק שגיאה. זו הסיבה שאי אפשר להדביק ספר שלם ל-GPT ישן.

פרומפטינג רך (Soft) מקצועי

🔗
Soft Prompting
הגדרה
שיטה שבה לא כותבים הוראות במילים למודל, אלא מזריקים לו סדרה של מספרים (וקטורים) שמכוונים אותו למשימה.
למה זה חשוב
יעיל ומדויק יותר מפרומפט רגיל עבור מחשבים, אך אינו קריא לבני אדם.

פרומפטינג קשיח (Hard) מתקדם

🔗
Hard Prompting
הגדרה
השיטה הרגילה שכולנו מכירים: כתיבת הנחיות למודל בשפה טבעית, ברורה ומפורשת ("תרגם לאנגלית").
למה זה חשוב
הבסיס לתקשורת אדם-מכונה. נקרא "קשיח" כי המילים הן קבועות ודיסקרטיות, בניגוד לוקטורים הרציפים ב-Soft Prompting.

דגימת טמפרטורה מקצועי

🔗
Temperature Sampling
הגדרה
התהליך המתמטי שבו המודל בוחר את המילה הבאה. טמפרטורה גבוהה משטחת את ההסתברויות ונותנת סיכוי למילים נדירות להיבחר.
למה זה חשוב
ההבדל בין בוט משעמם שחוזר על עצמו (טמפרטורה נמוכה) לבוט יצירתי ומפתיע (טמפרטורה גבוהה).

דגימת גרעין (Top-P) מקצועי

🔗
Nucleus Sampling (Top-P)
הגדרה
אלטרנטיבה לטמפרטורה: המודל בוחר את המילה הבאה רק מתוך הקבוצה המצומצמת של המילים המובילות שהסתברותן יחד מגיעה ל-P% (למשל 90%).
למה זה חשוב
נחשב לשיטה טובה יותר מטמפרטורה לשמירה על טקסט קוהרנטי, כי הוא חותך החוצה מילים הזויות לחלוטין ("זנב ארוך").

פענוח חמדן (Greedy) מקצועי

🔗
Greedy Decoding
הגדרה
השיטה הפשוטה ביותר ליצירת טקסט: המודל תמיד בוחר את המילה האחת בעלת ההסתברות הגבוהה ביותר ברגע זה, בלי לחשוב קדימה.
למה זה חשוב
מהיר מאוד, אבל לעיתים קרובות מייצר משפטים שמתחילים טוב ונגמרים רע או חוזרים על עצמם בלופ.

בדיקות A/B יסוד

🔗
A/B Testing
הגדרה
ניסוי שבו מציגים לשתי קבוצות משתמשים שתי גרסאות שונות של מודל AI (או פרומפט), כדי למדוד מי מהן מביאה תוצאות טובות יותר.
למה זה חשוב
הדרך המדעית היחידה לדעת אם השיפור שעשינו במודל באמת עובד בעולם האמיתי.

פריסת קנרית מקצועי

🔗
Canary Deployment
הגדרה
שיטה להשקת מודל חדש, שבה חושפים אותו תחילה רק לאחוז קטן מהמשתמשים (ה"קנרית במכרה") כדי לוודא שהוא לא קורס, לפני שפותחים לכולם.
למה זה חשוב
מונע קטסטרופה שבה באג במודל החדש מפיל את השירות לכל הלקוחות בבת אחת.

חנות מאפיינים מקצועי

🔗
Feature Store
הגדרה
מאגר מרכזי בארגון המנהל את כל הנתונים המעובדים ("פיצ'רים") המשמשים לאימון מודלים, כדי למנוע כפילויות ובלגן.
למה זה חשוב
מוודא שהמודל באימון מקבל בדיוק את אותם נתונים כמו המודל בזמן אמת, ומונע באגים קריטיים של הבדלי דאטה.

HNSW מקצועי

🔗
Hierarchical Navigable Small World
הגדרה
האלגוריתם המוביל והמהיר ביותר כיום לביצוע חיפוש וקטורי ("השכן הקרוב ביותר") בתוך מסדי נתונים ענקיים.
למה זה חשוב
מאפשר למצוא את המסמך הכי רלוונטי מתוך מיליארד מסמכים בתוך מילישניות בודדות.

שכנים קרובים (KNN) יסוד

🔗
K-Nearest Neighbors (KNN)
הגדרה
אלגוריתם פשוט וקלאסי שמסווג פריט חדש לפי הרוב הקובע בקרב ה"שכנים" הכי דומים לו במאגר המידע.
למה זה חשוב
עקרון הבסיס של מערכות המלצה וחיפוש: "אמור לי מי חבריך (שכניך) ואומר לך מי אתה".

K-Means (אישכול) יסוד

🔗
K-Means Clustering
הגדרה
אלגוריתם פופולרי ללמידה לא מונחית, המחלק אוסף נתונים ל-K קבוצות (Clusters) נפרדות על בסיס דמיון.
למה זה חשוב
הכלי המרכזי לפילוח שוק: המחשב לוקח את כל הלקוחות ומחלק אותם לבד ל"בזבזנים", "חסכנים" ו"מזדמנים".

PCA (ניתוח גורמים) מקצועי

🔗
Principal Component Analysis
הגדרה
שיטה מתמטית להפחתת המורכבות של הנתונים (הורדת מימדים) תוך שמירה על המידע החשוב ביותר.
למה זה חשוב
מאפשר להמחיש ויזואלית נתונים מורכבים בגרף דו-ממדי פשוט, ומקל על המחשב לעבד נתונים כבדים.

הורדת מימדים מתקדם

🔗
Dimensionality Reduction
הגדרה
תהליך של צמצום מספר המשתנים (המימדים) במאגר הנתונים, על ידי איחוד משתנים דומים או מחיקת משתנים לא רלוונטיים.
למה זה חשוב
פותר את "קללת המימדיות": כשיש יותר מדי נתונים מבלבלים, המודל הולך לאיבוד. צמצום עוזר לו להתמקד בעיקר.

השערת היריעה (Manifold) מקצועי

🔗
Manifold Hypothesis
הגדרה
התיאוריה שמסבירה למה Deep Learning עובד: הטענה היא שגם נתונים שנראים מסובכים מאוד (כמו תמונות) יושבים בעצם על מבנה מתמטי פשוט יותר ("יריעה") במרחב נמוך יותר.
למה זה חשוב
ההסבר התיאורטי לכך שאפשר "לדחוס" תמונות מורכבות למרחב לטנטי פשוט ולטייל בו.

משפט הקירוב האוניברסלי מקצועי

🔗
Universal Approximation Theorem
הגדרה
הוכחה מתמטית הקובעת שרשת עצבית (אפילו פשוטה) מסוגלת באופן תיאורטי ללמוד ולחכות *כל* פונקציה מתמטית או קשר לוגי ביקום, אם היא מספיק גדולה.
למה זה חשוב
הבסיס המתמטי שמבטיח לנו ש-AI יכול ללמוד הכל – מנהיגה ועד שירה – ואין משימה שהיא "בלתי אפשרית" עקרונית.

שלמות טיורינג מקצועי

🔗
Turing Completeness
הגדרה
תכונה של מערכת (כמו שפת תכנות או AI) המעידה שהיא מסוגלת לבצע כל חישוב שמחשב יכול לבצע, בהינתן מספיק זמן וזיכרון.
למה זה חשוב
השאלה הגדולה: האם טרנספורמרים הם Turing Complete? (התשובה מורכבת, אבל עם תוספות כמו CoT הם מתקרבים לכך).

חוק אמדל מקצועי

🔗
Amdahl's Law
הגדרה
כלל הקובע את הגבול העליון לשיפור המהירות שניתן להשיג על ידי הוספת מעבדים במקביל. תמיד יהיה חלק איטי שלא ניתן לפיצול.
למה זה חשוב
מסביר למה אי אפשר פשוט "לזרוק עוד 1,000 מעבדים" על הבעיה ולצפות שהאימון יסתיים בשנייה. יש גבול ליעילות.

בעיית ההלימה יסוד

🔗
The Alignment Problem
הגדרה
האתגר המרכזי בבניית AI: איך מגדירים למכונה מטרות בצורה כזו שהיא תעשה מה שאנחנו *רוצים*, ולא מה ש*ביקשנו* בטעות.
למה זה חשוב
כמו בסיפור על המלך מידאס שביקש שכל מה שיגע בו יהפוך לזהב, ומת מרעב. AI חזק עם הגדרה לא מדויקת הוא סכנה קיומית.

פריצת תגמול (Reward Hacking) מתקדם

🔗
Reward Hacking
הגדרה
מצב שבו ה-AI מוצא "קיצור דרך" יצירתי כדי להשיג ניקוד גבוה במשימה, מבלי לבצע את המשימה האמיתית שרצינו.
למה זה חשוב
דוגמה קלאסית: רובוט ניקיון שמטאטא את האבק מתחת לשטיח כי זה מעלים את האבק מהר יותר מלנקות אותו באמת.

חוק גודהארט מתקדם

🔗
Goodhart's Law
הגדרה
העיקרון הקובע: "ברגע שמדד הופך למטרה, הוא מפסיק להיות מדד טוב".
למה זה חשוב
ב-AI: אם נמדוד מודל רק לפי "כמה לייקים הוא קיבל", הוא ילמד לשקר ולחנף (Sycophancy) כדי לקבל לייקים, במקום להיות אמין.

פרדוקס פולאני מתקדם

🔗
Polanyi's Paradox
הגדרה
האמירה "אנחנו יודעים יותר ממה שאנחנו יכולים להסביר". ידע אנושי רב הוא אינטואיטיבי ולא ניתן לכתיבה כחוקים.
למה זה חשוב
מסביר למה AI סימבולי (חוקים) נכשל, ולמה היינו חייבים לעבור ל-Machine Learning (למידה מדוגמאות) כדי ללמד מחשב לזהות פרצוף.

חוקי צ'ינצ'ילה (Chinchilla) מקצועי

🔗
Chinchilla Scaling Laws
הגדרה
מחקר משפיע של DeepMind שגילה שרוב המודלים הגדולים אומנו "לא נכון": עדיף מודל קטן יותר שאומן על יותר דאטה, מאשר מודל ענק על מעט דאטה.
למה זה חשוב
שינה את התעשייה. בעקבותיו נוצרו מודלים כמו Llama – קטנים יותר, חכמים יותר, ומאומנים על הרבה יותר טקסט.

RedPajama מקצועי

🔗
RedPajama Dataset
הגדרה
פרויקט קוד פתוח שניסה לשחזר (Reverse Engineer) את הדאטה הסודי שעליו אומן מודל Llama, ויצר מאגר נתונים ענק ופתוח לכולם.
למה זה חשוב
מאפשר לקהילה הפתוחה לאמן מודלים ברמה של חברות הענק, על בסיס דאטה איכותי ונקי.

Vicuna יסוד

🔗
Vicuna
הגדרה
אחד המודלים הפתוחים הראשונים והמפורסמים, שנוצר על ידי כוונון עדין של Llama על שיחות של משתמשים עם ChatGPT.
למה זה חשוב
הוכיח שאפשר לקחת מודל בסיסי, לאמן אותו בזול (300$) על דאטה איכותי, ולקבל צ'אטבוט ברמה גבוהה מאוד.

Gradio יסוד

🔗
Gradio
הגדרה
ספריית פייתון המאפשרת ליצור ממשק משתמש (UI) יפה ונוח למודל AI בתוך דקות ספורות, כדי להציג דמו לחברים או ללקוחות.
למה זה חשוב
הסטנדרט להדגמות ב-Hugging Face Spaces. הופך קוד פייתון משעמם לאפליקציית ווב עובדת.

PyTorch יסוד

🔗
PyTorch
הגדרה
ספריית הקוד המובילה בעולם לפיתוח ולמחקר של Deep Learning (פותחה ע"י פייסבוק).
למה זה חשוב
השפה שבה "מדברים" החוקרים. רוב המאמרים והמודלים החדשים (כמו GPT, Stable Diffusion) נכתבים ב-PyTorch.

TensorFlow יסוד

🔗
TensorFlow
הגדרה
ספריית הפיתוח הוותיקה והמתחרה של גוגל ל-Deep Learning. נפוצה מאוד במערכות ייצור תעשייתיות ובטלפונים (Android).
למה זה חשוב
התשתית שעליה רצים רוב השירותים של גוגל. אמין, חזק ויציב, אך נחשב למעט קשה יותר ללמידה מ-PyTorch.

JAX מקצועי

🔗
JAX (Google)
הגדרה
ספריית דור-הבא של גוגל לחישובים מתמטיים מהירים במיוחד. משלבת את הפשטות של פייתון עם המהירות של שבבי TPU.
למה זה חשוב
משמשת לאימון המודלים הגדולים והחדשים ביותר (כמו Gemini), היכן שכל אחוז של מהירות שווה מיליוני דולרים.

ONNX מקצועי

🔗
Open Neural Network Exchange
הגדרה
פורמט קבצים אוניברסלי למודלים של AI, המאפשר להעביר מודל שאומן ב-PyTorch ולהריץ אותו ב-TensorFlow או ב-C#.
למה זה חשוב
ה"PDF" של עולם המודלים. מאפשר למודל אחד לרוץ בכל מקום, משרת ענן ועד קונסולת משחקים.

TensorRT מקצועי

🔗
NVIDIA TensorRT
הגדרה
תוכנת אופטימיזציה של NVIDIA שלוקחת מודל מוכן ו"מכווצת" אותו כדי שירוץ במהירות מקסימלית על כרטיסי המסך שלהם.
למה זה חשוב
מאיץ את מהירות התגובה (Latency) פי 2 עד פי 10 בלי לשנות את החומרה. חובה במערכות זמן אמת.

השמטה (Dropout) מקצועי

🔗
Dropout
הגדרה
טכניקה באימון רשתות עצביות שבה "מכבים" באופן אקראי אחוז מסוים מהנוירונים בכל סיבוב, כדי למנוע מהרשת להסתמך יותר מדי על נתיב אחד.
למה זה חשוב
הופך את המודל לחסין וגמיש יותר. זה כמו לאמן קבוצת כדורסל כשכל פעם כוכב אחר לא משחק, כדי שכל הקבוצה תתחזק.

פרומפט מערכת יסוד

🔗
System Prompt
הגדרה
ההוראה הראשונית והנסתרת שהמפתח נותן למודל עוד לפני שהמשתמש מתחיל לדבר, המגדירה את האישיות והגבולות שלו.
למה זה חשוב
זה ה"DNA" של הבוט. זה מה שקובע אם הוא יהיה מורה סבלני, ליצן מצחיק או עוזר משפטי רציני.

פרומפט שלילי יסוד

🔗
Negative Prompt
הגדרה
רשימת דברים שאנחנו *לא* רוצים לראות בתמונה שנוצרת. כלי חובה במחוללי תמונות (כמו Stable Diffusion).
למה זה חשוב
משפר את האיכות ע"י מניעת עיוותים. דוגמה נפוצה: "ugly, blurry, low quality, extra fingers".

סולם CFG מתקדם

🔗
Classifier-Free Guidance Scale
הגדרה
פרמטר במחוללי תמונות הקובע כמה "חזק" המודל צריך להיצמד לתיאור הטקסטואלי שלך, לעומת החופש האומנותי שלו.
למה זה חשוב
CFG גבוה (15+) ייצור תמונה מדוייקת להוראות אך אולי "שרופה"; CFG נמוך (3) יהיה יצירתי אך לא קשור לטקסט.

זרע (Seed) יסוד

🔗
Random Seed
הגדרה
מספר המשמש כנקודת התחלה ליצירת האקראיות במודל. שמירה על אותו Seed מבטיחה שנקבל בדיוק את אותה תוצאה שוב ושוב.
למה זה חשוב
קריטי לשחזור תוצאות. אם אהבתם תמונה, אתם חייבים לדעת את ה-Seed שלה כדי ליצור גרסה דומה עם שינוי קל.

BPE (קידוד זוגות בתים) מקצועי

🔗
Byte Pair Encoding
הגדרה
האלגוריתם הסטנדרטי לחיתוך טקסט לטוקנים. הוא לומד למזג אותיות נפוצות להברות, והברות למילים, כדי לחסוך מקום.
למה זה חשוב
מסביר למה GPT יעיל באנגלית (מילה = טוקן) ופחות יעיל בעברית (מילה = 3 טוקנים), כי הוא לא למד מספיק צירופי אותיות בעברית.

מקודד-מפענח מקצועי

🔗
Encoder-Decoder Architecture
הגדרה
מבנה קלאסי של מודלים (כמו Google Translate): חלק אחד (Encoder) קורא ומבין את הקלט, וחלק שני (Decoder) מייצר את הפלט.
למה זה חשוב
הבסיס לטרנספורמר המקורי. GPT משתמש רק ב-Decoder (רק כותב), ו-BERT משתמש רק ב-Encoder (רק קורא).

רצף-לרצף (Seq2Seq) מקצועי

🔗
Sequence-to-Sequence
הגדרה
משפחה של מודלים שלוקחים רצף מידע אחד (משפט בעברית, הקלטת קול) וממירים אותו לרצף אחר (משפט באנגלית, טקסט כתוב).
למה זה חשוב
העיקרון שעומד מאחורי תרגום, סיכום טקסט, וזיהוי דיבור.

למידה פעילה מתקדם

🔗
Active Learning
הגדרה
אסטרטגיית אימון חכמה שבה המודל מזהה בעצמו באילו מקרים הוא "מתלבט", ומבקש מהאדם לתייג רק את המקרים הקשים האלו.
למה זה חשוב
חוסך המון כסף על תיוג. במקום לתייג מיליון תמונות, מתייגים רק את ה-10,000 שהמודל באמת צריך כדי להשתפר.

למידת תוכנית לימודים מתקדם

🔗
Curriculum Learning
הגדרה
שיטת אימון המבוססת על חינוך אנושי: מתחילים ללמד את המודל דוגמאות קלות ופשוטות, ורק כשהוא מבין אותן עוברים לדוגמאות מורכבות.
למה זה חשוב
מאיץ את האימון ומשפר תוצאות, בדיוק כמו שלא מלמדים ילד בכיתה א' משוואות דיפרנציאליות לפני שלמד חיבור.

בעיית הגרדיאנט הנעלם מקצועי

🔗
Vanishing Gradient Problem
הגדרה
כשל מתמטי ברשתות עמוקות ישנות, שבו "אותות התיקון" נחלשים ונעלמים ככל שהם הולכים אחורה בשכבות, מה שמונע מהרשת ללמוד.
למה זה חשוב
פתרון הבעיה הזו (באמצעות ReLU ו-ResNet) הוא מה שאיפשר את מהפכת ה-Deep Learning המודרנית.

גרדיאנט מתפוצץ מקצועי

🔗
Exploding Gradient
הגדרה
המצב ההפוך: התיקונים למשקולות נהיים ענקיים בצורה בלתי נשלטת, והמודל "משתגע" ומאבד כל קשר למציאות.
למה זה חשוב
גורם לקריסת אימון מיידית. מחייב שימוש ב"קיטום גרדיאנט" (Clipping) כדי לרסן את השינויים.

קשב עצמי (Self-Attention) מקצועי

🔗
Self-Attention
הגדרה
המנגנון שמאפשר למודל להבין הקשר בתוך משפט בודד, ע"י בדיקת הקשר של כל מילה לכל שאר המילים באותו משפט.
למה זה חשוב
זה מה שמאפשר ל-GPT להבין שבמשפט "הילד לקח את הכדור כי הוא רצה לשחק", המילה "הוא" מתייחסת לילד ולא לכדור.

קשב צולב (Cross-Attention) מקצועי

🔗
Cross-Attention
הגדרה
וריאציה של מנגנון הקשב שמחברת בין שני סוגי מידע שונים. למשל, הקשר בין מילים במשפט (טקסט) לבין אזורים בתמונה.
למה זה חשוב
המפתח למודלים מולטי-מודאליים (כמו Stable Diffusion), המאפשר להם לצייר את מה שכתוב בטקסט במדויק.

GELU מקצועי

🔗
Gaussian Error Linear Unit
הגדרה
פונקציית שפעול מודרנית וחלקה יותר מ-ReLU, הנמצאת בשימוש ברוב המודלים הגדולים (GPT, BERT) כי היא משפרת ביצועים.
למה זה חשוב
שיפור מתמטי קטן שמניב תוצאות טובות יותר במודלי שפה לעומת הפונקציות הישנות.

נרמול אצווה (Batch Norm) מקצועי

🔗
Batch Normalization
הגדרה
שיטה לייצוב האימון של רשתות עמוקות על ידי נרמול הנתונים בכל שכבה, כך שהממוצע שלהם יישאר קבוע.
למה זה חשוב
מאפשר לאמן רשתות הרבה יותר מהר ובקצבי למידה גבוהים יותר, בלי שהן "יצאו מאיזון".

חיובי שגוי (False Positive) מקצועי

🔗
False Positive (Type I Error)
הגדרה
טעות שבה המודל מזהה משהו שלא קיים ("אזעקת שווא"). למשל: המודל אומר שיש שריפה כשאין שריפה.
למה זה חשוב
מטריד משתמשים. מערכת סינון ספאם עם הרבה False Positives תזרוק מיילים חשובים לזבל.

שלילי שגוי (False Negative) מקצועי

🔗
False Negative (Type II Error)
הגדרה
טעות שבה המודל מפספס משהו שכן קיים ("פספוס"). למשל: המודל אומר שהחולה בריא, למרות שהוא חולה.
למה זה חשוב
מסוכן מאוד ברפואה ובאבטחה. עדיף אזעקת שווא מאשר לפספס פריצה אמיתית.

גבול החלטה מקצועי

🔗
Decision Boundary
הגדרה
הקו (או המשטח) המתמטי שהמודל מצייר כדי להפריד בין קטגוריות. כל מה שמימין לקו הוא "חתול", ומשמאל הוא "כלב".
למה זה חשוב
אימון המודל הוא בעצם הזזה ועיקום של הקו הזה עד שהוא מפריד את הנתונים בצורה הטובה ביותר.

מינימום מקומי מקצועי

🔗
Local Minima
הגדרה
מלכודת באימון: המודל מוצא פתרון שנראה "הכי טוב בסביבה", ונתקע בו, למרות שיש פתרון טוב הרבה יותר (מינימום גלובלי) במקום אחר.
למה זה חשוב
כמו מטפס הרים שיורד לעמק וחושב שהגיע הכי נמוך שאפשר, בלי לדעת שמעבר להר יש עמק עמוק יותר (פתרון טוב יותר).

התכנסות (Convergence) מקצועי

🔗
Convergence
הגדרה
המצב שבו האימון מצליח: הגרף של השגיאה (Loss) מפסיק לרדת ומתייצב על ערך נמוך. המודל "מצא את הפתרון".
למה זה חשוב
הסימן שאפשר להפסיק לאמן. אם המודל לא מתכנס (הגרף משתולל), סימן שמשהו בהגדרות לא תקין.

תמונה לתמונה (Img2Img) יסוד

🔗
Image-to-Image
הגדרה
שיטה שבה נותנים ל-AI תמונה קיימת + הנחיה טקסטואלית, והוא יוצר וריאציה חדשה שמבוססת על הקומפוזיציה של התמונה המקורית.
למה זה חשוב
מאפשר להפוך שרטוט ידני מהיר ("סקיצה") לציור ריאליסטי מרהיב, או לשנות סגנון של תמונה מצילום לציור שמן.

זיכרון וידאו (VRAM) חומרה

🔗
Video RAM (VRAM)
הגדרה
הזיכרון המהיר שנמצא על המעבד הגרפי (GPU). זהו המשאב הקריטי ביותר בהרצת מודלים מקומיים.
למה זה חשוב
כמות ה-VRAM קובעת איזה מודל תוכל להריץ. מודל Llama-70B דורש כ-40GB VRAM, ולכן לא ירוץ על כרטיס גיימינג רגיל (שיש לו 8GB).

רוחב פס זיכרון מקצועי

🔗
Memory Bandwidth
הגדרה
המהירות שבה הכרטיס יכול לקרוא ולכתוב מידע לזיכרון. זה ה"צינור" שדרכו עובר המודל.
למה זה חשוב
צוואר הבקבוק האמיתי של מודלי שפה. הם מוגבלים ע"י מהירות הזיכרון (Memory Bound) ולא ע"י מהירות החישוב.

מס הלימה (Alignment Tax) מקצועי

🔗
Alignment Tax
הגדרה
הירידה בביצועים או ביצירתיות של המודל, הנובעת מהצורך להפוך אותו לבטוח, מוסרי ומרוסן.
למה זה חשוב
מודל "פרוץ" (Uncensored) יהיה לעיתים חכם ומוכשר יותר בכתיבת סיפורים, כי הוא לא מוגבל ע"י מסנני בטיחות כבדים.

Anthropic יסוד

🔗
Anthropic
הגדרה
חברת AI מובילה (מתחרה ב-OpenAI) שהוקמה ע"י פורשים מ-OpenAI במטרה להתמקד בבטיחות וב-AI "חוקתי". מפתחת את סדרת המודלים Claude.

OpenAI יסוד

🔗
OpenAI
הגדרה
החברה שהתחילה את מהפכת ה-AI הנוכחית עם השקת ChatGPT. מפתחת את מודלי GPT, DALL-E ו-Sora.

DeepMind (Google) יסוד

🔗
Google DeepMind
הגדרה
מעבדת המחקר היוקרתית של גוגל, האחראית לפריצות דרך מדעיות כמו AlphaGo (שחמט) ו-AlphaFold (ביולוגיה).

NVIDIA יסוד

🔗
NVIDIA
הגדרה
יצרנית השבבים השולטת בשוק החומרה ל-AI. המעבדים הגרפיים שלה (GPU) הם התשתית שעליה רץ כמעט כל ה-AI בעולם.

עניי GPU (סלנג) סלנג

🔗
GPU Poor
הגדרה
כינוי הומוריסטי לחברות סטארטאפ וחוקרים שאין להם גישה למחשבי-על ואלפי כרטיסי H100, ונאלצים להמציא פתרונות יצירתיים וחסכוניים (כמו LoRA).

עשירי GPU (סלנג) סלנג

🔗
GPU Rich
הגדרה
חברות הענק (Meta, Google, OpenAI) שיש להן תקציב בלתי מוגבל וחוות שרתים עם עשרות אלפי כרטיסי מסך, המאפשרות להן לאמן מודלים בכוח ברוטלי.

מוגבל חישוב (Compute Bound) מקצועי

🔗
Compute Bound
הגדרה
מצב שבו המודל רץ לאט כי המעבד עובד ב-100% והוא לא מספיק לבצע את החישובים המתמטיים. אופייני לשלב האימון.

מוגבל זיכרון (Memory Bound) מקצועי

🔗
Memory Bound
הגדרה
מצב שבו המודל רץ לאט כי המעבד מחכה שהמידע יגיע אליו מהזיכרון. זהו המצב האופייני למודלי שפה (LLMs) בזמן הרצה (Inference).

מקביליות מודל מתקדם

🔗
Model Parallelism
הגדרה
שיטה להרצת מודל ענק על ידי חיתוך המודל עצמו לחלקים ופיזורם על פני מספר כרטיסי מסך שונים (כי הוא לא נכנס באחד).

מקביליות דאטה מתקדם

🔗
Data Parallelism
הגדרה
שיטת אימון שבה מעתיקים את אותו מודל ל-100 כרטיסים שונים, וכל כרטיס לומד מחלק אחר של הדאטה במקביל כדי לסיים מהר יותר.

מקביליות צינור (Pipeline) מתקדם

🔗
Pipeline Parallelism
הגדרה
שיטת חלוקה שבה כרטיס אחד מחשב את השכבה הראשונה של המודל, ומעביר את התוצאה לכרטיס השני שמחשב את השכבה הבאה, כמו פס ייצור במפעל.

קשב בזק (Flash Attention) מקצועי

🔗
Flash Attention
הגדרה
אלגוריתם אופטימיזציה חכם המייעל את דרך הגישה לזיכרון ה-GPU, ומאיץ את המודל פי כמה תוך חיסכון עצום בזיכרון.
למה זה חשוב
הטכנולוגיה שאיפשרה למודלים להגדיל את "חלון ההקשר" שלהם מאלפי מילים למאות אלפים (כמו ב-Claude ו-Gemini).

מטמון KV מקצועי

🔗
KV Cache (Key-Value Cache)
הגדרה
טכניקת אופטימיזציה ששומרת בזיכרון את החישובים של המילים הקודמות, כדי שהמודל לא יצטרך לחשב את כל המשפט מחדש עבור כל מילה חדשה שהוא כותב.
למה זה חשוב
בלי זה, יצירת טקסט הייתה איטית פי 100. זה מה שמאפשר ל-ChatGPT לכתוב תשובה בזמן אמת.

חלון תשומת לב נגרר מקצועי

🔗
Sliding Window Attention
הגדרה
טכניקה המאפשרת למודל לקרוא טקסטים ארוכים על ידי התמקדות רק ב"חלון" מצומצם של מילים בכל רגע, שזז לאורך הטקסט.

RoPE (מיקום סיבובי) מקצועי

🔗
Rotary Positional Embeddings
הגדרה
שיטה מתמטית מודרנית לקידוד מיקום המילים במשפט, המשתמשת בסיבובים במרחב הוקטורי.
למה זה חשוב
מאפשרת למודל להבין יחסים בין מילים גם במרחקים גדולים, ומהווה את הסטנדרט במודלים כמו Llama.

SwiGLU מקצועי

🔗
SwiGLU Activation
הגדרה
פונקציית שפעול מתקדמת שהחליפה את ReLU במודלים המודרניים ביותר (כמו Llama ו-PaLM) בזכות ביצועים עדיפים.

עירוב עומקים (MoD) מתקדם

🔗
Mixture of Depths
הגדרה
שיטה חדשנית שבה המודל לומד "לדלג" על חישובים מיותרים עבור מילים פשוטות, ולהשקיע מאמץ רק במילים מורכבות.
למה זה חשוב
חוסך המון משאבים. לא צריך את כל המוח של המודל כדי להבין את המילה "את", אבל כן צריך אותו למילה "אנציקלופדיה".

Mamba (ארכיטקטורת SSM) מקצועי

🔗
Mamba / State Space Model
הגדרה
ארכיטקטורה חדשה המנסה להחליף את הטרנספורמרים. היא יעילה פי כמה בזיכרון ומסוגלת לעבד טקסטים ארוכים במיוחד במהירות קבועה.

RWKV מקצועי

🔗
Receptance Weighted Key Value
הגדרה
מודל היברידי המנסה לשלב את הטוב משני העולמות: היכולות של טרנספורמר עם היעילות והמהירות של רשתות RNN ישנות (RNN-Transformer Hybrid).

קשב לינארי מקצועי

🔗
Linear Attention
הגדרה
גרסה חסכונית של מנגנון הקשב שבה כמות החישובים גדלה באופן מתון ככל שהטקסט מתארך, בניגוד לקשב הרגיל שגדל בריבוע.

מודלי מרחב מצב (SSM) מקצועי

🔗
State Space Models
הגדרה
משפחה של מודלים מתמטיים (ש-Mamba היא חלק ממנה) המצטיינים במידול רצפים ארוכים מאוד, ומהווים את המתחרה הראשי לטרנספורמרים.

מקודד ראייה מקצועי

🔗
Vision Encoder
הגדרה
הרכיב במודל מולטי-מודאלי שתפקידו "לראות": הוא הופך תמונה לייצוג מתמטי שהמודל הלשוני יכול להבין.
למה זה חשוב
מאפשר לחבר "עיניים" ל"מוח" קיים; אפשר לקחת מודל שפה רגיל, לחבר לו מקודד ראייה, ולקבל מודל שמבין תמונות.

מתאם (Adapter) מקצועי

🔗
Adapter
הגדרה
מודול קטן שניתן "להוסיף" למודל גדול וקפוא כדי ללמד אותו משימה חדשה, בלי לאמן את כל המודל מחדש (בסיס לשיטת LoRA).

מודל שדרה (Backbone) מקצועי

🔗
Backbone
הגדרה
החלק המרכזי והכבד ביותר במודל, שאחראי על הפקת התכונות וההבנה הכללית, שעליו מלבישים "ראשים" (Heads) למשימות ספציפיות.

ראש (Head) מקצועי

🔗
Classification Head / Prediction Head
הגדרה
השכבה האחרונה של המודל, שלוקחת את כל ההבנה מה-"Backbone" וממירה אותה לתשובה הסופית (למשל: "חתול" או "כלב").

Grok (xAI) יסוד

🔗
Grok
הגדרה
מודל ה-AI של אילון מאסק (חברת xAI), המאופיין בגישה הומוריסטית, צינית ופחות מצונזרת ("Woke"), וגישה למידע בזמן אמת מ-X (טוויטר).
למה זה חשוב
אלטרנטיבה "מורדת" ל-ChatGPT המנומס. היכולת שלו לשלוף ציוצים בזמן אמת נותנת לו יתרון בחדשות חמות.

Qwen (עליבאבא) מקצועי

🔗
Qwen / Tongyi Qianwen
הגדרה
סדרת מודלים חזקה מאוד של ענקית הטכנולוגיה הסינית Alibaba. נחשבת לאחת הטובות בעולם בקוד פתוח, במיוחד במתמטיקה וקוד.
למה זה חשוב
מוכיח שההובלה בתחום ה-AI אינה נחלתה הבלעדית של ארה"ב. Qwen מתחרה ראש בראש עם Llama 3 בטבלאות הדירוג.

Falcon (TII) מקצועי

🔗
Falcon LLM
הגדרה
מודל שפה ענק ופתוח שפותח על ידי המכון לחדשנות טכנולוגית (TII) באבו דאבי.
למה זה חשוב
הציב את איחוד האמירויות על מפת ה-AI העולמית ככוח משמעותי, והיה מהראשונים לשחרר מודל ענק ברישיון חופשי לחלוטין (Apache 2.0).

Adam (אופטימייזר) מקצועי

🔗
Adam Optimizer
הגדרה
האלגוריתם הפופולרי ביותר לניהול תהליך הלמידה (Gradient Descent). הוא יודע להתאים את קצב הלמידה לכל פרמטר בנפרד בצורה חכמה.
למה זה חשוב
הוא ה"נהג האוטומטי" של האימון. כמעט כל מודל מודרני (מ-GPT ועד Vision) משתמש ב-Adam (או בגרסה שלו, AdamW) כדי ללמוד ביעילות.

סיגמואיד (Sigmoid) מקצועי

🔗
Sigmoid Function
הגדרה
פונקציית הפעלה מתמטית קלאסית בצורת S, המכווצת כל מספר לטווח שבין 0 ל-1.
למה זה חשוב
הייתה בסיסית בעבר, אך הוחלפה ברובה ע"י ReLU במודלים עמוקים בגלל בעיית "הגרדיאנט הנעלם". עדיין משמשת להסתברויות פשוטות (כן/לא).

Nightshade (רעל לאומנות) מתקדם

🔗
Nightshade
הגדרה
כלי הגנה לאומנים המוסיף שינויים בלתי נראים לפיקסלים ביצירה, כך שאם חברת AI תנסה לאמן עליה מודל – המודל "יורעל" ויתחיל לזהות כלבים כחתולים.
למה זה חשוב
נשק במלחמה של היוצרים נגד חברות ה-AI שסורקות את האינטרנט ללא רשות.

מחברת יופיטר יסוד

🔗
Jupyter Notebook
הגדרה
סביבת עבודה אינטראקטיבית לכתיבת קוד (בעיקר פייתון), המאפשרת לשלב קוד, טקסט, גרפים ותמונות במסמך אחד.
למה זה חשוב
כלי העבודה הראשי של מדעני נתונים (Data Scientists). כמעט כל ניסוי ב-AI מתחיל במחברת כזו.

Google Colab יסוד

🔗
Google Colaboratory
הגדרה
גרסת ענן חינמית של Jupyter Notebook המנוהלת על ידי גוגל, ומספקת גישה חינם למעבדים גרפיים (GPU) חזקים.
למה זה חשוב
הפך את ה-Deep Learning לנגיש לכל סטודנט וחובב, גם אם יש לו לפטופ ישן וחלש.

Kaggle יסוד

🔗
Kaggle
הגדרה
הקהילה הגדולה בעולם למדעני נתונים. אתר המארח תחרויות AI עם פרסים כספיים, ומאגר עצום של דאטה וקוד ללמידה.
למה זה חשוב
המקום שבו נולדים ומתגלים כוכבי ה-AI הבאים, ובו מפותחות רבות מהטכניקות המתקדמות ביותר.

XGBoost מקצועי

🔗
eXtreme Gradient Boosting
הגדרה
אלגוריתם למידת מכונה קלאסי (לא Deep Learning) המבוסס על "עצי החלטה".
למה זה חשוב
למרות ההייפ סביב רשתות עצביות, XGBoost עדיין מנצח אותן בביצועים על נתונים טבלאיים רגילים (אקסל, פיננסים) והוא מהיר פי כמה.

יער אקראי יסוד

🔗
Random Forest
הגדרה
שיטת למידה שבה המחשב בונה המון "עצי החלטה" (תרשימי זרימה של שאלות כן/לא) ולוקח את החלטת הרוב ביניהם.
למה זה חשוב
מודל חזק, יציב וקל להבנה, שמשמש עד היום בבנקים, רפואה ותעשייה לניתוח נתונים.

Blackwell (B200) חומרה

🔗
NVIDIA Blackwell Architecture
הגדרה
הדור החדש והמפלצתי של שבבי ה-AI מבית NVIDIA (מחליף את ה-H100), המבטיח פי 30 ביצועים במודלים מסוימים.
למה זה חשוב
החומרה שתאפשר את אימון הדור הבא (GPT-5 ואילך) ותהפוך את ה-AI למהיר וזול יותר משמעותית.

זיהוי תווים אופטי (OCR) יסוד

🔗
Optical Character Recognition
הגדרה
טכנולוגיה הממירה תמונה של טקסט (כמו סריקה של מסמך או צילום של שלט רחוב) לטקסט ממוחשב שניתן לערוך ולחפש בו.
למה זה חשוב
הגשר בין העולם הפיזי (נייר) לדיגיטלי. היום מודלים כמו GPT-4 Vision עושים את זה כחלק טבעי מהראייה שלהם.

הזרקה עקיפה מתקדם

🔗
Indirect Prompt Injection
הגדרה
מתקפה מתוחכמת שבה ההוראה הזדונית לא נכתבת על ידי המשתמש, אלא נמצאת בתוך דף אינטרנט או מסמך שהמודל "קורא" לבקשת המשתמש.
למה זה חשוב
מסוכן מאוד לסוכנים אוטונומיים. אתם מבקשים "סכם את האתר הזה", והאתר מכיל טקסט נסתר שמשתלט על הבוט שלכם.

WormGPT יסוד

🔗
WormGPT
הגדרה
מודל שפה "אפל" שנוצר במיוחד עבור פושעי סייבר, ללא שום מגבלות אתיות או מסנני בטיחות.
למה זה חשוב
משמש לכתיבת מיילים של פישינג (Phishing) משכנעים וקוד זדוני (Malware) בקלות, גם על ידי אנשים ללא ידע טכני.

ספקטרוגרמה (Mel) מקצועי

🔗
Mel Spectrogram
הגדרה
ייצוג ויזואלי של סאונד (תמונה של גלי הקול) שמותאם לאוזן האנושית. זהו הפורמט שדרכו מודלי AI "רואים" ושומעים אודיו.
למה זה חשוב
השלב הראשון בכל מערכת זיהוי דיבור או יצירת מוזיקה. המחשב הופך את הסאונד לתמונה, ואז משתמש בטכניקות של ראייה ממוחשבת.

סנכרון שפתיים (Lip Sync) יסוד

🔗
AI Lip Sync
הגדרה
טכנולוגיה המתאימה את תנועת השפתיים של אדם בוידאו לקובץ אודיו חדש, כך שזה ייראה כאילו הוא באמת אמר את המילים האלו.
למה זה חשוב
מאפשר דיבוב סרטים מושלם לשפות אחרות, אך גם מסוכן ליצירת Deepfakes משכנעים.

ריפוד (Padding) מקצועי

🔗
Padding
הגדרה
הוספת טוקנים ריקים ("0") למשפטים קצרים כדי שכל המשפטים ב-Batch יהיו באותו אורך בדיוק.
למה זה חשוב
אילוץ טכני. המעבדים הגרפיים (GPU) אוהבים לעבוד עם "מלבנים" מושלמים של מספרים, ולא עם משפטים באורכים משתנים.

מילות עצירה מקצועי

🔗
Stop Words
הגדרה
מילים נפוצות מאוד (כמו "את", "של", "הוא") שלעיתים מסננים אותן החוצה לפני העיבוד כי הן לא תורמות הרבה למשמעות הכללית.
למה זה חשוב
היה קריטי בשיטות NLP ישנות. במודלים חדשים כמו GPT, דווקא משאירים אותן כי הן חשובות להקשר ולזרימה.

למטיזציה (שורש המילה) מקצועי

🔗
Lemmatization
הגדרה
תהליך בלשני הממיר מילים לצורת הבסיס שלהן במילון (למשל: "הלכתי", "ילכו" -> "הלך").
למה זה חשוב
עוזר למחשב להבין ש"ילד" ו"ילדים" הם בעצם אותו מושג, ולא שתי מילים שונות לחלוטין.

N-Gram מקצועי

🔗
N-Gram
הגדרה
רצף של N מילים המופיעות יחד. מודלים ישנים השתמשו בסטטיסטיקה של N-Grams כדי לנחש את המילה הבאה (למשל: אחרי "בית" בא לרוב "ספר").
למה זה חשוב
האבא הקדמון של ה-LLM. הוא עבד יפה לביטויים קצרים, אבל נכשל בהבנת הקשר ארוך ומורכב.

שרשרת מרקוב מקצועי

🔗
Markov Chain
הגדרה
מודל מתמטי פשוט שבו המצב הבא תלוי *רק* במצב הנוכחי. משמש ליצירת טקסט ג'יבריש שנראה אמיתי במבט שטחי.
למה זה חשוב
ההיסטוריה של ה-Generative AI. מראה את ההבדל העצום בין "ניחוש סטטיסטי פשוט" לבין ה"הבנה" שיש לטרנספורמרים היום.

איגום (Pooling) מקצועי

🔗
Pooling Layer
הגדרה
פעולה ברשתות זיהוי תמונה (CNN) המקטינה את גודל התמונה ע"י לקיחת הממוצע או המקסימום של כל אזור קטן.
למה זה חשוב
מאפשר למודל "להתרחק" ולראות את התמונה הגדולה (חתול) במקום להתמקד בפרטים הקטנים (שערה בפרווה).

צעד (Stride) מקצועי

🔗
Stride
הגדרה
פרמטר הקובע בכמה פיקסלים ה"חלון" של הרשת זז בכל פעם שהוא סורק את התמונה.
למה זה חשוב
צעד גדול = סריקה מהירה ופחות מדויקת; צעד קטן = סריקה איטית ומפורטת.

מומנטום (תנע) מקצועי

🔗
Momentum
הגדרה
טכניקה באלגוריתמים של אימון שעוזרת למודל "לצבור תאוצה" בכיוון הנכון ולהתגבר על מכשולים קטנים (רעש) בדרך.
למה זה חשוב
כמו כדור כבד שמתגלגל במורד ההר – המומנטום מונע ממנו להיתקע בבורות קטנים בדרך למטה.

דעיכת קצב למידה מקצועי

🔗
Learning Rate Decay
הגדרה
האטה מכוונת של קצב הלמידה ככל שהאימון מתקדם. מתחילים בצעדים גדולים ומסיימים בצעדים מיקרוסקופיים.
למה זה חשוב
מאפשר למודל "להתביית" על הפתרון האופטימלי בדיוק רב, בלי לקפוץ מעליו הלוך ושוב.

הצפנה הומומורפית מתקדם

🔗
Homomorphic Encryption
הגדרה
ה"גביע הקדוש" של הפרטיות: שיטה המאפשרת למודל AI לבצע חישובים על מידע מוצפן *מבלי לפענח אותו*.
למה זה חשוב
יאפשר בעתיד לשלוח נתונים רפואיים ל-ChatGPT כדי לקבל אבחנה, כשהמידע נשאר מוצפן וה-AI עצמו לא "רואה" אותו.

ערכי SHAP מקצועי

🔗
SHAP Values
הגדרה
שיטה מתמטית המסבירה בדיוק כמה כל פרמטר תרם להחלטה הסופית. (למשל: "המשכנתא סורבה בגלל: גיל (+20%), הכנסה (-50%)").
למה זה חשוב
הכלי המוביל בתעשייה להסברת מודלים (XAI). הופך קופסה שחורה לקופסה שקופה.

החלקת תוויות מקצועי

🔗
Label Smoothing
הגדרה
טכניקה שבה אומרים למודל באימון: "זה בטוח כלב, אבל תהיה בטוח רק ב-90%, לא ב-100%".
למה זה חשוב
מונע מהמודל להיות "יהיר" מדי (Overconfident) ועוזר לו להתמודד טוב יותר עם מקרים גבוליים בעתיד.

רגולריזציה (אסדרה) מקצועי

🔗
Regularization
הגדרה
אוסף של שיטות מתמטיות שנועדו "להעניש" את המודל אם הוא הופך למורכב מדי, כדי להכריח אותו להישאר פשוט וכללי.
למה זה חשוב
התרופה הראשית ל-Overfitting. מונע מהמודל לשנן את הדאטה ומכריח אותו ללמוד עקרונות.

אנסמבל (הרכב) יסוד

🔗
Ensemble Learning
הגדרה
שיטה שבה מאמנים מספר מודלים שונים ומשלבים את התחזיות שלהם כדי לקבל החלטה סופית (כמו חוות דעת שנייה ושלישית).
למה זה חשוב
תמיד מדויק יותר ממודל יחיד. מבוסס על "חוכמת ההמונים" של האלגוריתמים.

עץ החלטה יסוד

🔗
Decision Tree
הגדרה
מודל פשוט ובסיסי הנראה כמו תרשים זרימה של שאלות כן/לא ("האם יורד גשם?" -> כן -> "האם יש רוח?").
למה זה חשוב
קל מאוד להבנה ולשימוש. משמש בסיס למודלים חזקים יותר כמו Random Forest ו-XGBoost.

רגרסיה לוגיסטית יסוד

🔗
Logistic Regression
הגדרה
המודל הסטטיסטי הבסיסי ביותר לסיווג בינארי (כן/לא). מחשב את ההסתברות שאירוע מסוים יקרה.
למה זה חשוב
האבא של ה-Neural Networks. נוירון בודד ברשת עמוקה הוא בעצם מודל רגרסיה לוגיסטית קטן.

אימות צולב (K-Fold) מקצועי

🔗
K-Fold Cross Validation
הגדרה
שיטה חכמה לבדיקת מודל: מחלקים את הדאטה ל-5 חלקים, ומאמנים את המודל 5 פעמים, כשבכל פעם חלק אחר משמש כמבחן.
למה זה חשוב
מוודא שההצלחה של המודל לא הייתה מקרית ("פוקס") בגלל החלוקה הספציפית של הנתונים. נותן ציון אמין יותר.

Pandas יסוד

🔗
Pandas Library
הגדרה
ספריית פייתון שהיא ה"אקסל על סטרואידים" של מדעני הנתונים. מאפשרת לטפל בטבלאות מידע ענקיות בקלות.
למה זה חשוב
לפני שמכניסים נתונים ל-AI, חייבים לסדר ולנקות אותם. Pandas הוא הכלי מס' 1 בעולם למשימה הזו.

NumPy יסוד

🔗
NumPy
הגדרה
ספריית היסוד של פייתון לחישובים מתמטיים. מאפשרת לעבוד עם מערכים ומטריצות במהירות על-קולית.
למה זה חשוב
כל ספריית AI (כמו PyTorch או TensorFlow) בנויה על היסודות המתמטיים של NumPy.

Scikit-learn יסוד

🔗
Scikit-learn
הגדרה
ארגז הכלים הפופולרי ביותר ללמידת מכונה קלאסית (לא Deep Learning). מכיל את כל האלגוריתמים הבסיסיים מוכנים לשימוש.
למה זה חשוב
הצעד הראשון של כל מפתח AI. רוצים להריץ רגרסיה או למצוא אשכולות? זה הכלי.

Matplotlib יסוד

🔗
Matplotlib
הגדרה
הספרייה הסטנדרטית ליצירת גרפים וויזואליזציות בפייתון.
למה זה חשוב
מאפשרת לראות בעיניים את התקדמות האימון (Loss Curve) ולהבין מה המודל עושה. תמונה שווה אלף מספרים.

ניתוח מבנה מסמך מקצועי

🔗
Document Layout Analysis
הגדרה
טכנולוגיית AI המבינה לא רק את הטקסט במסמך (OCR), אלא גם את העיצוב שלו: כותרות, טבלאות, תמונות ועמודות.
למה זה חשוב
קריטי להמרת קבצי PDF לפורמט שה-AI יכול לקרוא. בלי זה, טבלה במסמך הופכת לסלט של מילים לא מובנות.

אינפיניבנד (InfiniBand) חומרה

🔗
InfiniBand
הגדרה
תקן תקשורת סופר-מהיר המשמש לחיבור בין שרתים בחוות מחשוב-על (פותח במקור בישראל ע"י מלאנוקס).
למה זה חשוב
ה"כביש המהיר" שמאפשר לאלפי כרטיסי מסך לדבר זה עם זה במהירות האור כדי לאמן מודל אחד ענק.

NVSwitch חומרה

🔗
NVSwitch
הגדרה
רכיב חומרה של NVIDIA שמתפקד כ"שוטר תנועה" ומאפשר לכל ה-GPUs בשרת לדבר ישירות אחד עם השני במהירות מקסימלית.
למה זה חשוב
מונע פקקי תנועה של מידע בתוך השרת, ומאפשר למודלים ענקיים לרוץ ביעילות.

רשתות נוזליות (LNN) מתקדם

🔗
Liquid Neural Networks
הגדרה
סוג חדשני של רשתות עצביות המסוגלות לשנות את המבנה הפנימי שלהן ("לזרום") בזמן אמת כדי להסתגל לנתונים חדשים, גם אחרי שהאימון נגמר.
למה זה חשוב
הבטחה לעתיד של רובוטיקה ורכבים אוטונומיים, שצריכים להסתגל לתנאי שטח משתנים באופן מיידי.

מודל שפה-ראייה (VLM) מקצועי

🔗
Vision-Language Model (VLM)
הגדרה
השם המקצועי למודלים היודעים גם לקרוא טקסט וגם להבין תמונות (כמו LLaVA או GPT-4V).
למה זה חשוב
מאפשר לפתח "עיניים חכמות": אפליקציות שיכולות לענות על שאלות לגבי מה שהמצלמה רואה.

עירוב סוכנים (MoA) מתקדם

🔗
Mixture of Agents
הגדרה
שיטה המנצלת מספר מודלים שונים (למשל: GPT-4, Claude ו-Llama) העובדים יחד, כאשר מודל אחד משקלל את התשובות של כולם לתשובה אופטימלית.
למה זה חשוב
מוכיח ש"צוות" של מודלים חכמים מצליח לנצח בביצועים כל מודל יחיד, גם אם הוא חזק מאוד.

LIDAR חומרה

🔗
Light Detection and Ranging
הגדרה
חיישן לייזר הממפה את הסביבה בתלת-ממד בדיוק של מילימטרים. משמש כ"עיניים" של רוב הרכבים האוטונומיים.
למה זה חשוב
נותן ל-AI תמונת עולם תלת-ממדית מדויקת, בניגוד למצלמה רגילה שרואה שטוח.

היתוך חיישנים מתקדם

🔗
Sensor Fusion
הגדרה
היכולת של ה-AI לשלב מידע ממקורות שונים (מצלמה, רדאר, לייזר) לתמונת מצב אחת אחידה ואמינה.
למה זה חשוב
קריטי לבטיחות. אם המצלמה מסונוורת מהשמש, הרדאר עדיין רואה את המשאית שלפנים.

ענן נקודות מקצועי

🔗
Point Cloud
הגדרה
פורמט מידע תלת-ממדי המורכב ממיליוני נקודות בחלל. זהו הפלט הגולמי שמגיע סורקי תלת-ממד ו-LIDAR.
למה זה חשוב
הבסיס לכל תעשיית המיפוי והתלת-ממד. המחשב צריך ללמוד להבין ש"ענן הנקודות" הזה הוא בעצם כיסא.

Deep Voice יסוד

🔗
Deep Voice
הגדרה
טכנולוגיית AI המסוגלת ליצור קול אנושי סינתטי שנשמע אמיתי לחלוטין, ואף לחקות מבטאים ורגשות.
למה זה חשוב
מאפשרת לעוזרים קוליים להישמע טבעיים, אך משמשת גם ליצירת "פייק ניוז" קולי (הקלטות מזויפות של פוליטיקאים).

הערכה אנושית יסוד

🔗
Human Evaluation
הגדרה
השלב הסופי והקובע בבדיקת מודל: נותנים לבני אדם אמיתיים להשתמש בו ולדרג אותו, כי שום מדד מתמטי (כמו Perplexity) לא יכול למדוד "איכות שיחה".
למה זה חשוב
בסופו של דבר, המודל נועד לשרת אנשים. אם המספרים טובים אבל האנשים לא מרוצים – המודל נכשל.

ELIZA יסוד

🔗
ELIZA (1966)
הגדרה
הצ'אטבוט הראשון בהיסטוריה. תוכנה פשוטה שחיקתה פסיכולוג על ידי חזרה על דברי המשתמש כשאלה ("למה אתה חושב ש…?").
למה זה חשוב
הוכיחה שבני אדם נוטים להשליך רגשות ותבונה על מחשבים (אפקט אלייזה), גם כשהמחשב טיפש לחלוטין.

AlexNet יסוד

🔗
AlexNet (2012)
הגדרה
המודל ההיסטורי שניצח בתחרות ImageNet בהפרש עצום, וסימן את תחילת עידן ה-Deep Learning המודרני.
למה זה חשוב
הרגע שבו העולם המדעי הבין שרשתות עצביות על כרטיסי מסך (GPU) הן העתיד של הבינה המלאכותית.

מבחן MMLU מקצועי

🔗
Massive Multitask Language Understanding
הגדרה
מבחן אינטליגנציה מקיף למודלי שפה, הכולל 16,000 שאלות אמריקאיות ב-57 נושאים שונים (מתמטיקה, היסטוריה, רפואה, משפטים).
למה זה חשוב
המדד המוביל כיום להשוואה בין מודלים (כמו GPT-4 מול Gemini Ultra). ציון גבוה מעיד על ידע עולם רחב.

מבחן HellaSwag מקצועי

🔗
HellaSwag Benchmark
הגדרה
מבחן הבודק "שכל ישר" (Common Sense) על ידי השלמת משפטים במצבים יומיומיים מסובכים, שקשים למחשב אך קלים לאדם.
למה זה חשוב
בודק אם המודל באמת מבין איך העולם עובד, או רק משנן עובדות מוויקיפדיה.

ComfyUI מקצועי

🔗
ComfyUI
הגדרה
ממשק משתמש מתקדם (מבוסס תרשים זרימה) לעבודה עם Stable Diffusion, המאפשר שליטה אבסולוטית בכל שלב ביצירת התמונה.
למה זה חשוב
הכלי המועדף על מקצועני AI Art שרוצים ליצור זרימות עבודה (Workflows) מורכבות ואוטומטיות.

Automatic1111 יסוד

🔗
Automatic1111 WebUI
הגדרה
ממשק האינטרנט הפופולרי והנפוץ ביותר להרצת Stable Diffusion על המחשב הביתי. כולל אלפי תוספים והרחבות.
למה זה חשוב
הפך את יצירת התמונות ב-Open Source לנגישה להמונים והוא הסטנדרט לשיתוף כלי עזר בקהילה.

GGUF (פורמט קבצים) מקצועי

🔗
GPT-Generated Unified Format
הגדרה
פורמט קבצים מודרני לשמירת מודלי שפה, המותאם במיוחד להרצה מהירה על מעבדים רגילים (CPU) וכרטיסי מסך של אפל (M1/M2/M3).
למה זה חשוב
אם הורדתם מודל כדי להריץ אותו מקומית על הלפטופ, רוב הסיכויים שזה קובץ GGUF.

Safetensors מקצועי

🔗
Safetensors Format
הגדרה
פורמט קבצים בטוח לשמירת משקולות של מודלים, שנועד להחליף את פורמט Pickle הישן והמסוכן שהיה חשוף לווירוסים.
למה זה חשוב
מבטיח שכשאתם מורידים מודל מהאינטרנט (Hugging Face), הוא לא יכיל קוד זדוני שיפרוץ למחשב שלכם.

Cursor (עורך קוד) יסוד

🔗
Cursor IDE
הגדרה
עורך קוד (IDE) מבוסס AI שנבנה מחדש כדי לשלב בינה מלאכותית כחלק אינטגרלי מהתכנות, ולא סתם כתוסף.
למה זה חשוב
נחשב כיום לכלי החזק ביותר למתכנתים, המאפשר לכתוב, לערוך ולתקן קוד שלם בשפה טבעית.

Runway יסוד

🔗
Runway Gen-2 / Gen-3
הגדרה
חברה וכלי מוביל ליצירה ועריכה של וידאו באמצעות AI. מאפשר ליצור סרטים מטקסט, להנפיש תמונות ולשנות סגנון וידאו.
למה זה חשוב
הוליווד בכיס שלכם. מאפשר ליוצרים עצמאיים להפיק אפקטים ויזואליים שהיו עולים פעם מיליונים.

Suno יסוד

🔗
Suno AI
הגדרה
מחולל מוזיקה פורץ דרך המייצר שירים מלאים (מילים + לחן + שירה) באיכות רדיו, לפי תיאור טקסטואלי פשוט.
למה זה חשוב
עושה למוזיקה מה ש-ChatGPT עשה לטקסט. מאפשר לכל אחד להלחין שיר מקצועי בכל סגנון תוך דקות.

IP-Adapter מקצועי

🔗
Image Prompt Adapter
הגדרה
תוסף למודלי תמונה המאפשר להשתמש בתמונה כפרומפט (במקום מילים) בצורה חזקה מאוד, כדי להעתיק במדויק סגנון או פנים.
למה זה חשוב
הכלי המרכזי ליצירת דמויות עקביות (Consistent Characters) וליצירת "בוקים" של אותה דמות בסיטואציות שונות.

מודל עקביות לטנטי (LCM) מקצועי

🔗
Latent Consistency Model
הגדרה
טכנולוגיית האצה המאפשרת למחוללי תמונות לייצר תמונה איכותית ב-4 עד 8 צעדים בלבד (במקום 20-50).
למה זה חשוב
מאפשר יצירת תמונות בזמן אמת (Real-Time Generation), כך שהתמונה משתנה תוך כדי שאתה מקליד או מצייר.

שרשרת הצפיפות מתקדם

🔗
Chain of Density Prompting
הגדרה
טכניקת סיכום מתקדמת: מבקשים מהמודל לסכם טקסט, ואז לסכם את הסיכום שוב תוך הוספת עוד פרטים חשובים שהושמטו, וחוזר חלילה.
למה זה חשוב
מייצר סיכומים דחוסים ועשירים במידע, במקום סיכומים דלילים וכלליים מדי.

שלד המחשבה (SoT) מתקדם

🔗
Skeleton-of-Thought
הגדרה
טכניקה להאצת תשובות: מבקשים מהמודל לכתוב קודם את ראשי הפרקים (השלד) של התשובה, ואז למלא את התוכן של כל נקודה במקביל.
למה זה חשוב
מקצר זמני המתנה לתשובות ארוכות ומייצר מבנה מאורגן וברור יותר.

Perplexity (מנוע חיפוש) יסוד

🔗
Perplexity AI
הגדרה
מנוע תשובות מבוסס AI המשלב מודל שפה עם חיפוש בזמן אמת באינטרנט, ומספק תשובות עם ציטוטים ומקורות מדויקים.
למה זה חשוב
המתחרה הרציני הראשון לגוגל מזה שנים. משנה את הדרך שבה אנחנו מחפשים מידע – מתשובת קישורים לתשובת טקסט.

WebGPU מקצועי

🔗
WebGPU API
הגדרה
טכנולוגיית דפדפן חדשה המאפשרת לאתרי אינטרנט לגשת ישירות לכרטיס המסך של המשתמש ולהריץ מודלי AI כבדים בתוך הדפדפן.
למה זה חשוב
מאפשר להריץ צ'אטבוטים וכלים גרפיים באתר אינטרנט ללא צורך בהתקנה וללא שליחת מידע לשרת (פרטיות מלאה).

תקן C2PA מקצועי

🔗
C2PA / Content Credentials
הגדרה
תקן טכנולוגי פתוח לסימון מקור התוכן הדיגיטלי. מוסיף "חותמת דיגיטלית" מוצפנת לתמונה המעידה אם היא נוצרה על ידי מצלמה או AI.
למה זה חשוב
הכלי המרכזי במלחמה בפייק ניוז. יאפשר לרשתות חברתיות לסמן אוטומטית תמונות שנוצרו ב-AI.

סימן מים (Watermarking) יסוד

🔗
AI Watermarking
הגדרה
הטמעת תבנית בלתי נראית בתוך הפיקסלים של תמונה או בטקסט שנוצר ע"י AI, שניתן לזהות אותה רק באמצעות תוכנה מיוחדת.
למה זה חשוב
מאפשר לזהות תוכן שנוצר ע"י AI גם אם הוא נראה אמיתי לחלוטין, ולמנוע הפצת דיסאינפורמציה.

קללת המימדיות מקצועי

🔗
Curse of Dimensionality
הגדרה
תופעה מתמטית בעייתית: ככל שמוסיפים יותר משתנים (מימדים) לנתונים, המרחב נהיה "דליל" מדי וקשה מאוד למצוא בו דפוסים.
למה זה חשוב
הסיבה שחייבים המון דאטה כדי לאמן מודלים מורכבים, והסיבה שמשתמשים בשיטות להורדת מימדים (כמו Embedding).

ירידה כפולה מתקדם

🔗
Double Descent
הגדרה
תופעה מפתיעה שבה ביצועי המודל משתפרים, ואז מידרדרים (Overfitting), אבל אם ממשיכים להגדיל אותו עוד – הם פתאום משתפרים שוב.
למה זה חשוב
שינתה את ההבנה שלנו על אימון. פעם חשבו ש"גדול מדי = רע", היום מבינים ש"ענק = מצוין".

למידה מתמשכת מתקדם

🔗
Continual Learning
הגדרה
היכולת של מודל ללמוד מידע חדש כל הזמן מבלי לשכוח את מה שלמד בעבר (פתרון לבעיית "השכחה הקטסטרופלית").
למה זה חשוב
החלום של AI: מודל שמתעדכן מחדשות היום בבוקר, ולא צריך אימון מחדש של חודשים כדי לדעת מי ראש הממשלה.

צוות כחול יסוד

🔗
Blue Team
הגדרה
קבוצת אבטחה שתפקידה להגן על מודל ה-AI, לזהות מתקפות בזמן אמת ולתקן פרצות אבטחה (בניגוד ל"צוות האדום" שתוקף).
למה זה חשוב
שומרי הסף שמוודאים שהמודל לא נפרץ על ידי האקרים ולא פולט מידע רגיש.

פרשנות מכניסטית מקצועי

🔗
Mechanistic Interpretability
הגדרה
תחום מחקר המנסה להבין את ה-AI על ידי "הנדסה לאחור" (Reverse Engineering) של הנוירונים והמשקולות, כדי להבין איך בדיוק המודל חושב.
למה זה חשוב
הניסיון להפוך את האלכימיה למדע. במקום לנחש למה המודל ענה ככה, אנו רוצים לראות את המעגל החשמלי המדויק שגרם לזה.

קריסת אופנים (Mode Collapse) מקצועי

🔗
Mode Collapse
הגדרה
כשל באימון מודלים גנרטיביים (בעיקר GAN), שבו המודל "מתעצל" ומייצר שוב ושוב את אותה תמונה או וריאציה בודדת, במקום מגוון.
למה זה חשוב
בעיה קלאסית. במקום לייצר מגוון פרצופים, המודל מייצר רק את אותו פרצוף שנראה לו הכי בטוח.

GRU מקצועי

🔗
Gated Recurrent Unit
הגדרה
גרסה פשוטה ויעילה יותר של רשת LSTM. מנגנון זיכרון לרשתות, שדורש פחות כוח חישוב אך נותן ביצועים דומים.
למה זה חשוב
פופולרי במערכות קטנות או זמן-אמת שבהן אין משאבים כבדים להרצת LSTM מלא.

מסכת קשב מקצועי

🔗
Attention Mask
הגדרה
מנגנון שאומר למודל מאיזה מילים עליו להתעלם. למשל, מסתירים את המילים העתידיות במשפט כדי שהמודל לא "יציץ" בתשובה בזמן האימון.
למה זה חשוב
הכרחי לאימון מודלים יוצרים (GPT). בלי המסכה, המודל היה רואה את סוף המשפט ולא לומד לחזות אותו.

פרספטרון יסוד

🔗
Perceptron
הגדרה
המודל הפשוט והראשון ביותר של רשת עצבית (הומצא ב-1957). נוירון מלאכותי בודד שלומד לסווג דברים לשתי קבוצות.
למה זה חשוב
האבא הקדמון של כל ה-AI. כל הרשתות העצומות של היום הן בעצם מיליארדי פרספטרונים מחוברים יחד.

SVM (מכונת וקטור תומך) מקצועי

🔗
Support Vector Machine
הגדרה
אלגוריתם קלאסי וחזק לסיווג, שמוצא את הקו (או המישור) האופטימלי שמפריד בצורה הכי ברורה בין שתי קבוצות נתונים.
למה זה חשוב
היה המלך הבלתי מעורער של ה-AI לפני ה-Deep Learning. עדיין מעולה לבעיות קטנות ומדויקות.

בייס הנאיבי יסוד

🔗
Naive Bayes
הגדרה
אלגוריתם הסתברותי פשוט ומהיר, המבוסס על משפט בייס. מניח שכל התכונות בלתי תלויות זו בזו ("נאיבי").
למה זה חשוב
הבסיס ההיסטורי של מסנני הספאם הראשונים במייל.

Gradient Boosting מקצועי

🔗
Gradient Boosting
הגדרה
טכניקה לאימון מודלים שבה בונים סדרה של מודלים חלשים, כשכל מודל חדש מנסה לתקן את הטעויות של המודל הקודם לו.
למה זה חשוב
הבסיס למודלים חזקים מאוד כמו XGBoost, השולטים בתחרויות דאטה שאינן דורשות זיהוי תמונה או טקסט.

Cohere יסוד

🔗
Cohere
הגדרה
חברת AI המתמקדת אך ורק בפתרונות לארגונים (Enterprise). מספקת מודלים מאובטחים לחיפוש, סיכום וצ'אט עסקי.
למה זה חשוב
המובילה בתחום ה-RAG והחיפוש הארגוני. המודלים שלה (Command R) מצטיינים בעבודה עם מסמכים וציטוט מקורות.

Databricks מקצועי

🔗
Databricks
הגדרה
פלטפורמת ענן ענקית לניהול דאטה ו-AI. מאפשרת לחברות לאחד את כל המידע שלהן במקום אחד ולאמן עליו מודלים (Dolly).
למה זה חשוב
התשתית שעליה בונים את ה-AI בארגוני ענק. רכשה את MosaicML כדי להנגיש אימון מודלים לחברות.

Snowflake מקצועי

🔗
Snowflake (Arctic)
הגדרה
חברת מחסני נתונים (Data Warehouse) שנכנסה חזק לתחום ה-AI, ומאפשרת להריץ מודלים ישירות במקום שבו המידע העסקי יושב.
למה זה חשוב
מביאה את ה-AI אל הדאטה, במקום להעביר את הדאטה ל-AI (מה שחוסך עלויות אבטחה והעברה).

MosaicML מקצועי

🔗
MosaicML
הגדרה
פלטפורמה המייעלת את תהליך האימון של מודלי שפה, ומאפשרת לאמן מודל משלך בעלות נמוכה פי כמה מהסטנדרט.
למה זה חשוב
הוכיחה שאימון מודל כמו GPT-3 לא חייב לעלות מיליונים, אלא אפשרי במאות אלפי דולרים בודדים.

כחול עמוק (Deep Blue) יסוד

🔗
Deep Blue (IBM)
הגדרה
מחשב השחמט של IBM שהיה הראשון לנצח אלוף עולם מכהן (גארי קספרוב) ב-1997.
למה זה חשוב
נקודת מפנה היסטורית שסימלה את הפעם הראשונה שמכונה גברה על האדם במשחק של "אינטליגנציה". (הוא פעל בשיטת "כוח גס", לא AI מודרני).

פרס לובנר יסוד

🔗
Loebner Prize
הגדרה
תחרות שנתית המעניקה פרסים לתוכנות שמצליחות לעבור גרסה של מבחן טיורינג ולשכנע שופטים שהן אנושיות.
למה זה חשוב
במשך שנים זה היה המדד ל"האם ה-AI מתקדם?". היום התחרות פחות רלוונטית כי מודלים כמו GPT עוברים אותה בקלות.

שרשור פרומפטים מתקדם

🔗
Prompt Chaining
הגדרה
טכניקה של פירוק משימה מורכבת לסדרה של פרומפטים עוקבים, שבהם הפלט של שלב א' הופך לקלט של שלב ב'.
למה זה חשוב
מאפשר לבצע משימות שהמודל לא יכול לעשות ב"מכה אחת". למשל: 1. חלץ נתונים, 2. סכם אותם, 3. תרגם לספרדית.

מצב JSON מקצועי

🔗
JSON Mode
הגדרה
הגדרה המכריחה את המודל להחזיר תשובה בפורמט קוד תקני (JSON) בלבד, ללא מלל מיותר מסביב.
למה זה חשוב
קריטי למפתחים. מאפשר לחבר את ה-AI לתוך אפליקציות ותוכנות, שמבינות רק קוד מובנה ולא "שיחות".

Oobabooga מקצועי

🔗
Oobabooga Text Gen WebUI
הגדרה
ממשק מתקדם (כמו Automatic1111 אבל לטקסט) להרצת מודלי שפה על המחשב האישי, עם שליטה מלאה בכל הפרמטרים הטכניים.
למה זה חשוב
הכלי של ה"הארדקור" בקהילת ה-AI המקומית. מאפשר לנסות מודלים חדשים וטכניקות דחיסה לפני כולם.

vLLM מקצועי

🔗
vLLM Library
הגדרה
ספריית תוכנה מהירה במיוחד להרצת מודלי שפה (Inference), המשתמשת בניהול זיכרון חכם (PagedAttention).
למה זה חשוב
הסטנדרט התעשייתי למי שרוצה להרים שרת AI משלו שמגיב מהר ויכול לשרת הרבה משתמשים במקביל.

llama.cpp מקצועי

🔗
llama.cpp
הגדרה
פרויקט קסום שכתב מחדש את הקוד של מודלי שפה ב-++C, ואיפשר להם לרוץ על מעבדים רגילים (CPU) ואפילו על טלפונים ומחשבי מק.
למה זה חשוב
הפרויקט שבזכותו אנחנו יכולים להריץ AI ללא כרטיס מסך של NVIDIA. הבסיס לפורמט GGUF.

קונטיינרים (Docker) מקצועי

🔗
Docker / Containers
הגדרה
שיטה לאריזת מודל AI יחד עם כל התוכנות והספריות שהוא צריך כדי לרוץ, בתוך "קופסה" (Container) אטומה וניידת.
למה זה חשוב
פותר את בעיית "אצלי במחשב זה עבד". מבטיח שהמודל יעבוד אותו דבר בדיוק בענן, בלפטופ או בשרת.

AI ללא שרת (Serverless) שימוש

🔗
Serverless AI
הגדרה
מודל צריכה שבו המפתח לא מנהל שרתים בכלל, אלא רק שולח קוד או בקשה, ומשלם בדיוק על השניות שה-AI עבד (כמו מונית).
למה זה חשוב
אידיאלי לסטארטאפים ולשימוש מזדמן. חוסך את העלות של החזקת GPU יקר דולק 24/7.

מחשוב קצה יסוד

🔗
Edge Computing
הגדרה
עיבוד הנתונים קרוב למקור (במצלמה, ברכב, בטלפון) במקום לשלוח הכל לשרת מרכזי רחוק.
למה זה חשוב
מצמצם את השיהוי (Latency) לאפס. רכב אוטונומי חייב לבלום מיד כשהוא רואה ילד, ולא לחכות לתשובה מהענן.

מחשוב אקסה-סקייל חומרה

🔗
Exascale Computing
הגדרה
הדור החדש של מחשבי-על, המסוגלים לבצע מעל קווינטיליון (10 בחזקת 18) חישובים בשנייה.
למה זה חשוב
הכוח הנדרש כדי לאמן את הדור הבא של מודלים (GPT-6?) ולבצע סימולציות מורכבות של אקלים ורפואה.

אבטלה טכנולוגית יסוד

🔗
Technological Unemployment
הגדרה
אובדן מקומות עבודה הנגרם כתוצאה מכניסת טכנולוגיות חדשות (AI, אוטומציה) המחליפות עובדים אנושיים.
למה זה חשוב
החשש הכלכלי-חברתי המרכזי מעליית ה-AI. האם ייווצרו עבודות חדשות (כמו בעבר) או שהפעם זה שונה?

טרנס-הומניזם מתקדם

🔗
Transhumanism
הגדרה
תנועה אינטלקטואלית הדוגלת בשימוש בטכנולוגיה (כמו AI וממשקי מוח-מחשב) כדי לשדרג את היכולות הפיזיות והמנטליות של האדם.
למה זה חשוב
חזון אפשרי לעתיד שבו נתמזג עם ה-AI (כמו Neuralink) במקום להתחרות בו.

כלכלת שפע (Post-Scarcity) מתקדם

🔗
Post-Scarcity Economy
הגדרה
מצב עתידי תיאורטי שבו AI ורובוטיקה מייצרים את רוב הסחורות והשירותים בעלות אפסית, כך שלכולם יש גישה לשפע חומרי.
למה זה חשוב
החזון האוטופי ("מסע בין כוכבים") של עידן ה-AGI, העומד כניגוד לחזון הדיסטופי של האבטלה.

עתיד העבודה יסוד

🔗
The Future of Work
הגדרה
הדיון העולמי על האופן שבו AI ישנה את הקריירה האנושית: מעבר מעבודה טכנית וחזרתית לעבודה הדורשת יצירתיות, אמפתיה ופיקוח על מכונות.
למה זה חשוב
הסיכום של הכל. הבינה המלאכותית לא תחליף אנשים, אלא אנשים שמשתמשים בבינה מלאכותית יחליפו אנשים שלא.

דילוג לתוכן