הדור משופר בחיפוש (Retrieval‑augmented generation)
הדור משופר בחיפוש (RAG) הוא שיטת אינטיליגנציה מלאכותית שבה מודל שפה יוצר טקסט תוך כדי שליפה של מידע רלוונטי ממאגר חיצוני בזמן אמת. המודל משלב את היכולת היצירתית של מודלים גדולים עם ידע עדכני ממקורות כמו מסמכי PDF, מאגרי נתונים או אינטרנט.
איך זה עובד?
- שאילתת שליפה – המשתמש מזין שאלה או משימה. המערכת מתרגמת את השאילתה למספר מפתחות (keywords) ומחפשת במאגר חיצוני (לדוגמה, אינדקס ElasticSearch, וקטור‑דאטה ב‑FAISS או API של חיפוש Google) את הקטעים הכי רלוונטיים.
- הצמדת הקטעים – הקטעים שנמצאו מועברים למודל השפה יחד עם השאילתה המקורית. מודל זה מקבל שני קלטים: הטקסט של המשתמש והקונטקסט המוגדל.
- הדור הטקסט – המודל מייצר תשובה שמבוססת על הידע שהושג מהשליפה, כך שהמידע הוא עדכני, מדויק ומותאם לשאלה.
למה זה חשוב?
- עדכניות – מודלים גדולים נלמדים על נתונים שיכולים להיות ישנים כמה שנים. RAG מאפשר למערכת להשתמש במידע שמעודכן ברגע השאילה, מה שמונע טעויות של מידע מיושן.
- שקיפות – ניתן להציג למשתמש את הקטעים שהמודל השתמש בהם, מה שמגביר את האמון והבקרתיות.
- יעילות – במקום לאמן מודל על כל המידע הקיים, אפשר להסתמך על מאגר חיצוני ולחסוך משאבי חישוב.
דוגמה מספרית
ב‑חברת Wiz (ישראל) השתמשו ב‑RAG כדי לנתח 2 מיליון מסמכי מדיניות אבטחת מידע. מודל GPT‑3.5 שלח 5 קטעים ממוצע לכל שאלה, והדיוק של תשובות האוטומטיות עלה מ‑68 % ל‑92 % – חיסכון של כ‑30 % בזמן חיפוש ידני.
רלוונטיות לאוטומציה בישראל
- חברות הייטק – חברות כמו Check Point ו‑CyberArk משלבות RAG במערכות תמיכה טכנית, כך שהצוותים מקבלים תשובות מדויקות תוך שניות.
- ממשל דיגיטלי – משרד החדשנות משתמש ב‑RAG כדי לספק למשתמשים מידע עדכני על חקיקה ותקנות, ללא צורך בתיעוד ידני.
- חינוך – פלטפורמות לימוד מקוונות בישראל (כגון Kaltura Israel) משתמשות ב‑RAG כדי להפיק סיכומי שיעורים ממקורות שונים, מה שמקצר את זמן ההכנה של המרצים.
סיכום
RAG הוא גשר בין יכולות היצירה של מודלים גדולים לבין ידע עדכני ממקורות חיצוניים. הוא משפר את הדיוק, מקצר זמן תגובה ומאפשר שקיפות, ולכן הוא כלי מרכזי באוטומציה של תהליכים עסקיים וטכנולוגיים בישראל.