September 22, 2024

הסיפור החשוב בקשר למודל החדש של openai

בטח שמעתם אתם הוציאו מודל חדש בשבוע שעבר. אם אתם כמוני, אתם רפרפים על ההודעות ועל הפרשנויות ממש בקלילות ואומרים לעצמכם יאללה יאללה אין פה שום דבר מעניין.

‏אבל הפעם אני חושבת שבמודל החדש יש אלמנט חדש ומעניין והוא שהסיפור לא נובע מההגדלה של המודל (כלומר הגדלה של כמות המידע שעליו המודל מבוסס), ‏וגם לא מהגדלת חלון ההגדרה של הבעיה (כלומר כמות המידע שאתה נותן בהגדרה הבעיה).

‏הפעם השיפור של המודל נובע משינויים באסטרטגית הפתרון לשאלה ששאלתי, ‏כלומר ההוראות שנותנים למודל בקשר לאיך לפתור את הבעיה. בקצרה – עכשיו המודל מפרק את המשימה לחלקים, ועונה עליהם בצורה מובנית.

‏למה זה מאוד חשוב? ‏כי זה בעצם אומר שיש דרכים משמעותיות לשפר את הביצועים של המודל מעבר לעניין גודל הבסיס או חלון השאלה. אני בטוחה שזו רק ההתחלה, ויש עוד שיפורים שאפשר לעשות ברמה הזו של היישום.

‏זה קשור באופן ישיר להגדרות של המוצר ואיך מודדים את התשובות. ‏היום אנחנו בודקים איזה ציון המודל היה מקבל במבחנים אוביקטיביים, כמו מבחנים באוניברסיטה.

‏אבל מה בקשר לקריטריונים אחרים? למשל – אנושיות? עד כמה התשובה שלך אמפתית, עד כמה התשובה גורמת לי להרגיש טוב, עד כמה התשובה מציפה את מה שאני לא יודע ולא מנסה לתת בצורה חד חד ערכית תשובה אחת נכונה.

‏כל העניין של אינטיליגנציה רגשית, של אינטראקציות בין בני אדם, כל זה לא מכוסה כרגע בכלל.

אני בטוחה שיש עוד המון שיפורים שאפשר לעשות, והם לא קשורים לדיוק של המודל או ההגעה לתשובה נכונה. אלא לדברים אחרים, שכרגע אנחנו בכלל לא חושבים עליהם.