איך לבנות סוכן AI: מדריך בנייה מעשי

רוב המדריכים על איך לבנות סוכן AI מניחים שאתם רוצים לכתוב קוד ב-Python. הם מוליכים אתכם דרך פריימוורקים, קריאות לפונקציות ולולאה דטרמיניסטית. הדרך הזו עובדת אם יש לכם מפתחים פנויים. לרוב הצוותים שבונים סוכן ראשון אין, והם גם לא באמת צריכים.

אנחנו בונים ומפעילים סוכנים על Reach, גם ב-WhatsApp וגם בווב, לתמיכה, למכירות ולתפעול. החלק הקשה כמעט אף פעם אינו המודל. אלה עשרות ההחלטות הקטנות שקובעות אם הסוכן עוזר ללקוח או דווקא עושה נזק בשקט. המדריך הזה עובר על ההחלטות האלה לפי הסדר שבאמת חשוב.

מה זה באמת אומר לבנות סוכן AI

סוכן AI אינו צ'אטבוט עם תסריט טוב יותר. צ'אטבוט עונה על מה שאמרו לו לענות. סוכן מחליט מה הצעד הבא, קורא לכלים כדי לאסוף מידע או לבצע פעולה, ויודע מתי לעצור או להעביר לאדם. ההבדל הזה הוא כל העניין, וגם שם רוב הניסיונות הראשונים נכשלים.

כשאתם בונים סוכן AI אתם מגדירים ארבעה דברים: מה הוא יודע, מה הוא יכול לעשות, איפה הוא מדבר עם אנשים, ומתי הוא צריך לפנות את הדרך. תכוונו אותם נכון והמודל יסתדר עם השאר. תפספסו אותם, ושום כיוונון של פרומפט לא יציל אתכם.

תתחילו ממשימה אחת, לא מאישיות

האינסטינקט הוא לבנות עוזר כללי שמטפל בהכול. תתאפקו. לקוח לוגיסטיקה שלנו רצה סוכן אחד לעדכוני משלוחים, לקליטת נהגים ולתביעות לקוחות. שחררנו קודם רק את סוכן עדכוני המשלוחים. הוא ענה היטב על שאלה אחת: איפה המשלוח שלי. תוך שבועיים הוא טיפל ב-70 אחוז מההודעות האלה בלי מעורבות אנושית.

תבחרו משימה שקורית הרבה, עם הגדרה ברורה של 'גמרנו', שאפשר למדוד. 'לענות על שאלות סטטוס הזמנה' היא משימה. 'לשפר את חוויית הלקוח' אינה. ככל שהסוכן הראשון צר יותר, כך תלמדו מהר יותר מה מקרי הקצה האמיתיים שלכם.

איך לבנות סוכן AI בחמש החלטות

אחרי שיש משימה, בניית הסוכן מתנקזת לחמש החלטות מוחשיות. אף אחת מהן לא דורשת קוד בפלטפורמה שמבוססת על הגדרות.

1. הגדירו את המשימה ואת תנאי העצירה

כתבו בדיוק מה הסוכן עושה, וחשוב מכך, מה מסיים את התור שלו. סוכן בלי תנאי עצירה נכנס ללולאות, מנחש, או מסלים הכול. תחליטו מראש מתי הוא ענה, מתי כדאי שישאל שאלת הבהרה, ומתי הוא מעביר לאדם. תנאי העצירה אינו פרט קטן. הוא גבול הבטיחות.

2. תנו לו את הידע הנכון, לא את כולו

צוותים מזריקים את כל מרכז העזרה, כל PDF ושלוש שנים של מיילים אל מאגר הידע ואז תוהים למה התשובות סוטות. סוכן מסיק מתוך מה שנותנים לו. תזינו לו סתירות והוא יבחר אחת בביטחון מלא. אצרו קודם מאגר קטן, עדכני וסמכותי. ב-Reach אתם מחברים את הידע הזה ורואים אילו מקורות הסוכן באמת מצטט, ומשם גוזמים.

3. בחרו את הכלים שהוא יכול להפעיל

כלים הם מה שהופך סוכן מדברן לעושה דבר: לאתר הזמנה, לבדוק מלאי, לפתוח קריאה, לתזמן שיחה חוזרת. תנו לו את השניים עד ארבעה כלים שהמשימה צריכה, ולא יותר. כל כלי מיותר הוא עוד דרך שבה הסוכן יכול לעשות משהו מפתיע. קלט ברור והיקף מצומצם מפחיתים לולאות הרבה יותר מפרומפט מתוחכם.

4. תחליטו איפה הוא רץ

סוכן באתר שלכם מטפל ברגע אחר מסוכן ב-WhatsApp. מבקרים בווב נמצאים באמצע בירור ומצפים לעומק. משתמשי WhatsApp רוצים תשובה מהירה ושיחתית ויברחו מקיר טקסט. Reach מריצה את אותו סוכן בשני הערוצים, אבל המסגור צריך להשתנות: תורות קצרים והעברה מהירה ב-WhatsApp, תשובות יסודיות יותר בווב. תחליטו על הערוץ לפני שאתם כותבים הוראה אחת, כי הוא משנה איך הסוכן צריך לדבר.

5. קבעו את כללי ההעברה לפני ההשקה

כל סוכן ייתקל במשהו שאסור לו לטפל בו. השאלה היא אם הוא יודע. הגדירו את טריגרי ההעברה במפורש: ביטחון נמוך, החזר מעל סף מסוים, טון כועס, שאלה משפטית או רפואית. העברה נקייה שמעבירה את כל השיחה לאדם עדיפה על סוכן שמאלתר את דרכו דרך מצב שאין לו עסק בו. אנחנו מתייחסים לתכנון ההעברה כחלק מבניית הסוכן, לא כמחשבה שאחרי.

לבנות מאפס או להגדיר: שאלת הקוד

הנה התמורה ההוגנת. בנייה מאפס עם פריימוורק נותנת לכם שליטה מלאה וחשבון תחזוקה ארוך. אתם הבעלים של התזמור, הניסיונות החוזרים, הלוגים, חיבורי הערוצים, וכל שדרוג כשהמודל שמתחת משתנה. למוצר באמת חדשני, השליטה הזו שווה את זה.

אצל הרוב המוחלט של סוכנים עסקיים אתם בונים מחדש את אותה אינסטלציה שכולם בונים מחדש. פלטפורמה שמבוססת על הגדרות מטפלת בתזמור, בחיבורי הערוצים, באחזור הידע ובהעברה, ואתם משקיעים את הזמן בהחלטות שלמעלה. רוב העבודה המותאמת שלנו ללקוחות אינה נבנית מכלום. זו Reach שהורחבה או הוגבלה כדי להתאים לתהליך עבודה ספציפי. תתחילו בהגדרה. תרדו לקוד רק היכן שיש לכם סיבה אמיתית.

איך לבדוק סוכן AI לפני שהלקוחות עושים זאת

אל תשיקו סוכן בכך שתעמידו אותו מול לקוחות אמיתיים ותצפו. תבדקו אותו מול השיחות שכבר יש לכם. קחו מדגם של קריאות או צ'אטים מהעבר והעבירו אותם דרך הסוכן. תמצאו את הפערים מהר: השאלה שמנוסחת בשלוש דרכים והוא מטפל רק באחת, מקרה הקצה שאף אחד לא תיעד, קריאת הכלי שנכשלת בשקט.

Reach כוללת סימולציות בדיוק לשם כך, כדי שתוכלו לשחזר שיחות מהעולם האמיתי ולראות איפה הסוכן נשבר לפני שמישהו מבחוץ רואה זאת. בכל כלי שתבחרו, העיקרון נשאר: סוכן שמעולם לא נבדק מול קלט מבולגן ואמיתי אינו מוכן, לא משנה כמה הדמו נראה טוב.

בנייה ראשונה ריאליסטית, מקצה לקצה

הנה איך נראה סוכן ראשון כשבונים אותו ככה. נניח שאתם מותג מסחר אלקטרוני ושאלות סטטוס הזמנה מציפות את תיבת הדואר. המשימה: לענות 'איפה ההזמנה שלי' מתוך הודעת לקוח. תנאי העצירה: ברגע שהסוכן נתן סטטוס מעקב או ביקש מספר הזמנה שאין לו.

ידע: מדיניות המשלוחים וה-FAQ, לא יותר. כלים: חיפוש אחד שמקבל מספר הזמנה או אימייל ומחזיר את סטטוס המעקב העדכני. ערוץ: WhatsApp, כי שם הלקוחות האלה כבר כותבים לכם. העברה: כל אזכור של פריט פגום, החזר, או משלוח שאיחר מעבר למובטח עובר לאדם עם השיחה מצורפת.

זה סוכן שלם. הוא עושה משימה אחת, מחזיק גבול ברור, ואפשר למדוד אותו לפי שיעור הודעות סטטוס ההזמנה שהוא סוגר בלי עזרה. ברגע שהוא יציב, מוסיפים את המשימה הבאה. ככה נבנים סוכנים שמחזיקים מעמד, אחריות תחומה אחת בכל פעם, ולא עוזר ענק אחד שמנסה הכול ולא סומך על כלום.

המדד היחיד שמראה שזה עובד

אם אתם עוקבים אחרי מספר אחד, עקבו אחרי פתרון בלי העברה: שיעור השיחות שהסוכן סיים נכון בעצמו. הוא כן כשמדדי נפח וזמן תגובה אינם. סוכן יכול לענות מהר ועדיין לטעות. פתרון בלי העברה, מול מדגם שאתם באמת קוראים, אומר לכם אם הדבר מצדיק את מקומו.

שלבו את זה עם קריאה מהירה של השיחות שכן הועברו. אלה מפת הדרכים שלכם. רובן מתקבצות לשניים-שלושה דפוסים, וכל דפוס הוא או פיסת ידע חסרה, או כלי חסר, או גבול שקבעתם רופף מדי. תקנו את הדפוס המוביל, תראו את המספר זז, חזרו על זה.

מה נשבר אחרי ההשקה

העבודה לא נגמרת בעלייה לאוויר. סוכנים סוטים כשהמוצרים, המחירים והמדיניות שלכם משתנים ומאגר הידע נשאר מאחור. מופיעים ניסוחים חדשים שהסוכן מגמגם בהם. API של כלי משתנה והתשובות מתדרדרות בשקט.

עקבו אחרי שלושה דברים בחודש הראשון: שיעור ההעברות, השאלות שהפעילו העברות, והשיחות שהלקוחות נטשו. אלה אומרים לכם איפה להוסיף ידע, להדק כלי, או לכוונן תנאי עצירה. לבנות סוכן AI אינו אירוע השקה. זו לולאה, והצוותים שמתייחסים לזה כך הם אלה שהסוכנים שלהם עדיין שימושיים בעוד חצי שנה.