תהליך הלמידה של דוקה



 
DOKKA משלבת בין שתי טכנולוגיות עיקריות:


1. בינה מלאכותית (AI)  – 

שמאפשרת למערכת ללמוד מהפעולות של מנהלי החשבונות ולהשתפר עם הזמן

2. זיהוי תווים אופטי (OCR) – 


טכנולוגיה שמזהה תווים מתוך המסמך על פי הפיקסלים שמרכיבים אותו



הודות לשילוב הזה, דוקה יודעת ללמוד איפה ממוקם המידע במסמך ולשלוף אותו אוטומטית בפעמים הבאות.
עם זאת, חשוב לדעת שיש שדות שלא נלמדים, ויש דרך נכונה ללמד את המערכת.




איך DOKKA עובדת?



1. למידה חכמה מהמשתמשים - AI



דוקה מתבוננת בפעולות שמבצעים המשתמשים (למשל גרירת מידע לשדות), ולומדת מהיכן לשלוף את הנתונים בפעמים הבאות. 


2. זיהוי תווים מתוך פיקסלים - OCR


כל מסמך שמועלה לדוקה מחולק למיליוני פיקסלים (נקודות זעירות בעין בלתי מזוינת).
המערכת יודעת לזהות אילו תווים נמצאים באילו מיקומים במסמך – וכך מאפשרת:


-גרירת טקסט מהמסמך לשדות החשבונאיים במקום להקליד ידנית

-למידה של מיקום המידע במסמך לצורך שליפה אוטומטית בהמשך




על בסיס מה DOKKA לומדת?



המערכת לומדת לפי ספק ומבנה מסמך (Layout). 

לכל מסמך שמועלה ל-DOKKA מוקצה מזהה ייחודי של מבנה (Layout ID). 

כאשר DOKKA מזהה גם את אותו הספק וגם את אותו המבנה – היא מפעילה את מה שלמדה בפעמים הקודמות.



מתי מתבצעת הלמידה בפועל?




למידה ב-DOKKA מתבצעת רק לאחר לחיצה על כפתור "קליטה".

הקליטה לא רק יוצרת את החשבונית במערכת ה-ERP, אלא גם שומרת את הפעולות שביצעתם כהוראות למידה למערכת (למשל, מאיפה גררתם כל  שדה במסמך).


אבל חשוב להבין עוד דבר: 


הרגע שבו דוקה שולפת את המידע מתוך המסמך ומכניסה אותו לשדות – הוא בעת העלאת המסמך למערכת.


ניתן ממש לראות את זה קורה – כשמעלים מסמך, מופיעה "חשיבה" קצרה על המסמך.

בשלב זה, דוקה מבצעת ניתוח חד-פעמי של הקובץ, מזהה את הספק והמבנה, ושולפת מידע לפי מה שהיא כבר יודעת באותו רגע.






המשמעות:


אם העליתם שתי חשבוניות מאותו ספק עם אותו מבנה, ולא לימדתם את המערכת לפני כן –

החשבונית השנייה לא תושפע מהלמידה, כי דוקה לא מנתחת מחדש מסמכים שכבר נמצאים במערכת.



מה עושים במצב כזה?

כדי שהלמידה תיושם גם על מסמך שכבר הועלה:

הורידו את המסמך למחשב

מחקו אותו מהמערכת

העלו אותו מחדש 

כעת DOKKA תזהה שהוא תואם לספק ולמבנה שנלמד, ותמלא את השדות אוטומטית בהתאם




איך מלמדים את DOKKA נכון?



 יש לגרור טקסט מתוך המסמך אל השדה הרצוי (ולא להקליד ידנית)

 רק גרירה מתוך המסמך מאפשרת לדוקה לדעת מאיפה המידע נלקח



אילו שדות לא נלמדים?




ישנם שדות שמוגדרים מראש לא להתמלא אוטומטית, למשל:

- מקט״ים

- תיאור מוצר

- פרטים

- שדות מותאמים אישית שהגיעו מה-ERP


בנוסף, שדות מסוימים כמו מספר חשבון ( Account Number) לא נלמדים דרך גרירה.
במקרה הזה, דוקה תשתמש באותו הערך שהופיע בקליטה האחרונה של ספק זהה.