מייסדי דאטהג'ן, אופיר צ'קון וגיל אלבד (צילום: נדב כהן יהונתן , יחצ)
מייסדי דאטהג'ן, מימין: גיל אלבד ואופיר צ'קון. "אנחנו סוג של הדלק של התעשייה הזו" | צילום: נדב כהן יהונתן , יחצ

חברת הדאטה הסינתטית דאטהג'ן (Datagen) מודיעה היום שהשלימה סבב גיוס הון B בהיקף 50 מיליון דולר, מה שמביא את סך ההון שגייסה עד כה ל-70 מיליון דולר. את הסבב הוביל משקיעה חדשה - קרן Scale Venture Partners והצטרפו אליה המשקיעים הקיימים TLV Partner, קרן Viola Ventures שצירפה גם את Viola Growth וכן, Spider Capital.

בכנות בלתי שגרתית, מספרים בדאטהג'ן כי הגיוס נסגר בתחילת החודש שעבר ובחברה מעריכים כי מאז דועכת התלהבות המשקיעים - לדבריהם, חברות שמנסות לגייס כעת נתקלות בהערכות שווי מופחתות או בסירוב להשקיע. "אני חושב שגייסנו בזמן מאוד מדויק, סגרנו בתחילת פברואר", מסביר המייסד אופיר צוק (צ'קון). "ראיתי שזה היה המייל האחרון לפני שהייתה האטה די רצינית. הייתי בוואלי כמה שבועות אחרי זה וקיבלתי את הפידבק הזה מהרבה יזמים – שמשקיעים משכו termsheets, שהורידו הערכות שווי בצורה משמעותית".

ותודה למארק צוקרברג

את הרעיון לפיתוח הטכנולוגיה חייבים המייסדים אופיר צוק (צ'קון) וגיל אלבז למארק צוקרברג, מנכ"ל מטא. זה היה כשביוטיוב עלה הסרטון שלו מדגים את משקפי אוקולוס שפייסבוק קנתה אז, לעיניהם המכוסות משקפיים של מאות משתתפי האירוע. מעבר לסיטואציה המשעשעת, היה ברור לשניים שפייסבוק לא מצליחה לייצר את הסימולציה של המציאות טוב מספיק. למעשה, עד היום סביבת הורייזן של מטא, הגרסה הנוכחית של המטאוורס, מסתפקת בדמויות אנימציה ללא חלק תחתון בגלל מגבלות הפוטו-ריאליזם בשיקוף העולם האמיתי.

מנכ"ל החברה ומייסד משותף, אופיר צוק: "היום מאמנים רשתות נוירוניות בצורה מגוחכת. צריך המון דאטה כדי שהן ילמדו, זה תהליך ידני, מאוד לא סקיילבילי, חשוף להמון טעויות והטיות אנוש"

דאטהג'ן פועלת בתחום המציאות הווירטואלית, הסימולציות ועולמות המטאוורס והיא מאפשרת ללקוחות לייצר לעצמם דאטה מתויגת בכמות גדולה כדי לאמן מערכות בינה מלאכותית. ואם זה נשמע לכם מסובך, זה כנראה בגלל שאתם לא אימנתם AI עד היום.

"היום מאמנים רשתות נוירוניות בצורה מגוחכת", אומר צוק, מנכ"ל החברה ומייסד משותף, "צריך המון דאטה כדי שהן ילמדו, אז אוספים מאות מיליוני תמונות, ואחר כך שולחים את זה למכוני תיוג שמסמנים איפה השולחן ואיפה הכיסא וברוב המקרים התוצאה לא מספיק טובה וצריך לחזור עליה. זה תהליך ידני, מאוד לא סקיילבילי, חשוף להמון טעויות והטיות אנוש".

הפתרון של דאטהג'ן הוא לייצר סימולציה של העולם האמיתי. כך ניתן לאמן AI או רובוטים במציאות וירטואלית, שמהווה העתק דיגיטלי של העולם האמיתי. מאגר הנתונים של החברה כולל כמות עצומה של בני אדם מסומלצים, בתים, רהיטים, מכוניות, נוף אורבני וחיק הטבע, בארה"ב או בסיאול, השכם בבוקר או לעת ערבית.

"התחלנו כבוטסטראפ, סגרנו עסקאות בגראז' מוד, עסקאות די משוגעות עם חברות ענק כשלנו לא היה כסף בבנק", מספר צוק. ההמשך היה כשהחברה הוציאה לשוק פלטפורמה, שמאפשרת ללקוחות לייצר בעצמם סביבה סימולטיבית לפי צרכיהם, ששאובה מתוך המאגר העצום של דאטהג'ן.

צוק אומר שהוא חתום על הסכמי סודיות ולכן הוא לא יכול לחשוף את שמות הלקוחות, אבל תחשבו על חמש חברות הביג טק הבינלאומיות? שלוש מתוכן לקוחות של החברה. על חברות רכב גדולות? גם ביניהן יש לא מעט לקוחות של החברה.

צוק: "אנחנו עושים כל מה שקשור להבנה של אנשים בסביבות indoors בבתים ובמכוניות". דאטהג'ן מפתחת סימולציות שמאפשרות לאמן AI לזהות ידיים, תנועות, גוף שלם, הבעות פנים, מצבי עירנות של נהגים ואפילו מערכות אבטחה לבתים

דאטהג'ן מתמקדת בפיתוח סימולציה לעולמות הרובוטיקה בתוך הבית, ויש מתברר לא מעט רובוטים ביתיים בפיתוח וגם בסימולציה של עולמות הרכב, עם דגש על תא הנוסעים. "אנחנו עושים כל מה שקשור להבנה של אנשים בסביבות indoors בבתים ובמכוניות" אומר צוק. הסימולציות של החברה מאפשרות לאמן AI לזהות ידיים ותנועות, גוף שלם, הבעות פנים, מצב הערנות של הנהג והאם הוא מתעסק עם הילדה בכסא מאחורה. זיהוי הבעות פנים מעניין גם את החברות שמציעות פלטפורמות לשיחות וידאו, אם כדי לנתח את הופעתו של הדובר או כדי לשפר את הקרנת הרקע הווירטואלי מאחוריו. והוא גם שימושי לאימון AI של מערכות אבטחה לבתים.

מוצר DATAGEN דאטהג'ן  (הדמיה: נדב כהן יהונתן , יחצ)
דאטהג'ן מייצרים סימולציה של העולם האמיתי | הדמיה: נדב כהן יהונתן , יחצ

צריך לזכור - בכל המקרים האלה דאטהג'ן לא מפתחת את המערכות עצמן אלא מספקת את הסימולציה כדי לאמן את המערכות. "אנחנו סוג של הדלק של התעשייה הזו, שחסר לה דאטה כדי לאמן את ה-AI. והדרך היא, שאנחנו מעצימים את מה שהם עושים אבל לא מחליפים אותם".

אין פה בעיה מעגלית? אתה יוצר סימולציה באמצעות AI ואז מאמן AI באמצעותה. ואם יש הטיה או טעות בסימולציה, ה-AI תהיה פגומה.
"זה מאוד נכון. אבל מטרת הדאטה היא לא להיות יפה לעיניים אנושיות אלא להכליל לעולם האמיתי. אם פונקציית המטרה שלך היא לאמן מודלים של AI שיעבדנו על העולם האמיתי, אתה תייצר את הדאטה שלך לפי אותה פונקציית מטרה. והמנוע שאיתו אנחנו מייצרים את הסימולציה, כל הזמן הוא מאמן בתהליך צדדי מודל של AI על משימות ובודק אותן על דאטה אמיתית. כל עולמות ה-AI הם מאוד ניסויים נכון לכרגע, ואם מישהו אומר שיש לו את הדאטה המושלמת, אז תברח ממנו. אבל אנחנו מספקים כלי שבעזרתו יכולים לבנות את הסימולציה פי 100 יותר מהר ממה שעושים היום".

הלקוחות מייצרים את הסימולציה בעצמם

חברת Datagen הוקמה בשנת 2018 על ידי אופיר צוק וגיל אלבז, והיא מעסיקה כיום 85 עובדים בתל אביב ובניו יורק. צוק אומר כי בשנה האחרונה החברה עברה למודל של שירות עצמי של הלקוחות, שכעת יכולים לייצר בעצמם את הסימולציות שלהם על הפלטפורמה: "עשינו קפיצת מדרגה, שחררנו את מוצר השירות העצמי הראשון בעולמות הדאטה הסינטטית ויש לנו לא מעט לקוחות שעובדים עצמאית ולא צריכים אותנו. זו הכנה מאוד רצינית לקראת צמיחה".

דאטהג'ן DATAGEN (צילום: נדב כהן יהונתן , יחצ)
Datagen מעסיקה כיום 85 עובדים בתל אביב ובניו יורק. "עשינו קפיצת מדרגה" | צילום: נדב כהן יהונתן , יחצ

לדברי צוק, החברה צמחה פי שמונה בהכנסות בשנה האחרונה ומספר הלקוחות גדל משמעותית. "אחד הדברים שהיה מעניין ב-2021, זה שפתאום פרץ איזה תיאבון מאוד גדול של השוק והיו אבני דרך משמעותיות שהשוק עבר: ענקיות הטכנולוגיה הגדירו טייטל חדש – "מהנדס דאטה סינתטית" ויש כבר עשרות מהנדסים כאלה. זה מעלה את היוקרה ואת ההכרה בתחום, והיו גם כנסים בתחום ראיית המחשב, עם מסלולים שלמים על דאטה סינתטית וכל החברות מדברות המון על סימולציות".

על פי סקר שוק שהוזמן על ידי דאטהג'ן, שיעור של 99% מצוותי הראייה הממוחשבת בחברות העידו כי היו מעורבים בפרויקט למידת מכונה שהתבטל לחלוטין עקב מחסור בדאטה לצורכי אימון. דאטה סינטטית זוכה לאימוץ נרחב ו-96% מצוותי הראייה הממוחשבת מציינים בסקר שהם משתמשים בה במידה כזו או אחרת לאימון המודלים. לאחרונה הגדירה גרטנר את הדאטה הסינטטית בתחזיות האסטרטגיות שלה לשנת 2022 וציינה: "עד שנת 2024 60% מהדאטה שישמש לפיתוח פרויקטים של AI ואנליטיקה ייוצר באופן סינטטי".

בשנה הקרובה, איזה הישג ייחשב בעיניך להצלחה?
"להראות שהלקוחות מרחיבים את השימוש בדאטה סינתטית בצורה משמעותית ומעבירים תקציבים מדאטה בעולמות אמיתיים לדאטה סינתטית. זה יראה אמון בדאטה סינתטית וגם בנו ויביא אותנו למקום שאנחנו נהיה הפתרון לדאטה בכלל, לא רק דאטה סינתטי".

צירפתם משקיעים חדשים לסבב הגיוס הנוכחי.
"כן, סקיילונצ'ר פרטנרס הם משקיע מדהים, עם אוריינטציה מאוד עסקית. והמשקיעים הקיימים הצטרפו בהתלהבות משמעותית, כולל 30 משקיעים פרטיים שהצטרפו לסיבוב, מעולמות האקדמיה, הביזנס, ה-AI".

צוק: "אני פוגש מנכ"לי חברות מתחרות, והם מצטערים שהם לא גייסו ב-2021 כי הם גם מאוד רואים את הדבר הזה. זה שם אותנו במקום מאוד טוב, כי גייסנו וסוג של השארנו אבק לתחרות"

מרגישים בשוק ירידה בעניין של המשקיעים?
"אני פוגש מנכ"לי חברות מתחרות, והם מצטערים שהם לא גייסו ב-2021 כי הם גם מאוד רואים את הדבר הזה. זה שם אותנו במקום מאוד טוב, כי גייסנו וסוג של השארנו אבק לתחרות. אבל כן – מי שגייס, צייד את עצמו בכסף בצורה שתביא אותו לשקט נפשי ומי שלא – רואים שיש האטה. כמה היא תמשיך – זה אין לדעת אבל אין ספק שהשוק הרבה פחות חם ממה שהיה".

"עתה, כשמתחיל עידן חדש של למידת מכונה ממוקדת דאטה, פס ייצור של דאטה שניתן לשימוש עשוי להיות המרכיב המשתלם ביותר בתצרף של למידת מכונה", מסר אנדי ויטוס, שותף ב-Scale Venture Partners. "זו הסיבה שאנו משקיעים בדאטהג'ן שבנתה פתרון מקצה לקצה בתחום הראייה הממוחשבת שיקדם את תחום הבינה המלאכותית וישנה מהיסוד את האופן שבו מפתחים ובודקים אפליקציות ראייה ממוחשבת".