סם אלטמן, OpenAI (צילום: Win McNamee, Getty Images)
סם אלטמן, מייסד OpenAI. טענות לפגיעה בזכויות יוצרים | צילום: Win McNamee, Getty Images

"המפתחת של ChatGPT הפרה זכויות יוצרים של מיליוני משתמשים". כך נטען בבקשה לתביעה ייצוגית נגד חברת הבינה המלאכותית OpenAI. את הבקשה, שהוגשה לבית משפט פדרלי במחוז הצפוני בקליפורניה, יזמה פירמת עורכי דין Clarkson. לדבריה, החברה פגעה בפרטיות של מיליוני אנשים באמצעות קצירת מידע מהרשת ששימש לאימון מודלי הבינה המלאכותית שלה.

נטען כי OpenAI השתמשה ללא אישור בפוסטים ובתגובות מרשתות חברתיות וכן בפוסטים בבלוגים. OpenAI לא חשפה את המידע והנתונים ששימשו לפיתוח מודל הבינה המלאכותית האחרון שלה.

טענות לחוסר שקיפות

הטכנולוגיה של מודלי שפה גדולים מתבססת על מידע רב שנאסף, שעל בסיסו הם "לומדים" ומסוגלים לספק מענה לבקשות שכתובות בשפה טבעית אנושית באמצעות שאילתות (פרומפטים).

לפי הבקשה לייצוגית, אנשים שיצרו ופירסמו תוכן ברשת לא נתנו הסכמה לכך שחברה כמו OpenAI תעשה בתוכן שלהם שימוש ממנו היא תוכל להרוויח. למרות ש-OpenAI אינה היחידה שעוסקת באימון מודלי בינה מלאכותית, הבחירה של התביעה להתייחס רק אליה נובעת מכך שהיא זו שהציתה את הבאזז והמרוץ ל-AI כששיחררה לציבור את הצ'אטבוט הפופולרי בסתיו האחרון.

עוד נטען שהחברה לא עושה די כדי לוודא שילדים מתחת לגיל 13 לא משתמשים במוצריה, טענה שהופנתה בעבר גם נגד חברות טכנולוגיה גדולות כמו יוטיוב ופייסבוק

התביעה טוענת גם ש-OpenAI לא שקופה מספיק עם משתמשים לגבי האופן בו המידע שהם מוסרים בשימוש במוצרים שלה משמש לפיתוח מוצרים נוספים שמניבים לה הכנסות. עוד נטען שהחברה לא עושה די כדי לוודא שילדים מתחת לגיל 13 לא משתמשים במוצריה, טענה שהופנתה בעבר גם נגד חברות טכנולוגיה גדולות כמו יוטיוב ופייסבוק.

עורכת הדין קתרין גרדנר, שמייצגת סטארט אפים בסוגיות קניין רוחני, אמרה ל"וושינגטון פוסט" כי בעוד שאמנים יכולים לטעון לזכויות יוצרים אם יוכיחו שעבודות מוגנות בזכויות שלהם שימשו לאימון מודלי בינה מלאכותית, הרי האדם הממוצע שפירסם פוסט או תגובה באתר יתקשה לטעון שהוא זכאי לפיצוי.

אחת המטרות של התובעת היא שבית המשפט יחליט על האיזון הנכון בין אימון אלגוריתמים של בינה מלאכותית והזכאות לפיצוי כשנעשה שימוש בדאטה אנושי. הנושא נמצא במחלוקת מאחר שמפתחי בינה מלאכותית רבים טוענים ששימוש בדאטה מהאינטרנט צריך להיות מוגדר כשימוש הוגן.