רעידת אדמה בעולם ה-AI: הניו יורק טיימס תובעים את OpenAI ומיקרוסופט
מודלי AI שרובנו מכירים כיום, כמו ChatGPT, זקוקים להמון מידע וטקסט בשביל לפעול ברמה בה הם שואפים לפעול. למעשה, הם צריכים כל כך הרבה מידע עד לרמה שהחברות מוכנות לשלם לאנשים בשביל לכתוב טקסטים חדשים ולהזין אותם לבוטים, וזאת כתוצאה מההערכות שכל המידע הזמין כיום באינטרנט יספיק לאימון הבוטים רק עד שנת 2026, בשביל קנה מידה נוסף, הגרסה הראשונה של ChatGPT אומנה בעזרת 570 ג'יגה של טקסט, שהם 300 מיליארד מילים.
בנוסף לכך שהמודלים זקוקים לכמויות גדולות של טקסט רק בכדי להבין איך לדבר עם בני אדם, הם גם צריכים גישה למידע רב ככל הניתן בשביל שהם יוכלו להנגיש אותו למשתמש בעת הצורך. לכן, אתרי מידע ועיתונים הם מקורות חשובים יותר למודלים השואפים לפתור את כל הבעיות שיציגו בפניו.
אלא שעדיין קיימת מגבלה אחת על המודלים בנושא שימוש במידע, זכויות יוצרים, ויכול להיות שהמגבלה הזאת הולכת להקשות על החברות עוד יותר.
התביעה של הניו יורק טיימס
בניו יורק טיימס בעצם טוענים שתי טענות מרכזיות - הראשונה היא שחברות הטכנולוגיה השתמשו בכתבות שלהן בשביל לאמן את המודלים. סביר להניח שהטענה הזאת לא תתקבל, מאחר ושימוש בתכנים הזמינים בחינם באינטרנט נחשב, לפי חוקי זכויות היוצרים בארה"ב, ל"שימוש הוגן". עם זאת, בטיימס טוענים שהם מאמינים שהם אחד מהמקורות הגדולים ביותר בהם השתמשו חברות הטכנולוגיה בשביל לאמן את המודלים שלהן.הטענה השנייה, וזו שאולי תשפיע כל התחום כולו, היא שהמודלים משתמשים במידע הזמין בכתבות של הטיימס בשביל לתת תשובות למשתמשים במודל, כלומר במקום שאותו משתמש יגיע לאתר של הטיימס, הוא נשאר עם הבוט, מה שמונע מהטיימס טראפיק שהיא הייתה צריכה לקבל עם התוכן שלה.
"הניו יורק טיימס הוא פרי כפם של אלפי עיתונאים, שעיסוקם עולה מאות מיליוני דולרים בשנה", נכתב בתלונה של הטיימס. "חברות הטכנולוגיה נמנעו בפועל מלשלם את המיליארדים שהושקעו בתכנים על ידי הטיימס בכך שהשתמשו בהם ללא רשות וללא תשלום".
בטיימס ידרשו פיצויים, אבל יותר מכך, הם ידרשו שבית המשפט יאסור על מודלי הבינה המלאכותית להשתמש בתכנים שלהם בשביל להעביר את המידע למשתמשים בבוטים, ואם בית המשפט יאשר את זה, כל תחום ה-AI עלול להשתנות.
הבוטים חכמים, אבל רק אם מלמדים אותם
כל מי שהתנסה עם מודל AI כזה או אחר מבין את הפוטנציאל הטמון בטכנולוגיה הזאת. בספר שניות הבוט יכול לבצע כמעט כל משימה שתבקשו ולענות על כמעט כל שאלה שתשאלו, אבל בשביל לבצע את המשימות הללו בהצלחה הוא צריך מידע, והמידע מגיע ממקורות חיצוניים.בתחילת הדרך, הבעיה המרכזית של ChatGPT למשל הייתה שלא הייתה לו גישה מידע עדכני. רוב המידע הזמין לו היה עדכני נכון לשנת 2021 וזה הקשה על ביצוע של משימות רבות. כאשר גוגל GOOGLE -1.58% GOOGLE 166.57 -1.58% סגירה:0 פתיחה:166.98 גבוה:168.26 נמוך:165.71 מחזור:-- לעמוד ציטוט חדשות גרפים פרופיל חברה המלצות כתבות נוספות בנושא: השיקו את הבוט המתחרה שלהם, בארד, החיסרון הזה הפך למשמעותי הרבה יותר, מאחר ולבארד היה את כל מנוע החיפוש של גוגל בעזרתו יכל לדלות מידע כמעט מכל פינה באינטרנט, וזה מה שהפך אותו לעוצמתי יותר.
ChatGPT הצליחו לגשר על הפער הזה בזכות מיקרוסופט MICROSOFT +1% MICROSOFT 417 +1% סגירה:0 פתיחה:411.06 גבוה:417.4 נמוך:411.06 מחזור:-- לעמוד ציטוט חדשות גרפים פרופיל חברה המלצות כתבות נוספות בנושא: , שמחזיקה ב-49% מהחברה, וגם מאפשרת לה להשתמש במנוע החיפוש שלה, בינג, בשביל לדלות עוד מידע.
כמובן שכל אדם שמשתמש באחד מהבוטים האלה רוצה לקבל את המידע העדכני ביותר בזמן הקצר ביותר, מבלי לדפדף בין אתרים שונים, ולכן השימוש במידע של אתרים כמו הניו יורק טיימס קריטי למודלים האלה. אבל הניו יורק טיימס תלוי בהכנסות שלו ממנויים, הכנסות שעומדות על בערך 600 מיליארד דולר בשנה, ושימוש בתכנים שלו, גם החינמיים, מונע ממנו לקבל מבקרים שאחרת היו קוראים את האתר אצלם ואולי היו שוקלים להירשם כמנויים בעצמם.
תודה.
לתגובה חדשה
חזור לתגובה
-
3.ץישרפו כולם אין לכם מה לעשות בחיים!!!יגאלהנאצי 28/12/2023 19:33הגב לתגובה זו0 0לבזבז את הזמן והכסף על משחקי אגו ושטויות אשכרה נצעס מכל האיגודים האלא לוקחים כל מה שבא להם עושים מה שהם רוצים ואחרכ מחפשים איך להרויח כספים ראבק תתרמו לי רבע אחוז ממה שאתם מבזבזים על זמן אויר ואני מיליונר מאושרסגור
-
2.מייקרוסופט מקצרת את הדרך לכל נושא ומקילה על חיפושים מיו (ל"ת)רחלה 28/12/2023 13:27הגב לתגובה זו0 0סגור
-
1.אין מצב שהם מכניסים 600 מיליארדאליהן 27/12/2023 20:20הגב לתגובה זו5 0אולי מיליון וגם זה בספק רבסגור
-
ברוריהודי 28/12/2023 08:06הגב לתגובה זו0 0אולי 60 מיליון....סגור