На крајот на декември 2023 година New York Times до Федералниот окружен суд во Менхетан, Њу Јорк поднесе тужба со која се тврди дека OpenAI користел милиони нивни написи за тренинг на своите големи јазични модели. Microsoft користел содржини на New York Times за тренирање во рамките на моделот Microsoft Copilot.
Со тужбата New York Times бара да се утврди дека тужените на ваков начин го повредиле правото на интелектуална сопственост, поточно авторското право. Ова од причина што според New York Times алатките на тужените можат да генерираат содржина што ја повторува содржината на New York Times, креира сумарна содржина, и го имитира стилот на јазикот кој е искористен, како што е прикажано во голем број примери.
Значајно е да се напомене дека New York Times е на трето место по застапеност на содржина на која е трениран GPT. Пред нив се единствено Wikipedia и базата на податоци на Заводот за патенти на САД.
Според неведеното во тужбата на New York Times на ваков начин ChatGPT, но и Bing Chat може да пренесат цели делови на текстови без да има било какви технички или суштински грешки. Според нив, иако дел од овие содржини се достапни единствено за претплатниците, ChatGPT и Bing Chat оневозможуваат заштита и валоризација на содржината, од причина што истата се прави подостапна. Наместо претплата корисниците секогаш ќе можат да посетат било кој од двата асистенти на вештачка интелигенција и ќе ги добијат бараните информации. На ваков начин приходите на New York Times, но и на сите останати новински агенции значително ќе се намалата, а моделите на вештачка интелигенција заработуваат од содржина за која немаат материјални трошоци.
Интересно е да се забележи дека тужбата не содржи точен износ на монетарна компензација која ја бара New York Times. Но, се вели дека тужените треба да бидат одговорни за „милиони долари законска и фактичка штета“ поврзана со „незаконско копирање и користење на уникатно вредните дела на New York Times. Дополнително, во тужбата е ставено барање и OpenAI и Microsoft да ја отстранат целата содржина со која е тренирана вештачката интелигенција, како и нивната содржина повеќе да не се користи за тренирање на вештачка интелигенција.