Интернет е "замърсен" от AI съдържание заради масовото използване: Експертите

Широкото използване на ChatGPT и други подобни генеративни модели на ИИ доведе до нарастваща загриженост сред експертите относно "замърсяването" на интернет със съдържание, генерирано от ИИ.

Това съдържание, което често е неразличимо от човешкото, все по-често се изстъргва и се използва повторно за обучение на бъдещи модели на ИИ.

Резултатът е явление, известно като „срив на модела“, при което моделите на ИИ започват да губят оригиналност, точност и полезност, тъй като се обучават на синтетично съдържание, създадено от други модели, а не на истинско човешко знание.

Изследвания, публикувани в най-добрите списания като Nature, потвърждават, че обучението на системи за ИИ върху данни, генерирани от по-стари ИИ, може да влоши тяхната ефективност с течение на времето.

Големи издания, сред които Scientific American, Business Insider и Financial Times, подкрепиха тези опасения, като отбелязаха, че този цикъл може значително да попречи на бъдещото развитие на ИИ, ако не бъде контролиран.

За да се справят с проблема, изследователите и компаниите проучват методи като поставяне на водни знаци на резултатите от ИИ, откриване на синтетичен текст и запазване на висококачествени набори от данни, създадени от хора, за да се гарантира, че бъдещите модели се обучават на автентична и разнообразна информация.

Пламен Валентинов