Против OpenAI, поддерживаемой Microsoft компании, разработавшей чат-бот ChatGPT generative AI, подан коллективный иск. Его авторы утверждают, что методы обучения ИИ компании нарушают конфиденциальность и авторские права практически всех, кто когда-либо делился контентом в Интернете.
В жалобе, поданной в Северный округ Калифорнии, перечислены 15 оснований для федерального коллективного иска, включая нарушения закона о компьютерном мошенничестве и злоупотреблениях, Закона о конфиденциальности электронных коммуникаций и нескольких законов штата о правах потребителей и правонарушениях общего права, пишет Computerworld.
OpenAI собрала огромное количество данных из различных источников в Интернете для обучения своих продвинутых языковых моделей ИИ. Эти наборы данных состоят из широкого спектра материалов, включая сайты, энциклопедии, популярные книги, сообщения в социальных сетях и т. д. Отмечается, что OpenAI получила все эти сведения, не спрашивая разрешения у создателей контента, что равносильно прямой краже данных.
В исковом заявлении говорится: «Вместо того, чтобы следовать установленным процедурам получения и использования личной информации, Ответчики прибегли к краже. Они систематически извлекали из Интернета 300 млрд слов, включая "книги, статьи, веб-сайты и посты", включая личную информацию, полученную без согласия».
По мнению истцов, цифровой вклад каждого пользователя глобальной сети, вероятно, включён в наборы данных OpenAI. Следовательно, любые выходные данные, созданные языковыми моделями OpenAI, которые используются для получения прибыли, могут содержать фрагменты каждого из пользователей данных, полученных в результате скрытой очистки.
«OpenAI использовала украденные данные для обучения и разработки [ChatGPT] с использованием больших языковых моделей ... и глубоких языковых алгоритмов для анализа и генерации человекоподобного языка, который может быть использован для широкого спектра приложений», — говорится в жалобе.
Истцы утверждают, что, взяв данные из общедоступного Интернета, которые, тем не менее, содержали личную информацию, позволяющую установить личность, OpenAI нарушила их конфиденциальность. Они просили суд разрешить сохранить их имена в тайне в надежде избежать «навязчивого изучения». В дополнение к денежному ущербу истцы просили предпринять ряд корректирующих действий в отношении предполагаемых правонарушений OpenAI, включая создание независимого совета по управлению ИИ и открытый доступ ко всей личной информации, собранной OpenAI.
Исход дела в суде остается неопределённым. Инфраструктура интернета сложна, и понятие свободной и открытой сети часто не совсем точно. Онлайн-платформы имеют собственные условия и соглашения с пользователями, и даже если пользователи размещают контент на этих платформах, право собственности обычно принадлежит самой платформе, а не пользователям, отмечает портал FirstPost со ссылкой на юристов по интеллектуальной собственности. В результате обычным пользователям будет сложно требовать выплаты или компенсации за использование их данных в моделях обучения.
Это дело проверит соблюдение разработчиками ИИ законодательства США об авторском праве. Добросовестное использование информации означает, что создатели ИИ, такие как OpenAI, не могут быть привлечены к ответственности за нарушение авторских прав, что, впрочем, не оспаривается истцами.
Второй коллективный иск, инициированный двумя авторами из Массачусетса, прямо утверждает о нарушениях авторских прав OpenAI в отношении использования материалов авторов для обучения ИИ. Его авторы утверждают, что «языковые модели OpenAI не могут функционировать без выразительной информации, извлечённой из работ истцов (и других лиц) и сохранённой внутри них, языковые модели OpenAI сами по себе являются производными работами, нарушающими авторские права». Жалоба по этому делу также подана в Северный округ Калифорнии.