Как сообщает OpenNET, правозащитная организация Software Freedom Conservancy (SFC), предоставляющая юридическую защиту свободным проектам и отстаивающая необходимость соблюдения лицензии GPL, объявила о прекращении любого использования платформы для совместной разработки кода GitHub и призвала разработчиков других открытых проектов последовать своему примеру.
Организация также запустила инициативу, нацеленную на упрощение миграции проектов с GitHub на более открытые альтернативы, например, CodeBerg (на базе Gitea) и SourceHut, или внедрение на своих серверах собственных сервисов разработки, основанных на открытых платформах, таких как Gitea или GitLab Community Edition.
К созданию инициативы организацию SFC подтолкнуло нежелание GitHub и Microsoft разбираться в этических и юридических тонкостях использования исходных текстов свободного ПО в качестве основы для построения модели машинного обучения в коммерческом сервисе GitHub Copilot.
Представители SFC попытались разобраться в том, является ли созданная модель машинного обучения объектом авторских прав и если да, то кому принадлежат эти права и как они соотносятся с правами на код, на основе которого построена модель. Также пока непонятно, может ли считаться производной работой блок кода, сгенерированный в GitHub Copilot и повторяющий код из используемых при построении модели проектов, и может ли рассматриваться включение таких блоков в проприетарное ПО как нарушение копилефт лицензий.
Представителям Microsoft и GitHub были заданы вопросы о том, какие юридические нормы легли в основу заявлений директора GitHub о том, что тренировка модели машинного обучения на публично доступных данных относится к категории добросовестного использования и обработку кода в GitHub Copilot можно трактовать по аналогии с использованием компилятора. Дополнительно Microsoft попросили предоставить список лицензий и перечень названий репозиториев, используемых при обучении модели.
Также был задан вопрос о том, как соотносится заявление, что допустимо обучение модели на любом коде без оглядки на используемые лицензии с тем, что для обучения GitHub Copilot использован только код открыто ПО и обучение не охватывает код закрытых репозиториев и проприетарных продуктов компании, таких как Windows и MS Office. Если обучение модели на любом коде является добросовестным использованием, то почему Microsoft ценит свою интеллектуальную собственность выше, чем интеллектуальную собственность разработчиков открытого ПО.
Компания Microsoft уклонилась от ответов и не предоставила юридического анализа, подтверждающего легитимность своих заявлений о добросовестном использовании. Попытки получить необходимую информацию предпринимались с июля прошлого года. Вначале представители Microsoft и GitHub пообещали ответить в ближайшее время, но так и не ответили. Через полгода было инициировано публичное обсуждение потенциальных юридических и этических проблем в системах машинного обучения, но представители Microsoft проигнорировали приглашение принять в нём участие. В конечном счёте, спустя год представители Microsoft напрямую отказались обсуждать этот вопрос, пояснив, что обсуждение бессмысленно, так как оно вряд ли изменит позицию SFC.
Кроме претензий, связанных с проектом GitHub Copilot, отмечаются также следующие проблемы GitHub:
- GitHub заключил контракт на предоставление коммерческих услуг иммиграционной и таможенной полиции США (ICE), деятельность которой рассматривается активистами как неэтичная, например, из-за практики разделения детей и их родителей после задержания нелегальных эмигрантов. Попытки обсудить вопрос сотрудничества GitHub и ICE натолкнулись на пренебрежительное и лицемерное отношение к поставленному вопросу.
- GitHub заверяет сообщество в своей поддержке открытого ПО, но сайт и весь сервис GitHub является проприетарными, а кодовая база закрыта и недоступна для анализа. Несмотря на то, что инструментарий Git был разработан для замены проприетарного BitKeeper и с целью ухода от централизации в пользу распределенной модели разработки, GitHub, через предоставление специфичных надстроек над Git, привязывает разработчиков к централизованному проприетарному сайту, контролируемому одной коммерческой компанией.
- Руководители GitHub выступают с критикой копилефта и GPL, агитируя использовать разрешительные лицензии. GitHub принадлежит компании Microsoft, ранее проявившей себя нападками на СПО и действиями против модели лицензирования копилефт.
В комментариях к новости отмечается, что:
«…Разницы то нет, это действительно копипаста, другой вопрос, что
1) копилот становиться действующим лицом
2) Полноценное Физ/Юр лицо можно честно упрекнуть и засудить
3) Копирование кусков кода копилотом фактически является нарушением многих свободных лицензий, ибо копирование кода часто предполагает указание источника/автора и более того получается, что обезличивание авторства по факту приводит к отрицанию лицензий, тогда как логичнее как раз наоборот обязывать пользователей копилота указывать полный список лицензий открытого ПО по которым строилась модель, ибо только в таком случае по сути не будет происходить нарушения лицензии, более того по сути нейросетка в данном случае ведь условно делает чуть более замороченный поиск по готовым кускам кода, которые просто в замороченном формате были зашиты(хотя не обязательно…) в обученную модель.
Т.е. тот факт, что модель представляет собой замороченную форму посредничества при заимствовании кода, заимстование кода уже произошло на стадии выбора репозиториев в качестве данных для обучения и этим всё сказано.»
Источники:
OpenNET, 04.07.2022, Организация SFC призвала открытые проекты прекратить использовать GitHub
Software Freedom Conservancy, June 30, 2022, Give Up GitHub: The Time Has Come!
См. также:
GitHub запустил систему машинного обучения Copilot, генерирующую код