Блог

Комплексная защита контента сайта от копирования: стратегии и инструменты

30 мая 2023
27 мин. 3564
image
image
image
Илья Воропаев backend-разработчик
image
Юлия Гаврилова редактор
Комплексная защита контента сайта от копирования: стратегии и инструменты
Вы потратили много ресурсов на создание собственного сайта, который не стыдно показать клиентам и партнерам. Но вот обнаруживаете точную копию у конкурента. Действуйте решительно. Сайты-клоны не только обманывают потребителей и зарабатывают минус-очки себе в карму. Они вредят вашему бизнесу.

В статье разберемся, как защитить свой контент от копирования и что делать, если дизайн, изображения, тексты или код все-таки украли.

Зачем защищать контент от копирования?

Любой контент — это интеллектуальная собственность. Если вы создаете контент сами или через подрядчиков, то результаты труда такая же ваша собственность, как машина и квартира. Красть ее нехорошо и непорядочно.

В реальном мире доказать кражу собственности довольно просто: достаточно заявить о пропаже и предъявить документы собственника.

С интеллектуальной собственностью сложнее. Когда две компании заявляют, что идея, например, сайта принадлежит им, как понять, кто не обманывает? На дизайне не написано, что он ваш.

Кроме того, вы можете продолжать пользоваться своим интеллектуальным продуктом и даже не подозревать, что его кто-то украл.

Сайты ранжируются поисковыми системами. Google, Яндекс и другие сервисы любят уникальный контент и поднимают его выше в поисковой выдаче. А вот если контент неуникальный, то "наказать" могут не только компанию, которая украла контент, но и ту, у которой украли. Низкие позиции в выдаче — значит мало клиентов узнают о вас, придут и что-то купят.

Авторские права не нужно где-то регистрировать, чтобы они начали работать. Охрана возникает в момент создания уникального контента. Но вот на случай спорной ситуации стоит принять меры, которые помогут подтвердить, что контент принадлежит вам.

Преимущества оригинального контента

Оригинальный контент — это тексты, видео, изображения и другие файлы, которые до этого не были опубликованы на других ресурсах. Оригинальность бывает разной:
Техническая. Технической уникальности добиться легко. Например, взять чужой текст, заменить слова на синонимы, перефразировать. Сервисы проверки на плагиат определят такой текст как текст с высокой уникальностью.
Смысловая. Смысловой уникальности добиться сложнее. Тут уже нужно переосмыслить источники, провести свое исследование, предложить свою подачу материала. Смысловой плагиат легко замечает человек, а вот машины – нет.
Делать уникальный смысловой контент — сложно и дорого. Поэтому многие прибегают к рерайту, переводу и прочим «серым» практикам производства контента задешево. Это касается не только текстов — картинки можно перерисовать, видео повторить, дизайн скопировать.

Но чтобы посетители заходили на сайт и оставались на нем подольше, материалы должны быть небанальными. Тогда посетитель понимает: здесь что-то ценное, не как везде. Так формируется лояльность, которая может конвертироваться в продажи и более высокий доход. И наоборот — если пользователь заходит и видит «оригинальный» контент уже в сотый раз, то он может скептически отнестись и к тому, что вы пытаетесь продать.

Что будет за нарушение авторского права при копировании контента?

Сайт как программа для ЭВМ (программное обеспечение) — объект авторского права. Его охраняет закон.

Программа состоит из элементов, которые тоже объекты авторского права:
подготовительные материалы, необходимые для создания ПО, например, техзадания, исследования и анализ продукта, конкурентов и общественного мнения.
дизайн и оформление интерфейса,
исходный и объектный код,
При этом языки программирования не являются объектами авторских прав. ПО создается при помощи языка программирования, но охраняется только готовый проект.

Чтобы наказать мошенника, можно подать иск в суд о нарушении авторских прав. Если нарушение прав доказано, то автор или правообладатель может потребовать от нарушителя выплаты компенсации за нарушение исключительного права в размере от 10 000 до 5 000 000. При этом суд вправе изменить по своему усмотрению сумму компенсации в зависимости от обстоятельств дела.

Однако даже если вам удастся отстоять свою правоту, судебное разбирательство может бросить тень на репутацию компании и снизить количество продаж товаров или услуг.

Поэтому лучше предотвратить кражу контента, чем иметь дело с ее последствиями.

Типы контента под угрозой копирования

Контентокрады могут нацеливаться на разные виды контента.

Текстовый контент

К текстовому контенту относятся статьи, новостные публикации, заметки, информация о товарах и услугах, а также текстовый код сайта. То есть, все, представленное в текстовом виде, что можно прочитать.

Пару лет назад на VC.ru появилась статья, где Mindbox заявил о краже своего кода и калькулятора тестов другой компанией:

«Сервис email-рассылок DashaMail „позаимствовал“ калькулятор AB-тестов и вдобавок использовал наш JS-клиент и API на сайте „Билайна“. Сначала мы попробовали договориться с коллегами в переписке, потом отправили досудебную претензию — ответа не получили».

Закончилась ли история судом, неизвестно. Но то, что DashaMail навсегда испортили себе репутацию, это точно. Достаточно почитать комментарии под статьей.

Графический контент

К графическому контенту относятся изображения на сайте. Это и картинки, иллюстрирующие статьи, и фото товаров, а также инфографика.

В 2020 году студию Артемия Лебедева обвинили в плагиате. Основательница бренда предметов для дома заявила, что дизайнеры украли идею их логотипа. Студия никак не отреагировала на обвинение. Судите сами, похожи логотипы или нет.

Аудио и видео контент

Аудио и видео контент может быть размещен на сайте как файл или ссылка на сторонний ресурс. Например, видео может быть размещено при помощи YouTube.

Чаще всего с плагиатом аудио и видео материалов сталкиваются создатели онлайн курсов или популярных YouTube-каналов. Если вы тоже создаете аудио и видео материалы, фиксируйте процесс создания контент на фото и видео, чтобы доказать авторство.

Основные методы копирования контента

К сожалению, украсть контент, если он не был специально защищен, довольно просто.

Копирование с помощью копирайтерских программ

Сайт можно скопировать автоматически, то есть с помощью специальной программы. Их еще называют парсеры.

Парсер — это программа, которая притворяется реальным пользователем, но вместо этого ходит по страницам сайта и выкачивает информацию. Отличить реального посетителя сайта от парсера, прикидывающегося Google Chrome, довольно сложно.

Но можно принять меры. Например, отслеживать подозрительную активность: если пользователь открывает сотни страниц в минуту, то скорее всего это зловредная программа. Тогда можно ограничить скорость загрузки и заблокировать парсер по user-агенту.

Этот способ неидеален. Можно случайно заблокировать реальных пользователей, которые просто быстро что-то ищут. Иногда пользователей просят подтвердить, что они не роботы, когда они просто пытаются купить билет на самолет или найти фильм на вечер. Тогда юзер может просто закрыть вкладку и уйти на другой сайт.

Копирование вручную с сайта

Текст можно скопировать с сайта через Ctrl + C/ Ctrl +V с помощью выделения фрагмента. Картинку, видео или аудио с сайта можно просто скачать.

Полностью защитить материалы от ручного копирования практически невозможно. Но существуют технические методы, усложняющие работу любителям украсть контент. О них расскажем чуть ниже.

Копирование через RSS-фиды и API

«Украсть» контент можно с помощью RSS-ленты — списка последних публикаций сайта, откуда можно скопировать информацию. Вот только тут все корректно и легально — по сути, мы сами отдаем контент для использования его вне сайта, поэтому не надо ничего предотвращать. Часто в RSS отдается превью материала и ссылка на полную версию, которые могут спарсить разные агрегаторы новостей. Размещение постов и других материалов на сайтах-агрегаторах дает дополнительные переходы на сайт.

Например, RSS Feed Reader собирает статьи из разных медиа в одном месте, чтобы вам не приходилось заходить отдельно на каждый сайт.

Как предотвратить копирование контента?

Защитить контент можно техническими и нетехническими методами. Вот что вы можете сделать без айтишника:

Создайте уникальный стиль и дизайн

Чем более уникальный стиль изложения контента вы используете, тем сложнее будет заимствовать информацию с вашего сайта. Пользователи по стилю и тону изложения могут узнать вас. И сделать негативные выводы о скопированном материале от ваших конкурентов.

К тому же вы усложните конкурентам задачу — ваш уникальный материал придется адаптировать и переделывать, чтобы информация не была похожей.

Пример уникального ToV (Tone-of-Voice) — Авиасейлс. В контент-маркетинге компания использует смесь пост-иронии, мемов и игры слов. Кстати, вот что говорит руководитель отдела контент-маркетинга Дарья Смирнова по поводу «тона голоса компании»:

«Мы подбираем людей, которые будут мыслить так же, как мы. Чтобы они понимали, что мы хотим сказать людям, и каким языком это нужно донести. Наш бренд — это живой механизм. Лет пять назад его можно было описать, как „злой школьник“: он постоянно над всеми прикалывался. Но мы решили уйти в сторону взросления: все так же шутливо, но понятно для взрослой аудитории».

А еще Авиасейлс легко узнать по фирменному ярко-синему цвету, который ребята используют везде.
ToV Авиасейлс
ToV Авиасейлс

Используйте собственные источники данных и материалов

Сами делайте фотографии для оформления на сайте, чтобы на них были ваши сотрудники и ваш бизнес. Если у вас есть свои данные, напишите на их основе исследование. Берите интервью у экспертов компании — таких материалов не будет больше ни у кого. А еще такой контент сложно украсть, ведь легко доказать право собственности.
Примеры успешных сайтов с уникальным контентом
В Медиа Нетологии размещают оригинальные статьи от экспертов в сфере IT, digital и онлайн-образования. Кстати, многие из них пишут преподаватели школы, практикующие специалисты. Графический контент также является уникальным.
В онлайн-СМИ Cossa публикуют статьи на тему маркетинга, digital-сферы и управления. Статьи пишут не копирайтеры или редакторы, а эксперты на основе своего опыта.

Технические методы защиты контента

Если айтишник все же имеется, то примените технические методы защиты контента.

SSL-сертификаты и шифрование

SSL — протокол безопасности в сети Интернет. SSL-сертификат подтверждает подлинность домена сайта и помогает зашифровать информацию на нем. Такой сертификат можно приобрести у организации, которая их выдает. Например, Comodo, Symantec, Sectigo и GeoTrust.

SSL-сертификат помогает защитить сайт от перехвата и подмены данных, а также атаки типа «человек посередине» (Man-in-the-Middle) и фишинга. SSL также подтверждает подлинность сервера и клиента, чтобы не допустить подделки сайта. А еще поисковые системы считают сайты с сертификатом более надежными и отображают их выше в выдаче.

SSL-сертификат подтверждает права на сайт, но не может защитить от его от копирования.

Автоматическая генерация разметки

Автоматическое генерирование разметки сайта усложняет парсинг с помощью поисковых роботов. Оно не дает программам собирать и копировать информацию с вашего сайта. При автоматической генерации у всех тегов (они как карта для парсера при сборе информации) рандомные бессмысленные названия, которые могут отличаться на разных страницах. Поэтому парсер сделать хоть и можно, но уже гораздо сложнее.

Однако этот способ все равно не защитит, если парсер просто собирает весь текст на странице или все картинки. Он не обращает внимания на разметку, поэтому даже если каждая буква будет в отдельном теге, это не затруднит задачу.
head - заголовок
body
    content
        menu - меню сайта
        breadcrumbs - хлебные крошки
        article.news-item - контейнер с новостью
            title - заголовок
            date - дата
            text - текст
footer

Ограничение доступа к контенту

Ограничить доступ к контенту можно несколькими способами. Например, защитить изображения и перевести их в формат svg. Так их будет сложнее получить и открыть.

В качестве дополнительных вариантов защиты можно ввести доступ к информации за регистрацию или платную подписку. Так делает, например, портал РБК Pro. Это не может 100% гарантировать отсутствие копирования, но поможет быстрее и проще идентифицировать того, кто занимался воровством контента.

Запрет на копирование и вырезание

С помощью JavaScript можно также задать запрет на копирование. Например, сделать блокировку команд вроде Ctrl + C. Но гарантии, что ваш контент не украдут нет. К тоже же можно усложнить жизнь обычным пользователям. А контентокрад может отправить ссылку на страницу сайта в Telegram-бот, откуда потом получит файл. Однако это усложняет копирование и кого-то это может остановить.

Добавление источника для защиты контента

При работе с кодом страницы можно добавить функцию добавления источника при копировании. Если кто-то выделит и скопирует себе, например, фрагмент статьи, в скопированный текст автоматически добавится подпись. Еще можно поставить ссылку на сайт. Такое можно удалить, но кто-то этого делать не будет или не заметит.

Применение технологии DRM

DRM — это технология защиты видеоконтента, при которой пользователь получает ограниченный доступ к видеофайлу или online-трансляции. Такой способ поможет ограничить доступ по длительности и времени просмотра. Например, посмотреть 5-минутный фрагмент видео можно только в течении 3 месяцев.

Эта технология позволяет автоматизировать процесс предоставления доступа. Защитить материалы можно с помощью ПО от Apple, Google и Huawei.

Защита через сервисы уникального контента

Чтобы защитить текстовый контент, используйте сервисы проверок на плагиат. Например, Advego позволяет заказчикам зафиксировать уникальность и дату оплату после приемки текста на бирже и даже сгенерировать знак уникальности текста для размещения на сайте.

Но можно поступить и проще — в Advego или text.ru запустить проверку на плагиат, а потом сохранить ссылку или скриншот. Так вы сможете доказать свою правоту в случае воровства контента.

Проблема всех технических методов — способы обойти их эволюционируют еще быстрее. Так что сочетайте технические методы с другими способами защиты контента.

Юридические методы защиты контента сайта

Еще один способ защитить контент — использовать юридические методы.

Разместите на сайте знак охраны авторского права и уведомления об авторских правах

На вашем сайте вы можете установить знак Copyright. Он оповещает о принадлежащем вам исключительном праве на произведение знак охраны авторского права. Выглядит как латинская буква «C» в окружности, имени или наименовании правообладателя, года первого опубликования произведения.
Знак Copyright
Знак Copyright
Присутствие знака на сайте не создает дополнительных прав у владельца, а его отсутствие не лишает этих прав. Однако Copyright дает сигнал всем посетителям, что вы считаете себя владельцем контента и сайта и заявляете об этом.

Также вы можете разместить на сайте текстовую заметку о том, что все материалы являются объектами авторского права, а копирование без согласования запрещено и преследуется по закону. Еще можно составить пользовательское соглашение, в котором обязательно сделать указание на охрану и ответственность за нарушение авторских прав.

Пользуйтесь лицензией Creative Commons

Лицензии Creative Commons (CC) никто не выдает. Чтобы начать их использование достаточно разместить на своем сайте информацию о том, что сайт и все материалы распространяются по лицензии СС и вставить ссылку на текст конкретного типа лицензии.

Есть несколько типов лицензий CC, и если владелец сайта хочет воспользоваться одной из них, то лучше выбрать лицензию CC BY-NC-ND. Она позволяет другим распространять копию работы, не изменяя ее, и использовать её в некоммерческих целях в любой точке мира.

Лицензирование под Creative Commons не пользуется особой популярностью у владельцев сайтов в России:
это международные нормы, которые могут противоречить специфике российского законодательства;
01
их положения постоянно меняются и за ними сложно уследить;
02
03
такие лицензии являются неотзывными — это означает, что нельзя остановить кого-нибудь, кто уже начал использование произведения в соответствии с этой лицензией. Можно в любой момент прекратить распространение для новых случаев, но доказать момент начала использования крайне сложно.
Также такая лицензия дает возможность всем желающим использовать материалы сайта. А в некоторых случаях даже перерабатывать их для создания собственного сайта.

Учитывайте, что в судах или других госорганах ссылаться на использование такой лицензии будет бесполезно — российское авторское право имеет абсолютное преимущество.

Участвуйте в программах защиты авторских прав

Вы можете зарегистрировать сайт и/или его составные элементы с помощью процедуры депонирования — загрузки файлов на хранение в виртуальную ячейку. Это можно сделать с помощью распределенного реестра данных, таких как IPChain или n’RIS, а также в офисах официальных партнеров Российского авторского общества. В случаях нарушения факт депонирования поможет подтвердить, что на определенные дату и время вы уже создали спорный объект и заявили себя как автора.

Также можно зарегистрировать сайт в качестве программы для ЭВМ в Роспатенте. Это поможет защитить права разработчика на программный код. Этот способ регистрации чаще всего используют в целях продажи лицензии и наличия свидетельства для подачи документов в Реестре российского ПО и базы данных Минцифры. Это более серьезная защита, однако она не распространяется на контент сайта.

Еще можно защитить дизайн сайта с помощью получения патента на промышленный образец. Дизайнерское решение должно быть действительно уникальным в России и мире: охраняются только кардинально новые элементы или их совокупность, выделяющие сайт среди остальных. Детали, стандартные для любого сайта (шаблонные текстовые поля, слайдеры) не подлежат охране. Минус получения патента — защита распространяется только на зарегистрированный интерфейс. Если вы вносите изменения в запатентованный объект, патент теряет силу. Регистрировать придется новый внешний вид.

Что делать, если контент все же скопировали?

Если кража все же произошла, нужно доказать свое авторство и наказать виновного.

Попросите удалить ваш контент

По закону нужно хотя бы попытаться урегулировать конфликт в досудебном порядке. Напишите e-mail, отправьте заказное письмо с уведомлением по почте, призовите к совести. Иногда человек может просто не знать, что его действия незаконны. А иногда просто расчитывает на то, что никто не заметит. Тогда он предпочтет решить все мирным путем. Если вас игнорируют, можете воспользоваться и методом Mindbox — сделать конфликт публичным и использовать давление общественности.

Соберите доказательства и подготовьте документацию

Если нарушитель по каким-либо причинам отказывается устранить нарушение или игнорирует вас, то следует подготовить доказательную базу для суда. Для этого вам нужно собрать все ваши наброски, исходники, бэкстейджи и обратиться к нотариусу. Он составит протокол осмотра страниц сайта нарушителя, где укажет что факт нарушения действительно имеет место в определенные день и время. Также вы можете заверить скриншоты страниц своего сайта, чтобы впоследствии доказать, что опубликовали свою работу раньше, чем ее скопировали.

Обратитесь в суд

По закону РФ нельзя использовать чужие работы без разрешения автора или владельца прав. Если кто-то это нарушает, можно потребовать от нарушителя прекратить использование и заплатить компенсацию.

Чтобы защитить свои работы заранее, можно использовать специальные программы или знак правовой охраны. Если дело попадает в суд, нужно доказать две вещи:
что нарушитель использовал их без разрешения.
что сайт или элементы сайта принадлежат автору или владельцу прав
Если это доказывается, то автор или владелец прав может потребовать компенсацию от нарушителя.

Если контент сначала украли, а потом удалили, как его восстановить?

В реальном мире защита авторских прав редко доходит до суда. Удалили — и ладно. И нечистые на руку люди этим пользуются. Если вы не хотите потворствовать мошенникам и настроены доказать неправомерность их действий, то соберите доказательства, что контент использовали против вашей воли, а потом удалили.

Восстановите контент с использованием резервных копий

Прежде чем писать тому, кто скопировал ваш сайт, создайте резервные копии страниц его сайта. Это поможет восстановить данные, если те, кто занимается воровством контента удалят материал, и доказать вашу правоту. Например, уникальность текста. Резервные копии можно размещать на облачных хранилищах во избежание полного удаления материалов.

Восстановите контента с использованием инструментов аналитики

К сайтам на панели администратора можно подключать различные аналитики. Например, Яндекс. Метрика или Google Analytics. При удаленных данных с сайта с помощью этих сервисов можно получить доступ к контенту, если он был загружен ранее. Также если те, кто скопировал ваши материалы, захотят удалить украденный контент, его можно попробовать восстановить с помощью этих сервисов на чужом сайте.

Заключение: защитите контент со всех сторон

Нельзя использовать чужие работы без разрешения. Если кто-то скопировал ваш сайт или другой контент, вы можете остановить его и получить компенсацию через суд. Однако, чтобы кражи не произошло, защитите свои работы заранее:
Используйте уникальный стиль визуальный и текстовый стиль, который тяжело подделать;
Для иллюстраций, фото и экспертизы привлекайте собственных экспертов, а не материалы из интернета;
Используйте рандомную генерацию контента, чтобы защитить контент от кражи;
Ограничьте доступ к контенту с помощью запрета на копирование и вырезание и временных ограничений;
Разместите на сайте знак копирайта и/или депонируйте сайт в Роспатенте и других организациях;
Создайте резервную копию сайта мошенника, прежде чем обратиться в суд, чтобы доказать свою правоту.

Расскажите
о вашем проекте