Подпишитесь

И получайте новые статьи блога на Ваш e-mail:

Мы против спама
Нет, спасибо!

Про неуникальный контент и воровство уникального контента

26 сентября 2014
Просмотров: 1 008

Ворованный уникальный и неуникальный контент

Значимость контента сложно переоценить. Если на сайте размещено большое количество качественного контента, то сайт обречен на успех. Но все было бы хорошо, если бы не одно но: контент должен быть свой. Свой, уникальный, интересный и полезный. И вот на слове «уникальный» срезается 90% тех, кто открыл для себя всю прелесть контента.

И правда, зачем что-то придумывать, если все уже придумано? Интернет большой, и там все уже написано, зачем изобретать велосипед? Берем кусочек текста из Википедии, пучок абзацев с сайта конкурентов, щепотку красивых фраз с сайтов из топа поисковой выдачи и украшаем фотографиями из Google Картинок. Ссылки на источники? Не-не, слышал. Вот и все, статья готова. Добро пожаловать, в мир современного копирайтинга!

Уникальный контент

Уникальный контент — основа интернета. Есть еще коммуникация, но эта тема выходит за рамки части SEO. То есть пользователи интернета, не считая возможность пообщаться, заходят в интернет, чтобы получить доступ к какому-то интересующей их информации. Поиск контента — это именно то, для чего существуют поисковые системы, и то, что поисковые системы ценят превыше всего. Яндекс открыто говорит, что главное для Яндекса — контент. Аналогия для Google — «Content is King». Соответственно, поисковые системы больше всего ценят тех, кто регулярно поставляет уникальный и актуальный контент.

Вопрос, что считать уникальным контентом, уже давно будоражит фантазии людей, которые хотят защитить свои интеллектуальные права или хотят нажиться на чужих трудах. Не хочу влезать в полемику, но создать что-то с нуля практически невозможно. Чтобы что-то создать, нужно создать это из чего-то. То есть, в любом случае, новое появляется на базе чего-то уже существующего, и заявлять: «Это создал Я!», по меньшей мере странно.

Однако это совсем не значит, что труд, время и силы не должны вознаграждаться и тем более заимствоваться. Поэтому вопрос стоит не столько в защите прав и даже не в создании сложностей для использования чужого контента, а в ускорении и упрощении его индексации, то есть в признании контента за вами как за первоисточником.

Неуникальные тексты

Контент оценивается с точки зрения потенциальной применимости и пользы, которую этот контент может принести. Но если мы говорим о контенте с точки зрения поисковых систем, то к потенциальной применимости контента добавляется еще и УНИКАЛЬНОСТЬ контента. Следовательно, напрашивается вопрос, кто определяет уникальность контента? Действительно, ведь уникальность контента — понятие сравнительное.

Так кто же, как, что и с чем сравнивает? Сравнивают поисковые системы, сравнивают новый контент с уже проиндексированным. Грубо говоря, у кого текст проиндексировался первым, у того он и оригинален. Повторюсь, грубо говоря, первоисточником контента считается тот ресурс, на котором этот контент был впервые обнаружен. Грубо потому, что к различным видам контента применяются различные способы анлиза для определения первоисточника. Можно допустить, что первоисточник контента может меняться в зависимости от накопленных о контенте и источниках контента данных и состояния этих источников.

Неуникальные картинки

Возьмем, к примеру, изображения. Сегодня поисковая система нашла новую картинку с разрешением 640х480 на одном сайте, а завтра ту же самую картинку с большим разрешением 800х600 на другом сайте. Кто первоисточник? Это зависит от огромного числа факторов и, собственно, самой поисковой системы, которая нашла эти картинки.

Контент в интернете выкладывается в свободное пользование, и все пользователи могут делать с этим контентом все, что им захочется. Это так, по сути. Конечно, кто-то может заявить, что это его картинка, и начать разбирательство по поводу неправомерного использования авторского материала. Но сама возможность пользоваться этим контентом никуда не денется.

Потому никто не может быть уверен в том, что за 100% контента, который он создает, будет признано 100% его авторства. И значок © не поможет.

Ворованый контент

Тексты воруют. Фотографии, картинки и все виды изображений тоже воруют. Видео воруют. Музыку воруют. Еще воруют нефть, газ, лес, людей, морских котиков, любовь, свободу и независимость. Все воруют. Это нужно понять, принять и подумать, как этому противостоять, тем более, что тут за вас уже действительно подумали и придумали. Почему бы не воспользоваться? 🙂

Не буду перечислять все возможные способы борьбы с воровством контента (если очень хотите, пишите в комментариях, можно написать об этом отдельную статью). Я постараюсь объяснить общие принципы размещения и первичной защиты контента в интернете.

Основные принципы

Первый и самый важный принцип — это максимальная уникальность контента. Понятно, что букв в алфавите ограниченное количество, а цвета всего три (ок, еще есть черный и белый). Но, в каждом тексте есть уникальная логическая структура и, если текст пишет человек, то логическая структура и манера написания становятся уникальным отпечатком. А создать две абсолютно идентичные фотографи невозможно.

Вывод: создавая контент самостоятельно, вероятность существенных совпадений стремится к нулю.

Второй важный принцип — скорость индексации. Чем быстрее поисковая система найдет и проиндексирует контент, тем быстрее будет определен его источник. Например, вы активно ведете блог, но поисковые системы по тем или иным причинам плохо индексируют ваш сайт. Кто то, у кого сайт индексируется лучше (быстрее) начинает банальным копипастом воровать ваш контент и размещать на своем сайте. Если ваш контент проиндексируется быстрее на чужом сайте — это не ваш контент. С точки зрения поисковых систем, первоисточником будет считаться тот сайт, на котором впервые будет найдена ваша статья. А вы, получается, украли статью.

Вывод: высокая скорость индексации — ваш лучший друг.

Яндекс.Вебмастер — Оригинальные тексты

Это сервис, с помощью которого можно сообщить Яндексу о появлении оригинального текста на сайте.

Цитата:
 Если вы публикуете на своем сайте оригинальные тексты, а их перепечатывают другие интернет-ресурсы, предупредите Яндекс о скором выходе текста. Мы будем знать, что оригинальный текст впервые появился именно на вашем сайте, и попробуем использовать это в настройке поисковых алгоритмов.

Существует множество способов воспрепятствовать неправомерному использованию вашего контента. Но на каждый из них есть несколько способов их обойти. И если известно, что кто-то систематически ворует ваш контент, вы можете потребовать удалить ваш контент со стороннего сайта или начать разбирательство. Но практика показывает, что если сторонний ресурс не удалит контент добравольно, то попытка добиться этого через суд, может стоить дороже, чем ущерб от кражи котнтета.

Размещайте собственный уникальный контент. Думайте, как, когда и где размещать контент. И будет вам счастье 🙂

Получите новые статьи блога на ваш e-mail:

Похожие статьи:

Добавить комментарий (8)

Войти с помощью: 
  1. Сергей Бурых

    Здравствуйте!
    Пример: Я — стартапер. открыл интернет-магазин, в первое время у меня нет физической возможности размещать уникальный контент. И я конечно делаю бааальшой копипаст. Но, к примеру, дела пошли в гору, у меня появились ресурсы, и я решил улучшить ситуацию. И начал планомерно ну хотя бы рерайтить тексты. Будут ли поисковики их индексировать?
    И ещё вопрос, а какой процент уникальности можно считать годным? например 70% — этого достаточно, или надо 99, не меньше?
    спасибо)

    1. 1. «…у меня нет физической возможности размещать уникальный контент». Если сайту нечего предложить поисковой системе, тогда ему нечего делать в поисковой выдаче.
      2. «… начал планомерно ну хотя бы рерайтить тексты. Будут ли поисковики их индексировать?». Поисковики будут индексировать в любом случае.
      3. «… какой процент уникальности…». Процент относительно чего? Вы точно знаете, как поисковые системы определяют уникальность текста на сайте и как это выразить в процентах?
      4. «… можно считать годным? например 70% — этого достаточно…». «Годным» и «достаточно» для чего?

      Исходя из примера, который Вы привели: Вы пытаетесь заткнуть дыру в сайте под модным названием SEO, не вполне понимая что это и зачем. SEO — это большой комплекс взаимосвязанных факторов и один только рерайт текстов погоды не сделает.

      1. Сергей Бурых

        Я понимаю, что сео-дыра большая, и факторов, влияющих на её размер, много. И работа над ними идёт. Давайте возьмём гипотетическую ситуацию, что все технические моменты более-менее решены. Но контент остался прежним, то есть неуникальным. Вот я беру, рерайчу текст, проверяю его на Адвего Плагиатусе, или другим способом, и программа мне выдаёт, что уникальность 70%. И выделяет участки текста, которые уже есть на других сайтах. И вот тут я как раз хотел задать вопрос профессионалам: «как поисковые системы определяют уникальность текста на сайте и как это выразить в процентах?» Я понимаю, что эти алгоритмы неизвестны наверное. Но я хотя бы принцип понять хочу. А «годный», это значит , что текст воспринимается поисковыми системами как уникальный. Сумбур получился, но надеюсь понятно хоть чуть-чуть)

        1. Не существует четкой величины которая могла бы характеризовать оригинальность конкретного текста глазами поисковой системы. Поэтому, смысла заострять внимание на этом нет. То есть, буквально мы не должны задумываться об оригинальности контента, если источником контента являемся мы сами. Это значит, что рерайт текста как вольный пересказ, может считаться оригинальным. Выявление процентного соответствия с исходным текстом — это хорошо, так как позволяет дальше отойти от исходника. Но тут тоже не так все просто. Поисковые системы вроде Google или Яндекс прекрасно распознают синонимизацию и читают логику текста. В идеале, при рерайте должны меняться логические конструкции в тексте, а вместо синонимов лучше использовать логические синонимы (всегда можно описать одно и то же разными словами и с разным смыслом). Google где-то писал, что для него важно не столько уникальность текста, сколько уникальное мнение, которое человек выражает используя текст. Поэтому, я написал выше про ВОЛЬНЫЙ пересказ источника, а именно персонализированный рерайт. В рамках интернет-магазина, задача может быть сложнее, так как объем текстовых описаний, обычно невелик и в них сложно выразить оригинальность. Но суть подхода не меняется. Если вы сделаете оригинальные, необычные и более информативные текстовые описания, вы однозначно увидите, что они будут лучше ранжироваться чем стандартные описания конкурентов.

  2. Варвара Билалова

    У меня такой вопрос. Подготовила сайт. Написала около 2000 уникальных статей. Осталось лишь запустить все в работу. Сервисом Яндекса я пользоваться не могу, так как у них указано, что он доступен для сайтов с ТИЦ не меньше 10. Т.е. самыми незащищёнными остаются именно новички, те, кому эта защита нужна как воздух.. Мой контент стырят и все пол года активной подготовки пойдут псу под хвост? Читала советы про пинги и про то, что меня дико должен возлюбить быстроробот. Но при этом постоянно натыкаюсь на разных форумах отмазы от яндекса и гугла, что они не отвечают за авторство контента. Т.е. по сути никто на данный момент не может предложить более или менее действенную схему защиты уникальности контента. Прочла на двух сайтах такие советы, которые вроде бы помогали новичкам:
    1. До повышения ТИЦ до 10 писать всякую фигню от 2000 збп, но не выкладывать серьёзные статьи (на мой взгляд, сомнительно, но люди утверждают, что это работает).
    2. Нигде не светить сайт до того как яндекс и гугл проиндексируют страницы, т.е. по сути создать сайт выложить туда весь контент и до индексации «забыть» о его существовании.
    Вот Вы когда создавали блог, каким образом начинали? И что думаете по поводу вышеописанных методов защиты?

    1. Анастасия Богуш

      Добрый день, Варвара!
      На самом деле у многих сайтов имеющих ТИЦ меньше 10 есть возможность добавления оригинальных текстов, так же было и с нашим блогом.
      Однако если для вас она пока все же недоступна, вы можете сообщить Яндексу о появлении новой страницы на сайте с помощью сервиса «Добавить URL» по этой ссылке: https://webmaster.yandex.ru/addurl.xml это не будет являться 100% гарантией защиты, но если вы будете делать это регулярно при появлении нового контента то робот будет заходить к вам чаще

Наверх