ConvertMonster › Блог › SEO › Про неуникальный контент и воровство уникального контента
Про неуникальный контент и воровство уникального контента
Convertmonster
26.09.2014
14 084
Значимость контента сложно переоценить. Если на сайте размещено большое количество качественного контента, то сайт обречен на успех. Но все было бы хорошо, если бы не одно но: контент должен быть свой. Свой, уникальный, интересный и полезный. И вот на слове «уникальный» срезается 90% тех, кто открыл для себя всю прелесть контента.
И правда, зачем что-то придумывать, если все уже придумано? Интернет большой, и там все уже написано, зачем изобретать велосипед? Берем кусочек текста из Википедии, пучок абзацев с сайта конкурентов, щепотку красивых фраз с сайтов из топа поисковой выдачи и украшаем фотографиями из Google Картинок. Ссылки на источники? Не-не, слышал. Вот и все, статья готова. Добро пожаловать, в мир современного копирайтинга!
Уникальный контент
Уникальный контент - основа интернета. Есть еще коммуникация, но эта тема выходит за рамки части SEO. То есть пользователи интернета, не считая возможность пообщаться, заходят в интернет, чтобы получить доступ к какому-то интересующей их информации. Поиск контента - это именно то, для чего существуют поисковые системы, и то, что поисковые системы ценят превыше всего. Яндекс открыто говорит, что главное для Яндекса - контент. Аналогия для Google - «Content is King». Соответственно, поисковые системы больше всего ценят тех, кто регулярно поставляет уникальный и актуальный контент.
Вопрос, что считать уникальным контентом, уже давно будоражит фантазии людей, которые хотят защитить свои интеллектуальные права или хотят нажиться на чужих трудах. Не хочу влезать в полемику, но создать что-то с нуля практически невозможно. Чтобы что-то создать, нужно создать это из чего-то. То есть, в любом случае, новое появляется на базе чего-то уже существующего, и заявлять: «Это создал Я!», по меньшей мере странно.
Однако это совсем не значит, что труд, время и силы не должны вознаграждаться и тем более заимствоваться. Поэтому вопрос стоит не столько в защите прав и даже не в создании сложностей для использования чужого контента, а в ускорении и упрощении его индексации, то есть в признании контента за вами как за первоисточником.
Неуникальные тексты
Контент оценивается с точки зрения потенциальной применимости и пользы, которую этот контент может принести. Но если мы говорим о контенте с точки зрения поисковых систем, то к потенциальной применимости контента добавляется еще и УНИКАЛЬНОСТЬ контента. Следовательно, напрашивается вопрос, кто определяет уникальность контента? Действительно, ведь уникальность контента - понятие сравнительное.
Так кто же, как, что и с чем сравнивает? Сравнивают поисковые системы, сравнивают новый контент с уже проиндексированным. Грубо говоря, у кого текст проиндексировался первым, у того он и оригинален. Повторюсь, грубо говоря, первоисточником контента считается тот ресурс, на котором этот контент был впервые обнаружен. Грубо потому, что к различным видам контента применяются различные способы анлиза для определения первоисточника. Можно допустить, что первоисточник контента может меняться в зависимости от накопленных о контенте и источниках контента данных и состояния этих источников.
Тексты воруют. Фотографии, картинки и все виды изображений тоже воруют. Видео воруют. Музыку воруют. Еще воруют нефть, газ, лес, людей, морских котиков, любовь, свободу и независимость. Все воруют. Это нужно понять, принять и подумать, как этому противостоять, тем более, что тут за вас уже действительно подумали и придумали. Почему бы не воспользоваться? 🙂
Не буду перечислять все возможные способы борьбы с воровством контента (если очень хотите, пишите в комментариях, можно написать об этом отдельную статью). Я постараюсь объяснить общие принципы размещения и первичной защиты контента в интернете.
Основные принципы
Первый и самый важный принцип - это максимальная уникальность контента. Понятно, что букв в алфавите ограниченное количество, а цвета всего три (ок, еще есть черный и белый). Но, в каждом тексте есть уникальная логическая структура и, если текст пишет человек, то логическая структура и манера написания становятся уникальным отпечатком. А создать две абсолютно идентичные фотографи невозможно.
Вывод: создавая контент самостоятельно, вероятность существенных совпадений стремится к нулю.
Второй важный принцип - скорость индексации. Чем быстрее поисковая система найдет и проиндексирует контент, тем быстрее будет определен его источник. Например, вы активно ведете блог, но поисковые системы по тем или иным причинам плохо индексируют ваш сайт. Кто то, у кого сайт индексируется лучше (быстрее) начинает банальным копипастом воровать ваш контент и размещать на своем сайте. Если ваш контент проиндексируется быстрее на чужом сайте - это не ваш контент. С точки зрения поисковых систем, первоисточником будет считаться тот сайт, на котором впервые будет найдена ваша статья. А вы, получается, украли статью.
Вывод: высокая скорость индексации - ваш лучший друг.
Яндекс.Вебмастер - Оригинальные тексты
Это сервис, с помощью которого можно сообщить Яндексу о появлении оригинального текста на сайте.
Цитата:
Если вы публикуете на своем сайте оригинальные тексты, а их перепечатывают другие интернет-ресурсы, предупредите Яндекс о скором выходе текста. Мы будем знать, что оригинальный текст впервые появился именно на вашем сайте, и попробуем использовать это в настройке поисковых алгоритмов.
Существует множество способов воспрепятствовать неправомерному использованию вашего контента. Но на каждый из них есть несколько способов их обойти. И если известно, что кто-то систематически ворует ваш контент, вы можете потребовать удалить ваш контент со стороннего сайта или начать разбирательство. Но практика показывает, что если сторонний ресурс не удалит контент добравольно, то попытка добиться этого через суд, может стоить дороже, чем ущерб от кражи котнтета.
Размещайте собственный уникальный контент. Думайте, как, когда и где размещать контент. И будет вам счастье 🙂
Здравствуйте!
Пример: Я — стартапер. открыл интернет-магазин, в первое время у меня нет физической возможности размещать уникальный контент. И я конечно делаю бааальшой копипаст. Но, к примеру, дела пошли в гору, у меня появились ресурсы, и я решил улучшить ситуацию. И начал планомерно ну хотя бы рерайтить тексты. Будут ли поисковики их индексировать?
И ещё вопрос, а какой процент уникальности можно считать годным? например 70% — этого достаточно, или надо 99, не меньше?
спасибо)
1. «…у меня нет физической возможности размещать уникальный контент». Если сайту нечего предложить поисковой системе, тогда ему нечего делать в поисковой выдаче.
2. «… начал планомерно ну хотя бы рерайтить тексты. Будут ли поисковики их индексировать?». Поисковики будут индексировать в любом случае.
3. «… какой процент уникальности…». Процент относительно чего? Вы точно знаете, как поисковые системы определяют уникальность текста на сайте и как это выразить в процентах?
4. «… можно считать годным? например 70% — этого достаточно…». «Годным» и «достаточно» для чего?
Исходя из примера, который Вы привели: Вы пытаетесь заткнуть дыру в сайте под модным названием SEO, не вполне понимая что это и зачем. SEO — это большой комплекс взаимосвязанных факторов и один только рерайт текстов погоды не сделает.
Я понимаю, что сео-дыра большая, и факторов, влияющих на её размер, много. И работа над ними идёт. Давайте возьмём гипотетическую ситуацию, что все технические моменты более-менее решены. Но контент остался прежним, то есть неуникальным. Вот я беру, рерайчу текст, проверяю его на Адвего Плагиатусе, или другим способом, и программа мне выдаёт, что уникальность 70%. И выделяет участки текста, которые уже есть на других сайтах. И вот тут я как раз хотел задать вопрос профессионалам: «как поисковые системы определяют уникальность текста на сайте и как это выразить в процентах?» Я понимаю, что эти алгоритмы неизвестны наверное. Но я хотя бы принцип понять хочу. А «годный», это значит , что текст воспринимается поисковыми системами как уникальный. Сумбур получился, но надеюсь понятно хоть чуть-чуть)
Не существует четкой величины которая могла бы характеризовать оригинальность конкретного текста глазами поисковой системы. Поэтому, смысла заострять внимание на этом нет. То есть, буквально мы не должны задумываться об оригинальности контента, если источником контента являемся мы сами. Это значит, что рерайт текста как вольный пересказ, может считаться оригинальным. Выявление процентного соответствия с исходным текстом — это хорошо, так как позволяет дальше отойти от исходника. Но тут тоже не так все просто. Поисковые системы вроде Google или Яндекс прекрасно распознают синонимизацию и читают логику текста. В идеале, при рерайте должны меняться логические конструкции в тексте, а вместо синонимов лучше использовать логические синонимы (всегда можно описать одно и то же разными словами и с разным смыслом). Google где-то писал, что для него важно не столько уникальность текста, сколько уникальное мнение, которое человек выражает используя текст. Поэтому, я написал выше про ВОЛЬНЫЙ пересказ источника, а именно персонализированный рерайт. В рамках интернет-магазина, задача может быть сложнее, так как объем текстовых описаний, обычно невелик и в них сложно выразить оригинальность. Но суть подхода не меняется. Если вы сделаете оригинальные, необычные и более информативные текстовые описания, вы однозначно увидите, что они будут лучше ранжироваться чем стандартные описания конкурентов.
У меня такой вопрос. Подготовила сайт. Написала около 2000 уникальных статей. Осталось лишь запустить все в работу. Сервисом Яндекса я пользоваться не могу, так как у них указано, что он доступен для сайтов с ТИЦ не меньше 10. Т.е. самыми незащищёнными остаются именно новички, те, кому эта защита нужна как воздух.. Мой контент стырят и все пол года активной подготовки пойдут псу под хвост? Читала советы про пинги и про то, что меня дико должен возлюбить быстроробот. Но при этом постоянно натыкаюсь на разных форумах отмазы от яндекса и гугла, что они не отвечают за авторство контента. Т.е. по сути никто на данный момент не может предложить более или менее действенную схему защиты уникальности контента. Прочла на двух сайтах такие советы, которые вроде бы помогали новичкам:
1. До повышения ТИЦ до 10 писать всякую фигню от 2000 збп, но не выкладывать серьёзные статьи (на мой взгляд, сомнительно, но люди утверждают, что это работает).
2. Нигде не светить сайт до того как яндекс и гугл проиндексируют страницы, т.е. по сути создать сайт выложить туда весь контент и до индексации «забыть» о его существовании.
Вот Вы когда создавали блог, каким образом начинали? И что думаете по поводу вышеописанных методов защиты?
Добрый день, Варвара!
На самом деле у многих сайтов имеющих ТИЦ меньше 10 есть возможность добавления оригинальных текстов, так же было и с нашим блогом.
Однако если для вас она пока все же недоступна, вы можете сообщить Яндексу о появлении новой страницы на сайте с помощью сервиса «Добавить URL» по этой ссылке: https://webmaster.yandex.ru/addurl.xml это не будет являться 100% гарантией защиты, но если вы будете делать это регулярно при появлении нового контента то робот будет заходить к вам чаще
Хорошие статьи у Вас, особенно для таких пионеров в сайтостроении, как я. НО!!!! Господа монстры конвертации, наймите редакторов, чтобы тексты перечитывали внимательно. Частенько очепячтки и неуместные запятые встречаются. Это портит общее впечатление от сайта. Цитата: чтобы получить доступ к какому-то интересующей их информации. Пример 2: «кто то» пишется через дефис.
«Яндекс открыто говорит, что главное для Яндекса — контент»…»больше всего ценят тех, кто регулярно поставляет уникальный и актуальный контент»… Не вижу ни чего общего с «контент» и «уникальный контент», «уникальный», это свойство этого самого контента. Яндексу, да и всем другим поисковикам важна польза и востребованность контента для пользователей. Если Вы внимательно почитаете интервью ведущих специалистов Яндекса и Google, то будете удивлены, что никто из них и ни когда не использовал в интервью такие слова как: «Уникальный».
Как считаете, что самое важное для поисковиков? Кол-во их пользователей, которое приносит им прибыль.
Что самое главное для сайта? Кол-во пользователей, которое приносит им прибыль.
Сайтов миллионы, что бы урвать лакомый кусочек, нужно быть на голову выше конкурентов, во всем. Уникальный контент — одно из средств получения желаемого.
Вот такой грузинский тост получился.
Этот веб-сайт использует файлы cookie, чтобы улучшить вашу работу во время навигации по веб-сайту. Из них файлы cookie, которые классифицируются как необходимые, хранятся в вашем браузере, поскольку они необходимы для работы основных функций веб-сайта. Мы также используем сторонние файлы cookie, которые помогают нам анализировать и понимать, как вы используете этот веб-сайт. Эти файлы cookie будут храниться в вашем браузере только с вашего согласия. У вас также есть возможность отказаться от этих файлов cookie. Но отказ от некоторых из этих файлов cookie может повлиять на ваш опыт просмотра.
Необходимые файлы cookie абсолютно необходимы для правильной работы веб-сайта. Эти файлы cookie анонимно обеспечивают основные функции и функции безопасности веб-сайта.
Cookie
Duration
Description
cookielawinfo-checkbox-analytics
11 months
Этот файл cookie устанавливается подключаемым модулем GDPR Cookie Consent. Файл cookie используется для хранения согласия пользователя на использование файлов cookie в категории «Аналитика».
cookielawinfo-checkbox-functional
11 months
Cookie-файл устанавливается в соответствии с GDPR, чтобы записать согласие пользователя на использование cookie-файлов в категории «Функциональные».
cookielawinfo-checkbox-necessary
11 months
Этот файл cookie устанавливается подключаемым модулем GDPR Cookie Consent. Файлы cookie используются для хранения согласия пользователя на файлы cookie в категории «Необходимые».
cookielawinfo-checkbox-others
11 months
Этот файл cookie устанавливается подключаемым модулем GDPR Cookie Consent. Файл cookie используется для хранения согласия пользователя на использование файлов cookie в категории «Другое».
cookielawinfo-checkbox-performance
11 months
Этот файл cookie устанавливается подключаемым модулем GDPR Cookie Consent. Файл cookie используется для хранения согласия пользователя на использование файлов cookie в категории «Производительность».
viewed_cookie_policy
11 months
Файл cookie устанавливается подключаемым модулем GDPR Cookie Consent и используется для хранения информации о том, согласился ли пользователь на использование файлов cookie. Он не хранит никаких личных данных.
Функциональные файлы cookie помогают выполнять определенные функции, такие как совместное использование содержимого веб-сайта в социальных сетях, сбор отзывов и другие сторонние функции.
Файлы cookie производительности используются для понимания и анализа ключевых показателей производительности веб-сайта, что помогает улучшить пользовательский интерфейс для посетителей.
Аналитические файлы cookie используются для понимания того, как посетители взаимодействуют с веб-сайтом. Эти файлы cookie помогают предоставить информацию о таких показателях, как количество посетителей, показатель отказов, источник трафика и т.д.
Рекламные файлы cookie используются для предоставления посетителям релевантной рекламы и маркетинговых кампаний. Эти файлы cookie отслеживают посетителей на веб-сайтах и собирают информацию для предоставления персонализированной рекламы.
Комментарии
Здравствуйте!
Пример: Я — стартапер. открыл интернет-магазин, в первое время у меня нет физической возможности размещать уникальный контент. И я конечно делаю бааальшой копипаст. Но, к примеру, дела пошли в гору, у меня появились ресурсы, и я решил улучшить ситуацию. И начал планомерно ну хотя бы рерайтить тексты. Будут ли поисковики их индексировать?
И ещё вопрос, а какой процент уникальности можно считать годным? например 70% — этого достаточно, или надо 99, не меньше?
спасибо)
1. «…у меня нет физической возможности размещать уникальный контент». Если сайту нечего предложить поисковой системе, тогда ему нечего делать в поисковой выдаче.
2. «… начал планомерно ну хотя бы рерайтить тексты. Будут ли поисковики их индексировать?». Поисковики будут индексировать в любом случае.
3. «… какой процент уникальности…». Процент относительно чего? Вы точно знаете, как поисковые системы определяют уникальность текста на сайте и как это выразить в процентах?
4. «… можно считать годным? например 70% — этого достаточно…». «Годным» и «достаточно» для чего?
Исходя из примера, который Вы привели: Вы пытаетесь заткнуть дыру в сайте под модным названием SEO, не вполне понимая что это и зачем. SEO — это большой комплекс взаимосвязанных факторов и один только рерайт текстов погоды не сделает.
Я понимаю, что сео-дыра большая, и факторов, влияющих на её размер, много. И работа над ними идёт. Давайте возьмём гипотетическую ситуацию, что все технические моменты более-менее решены. Но контент остался прежним, то есть неуникальным. Вот я беру, рерайчу текст, проверяю его на Адвего Плагиатусе, или другим способом, и программа мне выдаёт, что уникальность 70%. И выделяет участки текста, которые уже есть на других сайтах. И вот тут я как раз хотел задать вопрос профессионалам: «как поисковые системы определяют уникальность текста на сайте и как это выразить в процентах?» Я понимаю, что эти алгоритмы неизвестны наверное. Но я хотя бы принцип понять хочу. А «годный», это значит , что текст воспринимается поисковыми системами как уникальный. Сумбур получился, но надеюсь понятно хоть чуть-чуть)
Не существует четкой величины которая могла бы характеризовать оригинальность конкретного текста глазами поисковой системы. Поэтому, смысла заострять внимание на этом нет. То есть, буквально мы не должны задумываться об оригинальности контента, если источником контента являемся мы сами. Это значит, что рерайт текста как вольный пересказ, может считаться оригинальным. Выявление процентного соответствия с исходным текстом — это хорошо, так как позволяет дальше отойти от исходника. Но тут тоже не так все просто. Поисковые системы вроде Google или Яндекс прекрасно распознают синонимизацию и читают логику текста. В идеале, при рерайте должны меняться логические конструкции в тексте, а вместо синонимов лучше использовать логические синонимы (всегда можно описать одно и то же разными словами и с разным смыслом). Google где-то писал, что для него важно не столько уникальность текста, сколько уникальное мнение, которое человек выражает используя текст. Поэтому, я написал выше про ВОЛЬНЫЙ пересказ источника, а именно персонализированный рерайт. В рамках интернет-магазина, задача может быть сложнее, так как объем текстовых описаний, обычно невелик и в них сложно выразить оригинальность. Но суть подхода не меняется. Если вы сделаете оригинальные, необычные и более информативные текстовые описания, вы однозначно увидите, что они будут лучше ранжироваться чем стандартные описания конкурентов.
спасибо:)
И Вам за активность:)
У меня такой вопрос. Подготовила сайт. Написала около 2000 уникальных статей. Осталось лишь запустить все в работу. Сервисом Яндекса я пользоваться не могу, так как у них указано, что он доступен для сайтов с ТИЦ не меньше 10. Т.е. самыми незащищёнными остаются именно новички, те, кому эта защита нужна как воздух.. Мой контент стырят и все пол года активной подготовки пойдут псу под хвост? Читала советы про пинги и про то, что меня дико должен возлюбить быстроробот. Но при этом постоянно натыкаюсь на разных форумах отмазы от яндекса и гугла, что они не отвечают за авторство контента. Т.е. по сути никто на данный момент не может предложить более или менее действенную схему защиты уникальности контента. Прочла на двух сайтах такие советы, которые вроде бы помогали новичкам:
1. До повышения ТИЦ до 10 писать всякую фигню от 2000 збп, но не выкладывать серьёзные статьи (на мой взгляд, сомнительно, но люди утверждают, что это работает).
2. Нигде не светить сайт до того как яндекс и гугл проиндексируют страницы, т.е. по сути создать сайт выложить туда весь контент и до индексации «забыть» о его существовании.
Вот Вы когда создавали блог, каким образом начинали? И что думаете по поводу вышеописанных методов защиты?
Добрый день, Варвара!
На самом деле у многих сайтов имеющих ТИЦ меньше 10 есть возможность добавления оригинальных текстов, так же было и с нашим блогом.
Однако если для вас она пока все же недоступна, вы можете сообщить Яндексу о появлении новой страницы на сайте с помощью сервиса «Добавить URL» по этой ссылке: https://webmaster.yandex.ru/addurl.xml это не будет являться 100% гарантией защиты, но если вы будете делать это регулярно при появлении нового контента то робот будет заходить к вам чаще
Хорошие статьи у Вас, особенно для таких пионеров в сайтостроении, как я. НО!!!! Господа монстры конвертации, наймите редакторов, чтобы тексты перечитывали внимательно. Частенько очепячтки и неуместные запятые встречаются. Это портит общее впечатление от сайта. Цитата: чтобы получить доступ к какому-то интересующей их информации. Пример 2: «кто то» пишется через дефис.
Даа, есть такой косяк с орфографией и пунктуацией(
«Яндекс открыто говорит, что главное для Яндекса — контент»…»больше всего ценят тех, кто регулярно поставляет уникальный и актуальный контент»… Не вижу ни чего общего с «контент» и «уникальный контент», «уникальный», это свойство этого самого контента. Яндексу, да и всем другим поисковикам важна польза и востребованность контента для пользователей. Если Вы внимательно почитаете интервью ведущих специалистов Яндекса и Google, то будете удивлены, что никто из них и ни когда не использовал в интервью такие слова как: «Уникальный».
Как считаете, что самое важное для поисковиков? Кол-во их пользователей, которое приносит им прибыль.
Что самое главное для сайта? Кол-во пользователей, которое приносит им прибыль.
Сайтов миллионы, что бы урвать лакомый кусочек, нужно быть на голову выше конкурентов, во всем. Уникальный контент — одно из средств получения желаемого.
Вот такой грузинский тост получился.