محتوای کپی چیست؟ چرا همه درباره آن اشتباه می‌کنند؟

وقتی صحبت از محتوای کپی و نحوه رفتار گوگل با آن می‌شود، متخصصان سئو نظرات ضد و نقیضی به ما می‌دهند. در این‌جا مهم‌ترین سوالات را پوشش دادیم تا خودتان متوجه باورهای اشتباه Duplicate Content شوید.

می‌خواهید یک مقاله در مورد محتوای کپی یا Duplicate Content بنویسید. اما به جای این‌که خودتان دست به کار شوید و یک مقاله مفید و ارزشمند خلق کنید، با هیجان بالایی یک مقاله را از نتایج گوگل انتخاب می‌کنید و محتوای آن را در سایت خود کپی پیست می‌کنید!

تبریک می‌گوییم، ماموریت با موفقیت انجام شد. حالا یک مقاله داریم که موضوع محتوای تکراری را خوب پوشش داده ولی یک مشکل در این زمینه وجود دارد:

این محتوا در بیش از یک سایت وجود دارد.

وقتی چنین اتفاقی بیافتد، یعنی یک محتوا در بیش از یک سایت با URLهای متفاوت ظاهر شود، به آن محتوای Duplicate گفته می‌شود.

ظاهر شدن 3 نتیجه مشابه از یک سایت در صفحه نتایج

حقیقت‌هایی دردناک درباره ماهیت واقعی محتوای تکراری

  • محتوای تکراری هیچ ارزشی به سایت شما اضافه نمی‌کند
  • بر خلاف باور عموم، محتوای کپی تنها با ایجاد متن مشابه به وجود نمی‌آید
  • گوگل با دیدن چند محتوای مشابه، یکی را در صفحه نتایج نشان می‌دهد. این یعنی در صورت وجود محتوای تکراری در سایت شما، گوگل آن را ایندکس می‌کند ولی در نتایج یکی را نشان می‌دهد
  • گوگل هیچ جریمه‌ای برای محتوای کپی در نظر نگرفته است
  • مشکلات تکنیکال و فنی موجود در سایت رایج‌ترین دلیل ایجاد Duplicate Content است.
  • 25 تا 30 درصد محتوای اینترنت تکراری است!

نظر متخصصین سئو درباره Duplicate Content و رفتار گوگل نسبت به آن

وقتی صحبت از محتوای تکراری و نحوه رفتار گوگل با آن می‌شود، متخصصان سئو نظرات متنوعی به ما می‌دهند. برای این‌که با طیف گسترده‌ای از دیدگاه‌های مختلف درباره Duplicate Content آشنا شویم، در این‌جا به بررسی نقطه نظرات کارشناس‌های سئو می‌پردازیم:

  1. «محتوای کپی یکی از بحث برانگیزترین موضوعات در سئو است. شکل‌های مختلفی از محتوای کپی وجود دارد که شما باید حواستان به آن‌ها باشد چون حتی یک باگ کوچک تکنیکال در سایت شما می‌تواند باعث به وجود آمدن هزاران صفحه Duplicate در سایت شما شود.»
  2. وقتی 3 یا 4 نسخه مشابه از یک صفحه دارید، مثل این است که دارید با 3 یا 4 سایت دیگر برای کسب جایگاه مبارزه می‌کنید. این‌کار ممکن است باعث شود محتوای اصلی شما هم شانس زیادی برای کسب جایگاه نداشته باشد.
  3. اگر یک یا دو صفحه در سایت خود دارید که بخشی از محتوای آن از سایت‌های دیگر گرفته شده است، اصلاً جای نگرانی نیست. مشکل زمانی حاد می‌شود که مشکلات فنی و تکنیکال سایت شما هزاران صفحه کپی تولید می‌کنند و شما روح تان هم خبر ندارد.
  4. اصلاً می‌دانستید که حدود 25 تا 30 درصد محتوای وب، کپی است؟ فقط اگر میزان Duplicate Content سایت شما زیاد است یا شما باید فکری برای آن بکنید یا گوگل خودش دست به کار می‌شود و این مشکل را برای شما حل می‌کند.

استفاده از نظرات متخصصان به دلیل این‌که بر اساس تجربه و آزمون خطا به وجود آمده، می‌تواند مانند قطب‌نما راه درست را به ما نشان دهد. در صفحه سئو چیست می‌توانید با تعداد بیشتری از متخصصان سئو ایرانی و خارجی آشنا شوید و از نظرات متنوع آن‌ها برای پیشبرد پروژه‌های خود استفاده کنید

Duplicate Content چیست و چطور به وجود می‌آید؟

محتوای تکراری معمولاً به دو دلیل به وجود می‌آید:

عامل انسانی: منظور از عامل انسانی همان روشی است که در آن محتوای سایت‌ها به صورت عمدی از یک سایت در سایتی دیگر کپی می‌شوند مثل:

  • سایت‌های دیگری که محتوای شما را کپی می‌کنند
  • کپی کردن محتوا از سایت‌های دیگر
  • لندینگ پیج‌های صفحاتی که در گوگل ادز هستند

عامل غیرانسانی: منظور ما از عامل انسانی، مشکلات و اختلالات فنی موجود در سایت است. این مشکلات فنی به طور کل شامل موارد زیر است:

  • نسخه www سایت با نسخه بدون www / نسخه HTTP با نسخه HTTPS
  • حرف کوچک و بزرگ در URLها
  • صفحات INDEX.html و (Index.php)
  • فیلتر محصولات سایت‌های فروشگاهی
  • محتوایی که در چند دسته‌بندی وجود دارد
  • صفحات مخصوص برای تصاویر
  • صفحات مخصوص کامنت‌ها
  • سایت‌های چند زبانه
  • نتایج جستجو در داخل سایت
مثال محتوای کپی در سایت های فروشگاهی با فیلتر محصولات

3 روش ساده برای حل کردن مشکلات مربوط به محتوای کپی

حل کردن مشکلات مربوط به محتوای کپی در یک نکته خلاصه می‌شود:

اگر چند نسخه تکراری از یک نوع محتوا داشته باشید، می‌توانید با معرفی کردن یکی از آن‌ها به عنوان محتوای اصلی، مشکل محتوای تکراری سایت خود را برطرف کنید.

اجازه دهید 3 روشی که بیش‌ترین تاثیر و استفاده را در حل کردن مشکلات مربوط به Duplicate Content دارد را به شما معرفی کنیم:

1- ریدایرکت 301

استفاده از ریدایرکت 301 از نسخه کپی شده به نسخه اصلی محتوا یکی از رایج‌ترین روش‌های مدیریت محتوای تکراری است. وقتی چند صفحه با پتانسیل کسب رتبه بالا با یکدیگر ترکیب می‌شوند، این صفحات نه تنها دیگر با یکدیگر در رقابت نیستند، بلکه شانس بیشتری هم برای کسب رتبه‌های برتر در صفحه نتایج دارند. این یعنی نسخه اصلی محتوا از نظر جایگاه تقویت می‌شود.

استفاده از ریدایرکت 301 برای مقابله با محتوای کپی

اگر نمی‌دانید ریدایرکت 301 چیست و چطور باید آن را انجام داد، به شما توصیه می‌کنیم مقاله ریدایرکت 301 چیست آکادمی وبسیما را مطالعه کنید و با انواع روش‌های این نوع ریدایرکت آشنا شوید.

2- تگ “Rel=”Canonical

استفاده از تگ کنونیکال این سیگنال را به گوگل می‌دهد که یک نسخه از محتوا، نسخه اصلی است و نسخه‌های مشابه آن اهمیتی ندارند. این یعنی هر امتیازی که موتور‌های جستجو برای رتبه‌دهی در نظر می‌گیرند (مثل اعتبار لینک‌ها یا کیفیت محتوا) نباید بین نسخه‌های کپی شده پخش شود و تنها به محتوای اصلی (یعنی آن که کنونیکال است) برسد.

برای این‌کار باید تگ “Rel=”Canonical را در بخش HTML head هر صفحه‌ای که محتوای کپی دارد قرار دهید و در قسمت URL، آدرس نسخه اصلی محتوا را به همراه لینکی از آن صفحه جای‌گذاری کنید. برای کسب اطلاعات بیشتر پیشنهاد می‌کنیم به مقاله تگ کنونیکال چیست مراجعه کنید.

3- نوایندکس کردن متا ربات‌ها

استفاده از تگ نوایندکس در متا ربات‌ها به گوگل می‌گوید که محتوای صفحه مورد نظر را ایندکس نکنند. در نتیجه با ایندکس نشدن صفحه، منابع ارزشمند سایت شما مثل بودجه خزش از بین نمی‌رود. تگ “noindex,follow” هم باید در بخش head صفحه HTML قرار بگیرد.

البته یادتان باشد که این دستور باعث نمی‌شود که گوگل وارد صفحه نشود. این‌کار تنها به گوگل می‌گوید که این صفحه را در لیست نتایج جستجوی خود قرار ندهد. 

اگر تمایل دارید تا بیشتر از نظر تکنیکال سایت خود را بهبود ببخشید پیشنهاد می‌کنیم تا سری به صفحه کارگاه سئو تکنیکال بزنید.

آموزش سئو تکنیکال

استانداردهای سئو در طراحی و کدنویسی

  • 16 ساعت
  • 868 دانشجو

ارتباط محتوای تکراری به cannibalization و نحوه رفع آن

یکی از مشکلاتی که بسیاری از سایت‌ها با آن دست و پنجه نرم می‌کنند، وجود صفحات با ماهیت یکسان است. مثلاً فرض کنید که در یک دسته‌بندی، 3 مقاله با عنوان «تست روانشناسی» داریم که با این‌که به موضوعات متفاوتی از تست روانشناسی پرداخته، ولی ماهیت همه آن‌ها یکی است. در این حالت می‌گوییم که cannibalization اتفاق افتاده، اگر این عبارت برای شما تازه است پیشنهاد می‌کنیم مقاله Cannibalization چیست را مطالعه کنید.

این 3 مقاله از نگاه گوگل محتوای کپی در نظر گرفته می‌شوند و به دلیل این‌که دائم در حال رقابت با هم هستند، شانس پایینی برای کسب جایگاه دارند.

مهم‌ترین سوالات کاربران درباره محتوای تکراری یا Duplicate Content

در این‌جا به مهم‌ترین و چالش برانگیزترین سوالات کاربران درباره Duplicate Content می‌پردازیم تا دیگر هیچ نقطه ابهامی در این زمینه برای شما به وجود نیاید.

آیا محتوای کپی همیشه اجتناب پذیر است؟

گوگل به طور مستقیم اشاره کرده که تقریباً همه سایت‌ها دارای محتوای کپی هستند. مثلاً وقتی یک پاراگراف متن از کسی نقل قول می‌کنید، به طور ناخودآگاه دارید محتوای Duplicate تولید می‌کنید. پس می‌توانیم این‌طور نتیجه بگیریم که وجود محتوای تکراری در سایت به هرحال اجتناب‌ناپذیر است ولی موردی که باید نگرانتان کند این است که تعداد این محتوا از کنترل خارج شود و شما از آن بی خبر باشید!

چرا سایت‌هایی که از ما محتوا برداشتند بهتر از سایت ما جایگاه می‌گیرند؟

پاسخ کوتاه: احتمالاً گوگل محتوای شما را ایندکس نکرده.

پاسخ بلند: بعضی از سایت‌ها به دلیل نرخ بودجه پایین‌تر، دیرتر ایندکس می‌شوند. همین دیر ایندکس شدن باعث می‌شود تا گوگل به محض انتشار یک مقاله، آن را ایندکس نکند و در همین زمانی‌که صفحه جدید شما از دید گوگل پنهان مانده، سایت‌های دیگری محتوای شما را در سایت خود قرار می‌دهند. اگر سایتی که محتوای شما را کپی کرده، نرخ بودجه بهتری داشته باشد و سریع ایندکس شود، جایگاه سایت شما پایین‌تر از این سایت خواهد بود.

چرا بعضی از سایت‌هایی که محتوای کپی دارند افت نمی‌کنند؟

به عنوان مثال سایت‌های خبری از جمله سایت‌هایی هستند که محتوای خبری مشابه زیادی در آن‌ها مشاهده می‌شود. اما دلایل زیادی وجود دارد تا سایت‌هایی که محتوای کپی یا تکراری دارند در جایگاه بالا باقی بمانند. مهم‌ترین دلیل آن هم اعتبار دامنه بالا سایت‌های خبری است.

وقتی یک سایت نزد گوگل اعتبار خوبی داشته باشد و در کلمات زیادی جایگاه اول باشد، با قرار دادن Duplicate Content، گوگل به آن سایت شک نمی‌کند. اما لازم است اشاره کنیم که حتی این سایت‌های شناخته شده، در صورت تکرار این‌کار، توجه گوگل را به خود جلب می‌کنند.

چگونه به گوگل اثبات کنیم صاحب اصلی محتوا ما هستیم؟

بعد از انتشار هر مقاله، در پنل سرچ کنسول خود Request Indexing کنید. با این‌کار اگر تا حالا محتوای شما از چشم ربات‌های گوگل پنهان مانده، می‌تواند با ارسال درخواست ایندکس، ربات‌های گوگل را از محتوای جدید خود با خبر کنید. به شما پیشنهاد می‌کنم مقاله URL Inspection را مطالعه کنید تا سریع‌ترین راه ایندکس دستی صفحه در گوگل را بهتر بشناسید.

امین اسماعیلی

امین اسماعیلی هستم، فارغ التحصیل مقطع کارشناسی ارشد از دانشگاه تهران و مدیر فنی آژانس خلاقیت وبسیما. از سال 91 تمرکز خود را بر روی مباحث روز سئو و طراحی سایت قرار داده و پس از کسب تجربه و دانش ارزشمند تصمیم گرفتم تا ثمره آن را با دیگران به اشتراک بگذارم.