الگوریتم SpamBrain؛ هوش مصنوعی در تقابل با اسپم

SpamBrain که در فارسی می‌توان به نوعی آن را معادل واژه هرزنامه دانست؛ سیستم مبارزه با محتوای اسپم است که از سال 2108 توسط گوگل معرفی شده و تا امروز در حال به‌روزرسانی و اثرگذاری بر نتایج جستجو است. این الگوریتم از هوش مصنوعی برای یادگیری و جریمه سایت‌ها بهره می‌برد.

الگوریتم اسپم برین چیست؟

هدف اصلی این الگوریتم مبارزه با انواع روش‌های اسپمینگ در فضای وب است و طیف گسترده‌ای از صفحات وب و اقدامات سئو کلاه سیاه را تحت پوشش دارد. شاید بتوان گفت که اسپم برین ترکیبی از الگوریتم‌های پنگوئن، پاندا و … است که با نام جدیدی معرفی شده‌اند.

این الگوریتم طی 3 سال اخیر همواره بخش مهمی از آپدیت‌های گوگل بوده و تا اکتبر 2023، 6 به‌روزرسانی (اعلام رسمی گوگل) را تجربه کرده است. جالب است بدانید که تمرکز این الگوریتم تنها بر لینک سازی خارجی نیست و بیشتر تکنیک‌های قدیمی و نوین که برای فریب گوگل استفاده می‌شوند را در بر می‌گیرد.

مهمترین اقداماتی که از نظر گوگل Spam شناخته می‌شود عبارتند از:

Cloaking؛ نمایش محتوای متفاوت به گوگل و کاربر

Cloaking یکی از قدیمی‌ترین تکنیک‌های سئو کلاه سیاه است که با استفاده از آن محتوای نمایش داده شده به کاربر کاملا متفاوت با چیزی است که در دسترس ربات‌های گوگل قرار دارد.

به مثال‌های خود گوگل در مورد این تکنیک دقت کنیم:

  • نمایش یک صفحه با محتوایی در مورد مسیرهای گردشگری و سفر به گوگل ولی پیشنهاد خرید دارو و مواد به کاربر
  • درج لینک یا متن در محتوای صفحه تنها زمانیکه ربات گوگل در حال بررسی آن است (به کاربر نمایش داده نمی‌شود)

در مواردی ممکن است مشکلات تکنیکال (به ویژه برای سایت‌های جاوااسکریپت) نیز بدون قصد قبلی چنین شرایطی رخ دهد در نتیجه بهتر است برای چنین سایت‌هایی حتما از مشورت یک متخصص سئو استفاده شود.

از طرفی ممکن است این کار توسط خود شما انجام نشود و کسی که سایت را هک کرده از چنین تکنیکی برای تغییر محتوای سایت و لینک‌سازی به PBN‌های خود بهره بگیرد.

احتمالا مدل “هک ژاپنی” را دیده‌اید در این روش با مراجعه مستقیم به سایت همه چیز عادی به نظر می‌رسد ولی محتوایی که به گوگل نشان داده شده و در نتایج جستجو قابل رویت است به زبان ژاپنی و با موضوعی کاملا متفاوت است. این تکنیک دقیقا نمونه‌ای از Cloaking با استفاده از هک است.

نمونه Cloaking از طریق هک سایت و ژاپنی شدن نتایج

Doorways؛ هدف‌گذاری یک عبارت با چند صفحه

در این تکنیک چندین صفحه در یک سایت یا حتی چندین دامنه مجزا برای یک عبارت کلیدی خاص ساخته می‌شود. همه این صفحات در نهایت کاربر را به یک نتیجه نهایی می‌رسانند ولی با تمرکز بر عبارات طولانی و متنوع!

شاید کمی دور از ذهن باشد ولی “برچسب گذاری اشتباه” را می‌توان یکی از مثال‌های جالب برای تکنیک Doorway دانست. در این روش که در سایت‌های دانلود موزیک بسیار دیده می‌شود؛ برای یک مقاله چندین و چند برچسب ساخته می‌شود که محتوای مشابه ولی نام‌گذاری متفاوت (البته شبیه به هم) دارند.

نمونه برچسب گذاری اشتباه که موجب ساخت صفحات doorway میشود

به همین راحتی، نبود دانش کافی و استفاده نادرست از یک ابزار موجب می‌شود که سایت شما به سمت سئو کلاه سیاه رفته و جایگاه مناسبی در نتایج جستجو کسب نکند. مفهوم Doorway در مواردی به کنیبالیزیشن نیز شبیه است ولی نمی‌توان آنها را یکسان دانست، پیشنهاد می‌کنم مقاله Cannibalization چیست را مطالعه کنید.

Hacked content؛ محتوای هک شده

تا همین چند سال پیش هک کردن سایت‌ها یک سرگرمی و در مواردی ابزاری برای خودنمایی بود ولی امروز هکرهای جدیدی فعالیت می‌کنند که هدفشان استفاده از منابع سایت شما برای اهداف بازاریابی، لینک سازی و حتی کلاه برداری است.

برخلاف گذشته که صفحه اول سایت‌ها را تغییر می‌دادند و یک بنر سیاه به کاربر نمایش داده می‌شد، امروز سایت شما رو طوی هک می‌کنند که خودتان هم متوجه نشوید!

مهمترین روش‌های هک و سواستفاده از سایت شما عبارتند از:

  1. درج کدهای مخرب در سایت و ارسال بازدید به سایت‌های دیگر
  2. ساخت صفحات جدید با محتوای غیرمرتبط و با هدف کلاه برداری از کاربران
  3. درج متن و لینک‌های مخفی شده در محتوای صفحات با قصد ساخت PBN و تقویت یک شبکه از بک لینک‌ها
  4. ریدایرکت ناخواسته کاربران به یک صفحه یا سایت دیگر برای دریافت اطلاعات کاربر و فیشینگ

درست است که این تغییرات توسط خود شما انجام نشده ولی قطعا چنین صفحاتی برای کاربران فریبنده و خطرناک خواهد بود و سایت شما به سرعت از نتایج جستجو حذف می‌شود.

دقت کنید که اگر سایت خود را در سرچ کنسول ثبت کرده باشید، با مشاهده چنین مشکلاتی از این طریق گوگل به شما اطلاع‌رسانی خواهد کرد. تصویر زیر یک نمونه از اعلام هک سایت در بخش Security Issues سرچ کنسول را نشان می‌دهد.

اعلام هک سایت در بخش Security Issues سرچ کنسول

Hidden text and links؛ متن و لینک مخفی شده

محتوایی که در صفحه مخفی شده باشد و کاربران به سادگی امکان مشاهده آن را نداشته باشند، می‌تواند موجب جریمه سایت و حذف آن نتایج جستجو شود.

گوگل به راحتی متوجه خواهد شد که این بخش از محتوا تنها با هدف کسب جایگاه در صفحه درج شده است. چند نمونه از مخفی کردن محتوا که از نظر گوگل یک رفتار اسپم محسوب می‌شوند را با هم مرور کنیم:

  1. متن سفید روی بک گراند سفید (یا هر رنگ مشابه)
  2. مخفی کردن متن پشت یک تصویر
  3. استفاده از CSS برای درج محتوا خارج از صفحه نمایش و دید کاربر
  4. استفاده از فونت سایز 0 برای متن
  5. درج لینک روی کاراکترهای کوچک مثل نقطه و کاما

البته مخفی بودن یک محتوا لزوما به معنی اسپم بودن صفحه نیست. المان‌های بصری زیادی هستند که بخشی از محتوا را طی تعامل کاربر با صفحه به او نشان می‌دهند و قاعدتا هیچ مشکلی برای سئو ایجاد نخواهند کرد. مواردی مانند:

  • استفاده از تب و آکاردئون که برای سوالات متداول یا مشخصات فنی محصول رایج است.
  • اسلایدشو برای محتوا یا تصویر.
  • Tooltip و متن‌های راهنما که روی دکمه یا المان‌های بصری درج می‌شود.

Keyword stuffing؛ تکرار بیش از حد یک کلمه کلیدی

استفاده و تکرار بیش از حد یک عبارت در محتوای صفحه را Keyword Stuffing می‌نامیم که البته فقط به محتوای متنی و مقاله محدود نیست و مدل‌های دیگری را هم شامل می‌شود:

  • درج لیست تلفن در یک صفحه بدون توضیحات و متن بیشتر
  • درج نام شهر، استان یا محله در یک صفحه با هدف کسب جایگاه در چندین موقعیت جغرافیایی (مثلا کلیدسازی غرب تهران)
  • تکرار یک عبارت یا کلمه بدون اینکه مفهوم یا ارزش جدیدی را به متن اضافه کند.

در مورد این تکنیک یک مقاله مفصل و کامل داریم، پیشنهاد می‌کنیم در مقاله Keyword Stuffing چیست را مطالعه کنید. تصویر زیر یک نمونه محتوای مفید را در مقایسه با مدلی با تکرار کلمه کلیدی را نشان می‌دهد.

به جای تکرار یک کلمه از عبارات هم‌معنی و هم‌خانواده استفاده کنید.

Link Spam، لینک‌سازی با هدف فریب گوگل

مبارزه با لینک‌های اسپم بخش مهمی از الگوریتم اسپم برین هستند و تاکنون دو تا از آپدیت‌های آن به صورت متمرکز در مورد لینک‌ها بوده است (جولای 2021 و دسامبر 2022).

در مورد این تکنیک‌ها به صورت کامل در مقاله “لینک سازی کلاه سیاه” صحبت کرده‌ایم و اینجا تنها مروری بر سرفصل‌های آن می‌کنیم:

  1. خرید و فروش لینک به هر طریق (پرداخت پول نقدی یا دادن هدیه)
  2. تبادل لینک بیش از حد (من به تو لینک می‌دم، تو هم به من لینک بده!)
  3. استفاده از نرم افزار و ربات برای لینک سازی (مثلا نرم افزار مانی ربات)
  4. مجبور کردن سایت‌های دیگر برای درج لینک شما به صورت فالو (کپی رایت طراحی سایت یا متخصص سئو در فوتر)
  5. تبلیغات متنی و تکرار آن در همه صفحات سایت به صورت فالو (بک لینک‌های متنی که در تریبون و تسمینو می‌خرید!)
  6. انتشار یک مقاله یا خبر در سایت‌های معتبر و رسانه‌ها در حالیکه هدف اصلی آن کسب بک لینک و بهبود جایگاه است (همون رپوتاژ آگهی)
  7. لینک‌های بی‌کیفیت دایرکتوری و بوک مارک
  8. ثبت نظر و ساخت پروفایل در فروم‌ها و سایت‌ها با هدف کسب بک لینک

گوگل معتقد است که خرید و فروش لینک امری طبیعی در فضای وب است ولی به شرطی که از آن برای بهبود سئو استفاده نشود و زمانی این اتفاق رخ نخواهد داد که از ویژگی نوفالو استفاده کنیم. پیشنهاد می‌کنیم برای اطلاعات بیشتر مقاله لینک نوفالو چیست را مطالعه کنید.

تصویر زیر یک نمونه از رپورتاژ آگهی بدون تگ اسپانسر را نشان می‌دهد که مثال خود گوگل در دایکومنت‌هایش است.

نمونه لینک سازی اسپم بدون استفاده از نوفالو در رپورتاژ آگهی

احتمالا تا اینجا یک سوال و ابهام بزرگ پیش آمده؛

همه روش‌های لینک سازی از نظر گوگل کلاه سیاه هستند، پس چطور سئو آف پیچ سایت خود را تقویت کنیم؟

در دنیای سئو مفهومی داریم به اسم “سئو کلاه خاکستری” به این معنی که روش‌های وجود دارد که ما می‌توانیم از تکنیک‌های ممنوع شده توسط گوگل برای تقویت سایت خود استفاده کنیم بدون آنکه الگوریتم‌ها سایت‌مان را جریمه کنند.

در دوره آموزش لینک سازی خارجی، همه مفاهیم و تکنیک‌هایی که باید برای لینک‌سازی کلاه خاکستری بدانید را آموزش داده‌ایم.

Machine-generated traffic؛ افزایش بازدید با ربات

جستجو در گوگل با استفاده از ربات‌ها اهداف متفاوتی دارد، برخی از آنها عبارتند از:

  • افزایش میزان جستجوی یک عبارت در گوگل و قرارگرفتن در لیست پیشنهادات جستجو
  • بالا بردن نرخ کلیک یک صفحه و ارسال این سیگنال به گوگل مورد توجه کاربران است
  • دریافت اطلاعات از صفحه نتایج جستجو مثل ردیابی رتبه و بیرون کشیدن عنوان صفحات

همه این موارد جزو لیست اسپم گوگل هستند و الگوریتم اسپم برین وظیفه مقابله با آنها را برعهده دارد.

Malware and malicious؛ بدافزار

این روش هم بعید است که توسط خودتان انجام شود و معمولا سایت‌های هک شده با چنین مشکلی مواجه می‌شوند. اگر بدون تایید و خواست کاربر، مرورگر را ملزم به دانلود یک فایل یا اپلیکیشن کنیم در واقع استانداردهای گوگل برای امنیت کاربر را زیر پا گذاشته و در لیست جریمه قرار می‌گیریم.

Misleading functionality؛ فریب کاربران

چنانچه سایت را با وعده مشخصی در دسترس کاربر قرار دهیم ولی عمکلرد درستی در آن نداشته باشیم، قوانین گوگل را نقض کرده‌ایم.

مثلا سایتی که ادعا می‌کند یک دیکشنری آنلاین است ولی قابل استفاده نیست. یا ابزاری که برای تبدیل PDF به متن استفاده می‌شود ولی هدفش فقط جذب کاربر و نمایش تبلیغات است.

Scraped content؛ محتوای جمع‌آوری شده

همین ابتدا بگوییم که برداشت محتوا از سایت‌های دیگر کار اشتباهی نیست! البته به شرطی که نظر و تجربه خودمان هم به آن اضافه کنیم و به درستی منبع اصلی را ذکر کرده باشیم.

مفهومی که اینجا مورد توجه الگوریتم اسپم برین قرار گرفته و با آن مقابله می‌کند عبارت است از؛

Scraped content یعنی؛ جمع‌‌‌آوری متن، تصویر، ویدیو یا هر فرمت محتوایی دیگری از یک یا چند سایت بدون آنکه ارزش جدیدی به آن اضافه کنیم.

حتی اگر این کپی کردن با تغییرات جزئی در متن (مثلا تغییر فعل و جایگزین کردن کلمات مترادف) باشد هم گوگل به راحتی متوجه آن خواهد شد و سایت شما را جریمه می‌کند.

پیشنهاد می‌کنیم قبل از اینکه الگوریتم SpamBrain به سراغ سایت شما بیاید، مقاله تکنیک‌های کلاه سیاه در محتوا را مطالعه کنید و از انجام چنین روش‌هایی جدا خودداری کنید.

Sneaky redirects؛ ریدایرکت ناخواسته

این روش یک تفاوت مهم با Cloaking دارد. در Cloaking محتوایی که به کاربر نشان می‌دهیم با چیزی که ربات گوگل مشاهده می‌کند یکسان نیست ولی در این روش محتوا فقط در دسترس گوگل است و کاربر بدون آنکه خودش بداند به صفحه دیگری ریدایرکت می‌شود

این تکنیک هم به ندرت توسط صاحب سایت انجام می‌شود و معمولا بلایی است که بر سر سایت‌های هک شده می‌آورند. مثلا کاربرانی که از طریق جستجو و با موبایل وارد سایت می‌شوند را به یک آدرس مخرب ریدایرکت می‌کنند.

دقت کنید که استفاده از ریدایرکت 301 برای تجمیع چند صفحه، تغییر دامنه سایت و ورود کاربر به فروشگاه همگی اقداماتی طبیعی و استاندارد هستند و چنین اقداماتی موجب جریمه سایت نمی‌شود.

Spammy automatically-generated content؛ محتوای اتوماتیک

منظور گوگل در اینجا محتوایی است که توسط ربات (بخوانید هوش مصنوعی) تولید شده باشد و هیچ اطلاعات کاربردی را به مخاطب ارائه نکند. چند نمونه رایج را با هم مرور کنیم:

  1. محتوای تولید شده با هوش مصنوعی بدون بازبینی و ویرایش توسط یک متخصص
  2. محتوایی که نسخه بازنویسی شده از یک متن دیگر توسط ربات باشد
  3. متنی که مفهوم و معنای مشخصی نداشته و هیچ سوالی از کاربر را پاسخ نمی‌دهد
  4. صفحاتی که مجموعه‌ای از نتایج جستجو شامل و عنوان و توضیحات صفحه را جمع‌آوری کرده و منتشر می‌کنند
  5. جمع‌آوری و ترکیب محتوا از چند صفحه بدون ایجاد ارتباط معنایی و اضافه کردن ارزش متفاوت به آن

Thin affiliate pages؛ صفحات کم محتوای همکاری در فروش

احتمالا شما هم با پلت‌فرم‌ها یا سایت‌های همکاری در فروش مواجه شده‌اید، منظورمان آنهایی هستند که یک بستر یکسان را در اختیار مشتریان قرارداده و محتوای تکراری برای معرفی محصولات را در همه سایت‌ها درج می‌کنند.

در این مدل هدف سایت‌ها فروش یک محصول از طریق چندین دامنه است ولی به واسطه رابط کاربری و محتوای یکسان (و البته کم ارزش) انبوهی از صفحات شبیه به هم را در اینترنت منتشر می‌کنند. نتیجه هم مشخص است دیگر؛ روبرو شدن با الگوریتم اسپم برین و جریمه گوگل.

البته هر سایتی که در حوزه همکاری در فروش فعال است لزوما در حال نقض قوانین گوگل نیست بلکه رسانه‌های معتبر زیادی داریم که با تولید محتوای تخصصی و نقد و بررسی محصولات هم به انتخاب کاربر کمک می‌کنند و هم از فروش محصولات درآمدزایی دارند.

User-generated spam؛ محتوای اسپم توسط کاربران

شما مالک سایت خود هستید و نسبت به هر محتوایی که در آن منتشر می‌شود مسئول خواهید بود. اگر صفحه‌ای در سایت خود دارید که کاربران امکان درج دیدگاه و لینک در آن دارند باید مراقبت باشید که مورد سواستفاده ربات‌ها و متخصصین سئو قرار نگیرد.

احتمالا نمونه‌هایی را در سایت‌های خارجی و دانشگاهی مشاهده کرده‌اید که در انتهای یک مقاله حجم بالای از دیدگاه درج شده و هرکدام برای یک سایت و موضوع نامرتبط لینک‌سازی کرده‌اند.

چنین روش‌هایی (به این روش به اشتباه لینک‌سازی لایه‌ای هم گفته می‌شود) موجب جریمه سایت میزبان می‌شود در نتیجه آنهایی که لینک خود را درج کردند نیز هیچ اعتباری کسب نخواهند کرد. بعضی از رایج‌ترین تکنیک‌ها عبارتند از:

  1. ساخت پروفایل کاربری با هدف درج لینک
  2. فعالیت در فروم‌های باز و مدیریت نشده
  3. درج دیدگاه اسپم در صفحات وب و مقالات عمومی
  4. آپلود در سایت‌های اشتراک گذاری فایل

به نمونه زیر دقت کنید، احتمالا چنین تکنیک‌هایی برای شما آشناست و بارها در محیط وب با آن روبرو شدید.

محتوای اسپم توسط کاربران در فروم و کامنت

گزارش محتوای اسپم شده به گوگل

تا اینجا با انواع تکنیک‌های اسپم آشنا شدیم و فهمیدیم که الگوریتم اسپم برین طیف گسترده‌ای از موضوعات را تحت پوشش خود دارد. ولی قصه ادامه دارد!

علاوه بر همه این موارد که بصورت مستمر با هوش مصنوعی بررسی می‌شوند، گزارشات مردمی (ادبیات صدا و سیما) هم مورد توجه گوگل قرار خواهد گرفت.

گوگل یک فرم برای اعلام محتوای اسپم طراحی کرده که هرکسی می‌تواند آدرس یک سایت یا صفحه و دلیل خود برای مخرب بودن محتوای آن را به گوگل اعلام کند. این گزارشات توسط یک “انسان” بررسی شده و در صورت صحیح بودن اقدامات لازم برای حذف صفحه از نتایج جستجو انجام می‌گیرد. تصویر زیر نمونه فرم و گزینه‌های موجود در آن را نشان می‌دهد.

گزارش محتوای اسپم شده به گوگل

سخن پایانی

به خوبی می‌دانیم که هریک از این تکنیک‌ها می‌تواند چه اثرات مخربی بر سایت و جایگاه آن در نتایج جستجو داشته باشد. یادمان باشد که برخی از رقبا از این روش‌ها نه برای سایت خودشان که برای تخریب سایت شما استفاده می‌کنند.

استفاده از تکنیک‌های کلاه سیاه برای سایت رقیب را اصطلاحا سئو منفی می‌نامیم. برای آشنایی با این تکنیک و روش‌های جلوگیری از آن پیشنهاد می‌کنیم که مقاله سئو منفی چیست را مطالعه کنید.

اگر تجربه‌ای از جریمه گوگل و حذف سایت از نتایج جستجو دارید، در بخش نظرات همین مقاله با ما به اشتراک بگذارید.

امین اسماعیلی

امین اسماعیلی هستم، فارغ التحصیل مقطع کارشناسی ارشد از دانشگاه تهران و مدیر فنی آژانس خلاقیت وبسیما. از سال 91 تمرکز خود را بر روی مباحث روز سئو و طراحی سایت قرار داده و پس از کسب تجربه و دانش ارزشمند تصمیم گرفتم تا ثمره آن را با دیگران به اشتراک بگذارم.

پرسش و پاسخ

پس از پاسخ گویی توسط کارشناسان، از طریق پیامک به شما اطلاع رسانی میشود

دیدگاه شما را با چه تصویری در سایت نمایش دهیم؟
امتیاز شما به این محتوا ارسال دیدگاه
حسین عباس نژاد 19 مهر 1402

مثل همیشه عالی و کاربردی

کیوان 13 مهر 1402

سئو کلاه سیاه فقط به سایتتون ضربه وارد میکنه و باعث گیر کردن شما در باطلاق میشه
خیلی خوب و مفید آموزش دادین ممنونم ازتون

آکادمی وبسیما 15 مهر 1402

دقیقا درسته، خوشحالیم که براتون مفید بوده و ممنون که تجربه‌تون رو با ما به اشتراک گذاشتید