الگوریتم SpamBrain؛ هوش مصنوعی در تقابل با اسپم
SpamBrain که در فارسی میتوان به نوعی آن را معادل واژه هرزنامه دانست؛ سیستم مبارزه با محتوای اسپم است که از سال 2108 توسط گوگل معرفی شده و تا امروز در حال بهروزرسانی و اثرگذاری بر نتایج جستجو است. این الگوریتم از هوش مصنوعی برای یادگیری و جریمه سایتها بهره میبرد.
الگوریتم اسپم برین چیست؟
هدف اصلی این الگوریتم مبارزه با انواع روشهای اسپمینگ در فضای وب است و طیف گستردهای از صفحات وب و اقدامات سئو کلاه سیاه را تحت پوشش دارد. شاید بتوان گفت که اسپم برین ترکیبی از الگوریتمهای پنگوئن، پاندا و … است که با نام جدیدی معرفی شدهاند.
این الگوریتم طی 3 سال اخیر همواره بخش مهمی از آپدیتهای گوگل بوده و تا اکتبر 2023، 6 بهروزرسانی (اعلام رسمی گوگل) را تجربه کرده است. جالب است بدانید که تمرکز این الگوریتم تنها بر لینک سازی خارجی نیست و بیشتر تکنیکهای قدیمی و نوین که برای فریب گوگل استفاده میشوند را در بر میگیرد.
مهمترین اقداماتی که از نظر گوگل Spam شناخته میشود عبارتند از:
Cloaking؛ نمایش محتوای متفاوت به گوگل و کاربر
Cloaking یکی از قدیمیترین تکنیکهای سئو کلاه سیاه است که با استفاده از آن محتوای نمایش داده شده به کاربر کاملا متفاوت با چیزی است که در دسترس رباتهای گوگل قرار دارد.
به مثالهای خود گوگل در مورد این تکنیک دقت کنیم:
- نمایش یک صفحه با محتوایی در مورد مسیرهای گردشگری و سفر به گوگل ولی پیشنهاد خرید دارو و مواد به کاربر
- درج لینک یا متن در محتوای صفحه تنها زمانیکه ربات گوگل در حال بررسی آن است (به کاربر نمایش داده نمیشود)
در مواردی ممکن است مشکلات تکنیکال (به ویژه برای سایتهای جاوااسکریپت) نیز بدون قصد قبلی چنین شرایطی رخ دهد در نتیجه بهتر است برای چنین سایتهایی حتما از مشورت یک متخصص سئو استفاده شود.
از طرفی ممکن است این کار توسط خود شما انجام نشود و کسی که سایت را هک کرده از چنین تکنیکی برای تغییر محتوای سایت و لینکسازی به PBNهای خود بهره بگیرد.
احتمالا مدل “هک ژاپنی” را دیدهاید در این روش با مراجعه مستقیم به سایت همه چیز عادی به نظر میرسد ولی محتوایی که به گوگل نشان داده شده و در نتایج جستجو قابل رویت است به زبان ژاپنی و با موضوعی کاملا متفاوت است. این تکنیک دقیقا نمونهای از Cloaking با استفاده از هک است.
Doorways؛ هدفگذاری یک عبارت با چند صفحه
در این تکنیک چندین صفحه در یک سایت یا حتی چندین دامنه مجزا برای یک عبارت کلیدی خاص ساخته میشود. همه این صفحات در نهایت کاربر را به یک نتیجه نهایی میرسانند ولی با تمرکز بر عبارات طولانی و متنوع!
شاید کمی دور از ذهن باشد ولی “برچسب گذاری اشتباه” را میتوان یکی از مثالهای جالب برای تکنیک Doorway دانست. در این روش که در سایتهای دانلود موزیک بسیار دیده میشود؛ برای یک مقاله چندین و چند برچسب ساخته میشود که محتوای مشابه ولی نامگذاری متفاوت (البته شبیه به هم) دارند.
به همین راحتی، نبود دانش کافی و استفاده نادرست از یک ابزار موجب میشود که سایت شما به سمت سئو کلاه سیاه رفته و جایگاه مناسبی در نتایج جستجو کسب نکند. مفهوم Doorway در مواردی به کنیبالیزیشن نیز شبیه است ولی نمیتوان آنها را یکسان دانست، پیشنهاد میکنم مقاله Cannibalization چیست را مطالعه کنید.
Hacked content؛ محتوای هک شده
تا همین چند سال پیش هک کردن سایتها یک سرگرمی و در مواردی ابزاری برای خودنمایی بود ولی امروز هکرهای جدیدی فعالیت میکنند که هدفشان استفاده از منابع سایت شما برای اهداف بازاریابی، لینک سازی و حتی کلاه برداری است.
برخلاف گذشته که صفحه اول سایتها را تغییر میدادند و یک بنر سیاه به کاربر نمایش داده میشد، امروز سایت شما رو طوی هک میکنند که خودتان هم متوجه نشوید!
مهمترین روشهای هک و سواستفاده از سایت شما عبارتند از:
- درج کدهای مخرب در سایت و ارسال بازدید به سایتهای دیگر
- ساخت صفحات جدید با محتوای غیرمرتبط و با هدف کلاه برداری از کاربران
- درج متن و لینکهای مخفی شده در محتوای صفحات با قصد ساخت PBN و تقویت یک شبکه از بک لینکها
- ریدایرکت ناخواسته کاربران به یک صفحه یا سایت دیگر برای دریافت اطلاعات کاربر و فیشینگ
درست است که این تغییرات توسط خود شما انجام نشده ولی قطعا چنین صفحاتی برای کاربران فریبنده و خطرناک خواهد بود و سایت شما به سرعت از نتایج جستجو حذف میشود.
دقت کنید که اگر سایت خود را در سرچ کنسول ثبت کرده باشید، با مشاهده چنین مشکلاتی از این طریق گوگل به شما اطلاعرسانی خواهد کرد. تصویر زیر یک نمونه از اعلام هک سایت در بخش Security Issues سرچ کنسول را نشان میدهد.
Hidden text and links؛ متن و لینک مخفی شده
محتوایی که در صفحه مخفی شده باشد و کاربران به سادگی امکان مشاهده آن را نداشته باشند، میتواند موجب جریمه سایت و حذف آن نتایج جستجو شود.
گوگل به راحتی متوجه خواهد شد که این بخش از محتوا تنها با هدف کسب جایگاه در صفحه درج شده است. چند نمونه از مخفی کردن محتوا که از نظر گوگل یک رفتار اسپم محسوب میشوند را با هم مرور کنیم:
- متن سفید روی بک گراند سفید (یا هر رنگ مشابه)
- مخفی کردن متن پشت یک تصویر
- استفاده از CSS برای درج محتوا خارج از صفحه نمایش و دید کاربر
- استفاده از فونت سایز 0 برای متن
- درج لینک روی کاراکترهای کوچک مثل نقطه و کاما
البته مخفی بودن یک محتوا لزوما به معنی اسپم بودن صفحه نیست. المانهای بصری زیادی هستند که بخشی از محتوا را طی تعامل کاربر با صفحه به او نشان میدهند و قاعدتا هیچ مشکلی برای سئو ایجاد نخواهند کرد. مواردی مانند:
- استفاده از تب و آکاردئون که برای سوالات متداول یا مشخصات فنی محصول رایج است.
- اسلایدشو برای محتوا یا تصویر.
- Tooltip و متنهای راهنما که روی دکمه یا المانهای بصری درج میشود.
Keyword stuffing؛ تکرار بیش از حد یک کلمه کلیدی
استفاده و تکرار بیش از حد یک عبارت در محتوای صفحه را Keyword Stuffing مینامیم که البته فقط به محتوای متنی و مقاله محدود نیست و مدلهای دیگری را هم شامل میشود:
- درج لیست تلفن در یک صفحه بدون توضیحات و متن بیشتر
- درج نام شهر، استان یا محله در یک صفحه با هدف کسب جایگاه در چندین موقعیت جغرافیایی (مثلا کلیدسازی غرب تهران)
- تکرار یک عبارت یا کلمه بدون اینکه مفهوم یا ارزش جدیدی را به متن اضافه کند.
در مورد این تکنیک یک مقاله مفصل و کامل داریم، پیشنهاد میکنیم در مقاله Keyword Stuffing چیست را مطالعه کنید. تصویر زیر یک نمونه محتوای مفید را در مقایسه با مدلی با تکرار کلمه کلیدی را نشان میدهد.
Link Spam، لینکسازی با هدف فریب گوگل
مبارزه با لینکهای اسپم بخش مهمی از الگوریتم اسپم برین هستند و تاکنون دو تا از آپدیتهای آن به صورت متمرکز در مورد لینکها بوده است (جولای 2021 و دسامبر 2022).
در مورد این تکنیکها به صورت کامل در مقاله “لینک سازی کلاه سیاه” صحبت کردهایم و اینجا تنها مروری بر سرفصلهای آن میکنیم:
- خرید و فروش لینک به هر طریق (پرداخت پول نقدی یا دادن هدیه)
- تبادل لینک بیش از حد (من به تو لینک میدم، تو هم به من لینک بده!)
- استفاده از نرم افزار و ربات برای لینک سازی (مثلا نرم افزار مانی ربات)
- مجبور کردن سایتهای دیگر برای درج لینک شما به صورت فالو (کپی رایت طراحی سایت یا متخصص سئو در فوتر)
- تبلیغات متنی و تکرار آن در همه صفحات سایت به صورت فالو (بک لینکهای متنی که در تریبون و تسمینو میخرید!)
- انتشار یک مقاله یا خبر در سایتهای معتبر و رسانهها در حالیکه هدف اصلی آن کسب بک لینک و بهبود جایگاه است (همون رپوتاژ آگهی)
- لینکهای بیکیفیت دایرکتوری و بوک مارک
- ثبت نظر و ساخت پروفایل در فرومها و سایتها با هدف کسب بک لینک
گوگل معتقد است که خرید و فروش لینک امری طبیعی در فضای وب است ولی به شرطی که از آن برای بهبود سئو استفاده نشود و زمانی این اتفاق رخ نخواهد داد که از ویژگی نوفالو استفاده کنیم. پیشنهاد میکنیم برای اطلاعات بیشتر مقاله لینک نوفالو چیست را مطالعه کنید.
تصویر زیر یک نمونه از رپورتاژ آگهی بدون تگ اسپانسر را نشان میدهد که مثال خود گوگل در دایکومنتهایش است.
احتمالا تا اینجا یک سوال و ابهام بزرگ پیش آمده؛
همه روشهای لینک سازی از نظر گوگل کلاه سیاه هستند، پس چطور سئو آف پیچ سایت خود را تقویت کنیم؟
در دنیای سئو مفهومی داریم به اسم “سئو کلاه خاکستری” به این معنی که روشهای وجود دارد که ما میتوانیم از تکنیکهای ممنوع شده توسط گوگل برای تقویت سایت خود استفاده کنیم بدون آنکه الگوریتمها سایتمان را جریمه کنند.
در دوره آموزش لینک سازی خارجی، همه مفاهیم و تکنیکهایی که باید برای لینکسازی کلاه خاکستری بدانید را آموزش دادهایم.
کسب اعتبار از طریق لینکسازی و برندینگآموزش حرفهای لینکسازی
Machine-generated traffic؛ افزایش بازدید با ربات
جستجو در گوگل با استفاده از رباتها اهداف متفاوتی دارد، برخی از آنها عبارتند از:
- افزایش میزان جستجوی یک عبارت در گوگل و قرارگرفتن در لیست پیشنهادات جستجو
- بالا بردن نرخ کلیک یک صفحه و ارسال این سیگنال به گوگل مورد توجه کاربران است
- دریافت اطلاعات از صفحه نتایج جستجو مثل ردیابی رتبه و بیرون کشیدن عنوان صفحات
همه این موارد جزو لیست اسپم گوگل هستند و الگوریتم اسپم برین وظیفه مقابله با آنها را برعهده دارد.
Malware and malicious؛ بدافزار
این روش هم بعید است که توسط خودتان انجام شود و معمولا سایتهای هک شده با چنین مشکلی مواجه میشوند. اگر بدون تایید و خواست کاربر، مرورگر را ملزم به دانلود یک فایل یا اپلیکیشن کنیم در واقع استانداردهای گوگل برای امنیت کاربر را زیر پا گذاشته و در لیست جریمه قرار میگیریم.
Misleading functionality؛ فریب کاربران
چنانچه سایت را با وعده مشخصی در دسترس کاربر قرار دهیم ولی عمکلرد درستی در آن نداشته باشیم، قوانین گوگل را نقض کردهایم.
مثلا سایتی که ادعا میکند یک دیکشنری آنلاین است ولی قابل استفاده نیست. یا ابزاری که برای تبدیل PDF به متن استفاده میشود ولی هدفش فقط جذب کاربر و نمایش تبلیغات است.
Scraped content؛ محتوای جمعآوری شده
همین ابتدا بگوییم که برداشت محتوا از سایتهای دیگر کار اشتباهی نیست! البته به شرطی که نظر و تجربه خودمان هم به آن اضافه کنیم و به درستی منبع اصلی را ذکر کرده باشیم.
مفهومی که اینجا مورد توجه الگوریتم اسپم برین قرار گرفته و با آن مقابله میکند عبارت است از؛
Scraped content یعنی؛ جمعآوری متن، تصویر، ویدیو یا هر فرمت محتوایی دیگری از یک یا چند سایت بدون آنکه ارزش جدیدی به آن اضافه کنیم.
حتی اگر این کپی کردن با تغییرات جزئی در متن (مثلا تغییر فعل و جایگزین کردن کلمات مترادف) باشد هم گوگل به راحتی متوجه آن خواهد شد و سایت شما را جریمه میکند.
پیشنهاد میکنیم قبل از اینکه الگوریتم SpamBrain به سراغ سایت شما بیاید، مقاله تکنیکهای کلاه سیاه در محتوا را مطالعه کنید و از انجام چنین روشهایی جدا خودداری کنید.
Sneaky redirects؛ ریدایرکت ناخواسته
این روش یک تفاوت مهم با Cloaking دارد. در Cloaking محتوایی که به کاربر نشان میدهیم با چیزی که ربات گوگل مشاهده میکند یکسان نیست ولی در این روش محتوا فقط در دسترس گوگل است و کاربر بدون آنکه خودش بداند به صفحه دیگری ریدایرکت میشود
این تکنیک هم به ندرت توسط صاحب سایت انجام میشود و معمولا بلایی است که بر سر سایتهای هک شده میآورند. مثلا کاربرانی که از طریق جستجو و با موبایل وارد سایت میشوند را به یک آدرس مخرب ریدایرکت میکنند.
دقت کنید که استفاده از ریدایرکت 301 برای تجمیع چند صفحه، تغییر دامنه سایت و ورود کاربر به فروشگاه همگی اقداماتی طبیعی و استاندارد هستند و چنین اقداماتی موجب جریمه سایت نمیشود.
Spammy automatically-generated content؛ محتوای اتوماتیک
منظور گوگل در اینجا محتوایی است که توسط ربات (بخوانید هوش مصنوعی) تولید شده باشد و هیچ اطلاعات کاربردی را به مخاطب ارائه نکند. چند نمونه رایج را با هم مرور کنیم:
- محتوای تولید شده با هوش مصنوعی بدون بازبینی و ویرایش توسط یک متخصص
- محتوایی که نسخه بازنویسی شده از یک متن دیگر توسط ربات باشد
- متنی که مفهوم و معنای مشخصی نداشته و هیچ سوالی از کاربر را پاسخ نمیدهد
- صفحاتی که مجموعهای از نتایج جستجو شامل و عنوان و توضیحات صفحه را جمعآوری کرده و منتشر میکنند
- جمعآوری و ترکیب محتوا از چند صفحه بدون ایجاد ارتباط معنایی و اضافه کردن ارزش متفاوت به آن
Thin affiliate pages؛ صفحات کم محتوای همکاری در فروش
احتمالا شما هم با پلتفرمها یا سایتهای همکاری در فروش مواجه شدهاید، منظورمان آنهایی هستند که یک بستر یکسان را در اختیار مشتریان قرارداده و محتوای تکراری برای معرفی محصولات را در همه سایتها درج میکنند.
در این مدل هدف سایتها فروش یک محصول از طریق چندین دامنه است ولی به واسطه رابط کاربری و محتوای یکسان (و البته کم ارزش) انبوهی از صفحات شبیه به هم را در اینترنت منتشر میکنند. نتیجه هم مشخص است دیگر؛ روبرو شدن با الگوریتم اسپم برین و جریمه گوگل.
البته هر سایتی که در حوزه همکاری در فروش فعال است لزوما در حال نقض قوانین گوگل نیست بلکه رسانههای معتبر زیادی داریم که با تولید محتوای تخصصی و نقد و بررسی محصولات هم به انتخاب کاربر کمک میکنند و هم از فروش محصولات درآمدزایی دارند.
User-generated spam؛ محتوای اسپم توسط کاربران
شما مالک سایت خود هستید و نسبت به هر محتوایی که در آن منتشر میشود مسئول خواهید بود. اگر صفحهای در سایت خود دارید که کاربران امکان درج دیدگاه و لینک در آن دارند باید مراقبت باشید که مورد سواستفاده رباتها و متخصصین سئو قرار نگیرد.
احتمالا نمونههایی را در سایتهای خارجی و دانشگاهی مشاهده کردهاید که در انتهای یک مقاله حجم بالای از دیدگاه درج شده و هرکدام برای یک سایت و موضوع نامرتبط لینکسازی کردهاند.
چنین روشهایی (به این روش به اشتباه لینکسازی لایهای هم گفته میشود) موجب جریمه سایت میزبان میشود در نتیجه آنهایی که لینک خود را درج کردند نیز هیچ اعتباری کسب نخواهند کرد. بعضی از رایجترین تکنیکها عبارتند از:
- ساخت پروفایل کاربری با هدف درج لینک
- فعالیت در فرومهای باز و مدیریت نشده
- درج دیدگاه اسپم در صفحات وب و مقالات عمومی
- آپلود در سایتهای اشتراک گذاری فایل
به نمونه زیر دقت کنید، احتمالا چنین تکنیکهایی برای شما آشناست و بارها در محیط وب با آن روبرو شدید.
گزارش محتوای اسپم شده به گوگل
تا اینجا با انواع تکنیکهای اسپم آشنا شدیم و فهمیدیم که الگوریتم اسپم برین طیف گستردهای از موضوعات را تحت پوشش خود دارد. ولی قصه ادامه دارد!
علاوه بر همه این موارد که بصورت مستمر با هوش مصنوعی بررسی میشوند، گزارشات مردمی (ادبیات صدا و سیما) هم مورد توجه گوگل قرار خواهد گرفت.
گوگل یک فرم برای اعلام محتوای اسپم طراحی کرده که هرکسی میتواند آدرس یک سایت یا صفحه و دلیل خود برای مخرب بودن محتوای آن را به گوگل اعلام کند. این گزارشات توسط یک “انسان” بررسی شده و در صورت صحیح بودن اقدامات لازم برای حذف صفحه از نتایج جستجو انجام میگیرد. تصویر زیر نمونه فرم و گزینههای موجود در آن را نشان میدهد.
سخن پایانی
به خوبی میدانیم که هریک از این تکنیکها میتواند چه اثرات مخربی بر سایت و جایگاه آن در نتایج جستجو داشته باشد. یادمان باشد که برخی از رقبا از این روشها نه برای سایت خودشان که برای تخریب سایت شما استفاده میکنند.
استفاده از تکنیکهای کلاه سیاه برای سایت رقیب را اصطلاحا سئو منفی مینامیم. برای آشنایی با این تکنیک و روشهای جلوگیری از آن پیشنهاد میکنیم که مقاله سئو منفی چیست را مطالعه کنید.
اگر تجربهای از جریمه گوگل و حذف سایت از نتایج جستجو دارید، در بخش نظرات همین مقاله با ما به اشتراک بگذارید.
امین اسماعیلی هستم، فارغ التحصیل مقطع کارشناسی ارشد از دانشگاه تهران و مدیر فنی آژانس خلاقیت وبسیما. از سال 91 تمرکز خود را بر روی مباحث روز سئو و طراحی سایت قرار داده و پس از کسب تجربه و دانش ارزشمند تصمیم گرفتم تا ثمره آن را با دیگران به اشتراک بگذارم.
پس از پاسخ گویی توسط کارشناسان، از طریق پیامک به شما اطلاع رسانی میشود