تگ کنونیکال چیست؟ تاثیر Canonical در سئو
اگر تگ Canonical نداشته باشیم، رباتهای گوگل خودشان آدرسی که از همه بهتر به نظر میرسد را به عنوان نسخه اصلی ایندکس کرده و در نتایج جستجو نمایش میدهند. مشکل اصلی زمانی رخ میدهد که انتخاب گوگل با ما یکسان نیست.
درک مفهوم و کاربرد تگ کنونیکال یکی از سختترین بخشهای یادگیری سئو است. ولی این تگ ساده به قدری ارزشمند و تاثیرگذار است که به جرات میتوان گفت، باید در 99.9 درصد سایتها استفاده شود. اگر از سیستم مدیریت محتوای وردپرس استفاده کنیم، دغدغه کمتری در این مورد خواهیم داشت چرا که هسته مرکزی وردپرس به خوبی این تگ را مدیریت میکند. ولی در سایتهای که با کدنویسی یا CMS اختصاصی طراحی شدهاند تصمیمگیری و مدیریت تگ Canonical نقش ویژهای خواهد داشت.
ابتدا تعریفی از مفهوم کنونیکال ارائه میکنیم و در ادامه با هم میبینیم که عدم توجه و استفاده از آن چه مشکلاتی را برای سایت ایجاد میکند. بعد از خواندن این مقاله، اولین چیزی که برای آنالیز سئو یک سایت بررسی میکنید استفاده درست از تگ Canonical است!
تگ Canonical چیست؟
کنونیکال در واقع یک تگ از نوع Link است که در head صفحه قرار گرفته و آدرس بهترین نسخه از این محتوا را به گوگل معرفی میکند. این تگ هیچ تاثیری در محتوای صفحه، تجربه کاربر و نحوه نمایش آن ندارد در نتیجه کاربر متوجه حضور یا عدم حضور Canonical در صفحه نمیشود.
<link rel="canonical" href="https://websima.academy/" />
مهمترین کاربرد کنونیکال، جلوگیری از ایندکس صفحاتی است که آدرس متفاوت ولی محتوای یکسان دارند. در چنین شرایطی گوگل تلاش میکند تا بهترین نسخه را از میان این آدرسها انتخاب کرده و در نتایج جستجو به کاربر نمایش دهد. استفاده از تگ Canonical به ما کمک میکند تا نسخه اصلی (پیشنهادی) را خودمان به گوگل معرفی کرده و از سردرگمی و اشتباه احتمالی رباتها پیشگیری کنیم.
شاید تصور کنید که چنین اتفاقی بهندرت پیش میآید، چرا باید دو صفحه با آدرس متفاوت ولی محتوای یکسان داشته باشیم؟! کمی جلوتر در مورد شرایط و دلایل ایجاد این صفحات صحبت میکنیم ولی پیش از آن بهتر است با انواع آدرس دهی در کنونیکال آشنا شویم؛
1- Self-Referencing؛ آدرس تگ Canonical با آدرس صفحهای که در آن هستیم یکسان باشد.
2- Preferred-URL؛ نسخه پیشنهادی (اصلی) به صفحهای دیگر در همان دامنه ارجاع داده باشد.
3- Cross-Domain؛ نسخه اصلی به صفحهای از یک دامنه دیگر ارجاع داده شود.
فکر میکنم تا همینجا به اندازه کافی گیج کننده بوده است، پس قبل از آنکه در مورد تگ Canonical بیشتر صحبت کنیم به بررسی دلایل ایجاد صفحات تکراری در سایت میپردازیم.
صفحات تکراری چطور در سایت ایجاد میشوند؟
شرایط مختلفی برای تولید محتوای تکراری در سایت وجود دارد و هیچ سایتی را نمیتوان از این قاعده مستثنی دانست. در ادامه رایجترین دلایل را با هم بررسی میکنیم:
1- تغییر آدرس براساس کاربرد صفحه
یک صفحه از سایت ما براساس کاربرد یا شرایط نمایش ممکن است آدرسهای متفاوتی داشته باشد. به مثال زیر توجه کنید.
Canonical: https://websima.academy
Mobile: https://m.websima.academy
AMP: https://websima.academy/amp
RSS: https://websima.academy/feed
Print: https://websima.academy/print
طراحی یک آدرس مجزا برای نسخه موبایل، استفاده از فریمورک AMP، داشتن نسخه Print اختصاصی و استفاده از RSS در سایت را میتوان نمونههایی از تولید صفحات با آدرسهای مجزا ولی محتوای یکسان دانست. هریک از این صفحات نیازمند یک تگ Canonical هستند که به نسخه اصلی لینک شده باشد.
2- مدیریت www و https
همه صفحات وب قابلیت دسترسی به 4 آدرس مختلف (نسخه http:// و نسخه https://) را دارند که آدرس https به دلیل فعال کردن گواهی SSL در سایت ایجاد میشود. ولی رباتهای گوگل تنها به یکی از آنها برای نمایش در نتایج جستجو نیاز دارند. اگر تگ کنونیکال به درستی در سایت ما استفاده نشده باشد برخی از صفحات با www، بعضی با https و بقیه با حالتهای دیگر ایندکس میشوند. این اتفاق آنالیز عملکرد سایت در ابزارهای مختلف را بسیار دشوار خواهد کرد.
https://websima.academy
http://www.websima.academy
https://websima.academy
https://www.websima.academy
تعداد صفحات سایت خود را در 4 ضرب کنید، حالا اهمیت تگ Canonical و تاثیر آن بر سرعت ایندکس سایت را به خوبی درک میکنیم. البته در این مورد خاص بهترین پیشنهاد این است که سه حالت جانبی بر روی آدرس اصلی ریدایرکت 301 شوند و نسخههای جانبی بهکلی در دسترس گوگل نباشند. برای آشنایی کامل و مشاهده نمونه کدها به مقاله ریدایرکت 301 چیست مراجعه کنید.
3- آدرسدهی داینامیک (فیلتر، جستجو و …)
این مشکل بیش از هرچیز در فروشگاههای اینترنتی یا سایتهای بزرگی که جستجو در آنها نقش مهمی دارد مشاهده میشود. یک تکنیک رایج برای جستجو یا فیلترکردن نتایج در فروشگاه اینترنتی ارجاع دادن موارد انتخاب شده توسط کاربر به آدرس صفحه و دریافت اطلاعات از سرور براساس آن است. سادهتر بگویم؛ وقتی در صفحه خرید تیشرت گزینه “رنگ آبی” را انتخاب میکنیم عبارت color=blue به آدرس صفحه اضافه شده و فقط محصولات آبی رنگ به ما نمایش داده میشود.
به تصویر زیر دقت کنید، با انتخاب برند “آرلدام”، وضعیت “موجود” و چیدمان براساس “ارزانترین” آدرس صفحه تغییرات اساسی داشته است ولی محتوای آن، عنوان، توضیحات و بسیاری فاکتورهای دیگر تفاوت اساسی با دستهبندی هولدر موبایل ندارد. اگر گوگل به اشتباه این نسخه از صفحه را به عنوان آدرس اصلی ایندکس کرده و به کاربران نمایش دهد عملا بخش زیادی از محصولات ما در دیدرس کاربر نیست.
شاید فکر کنید برخی از این صفحات ممکن است ارزشمند باشد، حق هم دارید. مثلا صفحه “پاور بانک سامسونگ” ممکن است با همین فیلترها ایجاد شده و بسیار پرجستجو باشد ولی آیا صفحاتی که به این شکل تولید میشوند همیشه ارزشمند هستند؟ چه تعداد صفحه ممکن است از این طریق ایجاد شود؟ اگر سایت ما 5 گزینه برای فیلتر داشته باشد و هرکدام 5 انتخاب در اختیار کاربر قرار دهند، به ازای هر دسته بندی محصول صدها صفحه جدید ایجاد میشود. صفحاتی که بیشتر آنها فاقد ارزش محتوایی بوده یا نتیجهای بههمراه ندارند. مثلا، تیشرتِ آبیِ یقه گردِ بزرگِ طرح دارِ تخفیف خورده!
آدرسهای زیر نمونههایی از ایجاد صفحات به صورت داینامیک هستند:
https://websima.academy/?s=search+term
https://websima.academy/?brand=apple&sort=price
https://websima.academy/?book=new
https://websima.academy/?utm_campaign=Email
دو مورد آخر توجهتون رو جلب نکرد؟ خطر بزرگی که در کمین همه سایتها نشسته اینجا نمایان میشود.
یک روش دیگر برای جلوگیری از ایندکس چنین صفحاتی و همچنین بهینهسازی بودجه خزش ساخت و مدیریت فایل robots.txt است. اگر نحوه استفاده و جزئیات آن را نمیدانید پیشنهاد میکنیم مقاله آموزش ساخت فایل robots.txt را در سایت آکادمی وبسیما مطالعه کنید.
4- تولید صفحات با لینکسازی خارجی
برای تولید آدرس جدید (با محتوای تکراری) حتما نباید مشکل از سایت خودمان یا زیرساخت تکنیکال آن باشد. گاهی اوقات لینکهای اشتباهی که از سایتهای دیگر دریافت میکنیم یا استفاده از UTM Campaign در تبلیغات موجب میشود یک صفحه از سایت ما با چندین آدرس در دسترس گوگل باشد.
کاربرد تگ Canonical از مدل Self-Referencing اینجا مشخص میشود. با ارجاع دادن یک صفحه به خودش عملا جلوی ایجاد صفحات تکراری از طریق آدرسهای داینامیک که در لینکسازی خارجی استفاده میشوند را میگیریم.
همین حالا که این مقاله را میخوانیم صفحات زیادی هستند که به دلیل نداشتن تگ کنونیکال، با آدرس کمپین تبلیغاتی خود در گوگل ایندکس شدهاند! زیرا این آدرس لینکهای ارزشمند زیادی را در مقایسه با نسخه اصلی دریافت کرده و از نظر گوگل مرجع اصلی انتخاب شده است.
موارد دیگری نیز برای تولید صفحات با محتوای تکراری و آدرس مجزا وجود دارند ولی تصور میکنم که به اندازه کافی با دلایل مختلف تولید این صفحات آشنا شدیم. حالا که صحبت به اینجا رسید بهتر است با معیارهای گوگل برای تعیین نسخه اصلی هم بیشتر آشنا شویم.
گوگل برچه اساسی آدرس مرجع را انتخاب میکند؟
رباتهای گوگل پس از مواجه شدن با چندین صفحه که محتوای مشابهی دارند تلاش میکنند تا بهترین نتیجه را از نظر حجم و کیفیت محتوا شناسایی کرده و در نتایج جستجو نمایش دهند. بهترین آدرس (مرجع) از نظر گوگل براساس فاکتورهای زیر تعیین میشود:
قرار گرفتن در نقشه سایت
صفحاتی که در نقشه سایت ما تعریف شده باشند در مقایسه با سایر نسخهها، شانس بیشتری برای انتخاب به عنوان آدرس مرجع از نظر گوگل دارند. پس یک بار دیگه به اهمیت نقشه سایت و تاثیر آن بر ایندکس صفحات پی میبریم.
تعداد و کیفیت لینکهای داخلی و خارجی
آدرسی که بیش از بقیه پیشنهاد شده (لینک دریافت کرده) از نظر گوگل گزینه بهتری برای کاربران است. بیشتر صفحات داخلی سایت ما از نظر لینکسازی خارجی فقیر هستند و دریافت یک یا دو لینک معتبر با آدرس اشتباه میتواند نسخه مرجع را از دید گوگل تغییر دهد. اگر تمایل دارید لینکسازی را به صورت حرفهای یاد بگیرید به شما پیشنهاد میکنم در این دوره شرکت کنید.
آموزش حرفهای لینکسازی
کسب اعتبار از طریق لینکسازی و برندینگ
حجم و کیفیت محتوا
در سیستمهای فیلترینگ، معمولا آدرسهای داینامیک محتوای کمتری (تعداد محصولات یا مقالات) را به کاربر نمایش میدهند و در نتیجه احتمال انتخاب آنها بهعنوان مرجع کم است. ولی اگر گزینههایی برای تغییر ترتیب نمایش مثل “ارزانترین”، “پربازدیدترین” و … داشته باشیم محتوای صفحات تولیدی بسیار شبیه به هم بوده و در اینجا نقش تگ کنونیکال بسیار پررنگ است.
اگر هنوز برای استفاده از تگ کنونیکال قانع نشدید یعنی حسابی سرسخت هستید! برای آنکه هیچ شکی در شما باقی نماند چند دلیل مهم دیگر را با هم بررسی میکنیم.
تگ Canonical چطور بر سئو سایت تاثیر میگذارد؟
برخی از متخصصین سئو معتقدند که درک ساختار سایت و پیدا کردن نسخه مرجع بر عهده گوگل است و این کار را به خوبی انجام میدهد. در نتیجه دیگر نیازی به مدیریت تگ Canonical نیست. تا حدی هم حق دارند چون در بیشتر موارد گوگل بهترین آدرس را انتخاب میکند. ولی مشکل فقط محتوای تکراری نیست؛ این موارد را هم در نظر داشته باشیم:
1- تجمیع اعتبار صفحات در یک آدرس
زمانیکه با استفاده از تگ Canonical یک صفحه را بهعنوان آدرس اصلی به گوگل معرفی میکنیم، هر لینک داخلی و خارجی که به نسخههای جانبی داده شود به این صفحه نسبت داده شده و ارزش و اعتبار همه آنها در یک جا جمع میشود. تا قبل از حضور کنونیکال در صفحه، لینک گرفتن صفحات جانبی برای ما خطرناک بود ولی با استفاده از آن عملا از نظر گوگل همه لینکها به نسخه اصلی ارجاع داده میشوند.
در برخی موارد استفاده از تگ کنونیکال برای تجمیع اعتبار صفحات کفایت نمیکند و همچنان به رقابت با یکدیگر در نتایج جستجو میپردازند. برای کسب اطلاعات بیشتر در این حوزه پیشنهاد میکنیم مقاله کنیبالیزیشن چیست را مطالعه کنید.
اگر از این اتفاق مطمئن نیستید پیشنهاد میکنم راهنمای خود گوگل در مورد تگ Canonical را در بخش Consolidate duplicate URLs مطالعه کنید. تصویر زیر بریدهای از توضیحات گوگل در مورد تاثیر این تگ است.
2- جلوگیری از تغییر دورهای نسخه مرجع
با اضافه و کم شدن محتوا یا تغییر در تعادل لینکسازی خارجی، ممکن است صفحه کانونی از نظر گوگل تغییر کرده و آدرس دیگری در نتایج جستجو نمایش داده شود (مثلا تا امروز http بوده و از این به بعد https دیده شود) با این اتفاق جایگاه ما از دست نمیرود ولی همه ابزارهای آمارگیر سردرگم میشوند. اطلاعاتی که در پنل سرچ کنسول، ابزار گوگل آنالیتیکس یا هر بستر تحلیلی دیگری مشاهده میکنیم دستخوش تغییر شده و عملا اجازه تحلیل دقیق را از ما میگیرد.
تصویر زیر نمونهای از پنل گوگل سرچ کنسول یک سایت است که آدرس خود را از http به https تغییر داده است. از تاریخ تغییر آدرس عملا اطلاعات سرچ کنسول به دو بخش تقسیم شده و تحلیل آمار در مقایسه با گذشته را بسیار دشوار میکند.
3- مدیریت زمان برای رباتهای گوگل
رباتهای گوگل برای هر سایت، بسته به نرخ انتشار محتوا، اعتبار و سابقه دامنه، زمان مشخصی را اختصاص میدهند. به عنوان مثال روزی دو ساعت به سایت آکادمی وبسیما مراجعه کرده و جدیدترین تغییرات آن را ایندکس میکنند. به این زمان به اصطلاح نرخ خزش یا Crawl Budget گفته میشود.
هرچقدر تعداد صفحات کمارزش یا بیمحتوا در سایت ما بیشتر باشد، شانس بررسی و ایندکس مقالات جدید کمتر شده و رباتهای گوگل در سایت ما سردرگم میشوند. استفاده صحیح از تگ Canonical نقش مهمی در مدیریت بودجه خزش و افزایش سرعت ایندکس دارد.
سخن پایانی؛ داشتن تگ Canonical در صفحه کافی نیست!
آنچه در این مقاله با هم بررسی کردیم به ما کمک میکند که در مورد صحتِ انتخاب آدرس کانونی تصمیم گیری کنیم. اگر آدرسی که برای صفحات شبیه به هم درج شده با نسخهای که در نقشه سایت قرار گرفته متفاوت باشد، عملا همه زحمات ما هدر میرود. یا اگر دو صفحه سایت که از نظر مفهوم و محتوا به یکدیگر ارتباط ندارند را با این تگ به هم مرتبط کنیم، گوگل پیشنهاد ما را نادیده گرفته و هر دو صفحه را به صورت مجزا ایندکس میکند.
اهمیت این تگ به قدری زیاد است که در ابزار Google Search Console و در بخش Indexing، چهار حالت متفاوت براساس تگ کنونیکال صفحه گزارش میشود، به تصویر زیر دقت کنید.
معنای هریک از این پیامها به شرح زیر است:
Alternate page with proper canonical tag؛ صفحاتی که با تگ کنونیکال به آدرس دیگری ارجاع داده شدهاند و از نظر گوگل آدرس پیشنهادی کاملا مناسب بوده است.
Duplicate without user-selected canonical؛ صفحاتی که از نظر گوگل محتوای تکراری داشتهاند ولی ما در آنها از تگ کنونیکال استفاده نکردهایم.
Duplicate, submitted URL not selected as canonical؛ محتوای صفحه تکراری است ولی گوگل آدرسی که به عنوان مرجع معرفی کردیم را نپذیرفته است.
Duplicate, Google chose different canonical than user؛ محتوای صفحه از نظر گوگل تکراری است، آدرسی که به عنوان صفحه کانونی معرفی کردیم را نپذیرفته و خودش صفحه دیگری را به عنوان نسخه اصلی انتخاب کرده است.
فکر میکردید قضیه تا این حد مهم و جدی باشد؟! اگر این مقاله برای شما مفید بوده و اهمیت تگ کنونیکال را روشن کرده است لطفا در بخش نظرات همین صفحه با ما در میان بگذارید. در صورتی که پس از مطالعه مقاله سوال یا ابهامی برایتان ایجاد شده همین جا مطرح کنید و مطمئن باشید به بهترین شکل ممکن پاسخ شما را خواهیم داد.
در نظر داشته باش که این یک مقاله تخصصی بود و احتمالا با واژگان جدید و متنوعی روبرو شدی، اگر معنی برخی از این کلمات را نمیدانید با مراجعه به صفحه اصطلاحات سئو با لیست بلندبالایی از این عبارات و معنی هرکدام روبرو خواهید شد. اگر در ابتدای مسیر یادگیری سئو هستید پیشنهاد میکنیم که از صفحه آموزش رایگان سئو آغاز کنید.
سوالات مرتبط با کنونیکال
نکات مرتبط با موضوع مقاله از زبان جان مولر که در hangout های گوگل منتشر شده است.
اگر تعداد صفحاتی از سایت شما که محتوای یکسانی به کاربر نمایش می دهند و باعث ایجاد کنیبالیزیشن می شوند زیاد باشد، گوگل علاوه بر تگ کنونیکال به مواردی دیگری مثل لینک سازی داخلی و نقشه سایت هم توجه می کند و با توجه به همه این فاکتورها صفحه اصلی را تشخیص می دهد. برای مثال در صفحات فروشگاهی که با انتخاب هر ویژگی یک URL متفاوت با محتوای یکسان تولید می شود چنین مسئله ای رخ می دهد.
جان مولر دو راه حل برای مدیریت این محصولات پیشنهاد کرد. راه اول این است که برای هر نوع از یک محصول صفحه ای جداگانه ساخته شود و در نتایج گوگل ایندکس شود. راه دوم هم این است که یک صفحه واحد ایجاد شود و انواع مختلف یک محصول در همان صفحه قابل انتخاب باشد. او توضیح داد که انتخاب یکی از این دو روش به مواردی مثل اندازه سایت و تعداد محصولات، و منحصر به فرد بودن هر یک از انواع محصولات بستگی دارد.
برخی از سایت های چند زبانه با استفاده از آیپی کاربر و زبان مرورگر آن ها زبان مورد نظر کاربر را تشخیص می دهند و او را با استفاده از ریدایرکت به نسخه زبان مورد نظر ارجاع می دهند. جان مولر توصیه می کند که بهتر است این وبسایت ها صفحات لندینگ خود برای تمام زبان ها را در دسترس ربات های گوگل قرار دهند، اما در همه آن ها از تگ Hreflang برای مشخص کردن زبان هر صفحه و از تگ Canonical برای مشخص کردن نسخه زبان اصلی وبسایت استفاده کنند.
اگر محتوای مشابهی در نسخه های AMP و HTML صفحات سایت خود دارید جای نگرانی نیست. گوگل متوجه تکراری بودن محتوای این صفحات می شود، اما هیچ تاثیر منفی بابت این مسئله در رتبه سایت شما ایجاد نمی کند. البته این موضوع باعث ایجاد مسئله کنیبالیزیشن و رقابت دو صفحه مورد نظر در نتایج جستجو می شود، اما این مسئله را می توان با استفاده از تگ کنونیکال برطرف کرد. با استفاده از تگ کنونیکال می توانید به گوگل نشان دهید که باید بر روی رتبه دهی کدام صفحه تمرکز کند.
جان مولر تاکید کرد که استفاده از تگ کنونیکال (تگ کنونیکال به خود صفحه) در صفحاتی که نسخه اصلی هستند بهترین کار است، اما توضیح داد که این روش تنها یکی از روش های شناسایی نسخه اصلی صفحات توسط ربات های گوگل است. مولر توضیح داد که روش هایی برای تشخیص صفحه اصلی از میان صفحات تکراری وجود دارد و اگر از تگ کنونیکال استفاده نشود در بیشتر موارد گوگل قادر به تشخیص نسخه اصلی صفحات هست، با این وجود استفاده از تگ کنونیکال بهتر از پذیرفتن ریسک استفاده نکردن از آن است.
وقتی صفحه ای را نو ایندکس میکنیم، یعنی تمام سیگنال های ورودی به آن صفحه از بین میرود. زمانی که میخواهید دسترسی گوگل به دو محتوای یکسان یا Duplicate را محدود کنید، بهتر است به جای No-Index کردن هر کدام از آن ها، با استفاده از تگ Canonical یکی از آن ها را بر روی دیگری لینک کنید تا به این ترتیب گوگل متوجه یکسان بودن این دو محتوای یکسان بشود.
اگر در صفحه از تگ کنونیکال استفاده کنید که صفحه هدف آن در حالت Noindex قرار داشته باشد، گوگل سیگنال های متناقضی دریافت می کند. در این شرایط گوگل با توجه به معیارهای دیگری همچون لینک سازی داخلی تصمیم می گیرد که کدام صفحه را ایندکس کند و کدام را نادیده بگیرد.
اگر تگ کنونیکال در موقعیتی استفاده شود که دو صفحه هدف و مبدا با هم یکسان نباشند گوگل تگ کنونیکال را نادیده می گیرد. تگ کنونیکال تنها برای صفحاتی کاربرد دارد که با همدیگر یکسان هستند.
لینک هایی که در آن ها پارامترهای اضافه وجود دارد معمولا برای بخش ویژگی های محصولات در فروشگاه، UTM لینک ها و موارد مشابه استفاده می شود. حتی اگر تگ کنونیکال به درستی اجرا شود، باز هم این احتمال وجود دارد که گوگل صفحات اصلی را نادیده بگیرد و نسخه های دارای پارامتر را ایندکس کند.
امین اسماعیلی هستم، فارغ التحصیل مقطع کارشناسی ارشد از دانشگاه تهران و مدیر فنی آژانس خلاقیت وبسیما. از سال 91 تمرکز خود را بر روی مباحث روز سئو و طراحی سایت قرار داده و پس از کسب تجربه و دانش ارزشمند تصمیم گرفتم تا ثمره آن را با دیگران به اشتراک بگذارم.
پس از پاسخ گویی توسط کارشناسان، از طریق پیامک به شما اطلاع رسانی میشود