🔍 راهنمای خطاهای سرچ کنسول و وضعیت ایندکس؛ از گزارش Page Indexing تا رفع سریع مشکل‌ها

👋 بذار خیلی خودمونی شروع کنیم: سرچ کنسول قرار نیست تو رو بترسونه؛ قرارِ مثل یه گزارشگر صادق بگه گوگل درباره صفحات سایتت چی دیده. مشکل اینه که خیلی‌ها اسم بعضی گزینه‌ها رو می‌بینن و فکر می‌کنن «اوه سایت نابود شد!» در حالی که نصفشون فقط وضعیت هستن، نه فاجعه.

معنی «خطا»، «Excluded»، «Not indexed» و «Valid» دقیقاً چیه؟

🧠 توی سرچ کنسول، همیشه کلمه‌ها دقیقاً معنای عرفی ندارن. خیلی وقت‌ها چیزی که تو ذهن ما «خطا»ست، برای گوگل فقط یک «دلیل برای ایندکس نکردن» حساب می‌شه. پس اول اینو تو ذهنت فیکس کن: Not indexed یعنی «الان داخل نتایج نیست»، نه اینکه «بدون راه برگشت نابود شده».

📌 معمولاً چهار مدل حالت می‌بینی: ۱) Indexed یعنی صفحه توی نتایج می‌تونه بیاد. ۲) Not indexed یعنی فعلاً نیومده. ۳) Excluded یعنی گوگل آگاهانه گذاشته کنار (مثلاً تکراری یا کانونیکال). ۴) Error یعنی گوگل واقعاً به مشکل خورده (مثلاً ۵۰۰ یا ریدایرکت اشتباه). تفاوتشون تو نوع برخورد توئه.

😌 یه نکته طلایی: اگر سایت تازه‌ست یا تازه محتوا زیاد اضافه کردی، دیدن تعداد قابل توجهی از «Crawled/Discovered – currently not indexed» می‌تونه طبیعی باشه. مهم اینه ببینی این وضعیت‌ها روی صفحات مهم (صفحه خدمات، لندینگ پول‌ساز، مقالات اصلی) افتاده یا روی صفحات کم‌اهمیت.

گزارش Page Indexing رو چطور بخونیم که اشتباه برداشت نکنیم؟

📊 تو گزارش Page Indexing، یه لیست از دلیل‌ها می‌بینی. پیشنهاد من اینه: به‌جای اینکه روی عددها حساس شی، اول نوع دلیل رو بفهم. چون یه «Duplicate without user-selected canonical» داستانش فرق داره با «Server error (5xx)».

🎯 برای شروع، صفحات رو سه دسته کن: پول‌ساز (خدمات/محصول/لندینگ)، اعتمادساز (درباره ما، نمونه‌کار، تماس)، محتوایی (مقالات). اگر مشکل روی پول‌سازهاست باید سریع‌تر بری سراغش. اگر روی صفحات کم‌اهمیت مثل تگ‌هاست، شاید اصلاً لازم نباشه دست بزنی.

🔎 هرجا شک کردی، برو روی همون URL و از ابزار URL Inspection استفاده کن. اینجا می‌فهمی: گوگل آخرین بار کی کرال کرده، چه کانونیکالی تشخیص داده، و آیا مشکلی مثل noindex یا blocked وجود داره یا نه.

خطاهای رایج سرچ کنسول (به زبان ساده + راه‌حل سریع)

۱) Discovered – currently not indexed

🕵️ یعنی گوگل URL رو پیدا کرده ولی هنوز نرفته داخلش یا تصمیم نگرفته کرال/ایندکسش کنه. این معمولاً وقتی پیش میاد که سایت تازه‌ست، تعداد URL زیاد شده، یا گوگل حس می‌کنه ارزش/اولویت بعضی صفحات پایین‌تره.

راه‌حل سریع: لینک داخلی به اون صفحه رو بیشتر کن، محتوا رو کامل‌تر کن، و مطمئن شو صفحه از جایی در سایت قابل دسترسه (نه اینکه فقط توی sitemap باشه). اگر هاست کند یا خطای موقتی داری، گوگل ممکنه کرال رو عقب بندازه.

۲) Crawled – currently not indexed

🧾 یعنی گوگل صفحه رو دیده ولی فعلاً گذاشته کنار. دلیل‌هاش می‌تونه اینا باشه: محتوای کم، شباهت زیاد به صفحات دیگه، کیفیت پایین، یا اینکه صفحه پاسخ دقیق به نیاز کاربر نداره.

🛠️ راه‌حل سریع: محتوا رو واقعاً ارتقا بده (نه فقط اضافه کردن چند خط). عنوان و H2ها رو دقیق‌تر کن، مثال و تجربه واقعی بذار، تصاویر بهینه اضافه کن، و لینک داخلی از مقالات مرتبط بده. اگر صفحه خیلی شبیه یه صفحه دیگه‌ست، یا ادغامش کن یا کانونیکال درست بده.

۳) Submitted URL blocked by robots.txt

🚫 یعنی خودت به گوگل گفتی «نیا!» و بعد همون URL رو توی sitemap یا جای دیگه معرفی کردی. این تناقض، هم اعصاب گوگل رو خرد می‌کنه هم گزارش رو قرمز می‌کنه. معمولاً با یه Disallow اشتباه یا پلاگین‌های امنیتی پیش میاد.

🔧 راه‌حل سریع: فایل robots.txt رو چک کن، اگر صفحه مهمه اجازه بده کرال بشه. اگر صفحه مهم نیست، از sitemap حذفش کن تا گزارش تمیز شه. اینجا باید تکلیف روشن باشه: یا معرفی کن، یا ببند.

۴) Submitted URL marked ‘noindex’

🏷️ یعنی توی کد صفحه یا تنظیمات سئو، تگ noindex فعال شده. خیلی وقت‌ها این اتفاق بعد از انتقال سایت، نسخه آزمایشی، یا تنظیم اشتباه افزونه سئو می‌افته.

راه‌حل سریع: تنظیمات افزونه سئو (مثلاً Yoast/RankMath) رو برای همون نوع صفحه بررسی کن. اگر صفحه باید بیاد تو نتایج، noindex رو بردار و بعد از URL Inspection گزینه Request Indexing رو بزن.

۵) Duplicate without user-selected canonical

🧩 یعنی گوگل می‌گه «این صفحه شبیه یکی دیگه‌ست، ولی تو نگفتی نسخه اصلی کدومه». این معمولاً با آرشیوها، تگ‌ها، پارامترهای UTM، یا نسخه‌های اسلش‌دار/بدون اسلش پیش میاد.

🧷 راه‌حل سریع: اگر واقعاً دو صفحه محتوای یکسان دارن، یکی رو ریدایرکت ۳۰۱ کن به اصلی. اگر باید هر دو باشن، کانونیکال درست بذار. و اگر مشکل از پارامترهاست، ساختار URL و لینک‌سازی داخلی رو تمیز کن.

۶) Alternate page with proper canonical tag

🔁 این یکی معمولاً بد نیست! یعنی صفحه جایگزین وجود داره (مثلاً نسخه AMP یا نسخه پارامتردار) و کانونیکال درست به نسخه اصلی اشاره کرده. خیلی وقت‌ها این وضعیت طبیعی و سالمه.

🧐 کی باید نگران شی؟ وقتی صفحه‌ای که برایت مهمه، خودش تبدیل به «alternate» شده و نسخه‌ای که نمی‌خوای، اصلی تشخیص داده شده. اونجا باید لینک‌های داخلی رو اصلاح کنی و مطمئن شی کاربران و سایتت به نسخه اصلی لینک می‌دن.

۷) Redirect error

🧯 یعنی گوگل تو مسیر انتقال گیر کرده: زنجیره ریدایرکت طولانیه، لوپ ریدایرکت داری، یا مقصد نهایی مشکل داره. این یکی از اون مواردیه که واقعاً می‌تونه ضرر بزنه چون کرال و ارزش لینک‌ها هدر می‌ره.

🧰 راه‌حل سریع: ریدایرکت‌ها رو کوتاه کن (ترجیحاً یک‌مرحله‌ای)، لوپ‌ها رو حذف کن، و مطمئن شو مقصد نهایی ۲۰۰ می‌ده. اگر http به https و www به non-www داری، همه رو یکدست کن.

۸) Server error (5xx)

💥 یعنی سرور موقع درخواست گوگل جواب درست نداده (۵۰۰، ۵۰۲، ۵۰۳…). این مورد معمولاً به هاست ضعیف، فشار زیاد، یا تنظیمات کش/امنیت مربوطه و روی ایندکس شدن صفحات مهم خیلی تاثیر می‌ذاره.

🧑‍💻 راه‌حل سریع: لاگ خطا رو چک کن، پلاگین‌های سنگین رو بررسی کن، منابع هاست رو ارتقا بده، و اگر فایروال یا افزونه امنیتی ربات گوگل رو محدود کرده، اصلاحش کن. اینجا سرعت واکنش مهمه چون گوگل اگر چندبار پشت هم ۵xx ببینه، کرال رو کم می‌کنه.

۹) Soft 404

🫥 یعنی صفحه از نظر تو «هست»، ولی از نظر گوگل محتوای مفید نداره یا شبیه صفحه خطاست (مثلاً نوشته: پیدا نشد، ولی کد ۲۰۰ می‌ده). این اتفاق توی صفحات آرشیو خالی، جستجوی داخلی، یا محصول ناموجود زیاد دیده می‌شه.

🧹 راه‌حل سریع: اگر واقعاً صفحه باید حذف شه، کد ۴۰۴ یا ۴۱۰ بده. اگر باید بمونه، محتوای واقعی و مسیر جایگزین بده (لینک به دسته‌ها/محصولات/مقالات). صفحات خالی رو یا پر کن یا از ایندکس خارج کن.

۱۰) Not found (404) و Blocked due to other 4xx issue

🧱 ۴۰۴ یعنی صفحه واقعاً نیست. ۴xxهای دیگه مثل ۴۰۳/۴۰۱ یعنی دسترسی بسته‌ست. برای صفحات قدیمی، ۴۰۴ همیشه بد نیست. بد زمانی می‌شه که لینک داخلی یا لینک بیرونی مهم به صفحه ۴۰۴ بخوره.

🧭 راه‌حل سریع: اگر صفحه مهم بوده، ۳۰۱ به نزدیک‌ترین صفحه مرتبط بده. اگر صفحه بی‌ارزش بوده، بگذار ۴۰۴ بماند ولی لینک‌های داخلی که به آن اشاره می‌کنند را حذف کن تا سایتت تمیز شود.

مشکلات Sitemap که زیاد دیده می‌شن (و سریع جمع می‌شن)

🗺️ Sitemap فقط یک «فهرست پیشنهادی» برای گوگل است؛ نه تضمین ایندکس. اما اگر خود sitemap مشکل داشته باشد، گوگل حتی درست و حسابی URLها را هم نمی‌بیند.

📭 اگر خطاهایی مثل “Couldn’t fetch” یا “General HTTP error” دیدی، یعنی گوگل به فایل sitemap دسترسی ندارد. این می‌تواند از فایروال، محدودیت دسترسی، یا خطای سرور باشد.

🧩 راه‌حل سریع: لینک sitemap را مستقیم در مرورگر باز کن، وضعیت ۲۰۰ بودنش را چک کن، و مطمئن شو robots.txt هم همان آدرس را درست معرفی کرده. اگر سایت CDN یا امنیتی دارد، اجازه دسترسی ربات گوگل را بده.

یک برنامه خیلی سریع ۳۰ دقیقه‌ای برای تمیز کردن گزارش‌ها

⏱️ اگر وقتت کمه، این روال ۳۰ دقیقه‌ای خیلی به درد می‌خوره: اول برو سراغ Errorها (۵xx، redirect error، blocked ۴xx). بعد برو سراغ noindex و robots. بعدش duplicate/canonical. در آخر اگر وقت داشتی Crawled/Discovered رو بهینه کن.

📍 دلیلش واضحه: بعضی وضعیت‌ها «کیفیت محتوا» می‌خوان (زمان‌بر) ولی بعضی‌ها مثل robots/noindex فقط یک تیک اشتباهه و با یک اصلاح، کلی URL آزاد می‌شن.

جدول خلاصه: معنی هر خطا + راه‌حل فوری

وضعیت در سرچ کنسول معنی ساده اقدام سریع اولویت
Discovered – currently not indexed پیدا شده، هنوز کرال/ایندکس نشده لینک داخلی + بهبود محتوا + بررسی سرعت/هاست متوسط
Crawled – currently not indexed دیده شده ولی فعلاً کنار گذاشته شده ارتقای کیفیت/یونیک بودن + لینک‌سازی داخلی متوسط
Submitted URL blocked by robots.txt خودت گفتی کرال نکن رفع Disallow یا حذف URL از sitemap بالا
Submitted URL marked ‘noindex’ تگ noindex فعاله برداشتن noindex + Request Indexing بالا
Duplicate without user-selected canonical تکراریه، نسخه اصلی مشخص نیست کانونیکال درست یا ۳۰۱ به نسخه اصلی متوسط
Redirect error زنجیره/لوپ ریدایرکت یک‌مرحله‌ای کردن ریدایرکت + حذف لوپ بالا
Server error (5xx) مشکل واقعی سمت سرور رفع خطای هاست/پلاگین/منابع خیلی بالا
Soft 404 صفحه شبیه «هیچی نیست» اما ۲۰۰ می‌ده محتوا/مسیر جایگزین یا ۴۱۰/۴۰۴ واقعی متوسط

چند لینک داخلی پیشنهادی (برای اینکه گوگل سریع‌تر بفهمه سایتت چی می‌گه)

🔗 اگر می‌خوای ساختار لینک‌های داخلی‌ات قوی‌تر بشه، این سه تا لینک می‌تونه توی خیلی از مقاله‌ها به‌صورت طبیعی قرار بگیره: یکی صفحه دسته طراحی سایت، یکی برنامه‌ریزی ۱۴ روزه، و یکی هم راه‌اندازی سایت اقتصادی برای کسب‌وکار کوچیک.

📎 ۱) دسته طراحی سایت در Say4Web
۲) مراحل شروع طراحی سایت در ۱۴ روز (برنامه پیشنهادی)
۳) مراحل شروع طراحی سایت برای کسب‌وکارهای کوچک (کم هزینه اما اصولی)

پرسش و پاسخ (FAQ)

اگر Crawled – currently not indexed زیاد باشه یعنی سایت بده؟

نه لزوماً. اگر سایت تازه‌ست یا تعداد URL زیاد اضافه کردی، طبیعی می‌تونه باشه. اما اگر روی صفحات مهمه، باید کیفیت محتوا و تکراری نبودن و لینک داخلی رو قوی‌تر کنی.

Request Indexing بزنم همه چیز حل می‌شه؟

نه. Request Indexing فقط درخواست می‌ده گوگل دوباره بررسی کنه. اگر مشکل اصلی مثل noindex، robots، محتوای ضعیف، یا سرور خطادار وجود داشته باشه، دوباره همون وضعیت برمی‌گرده.

کدوم وضعیت‌ها فوراً خطرناکن؟

معمولاً Server error (5xx)، Redirect error، و تناقض‌های robots/noindex روی صفحات مهم. این‌ها می‌تونن مستقیم جلوی کرال و ایندکس رو بگیرن.