علیرضا یاسینی – وب دیزاینر

نقشه سایت (Sitemap) و Robots.txt: تنظیمات درست برای وردپرس

از ایده تا اجرا در کنار شما هستم

اشتراک

تنظیم درست Robots و Sitemap در وردپرس؛ راهنمای کامل برای ایندکس سریع‌تر

👋 بذار خیلی خودمونی شروع کنیم: خیلی از سایت‌ها مشکل «سئو» ندارن، مشکلشون اینه که گوگل اصلاً درست نمی‌تونه سایت رو بخزه و ایندکس کنه! اینجاست که دو تا فایل/آدرس خیلی مهم می‌شن: Robots.txt و Sitemap. اگر این دو تا درست تنظیم بشن، مسیر گوگل تو سایتت صاف و روشن می‌شه؛ اگر هم اشتباه تنظیم بشن، ممکنه بهترین محتواها هم پشت درِ بسته بمونن.

🧠 یک تشبیه باحال: سایتت مثل یک فروشگاه بزرگه. Sitemap می‌شه «نقشه‌ی راهروها و قفسه‌ها» که به گوگل می‌گه چی کجاست. Robots.txt هم می‌شه «تابلوی قوانین ورود» که می‌گه به کدوم بخش‌ها می‌تونه بره و کجاها بهتره نره. حالا نکته طلایی اینه: robots قرار نیست «ایندکس» رو روشن/خاموش کنه، فقط مسیر خزش رو مدیریت می‌کنه. خیلی‌ها همینجا اشتباه می‌رن.

🗺️ Sitemap معمولاً یک فایل XMLـه (یا چندتا فایل) که لیست صفحه‌های مهم سایتت رو به موتورهای جستجو معرفی می‌کنه. تو وردپرس، خیلی وقت‌ها این شکلیه: /sitemap_index.xml (سایت‌مپ ایندکس) و داخلش چند سایت‌مپ ریزتر مثل نوشته‌ها، برگه‌ها، دسته‌ها و… قرار می‌گیره. مزیتش چیه؟ وقتی سایت تازه‌ست، وقتی سایت بزرگه، یا وقتی لینک‌سازی داخلی هنوز کامل نیست، سایت‌مپ کمک می‌کنه گوگل «زودتر و مرتب‌تر» صفحه‌ها رو پیدا کنه.

🚀 سایت‌مپ مخصوصاً وقتی می‌درخشه که: سایتت تازه لانچ شده، تعداد صفحه‌هات زیاده، فروشگاه داری و محصول زیاد داری، یا ساختار دسته‌بندی‌ها پیچیده‌ست. تازه یه نکته مهم‌تر: سایت‌مپ خوب فقط «وجود داشتن» نیست؛ باید صفحه‌های درست رو شامل بشه و صفحه‌های بی‌ارزش رو بی‌خودی شلوغ نکنه. مثلاً اگر هزار تا برچسب بی‌هدف داری، اضافه شدنشون به سایت‌مپ می‌تونه کیفیت خزش رو پایین بیاره و تمرکز گوگل رو پخش کنه.

🤖 Robots.txt یک فایل متنیه که معمولاً تو ریشه دامنه قرار می‌گیره (مثلاً site.com/robots.txt) و به ربات‌ها می‌گه چی رو خزش کنن و چی رو نه. دستورات معروفش هم این‌هاست: User-agent، Disallow و گاهی Allow. این فایل برای «مدیریت مسیر خزیدن» عالیه، اما اگر اشتباه تنظیم بشه، می‌تونه کل سایت رو قفل کنه.

🧯 یک سوءتفاهم رایج: خیلی‌ها فکر می‌کنن اگر تو robots چیزی رو Disallow کنن، یعنی اون صفحه «ایندکس نمی‌شه». واقعیت اینه که Disallow یعنی «نرو بخز»، نه «ایندکس نکن». ممکنه صفحه از جای دیگه لینک بشه و گوگل بدون خزش کامل، همچنان آدرسش رو تو نتایج نشون بده (گاهی با اطلاعات ناقص). برای کنترل ایندکس، ابزار اصلی noindexـه (از طریق افزونه سئو یا هدرها)، نه robots.

🧩 حالا بریم سر اصل کاری: تنظیم درست تو وردپرس معمولاً با یک افزونه سئو استاندارد (مثل Yoast یا RankMath) خیلی راحت‌تر می‌شه، چون خودش سایت‌مپ رو می‌سازه و کلی از خطاهای انسانی رو کم می‌کنه. چیزی که تو باید انجام بدی اینه که «مطمئن شی خروجی درست تولید شده» و «چیزهای اشتباه بسته نشده».

قدم اول و خیلی حیاتی: تو وردپرس از مسیر تنظیمات → خواندن، گزینه‌ی «از موتورهای جستجو درخواست کن این سایت را بررسی نکنند» باید خاموش باشه. خیلی از سایت‌ها روی حالت طراحی این تیک رو می‌زنن و بعد یادشون می‌ره بردارن؛ نتیجه‌اش هم می‌شه اینکه کارفرما می‌گه: «چرا تو گوگل نمیاد؟!» و تو باید بری دنبال یک تیک ساده که جا مونده.

🧾 برای اکثر سایت‌های وردپرسی، robots باید «ساده و تمیز» باشه. یعنی معمولاً لازم نیست چیزی رو با وسواس زیاد ببندی. به طور پیش‌فرض، این‌ها منطقیه که خزش نشن: /wp-admin/ و بعضی پارامترهای اضافی. اما اینکه کل /wp-content/ رو ببندی یا پوشه‌های عکس رو Disallow کنی، می‌تونه دردسر درست کنه (حتی برای نمایش عکس در نتایج یا دسترسی گوگل به فایل‌های لازم).

🔗 یک کار درست و حرفه‌ای: داخل robots، آدرس سایت‌مپ رو هم معرفی کن. خیلی وقت‌ها این خط آخر کافی و مفیده:
Sitemap: https://YOURDOMAIN.com/sitemap_index.xml
این کار به خزنده‌ها کمک می‌کنه سریع‌تر مسیر نقشه رو پیدا کنن. اگر سایت‌مپت ایندکس نیست و مستقیم یک فایل دیگه‌ست، همون رو بده.

🧹 تو افزونه‌های سئو معمولاً می‌تونی تعیین کنی چی وارد سایت‌مپ بشه. پیشنهاد خودمونی: اگر سایت محتوایی/شرکتیه و هنوز استراتژی برچسب‌ها رو درست نچیدی، برچسب‌های بی‌هدف رو وارد سایت‌مپ نکن. همینطور آرشیو نویسنده و تاریخ اگر کاربرد خاصی نداره، بهتره مدیریت بشه تا سایتت پر از صفحه‌های تکراری و کم‌ارزش نشه.

🛒 اگر فروشگاه ووکامرسی داری، سایت‌مپ محصولات و دسته‌ها خیلی مهم می‌شه. اما حواست باشه: صفحه‌های فیلتر و پارامترهای URL (مثل فیلتر قیمت، رنگ، مرتب‌سازی) اگر کنترل نشه، می‌تونه هزاران URL شبه‌تکراری بسازه. اینجا بیشتر از robots، باید روی کنونیکال و تنظیمات افزونه سئو و گاهی تنظیمات فیلترها کار کنی تا گوگل گیج نشه.

⚠️ چندتا اشتباه رایج که من زیاد می‌بینم:
۱) بستن کل سایت با robots (مثلاً Disallow: /)
۲) گذاشتن سایت روی noindex و فراموش کردنش
۳) معرفی سایت‌مپ اشتباه (آدرس غلط یا فایل حذف‌شده)
۴) شلوغ کردن سایت‌مپ با برچسب‌ها و آرشیوهای بی‌هدف
۵) قاطی کردن robots با «ایندکس» و انتظار معجزه از Disallow

🕵️ اگر حس می‌کنی گوگل داره «کم صفحه» از سایتت رو میاره یا دیر ایندکس می‌کنه، اول از همه همین دو تا رو چک کن: آیا robots بازه؟ آیا سایت‌مپ قابل دسترسه؟ آیا سایت‌مپ واقعاً صفحه‌های مهم رو شامل می‌شه؟ خیلی وقت‌ها مشکل همینجاست، نه اینکه “سئو خراب” باشه.

🧪 برای تست، سه کار ساده و خیلی کاربردی انجام بده:
۱) آدرس /robots.txt رو باز کن و ببین چی نوشته
۲) آدرس /sitemap_index.xml (یا سایت‌مپت) رو باز کن و مطمئن شو لود می‌شه
۳) تو Google Search Console سایت‌مپ رو معرفی کن و گزارش‌هاش رو چک کن (اگر ارور داد، همونجا سرنخ می‌گیری)

🔎 یک تست خیلی باحال تو سرچ کنسول اینه: یک URL مهم رو بزن تو URL Inspection و ببین وضعیتش چیه. اگر می‌گه «Crawled – currently not indexed» یا «Discovered – currently not indexed»، معمولاً یا کیفیت/ارزش صفحه مشکل داره یا خزش و بودجه خزیدن درست مدیریت نشده. اینجاست که مرتب بودن سایت‌مپ و تمیز بودن ساختار سایت کمک می‌کنه.

🏗️ اگر سایت محیط تست (staging) داره، حواست خیلی جمع باشه. محیط تست باید بسته باشه، اما دامنه اصلی باید باز باشه. خیلی‌ها staging رو روی یک ساب‌دامین می‌برن و درست می‌بندن، اما بعداً همون تنظیمات یا فایل robots رو اشتباهی روی دامنه اصلی می‌ذارن. نتیجه؟ یک سایت قشنگ که گوگل اصلاً حق ورود نداره!

یک نکته مهم که خیلی‌ها جدی نمی‌گیرن: سرعت سایت روی خزش هم اثر می‌ذاره. اگر سایت کند باشه، گوگل هم کمتر صفحه می‌خزه یا دیرتر سراغ صفحه‌های عمیق می‌ره. پس کنار تنظیمات robots و sitemap، حتماً به سرعت هم فکر کن؛ مخصوصاً بهینه‌سازی عکس‌ها و کش. (اگر دوست داشتی، این مسیر رو هم کامل می‌کنه: بهینه‌سازی فرمت عکس و رفع کندی وردپرس.)

جدول جمع‌بندی تنظیمات درست (سریع و قابل اجرا)

سناریو Robots.txt Sitemap نکته مهم
سایت تازه لانچ شده ساده، فقط بستن wp-admin فعال و معرفی در سرچ کنسول تیک «نمایش به موتور جستجو» خاموش نباشد
سایت فروشگاهی با فیلتر زیاد از بستن گسترده خودداری کن محصول/دسته‌ها دقیق و تمیز کنونیکال و کنترل URLهای پارامتردار حیاتی است
سایت با برچسب‌های زیاد و بی‌هدف به robots برای حل مشکل تکیه نکن برچسب‌های بی‌ارزش را وارد سایت‌مپ نکن صفحات تکراری، بودجه خزش را می‌خورند
محیط تست (Staging) می‌تواند کاملاً بسته باشد لازم نیست معرفی شود مراقب باش این تنظیمات به دامنه اصلی نچسبد

🧷 برای اینکه این بحث رو کامل‌تر کنی و لینک‌سازی داخلی هم اصولی جلو بره، وسط همین مقاله یا مقاله‌های بعدی می‌تونی به «دسته طراحی سایت» و چندتا مطلب مرتبط لینک بدی؛ هم کاربر مسیر یادگیریش کامل می‌شه، هم ارتباط موضوعی صفحات قوی‌تر می‌شه.

📚 لینک‌های مرتبط پیشنهادی:
آرشیو مقالات طراحی سایت
چک لیست سئو تکنیکال قبل از تحویل سایت
خطاهای رایج سرچ کنسول و معنی هرکدام
دلیل کند شدن سایت وردپرس + راه حل‌های سریع
بهترین فرمت عکس برای سایت: WebP یا JPEG؟

پرسش و پاسخ (FAQ)

❓ اگر سایت‌مپ داشته باشم، دیگه نیازی به لینک‌سازی داخلی نیست؟
نه دقیقاً. Sitemap کمک می‌کنه گوگل صفحه‌ها رو پیدا کنه، ولی لینک‌سازی داخلی کمک می‌کنه «اهمیت صفحه‌ها» و «ارتباط موضوعی» بهتر فهمیده بشه. ترکیب این دوتا بهترین نتیجه رو می‌ده.
❓ robots را چطور بنویسم که هم امن باشد هم جلوی ایندکس را اشتباهی نگیرد؟
ساده نگهش دار. معمولاً بستن /wp-admin/ کافی است و بقیه را با افزونه سئو و تنظیمات noindex مدیریت کن. از دستورهای خیلی تهاجمی مثل Disallow: / مگر برای staging استفاده نکن.
❓ چرا سرچ کنسول می‌گه Sitemap قابل خواندن نیست؟
معمولاً یکی از این‌هاست: آدرس اشتباه وارد شده، سایت‌مپ با خطای سرور/کش لود نمی‌شه، افزونه سئو درست تولیدش نمی‌کنه، یا دسترسی ربات‌ها (به خاطر تنظیمات امنیتی/فایروال/کلاود) محدود شده. اول خود URL سایت‌مپ رو تو مرورگر باز کن، بعد گزارش سرچ کنسول رو چک کن.
❓ بهتره همه چیز رو وارد سایت‌مپ کنم که گوگل بیشتر ببینه؟
نه! هدف سایت‌مپ «کیفیت»ه نه «شلوغی». صفحه‌های مهم و ارزشمند رو وارد کن. آرشیوهای بی‌هدف و برچسب‌های ضعیف می‌تونن تمرکز خزش رو خراب کنن.
❓ اگر robots یک صفحه را Disallow کند، آیا حذفش از گوگل قطعی است؟
قطعی نه. Disallow یعنی گوگل کمتر/اصلاً نخزه؛ اما برای حذف یا جلوگیری از ایندکس، راه درست‌تر noindex، ریدایرکت، یا حذف و درخواست Remove در سرچ کنسول (بسته به سناریو) است.
تنظیم robots.txt وردپرس
تماس ۰۹۹۱۱۱۱۹۴۶۰