به پرسش زیر که سوال یکی از خوانندگان سایت است دقت کنید:

وب سایت ما حدود ۶ ماه است که راه اندازی شده است، با ۳ نویسنده‌ای که روی سایت کار می‌کنند روزانه ۲۰ مطلب روی سایت قرار می‌گیرد اما ورودی ما از گوگل خیلی کم است. با یک بررسی به این نتیجه رسیدیم که اکثر مطالبمان، توسط گوگل ایندکس نمی‌شوند. حالا چند سوال داریم:

چرا برخی مطالبمان توسط گوگل ایندکس نمی‌شوند؟

ویژگی مطالبی که توسط گوگل ایندکس می‌شوند چیست؟

چگونه مشکل ایندکس مطالب را حل کنیم؟

این سوال موجب شد که ما به طور اساسی به بررسی موضوع ایندکس یا Indexing توسط گوگل بپردازیم و با به چالش انداختن این موضوع تمام زیر و بم آن را مورد بررسی قرار دهیم. در متن پیش رو، به تمامی سوالات بالا و آنچه در ذهن شما برای موضوع ایندکس شدن سایت توسط گوگل و دیگر موتورهای جستجو، وجود دارد خواهیم پرداخت.

از کجا بفهمیم که مطالبمان ایندکس می‌شوند یا خیر؟

برای اینکه بدانید مطالبتان ایندکس می‌شود یا خیر  ۸ راه وجود دارد.

راه اول: اول اینکه به تناسب حجم محتوایی که تولید می‌کنید از گوگل و دیگر موتورهای جستجو، ورودی ندارید.

راه دوم : دوم اینکه، می‌توانید به طور دستی در موتورهای جستجو، سرچ کنید که به صورت زیر است:

  Google: enter site: example.com
  Bing: enter site: example.com
 Yahoo: enter site: example.com

ایندکس مطالب سایت

راه سوم: اگر فایل خاصی روی سایت بارگذاری کرده‌اید، نام آن فایل را در موتورهای جستجو سرچ کنید.

برای مثال اگر یک فایل PDF یا فایل تصویری و فیلم و عکس و یا پادکست با نام ZZZZ در سایت قرار داده‌اید. این نام را در کنار نام سایت خود سرچ کنید.

راه چهارم: بهترین روش و سریع‌ترین روش نیز این است که عنوان یک پست را در گوگل و یا دیگر موتورهای جستجو سرچ کنید. اگر مطلب شما ایندکس شده باشد، در میان صفحات نمایش داده شده، قابل نمایش است. اگر مطمئنید عنوان‌تان کاملا شخصی سازی شده است، پس به راحتی می‌توانید مطلب خود را در مکان اول از صفحه اول از نتایج گوگل آن را مشاهده کنید.

راه پنجم: اگر فکر می‌کنید مطلب شما نمونه‌های مشابهی دارد و نمی‌توانید از لابلای صدها هزار نتیجه‌ی گوگل، آن را پیدا کنید، باید ۱۲ کلمه از مطلب را ( به صورت جمله وار ) جستجو کنید. بدین طریق اگر محتوایتان اختصاصی باشد سریعا گوگل شما را پیدا خواهد کرد.

راه ششم: روش دیگر نیز این است که URL متن و پست مورد نظرتان را سرچ کنید. بدین طریق گوگل آن را یکتا فرض کرده و به شما نمایش می‌دهد.

راه هفتم: راه دیگر این است که وارد ابزار Google Webmaster Tools خود شوید. از اینجا می‌توانید به بخش Health رفته و در این بخش به Index Status دسترسی پیدا کنید. در این حالت اگر پیش از این نقشه سایت خود را ثبت کرده باشید، به شما اطلاعاتی پیرامون تعداد صفحات ایندکس شده خواهد داد.

راه هشتم: اگر ایندکس شدن در یاهو نیز برایتان اهمیت دارد می‌توانید وارد ابزار Bing Webmaster Tools شوید و از آن جا به ما بقی اطلاعات دسترسی پیدا کنید.

چگونه یک مطلب در موتور جستجو ایندکس می‌شود؟

موتورهای جستجو خزنده‌هایی دارند که دائما به سایت‌ها سر می‌زنند تا ببینید مطالب جدیدی به سایت‌ها اضافه شده یا نه. در صورتی که مطالب یک سایت در دسترس خزنده‌ها قرار بگیرد، به راحتی مورد بررسی قرار گرفته و در صورت مشاهده‌ی صلاحیت‌ها، ایندکس می‌شوند. البته این خزنده‌ها، در درجه اول، از سایت‌های جدید مطلع نیستند و این وظیفه‌ی وبمستر است که یک نوتیفی برای موتورهای جستجو ارسال کنند و به آنها بگویند که چنین سایتی وجود دارد. البته این روش برای گوگل رسمیت دارد. برخی موتورهای جستجو نیز که این پروسه را دنبال نمی‌کنند فرصتی ایجاد کرده‌اند که با روش دیگری سایت جدید خود را معرفی کنید. برای مثلا برای ثبت سایت در یاهو باید به بخش ثبت سایت در یاهو بروید.

بعد از این باید با مشاهده‌ی ورودی‌های وب سرور، دقت کنید که آیا ربات‌های موتورهای جستجو به وب سایت شما سر می‌زنند یا خیر. این ربات‌ها با نام‌هایی مثل Googleboot، bingbot  و yahoobot شناخته شده‌اند.

چقدر طول می‌کشد که یک مطلب ایندکس شود؟

موتورهای جستجو با توجه به نوع محتوا، کیفیت آن و میزان اعتماد سایت، مدت زمان متفاوتی را صرف ایندکس کردن می‌کنند. گاهی مطلب جدید سایت شما، به محض ایجاد، حداکثر طی ۱ ساعت، در گوگل نمایان می‌شود ولی گاهی باید تا ۱ هفته نیز منتظر بمانید.

اگر وب سایت شما، فقط چند روز روی گوگل و دیگر موتورها نمایش داده شود و بعد حذف شود این یعنی سایت شما صلاحیت ایندکس را ندارد و باید موانع ایندکس شدن مطالب سایت را مورد بررسی قرار دهید. گاهی مطالب شما تنها تا ۱ ماه در گوگل نشان داده شده و بعد از آن حذف می‌شوند. این نیز نشان از عدم صلاحیت مطالب شما برای ماندن در گوگل دارد.

ایندکس مطالب

اگر مطلبی ایندکس شود و بعد آن را حذف کنیم باید چه اقدامی کنیم؟

گوگل شوخی بردار نیست! یعنی اگر یک مطلب بنویسید و گوگل آن را مفید بداند ولی شما آن را حذف کنید به منزله‌ی وارد آوردن خسارت به گوگل، شناخته می‌شود. بدین طریق گوگل در مورد سایت شما در چنین شرایطی تصمیماتی خواهد گرفت که دور از جریمه کردن نیست. از این رو باید توسط فایل‌های robots.txt  و META robots خزنده‌های موتور جستجو را از بررسی کردن این مطالب و لینک‌ها منع کنید. robots.txt بهترین چیزی است که می‌توانید از آن استفاده کنید.

طریقه استفاده از robots.txt برای منع خزنده‌های گوگل به صورت زیر است.

برای منع یک فایل خاص از شبه کد زیر استفاده کنید:

User-agent: *
 Disallow: /directory/name-of-file.html

برای منع یک دایرکتوری کامل، از شبه کد زیر استفاده کنید:

User-agent: *
 Disallow: /first-directory/
 Disallow: /second-directory/

طریقه استفاده از META robots برای منع خزنده‌ها برای دنبال کردن لینک و مطالب به صورت زیر است:

اگر از شبه کد زیر استفاده کنید به این معنی است که به خزنده‌ها اجازه نمی‌دهید که مطالب مورد نظر را ایندکس کنند و لینک داخل متن را نیز دنبال (follow ) کنند:

<meta name="robots" content="noindex, nofollow">

این قطعه کد به دو صورت دیگر نیز مورد استفاده قرار می‌گیرد و به بیان دیگر اصلاح پذیر است:

<meta name="robots" content="index, nofollow">

این بدین معنی است که تنها به لینک‌ها اجازه‌ی دنبال شدن نمی‌دهید اما منعی برای ایندکس شدن مطلب حاوی لینک وجود ندارد.

<meta name="robots" content="noindex, follow">

در اینجا نیز، به موتور جستجو، اجازه ایندکس نمی‌دهید اما از آن می‌خواهید که لینک داخلی متن را دنبال کند.

نکته مهم این است که عبارت noindex تنها بر روی موتورهای جستجو تاثیر خواهد گذاشت، اما بازدید کنندگان سایت به راحتی و بدون هیچ مشکلی می‌توانند مطالب را بخوانند و از آن استفاده کنند.

موانع ایندکس شدن مطالب توسط گوگل :

حالا اگر همه چیز درست باشد و باز هم می‌بینید که محتوایتان به درستی ایندکس نمی‌شود باید به یکی از راه‌های زیر، توجه کنید. شاید وب سایت شما شامل یکی از فاکتورهای زیر شود:

content-indexing-problems

عدم کیفیت محتوا:

خزنده‌های موتور جستجو، با دنبال کردن صفحات با کیفیت سعی می‌کنند آن را ایندکس کنند. درصورتی که سایت یا مطالب مورد نظر شامل یکی از شرایط زیر باشد، هرگز مطالب آن را ایندکس نمی کنند:

الف: سایت مورد نظر از نوع هرزنامه باشد یا مطالب آن عجیب و بی‌معنی باشد.

ب: مطالب سایت را در جای دیگری نیز دیده باشند. اگر از مطلب‌های کپی استفاده کنید، گوگل تنها یکی از مطالب مشابه را ایندکس خواهد کرد که از شهرت بیشتر و لینک‌های خارجی بیشتری برخوردار باشد.

ج: مطالب کم حجم، عموما ارزشی برای انتقال اطلاعات ندارند از این رو، موتورهای جستجو، به مطالب بلند‌تر اهمیت بیشتری می‌دهند و در ایندکس کردن به آن‌ها توجه بیشتری نشان می‌دهند.

د. صفحاتی که لینک‌های خارجی کمی به آن‌ها وارد شده است، توسط گوگل چندان که باید مورد پذیرش قرار نمی‌گیرند اما این موضوع نباید موجب وارد شدن شما به مبحثی به نام link farming شود.

صفحات شما کدهای وضعیت  http اشتباهی ارسال می‌کنند

کدهای وضعیت به ربات‌ها اجازه می‌دهند که مطالب سایت شما را بررسی کنند. یک صفحه معمولا دارای ۲۰۰ کد وضعیت موفق است که مشهور‌ترین آن‌ها این دو مورد است که برای سرور مورد استفاده قرار می‌گیرد :

۳۰۱جابجایی دایمی :این درخواست و تمامی درخواست‌های آینده به یک آدرس جدید منتقل خواهد شد.

۴۰۳ ممنوع شده : سرور از پاسخ دادن به درخواست امتناع می‌کند.

به منظور بهینه‌ سازی موتور‌های جستجو ، کد ۳۰۱ استفاده می‌شود تا از طریق آن به طور اصولی بتوانید بازدیدکنندگان را بین مسیرهای تغییر داده شده، به درستی هدایت کنید.

 صفحات شما به کوکی‌های جاوا اسکریپت نیاز دارند

کوکی‌ها و جاوا اسکریپت‌ها می‌توانند روبات‌های موتور جستجو را از دروازه‌های شما دور نگه دارد. برای نمونه شما می‌توانید با کوکی‌هایی، به کاربران اجازه دسترسی به محتوا را بدهید اما موتورهای جستجو را از این کار منع کنید که این کار بیشتر به شکل مخفی کردن بروز می‌کند. البته این کار گاهی به تولید کدهای پیچیده می‌انجامد. .بیشتر ربات‌های موتور جستجو از اجرای کدهای جاوا اسکریپت پیچیده خودداری می‌کنند بنابراین امکان خواندن صفحات شما را خواهند داشت.گوگل ممکن است برای تجزیه این صفحات آن‌ها را توسعه و تغییر دهد که در این حالت شما بی‌دلیل کار را سخت کرده‌اید.

صفحاتی که از رمز عبور استفاده می‌کنند، نیز ایندکس نمی شوند

صفحاتی که با پسورد حفاظت می‌شوند تنها برای کاربرانی که از رمز عبور برخوردارند، قابل شناسایی هستند و از این رو، موتورهای جستجو بدان‌ها راهی ندارند. به طور کلی پسورد گذاشتن برای صفحات اثر منفی بر سئوی صفحه‌ی مورد نظر و تجربه کاربری خواهد گذاشت. بنابراین بهتر است از تدابیر امنیتی دیگری بجای رمز گذاری استفاده کنید.

مشکلات ناشی از تگ‌های عنوان مشابه:

موضوع عدم ایندکس، گاهی به دلایل سهوی نیز پیش می‌آید. برای مثال فروشگاه‌های اینترنتی عموما صفحات مشابه زیادی دارند از این رو، وبمستر‌ها با ایجاد صفحات مشابه، سعی در تنظیم مشخصات محصولات می‌کنند و در نهایت، فراموش می‌کنند تگ‌های عنوان را تغییر دهند. به همین دلیل موتورهای جستجو، تمام صفحات را یک صفحه تصور می‌کنند. در خوشبینانه‌ترین حالت، موتور‌های جستجو، تنها یک صفحه از میان صفحات را انتخاب و نمایش می‌دهند که البته اگر بد شانس باشید، با توجه به الگوریتم‌های گوگل، مورد هجوم جریمه‌هایی قرار می‌گیریدکه گاهی کل سایت تجاری شما را از بین خواهد برد. بنابراین دقت در اصول موتورهای جستجو اصلی بسیار مهم است.

در صورتی که تگ‌های عنوان مشابه داریم می‌توانیم عناوین را به صورت محلی بهینه سازی کرد تا هم از یک اصول و استراتژی سئو بهره مند شوید و هم به موتور جستجو فرصتی متفاوت دهید که هر دو عنوان شما را نگهداری کند.  برای مثال اگر دو عنوان به صورت زیر دارید :

فروش لوازم تحریر

بهتر است که یکی از آن‌ها را به صورت زیر بهینه کنید:

فروش لوازم تحریر در شیراز

بدین صورت هر دو صفحه همچنان باقی خواهند ماند و مولد فرصت‌های جدید نیز خواهند بود.

مشکلات ناشی از عمق لینک مطلب و یا معماری سایت:

هر چه عمق یک لینک بیشتر باشد، خزنده‌ها و ربات‌ها به سختی بیشتری به آن‌ها دسترسی پیدا می‌کنند و گاهی ربات‌ها تا حد معینی بیشتر پیش نمی‌روند. هر چه لینک مطلب، به دامنه نزدیک‌تر باشد، برای خزیدن و ایندکس شدن، بیشتر مورد پسندیدن قرار می‌گیرند.

این کار را به کتابخانه‌ای تشبیه کنید که کتاب‌ها در زیر مجموعه‌های گسترده‌ای طبقه بندی شده‌اند. مطمئنا هیچ کدام از ما وقت و حوصله این را نداریم که بخواهیم، کل زیر مجموعه‌ها را مورد بررسی قرار دهیم تا به کتاب مورد نظر دسترسی پیدا کنیم.

بعد از حل موانع ایندکس مطالب باید چکار کنیم؟

بعد از این که وب سایت خود را مورد بازبینی قرار دادید و مشکلات بر شمرده شده را حل کردید می‌توانید یکی از دو کار زیر را انجام دهید :

اول اینکه صبر کنید تا خزنده‌ها و ربات‌ها، سایت شما را مورد بازدید قرار دهند و عملیات ایندکس را از نو شروع کنند. این کار ممکن است از یک ساعت تا ۱ هفته به طول بینجامد.

دوم اینکه با استفاده از ابزار وب مستر در بخش fetch and crawl feature به موتورهای جستجو هشدار دهید تا سریع‌تر به سایت شما سر بزنند.

کاربرد مفید منع بازدید خزنده‌ها برای چه زمانی است؟

گاهی از اوقات، وبمسترها می‌خواهند محتوایی را صرفا برای یک عده‌ی خاص ایجاد کنند به طوری که دیگران نتوانند از طریق جستجوی موتورهای جستجو، به این مطالب دست پیدا کنند. بهترین روش اقدام توسط noindex است. این کار در بسیاری از اوقات شامل قوانین محرمانگی است.

در بسیاری از اوقات، وبمسترها تنها برای اینکه بتوانند بخش‌هایی از سایت را آنالیز کنند، اقدام به منع بازدید خزنده‌ها برای مدت محدودی می‌نمایند. برای نمونه وقتی که مدیر بازاریابی قصد دارد کمپین‌های مختلف را مورد بررسی قرار دهد، نا چار است صفحاتی که در نتیجه آنالیز تاثیر منفی دارند را بلاک کند تا بهترین نتیجه را بگیرند.

گاهی اوقات در سایت‌های تبلیغاتی، نیز برای جلوگیری از لینک‌های خارجی زیاد، و اثر منفی آن، لینک‌ها را no follow می‌کنند.

موضوع عدم ایندکس، گاهی به دلایل سهوی نیز پیش می‌آید. برای مثال فروشگاه‌های اینترنتی عموما صفحات مشابه زیادی دارند از این رو، وبمستر‌ها با ایجاد صفحات مشابه، سعی در تنظیم مشخصات محصولات می‌کنند و در نهایت، فراموش می‌کنند تگ‌های عنوان را تغییر دهند. به همین دلیل موتورهای جستجو، تمام صفحات را یک صفحه تصور می‌کنند. در خوشبینانه‌ترین حالت، موتور‌های جستجو، تنها یک صفحه از میان صفحات را انتخاب و نمایش می‌دهند که البته اگر بد شانس باشید، با توجه به الگوریتم‌های گوگل، مورد هجوم جریمه‌هایی قرار می‌گیریدکه گاهی کل سایت تجاری شما را از بین خواهد برد. بنابراین دقت در اصول موتورهای جستجو اصلی بسیار مهم است.

 

برچسب ها
در همین زمینه میخوانید ...
نظرات
نام و نام خانوادگی
پست الکترونیک
کد امنیتی

Time limit is exhausted. Please reload the CAPTCHA.