ساختار موتورهای جستجو و جویشگرها

1- ساختار موتورهای جستجو

اکنون شما یک ایده فازی از این که یک موتور جستجو چطوری کارها را انجام می دهد دارید اما اینجا بررسی دقیقتری درباره آن خواهیم داشت. در واقع موتورهای جستجو چندین بخش دارند، متاسفانه اطلاعات دقیق در مورد ساختار موتور جستجو خیلی کم است – اطلاعاتی مهم که شرکت ها آنها را در اختیار عموم قرار نمی دهند – اطلاعاتی که برای پیشرفت سئو (SEO) یا بهینه سازی موتورهای جستجو (Search Engine Optimization) مهم و حیاتی هستند. مولفه های واسط جستجو، پایگاه داده ها و الگوریتم های جستجو سه مولفه اصلی تشکیل دهنده ساختار موتور جستجو هستند که جزئیات آنها در ادامه تشریح شده است.

1-1- واسط جستجو

واسط جستجو چیزی است که اکثر مردم با آن آشنا هستند و احتمالا موقعی که واژه “موتور جستجو” را می شنوید به ذهنتان می آید. واسط جستجو یا واسط کاربر صفحه ای است که کاربران موقع هدایت کردن موتور جستجو برای پیدا کردن یک واژه، می بینند.

یک زمانی شکل زیر واسط موتور جستجوی ASK بود این واسط یک صفحه ساده با یک کادر جستجو و یک دکمه ارسال برای جستجو بود نه چیزی بیشتر.

امروزه اکثر موتورهای جستجو در وب تلاش بیشتری در جهت اضافه کردن جنبه های شخصی سازی شده روی تم و شمای گرافیکی خود دارند مثلا موتور یاهو که در شکل زیر نشان داده شده سرویس هایی مثل ایمیل رایگان، اخبار، اطلاعاتی درباره آب و هوا، ورزش و اجزای زیاد دیگری را فراهم کرده است تا کاربرانی که به آن سایت رجوع می کنند جستجوهای آنها اداره شود.

کاربران برای واسط های مشهور و متداول یک انتخاب دیگر هم دارند این قابلیتی است که موتور جستجوی گوگل فراهم کرده است. موتور جستجوی گوگل یک واسط متداول است که کاربران می توانند ابزارهای متفاوتی به ان اضافه کنند. با این ابزارها کاربران قادرند ویژگی هایی متناسب با سلیقه یا نیازهای شخصی به صفحه اول گوگل اضافه کنند.

عملیات جستجو، حتی روی دسکتاپ هم توسعه یافته است. گوگل و مایکروسافت هر دو قابلیتی دارند که وقتی روی کامپیوتر نصب می شوند شما قادرید هارد دیسک را برای پیدا کردن مستندات و اطلاعات جستجو کنید مانند روش جستجو در وب. در واقع یک موتور جستجوی محلی روی سیستم نصب و برای جستجوی فایل های سیستم نیز استفاده می شود.

موقعی که SEO ظهور کرد، گوگل واسط کاربری ارائه نمود که گوگل برای جستجوی سایت های شما بهینه تر عمل کرد. اگر یک ابزار یا ویژگی مفیدی روی سایت شما قرار دارد شما می توانید کاربران را قادر سازید تا به این ابزار و ویژگی ها از طریق واسط برنامه کاربردی (API) که در گوگل موجود است دسترسی داشته باشند. با API گوگل شما می توانید ابزاری ایجاد کنید که کاربران بتوانند روی دسکتاپ خود صفحه گوگل، مرورگر فایرفاکس یا کروم را نصب کنند.

1-1-1- صفحه های حاصل شده از موتور جستجو

واسط جستجو و بخش های دیگر موتور جستجو که برای کاربران قابل رویت است به عنوان “صفحه های حاصل شده از موتور جستجو (SERPs)” شناخته می شوند. این صفحه های جمع آوری شده که حاصل جستجو هستند بعد از اینکه کاربر واژه یا عبارت مورد نظر را در کادر جستجو وارد کرد برگشت داده می شوند. رسیدن به هدف و بالا بردن سرعت جستجو نهایت چیزی است که شما می خواهید.

اجازه بدهید تا با شناخت روشی که کاربران SERPs را می بینند بحث را شروع کنیم. وانمود کردن شما به عنوان یک جستجو کننده، شما ابتدا بایستی موتور جستجوی مورد نظرتان را انتخاب کنید. ما از گوگل برای نشان دادن اهداهمان استفاده خواهیم کرد چونکه هرکسی آن را  می شناسد. موقعی که شما دکمه ارسال را برای جستجوی یک واژه می زنید، اولین چیزی که شما در صفحه ظاهر شده می بینید چییست؟. درست است اولین چیزی که شما می بیند یکسری لینک و اطلاعات توصیفی در مورد هدف مورد جستجوی خودتان است.

اکثر مردم شروع به مطالعه عناوین و توصیفات اولیه نتایج می کنند که شما با کلیک کردن روی لینک های پیشنهادی که روی صفحه وب تان قرار دارد در دام جستجوکننده ها می افتید اما شما باید به اندازه کافی عمل جستجو را انجام بدهید و با کلیک کردن روی یکی ازنتایج اولیه که معمولا بین 10 تا 20 است می توانید جزئیات عناوین و توصیفات نتایج را ببینید. اصولا اولین یا دومین صفحه از نتایج بیشترین ضریب توفیغ در مورد هدف را دارند.

این سحر، جادو و فرموله بندی نیست که شما به پایگاه داده ها در هر زمانی دسترسی خواهید داشت اما در عوض آن کار سخت و طاقت فرسایی است که سایت شما با اولویت بالاتر در SERPs قرار گیرد. به هر حال اینجا شناخت درستی از اینکه چطوری صفحات در SERPs قرار می گیرند وجود دارد. شما واقعا نیاز دارید که بدانید موتورهای جستجو چطوری این کار را انجام می دهند.

2-1-1- خزنده ها، عنکبوت ها (اسپایدرها) و رباتها

واسط جستجو و صفحه های حاصل از جستجو واقعا فقط بخشی از یک موتور جستجو است که کاربران می بیند. هر بخش دیگر از موتور جستجو که در پشت صحنه قرار دارد فراتر از دید مردم است که امروزه در موتور جستجو استفاده می شود. آن بدین معنا نیست که این بخش ها مهم نیستند. در واقع اجزای پشت صحنه مهمترین بخش یک موتور جستجو است.

اگر شما دارید از اینترنت استفاده می کنید ممکن است کمی درباره خزنده ها، اسپایدرها و رباتها شنیده باشید. این ابزارهای  کوچک برنامه هایی هستند که پیمایش را روی وب و کاتالوگ داده ها به خوبی انجام می دهند، بنابراین می توانند جستجو را هم انجام دهند. در تمام حالت های پایه این سه برنامه اجزای ضروری یک موتور جستجو هستند. آنها تمام اطلاعات درباره آدرس های URL که روی وب قرار دارند را جمع آوری می کنند. این اطلاعات فهرستی از URL هایی هستند که مکان و محل ذخیره سازی آنها روی پایگاه داده ها را نشان می دهد. موقعی که کاربر از یک موتور جستجو برای پیدا کردن بعضی چیزها استفاده می کند این موتور به پایگاه داده خود رجوع می کند و در صورت وجود نتایج جستجو را از پایگاه داده بر می گرداند.

2-1- پایگاه داده ها

هر موتور جستجویی ارتباط نزدیکی با سیستم پایگاه داده ها دارد که داده های مربوط به هر URL روی وب در آن پایگاه داده ها ذخیره می شوند. این پایگاه داده ها نواحی عظیم ذخیره سازی هستند که داده های متعدد مربوط به هر URL در آن قرار می گیرد.

داده ممکن است با روش های مختلف و با یک ترتیب خاص روی یک پایگاه داده قرار بگیرد یا از آن بازیابی شود که معمولا این روش ها توسط شرکت های مالک موتور جستجو اولویت بندی می شوند.

شما احتمالا درباره رتبه بندی صفحات که “نرخ صفحه” یا در حالت کلی “نشان کیفیت” نامیده می شود، شنیده اید. این رتبه بندی و نشانه گذاری یکی از پیچیدگی ها و بخش های پنهان SEO است. اینکه رتبه بند ها چطوری بدست می آیند، واقعا یک معما است. چونکه شرکت های دارنده موتور جستجو میزان امتیاز اجزای استفاده شده روی وب (صفحات) را بر طبق الگوهای کاربردی تغییر می دهند.

این ایده امتیاز دهی صفحات بر مبنای تعداد بینندگانی است که از یک صفحه سایت دیدن می کنند، ناشی می شود نه اینکه چطوری طراحان وب سایت اجزای صفحات وب را دستکاری کنند که امتیاز صفحه بالاتر گردد. برای مثال یک زمانی کلمات کلیدی فاکتورهای مهمی  بودند که استفاده از آنها امتیاز صفحه را بالاتر می برد اما اکنون شرایط رتبه بندی تغییر کرده است.

1-2-1- نگاهی دقیق تر به نرخ صفحه (رتبه صفحه)

نرخ صفحه یک مساله پیچیده است که ممکن است هرگز به طور کامل اشکار نشود. کتاب هایی درباره آن نوشته شده اما احتمالا فقط دو نفر در جهان وجود دارند که به طور کامل آن را می فهمند آن دو نفر لاری پیج (Larry Page) و سرجی برین (Sergey Brin) هستند چونکه مساله نرخ صفحه زاییده افکار آنها است.

نرخ صفحه واقعا قسمتی از پروژه تحقیقاتی بود که پیج و برین در دانشگاه استنفورد (Stanford) روی آن کار می کردند. پروژه شامل ایجاد کردن یک موتور جستجوی جدید بود که نرخ صفحه ها در یک روش ساده بایستی به درستی عمل می کرد.

چیزهای جالبی درباره نرخ صفحه است. اگرچه پیج و برین  ایده نرخ صفحه را ارائه و الگوریتم آن را نوشتند اما نرخ صفحه به آنها تعلق ندارد. دانشگاه استنفورد حق امتیاز الگوریتم نرخ صفحه را داشت تا اینکه گوگل برای استفاده انحصاری از الگوریتم، سهام آن را خریداری کرد. نرخ صفحه متدی است که به وسیله آن صفحات وب در نتایج جستجوی گوگل رتبه بندی می شوند. یک ترکیبی از فاکتورهای ایجاد شده که واقعا امتیاز یک صفحه را مشخص می کند.

2-2-1- توضیحات گوگل در این زمینه

نرخ صفحه به طبیعت منحصر به فرد وب متکی است آن هم به واسطه استفاده گسترده از ساختار لینک که به صفحه های شخصی با ارزش اشاره می کند. در حالت کلی گوگل یک اتصال از صفحه A به صفحه B را به عنوان یک امتیاز یا رای در نظر می گیرد که به واسطه صفحه A ایجاد شده است. اما گوگل بررسی های بیشتری برای امتیازها انجام می دهد یا اینکه لینک های دریافتی یک صفحه را می شمارد. گوگل همچنین صفحه ای را که امتیازش بیشتر است تجزیه و تحلیل می کند به طوری که امتیازهای صفحاتی که اهمیت بسزایی دارند و به صفحات دیگر کمک می کنند تا امتیاز آنها هم بیشتر شود در این تجزیه و تحلیل بررسی می شوند. در واقع یک صفحه که لینک های بیشتری دارد ممکن است امتیازش نسبت به صفحه ای که یک لینک دارد کمتر باشد و این نکته بایستی حتما در نظر گرفته شود که صفحات برای بینندگان ایجاد می شوند نه برای موتورهای جستجو.

3-2-1- کیفیت ملاحظات

خدمت به مشتری شامل هر چیزی است نه اینکه فقط یک چیز را دربر گیرد. آن یک دسته از فاکتورهای مختلف از قبیل – سلام و درود، طرز فکر و دانش – است که با همدیگر یک تجربه خوشایند را ایجاد می کنند. روش امتیاز دهی یک صفحه وب به همین شکل است. بنابراین اگر می خواهید که وب سایت شما رتبه خوبی در موتورهای جستجو داشته باشد، نیاز است که به کیفیت صفحات وب توجه شود.

اختلاف در امتیاز صفحات به روشی که شما اجزای طراحی شده را اندازه گیری می کنید بر می گردد. برای مثال بعضی از اجزایی که شناخته شده هستند و میزان امتیاز صفحه را بالا می برند به شرح ذیل هستند:

■ نام های دامنه و URL ها

■ محتوای صفحه

■ ساختار لینک

■ قابلیت استفاده و دسترس پذیری

■ برچسب های متا

■ ساختار صفحه

حقیقتا فقط کسی که الگوریتم امتیاز دهی صفحات را ایجاد کرده است روش کار فاکتورها را می فهمد اما مسلما شناخت این فاکتورها یک چیزی است که امتیاز سایت و نتایج موتور جستوجوی شما را بهتر می کند و این بدان معنی است که بیشتر ترافیکی که شما با آن روبرو خواهید بود مربوط به موتورهای جستجو است.

3-1- الگوریتم های جستجو

همه بخش های موتور جستجو مهم هستند اما الگوریتم جستجو قسمتی است که بر روی هر چیزی کار می کند. به صورت دقیق تر الگوریتم جستجو اساس هر چیزی است. روشی که موتور جستجو بر مبنای الگوریتم جستجو کار می کند ارتباط نزدیکی به روشی که داده توسط کاربر کشف می شود، دارد.

در بیشتر اصطلاحات عمومی الگوریتم جستجو یک رویه حل مساله است که یک مساله را می گیرد و تعدادی از جواب های ممکن را ارزیابی می کند سپس راه حل را بر می گرداند. یک الگوریتم جستجو در موتور جستجو یک مساله را می گیرد (واژه یا عبارت مورد جستجو) و به داخل پایگاه داده ها که شامل کاتالوگ کلمات کلیدی و URL ها است منتقل می کند و بعد از آن عمل مقایسه را انجام می دهد سپس صفحاتی را که شامل کلمه یا عبارت مورد جستجو هستند یا صفحه ای را که به یک URL در صفحه ای دیگر اشاره می کند را بر می گرداند. به طور کلی الگوریتم جستجو به ازای هر درخواستی که از سمت کاربر دریافت می کند، پایگاه داده موتور جستجو را مورد بررسی قرار می دهد و نهایتا نزدیک ترین جواب از طریق واسط جستجو به کاربر نمایش داده می شود.

الگوریتم جستجو این نتایج را بر مبنای بهترین تفسیر درست از صفحه که نتیجه و امتیاز بالاتری دارد باز می گرداند. الگوریتمی که استفاده می شود این کارها را به درستی و با کمترین اشتباه بر طبق یک ترتیب خاص انجام می دهد. اینجا چندین طبقه بندی از الگوریتم های جستجو وجود دارد و هر موتور جستجوی از الگوریتم هایی استفاده می کند که کمی با هم تفاوت دارند. الگوریتم های جستجو معمولا به سه دسته عظیم تقسیم می شوند: 1. الگوریتم های صفحه 2. الگوریتم های کل سایت 3. الگوریتم های خارج از سایت.

هر کدام از این الگوریتم ها اجزای متفاوتی از صفحه وب را بررسی می کنند. این سه نوع هنوز هم بخش اعظم الگوریتم های جستجو را تشکیل می دهند. در مقاله “الگوریتم های موتورهای جستجو” جزئیات هر یک از این الگوریتم ها به طور کامل تشریح شده است.

نظر بدهید

آدرس ایمیل تان منتشر نخواهد شد.