محركات البحث
محركات بحث
Search engines - Moteurs de recherche
محركات البحث
محرك البحث search engine هو برنامج مصمم للمساعدة على العثور على المعلومات المخزنة في نظام حاسوبي مثل الشبكة العنكبوتية العالمية «الوِب» world wide web (WWW) أو الحاسوب الشخصي. ويسمح محرك البحث للمستخدم بأن يطلب المحتوى الذي يقابل معايير محددة (والقاعدة فيها تلك المعايير التي تحتوي على كلمة أو عبارة ما) ويسترجع قائمة بالمراجع توافق تلك المعايير. تستخدم محركات البحث فهارس منتظمة التحديث لتعمل بسرعة وفعاليّة.
لمحة تاريخية
قبل قدوم الشبكة العنكبوتية (الوِب web)، طُور برنامج أرشي Archie بوصفه أول محرك بحث في عام 1990 من أجل البحث في قاعدة بيانات أسماء الملفات الموجودة في مواقع «بروتوكول» نقل الملفات File Transfer Protocol (FTP)، كما جاء محرك البحث ڤيرونيكا Veronica في عام 1991 من أجل البحث في الملفات النَصِّية المخزنة في «بروتوكول» غوفر Gopher.
وكان واندكس Wandex أول محرك بحث وِب، طَوَّره ماثيو غراي Matthew Gray في معهد ماساشوستس للتكنولوجيا MIT في عام 1993. وأُطلق المحرك أليوِب Aliweb في العام نفسه محرك بحث آخر مبكراً ولازال سارياً إلى اليوم. وظهر وِب كراولر WebCrawler في عام 1994 أول محرك بحث قائم على الزاحف العنكبوتي للنصوص الكاملة.
بعد ذلك بقليل، أُطلق العديد من محركات البحث وتزاحمت على الشعبية . وكان منها إكسايت Excite، ولايكوس Lycos، وإنفوسيك Infoseek، وألتا فيستا AltaVista. وفي بعض الحالات تنافست مع أدلة الوِب ذات الشعبية مثل ياهو Yahoo.
ظهرت فيما بعد محركات بحث كثيرة أخرى مثل محرك البحث هوت بوت Hotbot، وآسك چيڤز/تيوما Ask Jeeves/Teoma، ونورثرن لايت Northern Light، وتيوما Teoma وغيرها.
وكان أول ظهور لمحرك البحث غوغل Google في عام 1998 الذي صار فيما بعد الأكثر شعبية ونجاحاً، كما أطلق محرك البحث إم إس إن MSN في عام 2004.
وكانت هناك محركات بحث تبحث فقط في أنواع محددة من المحتوى مثل محرك البحث غوهوك GoHook لملفات پي دي إف PDF.
أنواع محركات البحث
1- محركات البحث العامة: أهم محركات البحث العامة والمسيطرة على السوق في الوقت الحالي هي: غوغل، وياهو، وإم إس إن. وتعد هذه المحركات الأقوى والأكثر شعبية بين محركات البحث، وتميل المحركات الأخرى إلى أن تكون بوابات تعرض نتائج محركات بحث شركات أخرى.
- غوغل: من أحد أفضل محركات البحث الحالية، اكتسب مرتبته العالية من واجهته البسيطة ونتائج البحث المميزة له، ويمتلك أكبر قاعدة بيانات لصفحات الوِب التي تتضمن وثائق وِب من مختلف الأنواع (مثل الـ بي دي إف PDF، والورد Word، والإكسل Excel، والبَوَربوينت Power Point). ويتميز بترتيب نتائج البحث.
- ياهو: من أكثر مواقع البحث شعبيةً على الوِب وكان أول محاولة كبيرة لتنظيم المعلومات الموجودة على الإنترنت وتصنيفها.
- إم إس إن: آخر أحدث محركات البحث الكبرى وهو ملك شركة ميكروسوفت. يدعمه زاحف وِب يخصها اسمه إم إس إن بوت.
2- محركات البحث المتخصصة: تُعنى محركات البحث المتخصصة باسترجاع موضوعات خاصة أو صفحات وِب متخصصة، ويدخل ضمن هذا النوع من المحركات: محركات البحث عن الصور والوسائط المتعددة المختلفة مثل كوربيس Corbis وميوزيك سيرش Music Search وفايند ساوندس Find Sounds وأوديو فايند Audio Find وويف سيرتش Wave Search، ومحرك البحث توبيكا Topica، ومحركات البحث عن الأخبار، ومحركات البحث الشخصية، ومحركات البحث الإقليمية، ومحركات البحث عن عنوانات البريد الإلكتروني مثل بيك سيرتش Pic Search، ومحركات البحث المخصصة للأطفال، ومحركات البحث النقَّالة.
3- محركات البحث البينية: إن السمة الأساسية لمحركات البحث البينية هي أنها لا تمتلك قاعدة بيانات خاصة بها، بل تستعين بقواعد بيانات محركات البحث الأخرى من أجل إجابة طلبات المستخدمين. فتتولى محركات البحث البينية مهمة إرسال الاستعلامات إلى محركات بحث متعددة وأدلة وِب وقواعد معطيات أخرى. وتُجمّع الإجابات وتوحدها باستخدام عدة طرق لتحديد مواءمة الوثائق في تلك الإجابات. تحدد المواءمة بحساب مجموع مواءمات محركات البحث التي وجدت الوثيقة أو حساب معدلها. ومن ثمّ تُغطى صفحات الوِب تغطيةً واسعةً.
طرائق عمل محركات البحث
يتألف محرك البحث من ثلاثة أجزاء رئيسة هي: برنامج العنكبوت spider program، وبرنامج المُفهرِسindexer program ، وبرنامج محرك البحث search engine program.
1- برنامج العنكبوت: تستخدم محركات البحث برنامج العنكبوت لإيجاد صفحات جديدة على الوِب لإضافتها، ويسمى هذا البرنامج أيضاً الزاحف crawler لأنه يُبحر في الإنترنت بهدوء لزيارة صفحات الوِب والاطلاع على محتوياتها، ويأخذ هذا البرنامج مؤشرات المواقع من عنوان الصفحة والكلمات المفتاحية التي تحويها، إضافة إلى محتويات محدِّدات علام الميتا Meta tags فيها. ولا تقتصر زيارة برنامج العنكبوت على الصفحة الأولى للموقع بل يتابع البرنامج تعقُّب الروابط links الموجودة فيها لزيارة صفحات أخرى. أما الغاية من هذه الزيارات فهي وضع النصوص المنتقاة في نظام الفهارس لمحرك البحث، ليتمكن المحرك من العودة إليها فيما بعد. ولم تغب فكرة تغيّر المحتوى في الموقع عن بال مصممي محرك البحث، إذ ينظم محرك البحث زيارات دورية للمواقع الموجودة في الفهرس للتأكد من التعديلات التي تصيب المواقع المفهرسة.
2- برنامج المُفهرِس: يُمثل برنامج المُفَهرِس «الكتالوج» أحياناً، قاعدة بيانات ضخمة توصِّف صفحات الوِب، وتعتمد في هذا التوصيف على المعلومات التي حصلت عليها من برنامج العنكبوت؛ كما تعتمد على بعض المعايير مثل الكلمات الأكثر تكراراً من غيرها، وتختلف محركات البحث عن بعضها في هذه المعايير، إضافة إلى اختلافها في خوارزميات المطابقة والترتيب.
3- برنامج محرك البحث: يبدأ دور برنامج محرك البحث عند كتابة طلب المستخدم في مربع البحث، إذ يأخذ هذا البرنامج الطلب وِبحث في قاعدة بيانات الفهرس عن صفحات الوِب التي تحقق الاستعلام الذي كونه برنامج المُفهرس، ثم تُعرَض نتيجة البحث المتمثلة بصفحات الوِب الأكثر مواءمةً تبعاً لمعاييره في نافذة المتصفح.
ويمكن أن يكون الطلب كلمة أو عبارة، وتمكِّن محركات البحث عادةً من استخدام بعض المعامِلات لتوفير خيارات إضافية لعملية البحث. مثلاً: تستخدم علامات التنصيص " " للبحث عن العبارة المحددة بين هذه العلامات كما هي، ويُستخدَم رمز النجمة * للبحث عن كلمة عُلِمَ أحد مقاطعها، وعلامة + قبل الكلمة فإن هذه الكلمة تصبح إجبارية، وبالعكس عند وضع علامة - قبل الكلمة فالمطلوب هو عدم ورود الكلمة في الصفحات المسترجعة. كما يستخدم المعامل المنطقي AND للبحث عن الصفحات التي تحتوي على الكلمتين الموجودتين قبله وبعده، والمعامل OR للبحث عن الصفحات التي تحتوي على أي من الكلمتين الموجودتين قبله وبعده، والمعامل NOT للبحث عن الصفحات التي لا تحتوي على الكلمة التي تليها، والمعامل NEAR للبحث عن الصفحات التي تكون فيها الكلمة الموجودة قبل NEAR قريبة من الكلمة الموجودة بعدها، وغيرها من المعاملات. كما تمكِّن محركات البحث من تحديد مجالات البحث للوصول إلى نتائج أكثر دقة.
ويعتمد مدى فائدة محرك بحث على مدى صلة النتائج التي يسترجعها بطلب المستخدم. فقد تكون هناك ملايين صفحات الوِب التي تحتوي على كلمة أو عبارة محددة، إلا أن بعض هذه الصفحات يمكن أن يكون أوثق صلة أو أروج أو معتمدة أكثر من غيرها. لذا توظِّف معظم محركات البحث أساليب لوضع مراتب النتائج لتقدم أفضل النتائج أولاً. وتختلف محركات البحث في كيفية تحديد الصفحات الأكثر مواءمةً، والنظام الذي تظهر به النتائج.
مستقبل محركات البحث
تواجه محركات البحث الحالية تحديات أهمها:
- إن الشبكة العنكبوتية تنمو بسرعة تفوق ما قد يستطيع أي محرك بحث بالتقنية الحالية فهرسته.
- صفحات الوِب كثيرة وتُحدَّث مراراً، وهذا يفرض على محرك البحث زيارتها مجدداً دوريّاً.
- الاستعلامات التي يمكن أن يكوّنها أحدهم محدودة اليوم بالبحث عن الكلمات المفتاحية، والتي قد تتسبب في كثير من النتائج الخاطئة.
- يمكن أن تكون المواقع المولَّدة ديناميكياً بطيئة أو صعبة الفهرسة، أو يمكن أن تتسبب في الإفراط بالنتائج القادمة من موقع واحد.
- كثير من المواقع المولَّدة ديناميكياً غير قابلة للفهرسة بوساطة محركات البحث، وتُعرف هذه الظاهرة باسم «الشبكة غير المرئية».
- لا ترتب بعض محركات البحث النتائج حسب المواءمة للطلب، وإنما حسب كمية الأموال التي دفعها أصحاب المواقع لها.
- تستخدم بعض المواقع خدعاً للتلاعب بمحرك البحث ليعرضها في النتائج الأولى رداً على بعض الكلمات المفتاحية. وربما يؤدي هذا إلى تشويش بعض نتائج البحث، مع تأخر الروابط الأكثر مواءمةً في ترتيب قائمة النتائج.
وتحرص محركات البحث في المستقبل على تجاوز تلك التحديات لتصبح المساعد الشخصي والخادم والمرشد؛ موفِرة إجابات سريعة وموائمة للأسئلة المبهمة، ويُتوقع أن تدخل إلى حياة الناس في وجوه كثيرة لتصير أكثر نفاذاً وشخصية وإقليمية.
سندس الحلبي
الموضوعات ذات الصلة: |
الإنترنت ـ متصفحات الإنترنت ـ مزود خدمة الإنترنت ـ نطاق الأسماء (مخدم ـ).
مراجع للاستزادة: |
ـ عمار خير بك، البحث عن المعلومات في الإنترنت (دار الرضا للنشر، دمشق 2000).
ـ أيمن عبد الله، محركات البحث على شبكة الإنترنت (الدار العربية للعلوم، بيروت 2002).
- M. LEVENE, An Introduction to Search Engines and Web Navigation (Addison Wesley Publishing Company 2005).
- MICHAEL W. BERRY & MURRAY BROWNE, Understanding Search Engines: Mathematical Modeling and Text Retrieval (Software, Environments, Tools) (SIAM 2005).
- التصنيف : التقنيات (التكنولوجية) - النوع : تقانة - المجلد : المجلد السابع عشر - رقم الصفحة ضمن المجلد : 908 مشاركة :