انجام تکالیف |
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
![]() | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
چطور موتورهاي جستجو كار ميكنند؟
وقتي جستجويي در يك موتور جستجوگر انجام و نتايج جستجو ارايه ميشود، كاربران در واقع نتيجه كار بخشهاي متفاوت موتور جستجوگر را ميبينند.
موتور جستجوگر قبلاً پايگاه دادهاش را آماده كرده است و اين گونه نيست كه درست در همان لحظهي جستجو، تمام وب را بگردد.
بسياري از خود ميپرسند كه چگونه ممكن است گوگل در كمتر از يك ثانيه تمام سايتهاي وب را بگردد و ميليونها صفحه را در نتايج جستجوي خود ارايه كند؟
گوگل و هيچ موتور جستجوي ديگري توانايي انجام اين كار را ندارند. همه آنها در زمان پاسخگويي به جستجوهاي كاربران، تنها در پايگاه دادهاي كه در اختيار دارند به جستجو ميپردازند و نه در وب! موتور جستجوگر به كمك بخشهاي متفاوت خود، اطلاعات مورد نياز را قبلاً جمعآوري، تجزيه و تحليل ميكند، آنرا در پايگاه دادهاش ذخيره مينمايد و به هنگام جستجوي كاربر تنها در همين پايگاه داده ميگردد. بخشهاي مجزاي يك موتور جستجوگر عبارتند از:
Spider يا عنكبوت
Crawler يا خزنده
Indexer يا بايگاني كننده
Database يا پايگاه داده
Ranker يا سيستم رتبهبندي
الف: Spider (عنكبوت)
اسپايدر يا روبوت (Robot) نرم افزاري است كه كار جمعآوري اطلاعات مورد نياز يك موتور جستجو را بر عهده دارد. اسپايدر به صفحات مختلف سر ميزند، محتواي آنها را ميخواند، لينكها را دنبال ميكند، اطلاعات مورد نياز را جمعآوري ميكند و آنرا در اختيار ساير بخشهاي موتور جستجوگر قرار ميدهد. كار يك اسپايدر، بسيار شبيه كار كاربران وب است. همانطور كه كاربران، صفحات مختلف را بازديد ميكنند، اسپايدر هم درست اين كار را انجام ميدهد با اين تفاوت كه اسپايدر كدهاي HTML صفحات را ميبيند اما كاربران نتيجه حاصل از كنار هم قرار گرفتن اين كدها را.
اسپايدر، به هنگام مشاهده صفحات، بر روي سرورها رد پا برجاي ميگذارد. شما اگر اجازه دسترسي به آمار ديد و بازديدهاي صورت گرفته از يك سايت و اتفاقات انجام شده در آن را داشته باشيد، ميتوانيد مشخص كنيد كه اسپايدر كدام يك از موتورهاي جستجوگر صفحات سايت را مورد بازديد قرار داده است. يكي از فعاليتهاي اصلي كه در SEM انجام ميشود تحليل آمار همين ديد و بازديدها است.
اسپايدرها كاربردهاي ديگري نيز دارند، به عنوان مثال عدهاي از آنها به سايتهاي مختلف مراجعه ميكنند و فقط به بررسي فعال بودن لينكهاي آنها ميپردازند و يا به دنبال آدرس ايميل (E-mail) ميگردند.
ب: Crawler (خزنده)
كراولر، نرمافزاري است كه به عنوان يك فرمانده براي اسپايدر عمل ميكند. كراولر مشخص ميكند كه اسپايدر كدام صفحات را مورد بازديد قرار دهد. در واقع كراولر تصميم ميگيرد كه كدام يك از لينكهاي صفحهاي كه اسپايدر در حال حاضر در آن قرار دارد، دنبال شود. ممكن است همه آنها را دنبال كند، بعضيها را دنبال كند و يا هيچ كدام را دنبال نكند.
كراولر، ممكن است قبلاً برنامهريزي شده باشد كه آدرسهاي خاصي را طبق برنامه در اختيار اسپايدر قرار دهد تا از آنها ديدن كند. دنبال كردن لينكهاي يك صفحه به اين بستگي دارد كه موتور جستجو چه حجمي از اطلاعات يك سايت را ميتواند (يا ميخواهد) در پايگاه دادهاش ذخيره كند. همچنين ممكن است اجازه دسترسي به بعضي از صفحات به موتورهاي جستجوگر داده نشده باشد.
شما به عنوان دارنده سايت، همان طور كه دوست داريد موتورهاي جستجو اطلاعات سايت شما را با خود ببرند، ميتوانيد آنها را از بعضي صفحات سايتتان دور كنيد و اجازه دسترسي به محتواي آن صفحات را به آنها ندهيد. موتور جستجو اگر مودب باشد قبل از ورود به هر سايتي ابتدا قوانين دسترسي به محتواي سايت را (در صورت وجود) در فايلي خاص بررسي ميكند و از حقوق دسترسي خود اطلاع مييابد. تنظيم ميزان دسترسي موتورهاي جستجو به محتواي يك سايت توسط پروتكل Robots انجام ميشود. به عمل كراولر، خزش (Crawling) ميگويند.
موتورهاي جستجو: www.ask.com
منبع : همشهري آنلاين
سايت Ask.com با وجود از دست دادن سهم عمده بازار جستجوگرهاي اينترنتي و سلطه گوگل بر اين بخش، قصد دارد كاربران بيشتري را جذب كند.
سايت Ask كه بيش از يك دهه قدمت دارد، طي سالهاي اخير و با رشد روز افزون كاربران گوگل و ساير رقبا و تبليغات بسيار اين شركتها، عملا از دور خارج شده است اما براي حفظ حيات خود و راضي نگه داشتن اندك كاربران خود، تغييرات وسيع و جالبي را در سايت خود اعمال كرده است.
مهندسين اين شركت با تغيير در نتايج جستجو، توانستهاند نظر بسياري از علاقهمندان و كارشناسان را به خود جلب نمايند.
در طي يك دهه گذشته، نتايج جستجو به صورت خطوط لينكهاي اينترنتي و زير هم به نمايش گذاشته ميشد (اكنون نيز اكثر موتورهاي جستجو به همين شكل نتايج خود را نمايش ميدهند.) ولي در طراحي جديد، نتايج سايت Ask در سه ستون كنار هم به نمايش گذارده ميشوند.
ستون اول در واقع همان صفحه اصلي سايت است كه در ابعاد كوچك به نمايش گذارده ميشود تا كاربر بتواند تغييرات را در جستجوي آخر خود اعمال كند يا جستجوي جديدي را آغاز كند. در ستون دوم، نتايج جستجو نمايش داده ميشود (به شكل لينكهاي مختلف) و ستون سوم، كه بيشتر خلاقيت و نوآوري در اين بخش متمركز شده، داراي اطلاعات جالبي براي كاربران است.
در اين ستون و با توجه به موضوع جستجو، اطلاعاتي نظير معني لغوي كلمه، عكس، ويديو، موزيك و ... مرتبط به صورت لينك نمايش داده ميشود كه در صورت علاقهمندي كاربران، ميتوانند با كليك بر روي آن، به نتيجه دلخواه برسند.
به طور كل اين سرويس جديد كه به نام Ask 3D معرفي شده، اين قابليت را دارد كه نتايج مولتيمديا را به كاربران ارائه دهد. ضمن اينكه در تمامي اين نتايج سعي شده از بهترين و معتبرترين منابع استفاده گردد.ضمن اينكه نتايج ستون سوم با توجه به موقعيت جغرافيايي كاربر تغيير خواهد كرد و با توجه به اخبار منطقه، مسايل سياسي، فرهنگي، هنري و اقتصادي رايج در منطقه خواهد بود.
لازم به ذكر است كه در حال حاضر گوگل، 50 درصد، ياهو 26.8 درصد، مايكروسافت 10.3 درصد و Ask تنها 5.1 درصد از كاربران موتورهاي جستجوي اينترنتي را به خود اختصاص ميدهند.
افزايش استفاده از موتورهاي جستجو و تعدد آنهاباعث شده تا كاربران با آگاهي وشناخت كامل به سراغ آنها رفته و با مفاهيم و اصول اوليه آنها آشنا شوند.
قصد داريم شما را با برخي از اصطلاحات موتورهاي جستجو آشنا كنيم:
الگوريتم (Algorithm): مجموعهاي از قوانين كه يك موتور جستجو براي مرتب و منظم نمودن اسامي و نامها در فهرست خود از آنها استفاده ميكند تا بتواند به يك درخواست مشخص پاسخگو باشد.
لينكهاي پشتصحنه (Back Links): تمام لينكهايي كه به يك صفحه اينترنتي خاص شاره ميكنند. همچنين به آن لينكهاي هممرز ( Inbound Links) نيز گفته ميشود.
نرخ كليكشدن (Click Through Rate): درصد كساني كه يك لينك را مشاهده ميكنند در مقايسه با تعداد دفعاتي كه يك لينك در صفحه نتايج( Result Page) نمايش داده ميشود.
پنهانكاري (Cloaking): در صنعت موتورهاي جستجو، به عملياتي گفته ميشود كه در آن موتور جستجو، محتوياتي از يك آدرس اينترنتي (URL) را ذخيره ميكند كه اين محتويات با آنچه كه جستجوگر مشاهده ميكند، متفاوت است.
هزينه هر كليك (Cost Per Click): سيستمي كه طبق آن افراد و شركتهاي تبليغاتكننده مبلغي را به ازاء هر كليك روي لينكي كه كاربران را به سايت او هدايت ميكند، ميپردازد. به اين سيستم CPC يا PPC نيز گفته ميشود.
كاوشگر(Crawler): اجزايي از موتور جستجو كه به صورت اتوماتيك در وب كاوش كرده و اقدام به جمعآوري اسامي مينمايد را گويند. اين جزء موتورهاي جستجو كه به نام عنكبوت( Spider) يا ربات نيز ناميده ميشود، لينكهاي مختلف را براي رسيدن به صفحات اينترنتي تعقيب ميكند تا به هدف برسد.
دايركتوريها(Directories): نوعي از موتورهاي جستجو است كه در آنها اطلاعات و اسامي جمعآوري شده با كوشش افراد بوده و از سيستم كاوش اتوماتيك در وب براي يافتن استفاده نميشود. در اين سيستم ليست اسامي و آدرسها توسط تعدادي از اپراتورها ذخيره ميگردد و در هنگام جستجو از اين پايگاه دادههاي تهيه شده براي رسيدن به مقصد استفاده ميشود.
صفحه درگاه (Doorway Page): صفحهاي مجازي است، ساخته شده از تعدادي كلمات كليدي و لينكهاي ديگر كه ترافيك موتورهاي جستجو را تعديل ميكند.
فهرست (Index): مجموعهاي از اطلاعاتي كه يك موتور جستجو دارد و جستجوگران ميتوانند از آنها استفاده كنند.
صفحه فرود(Landing Page): صفحهاي كه نهايتا جستجوگر پس از كليك كردن بر روي ليست نتايج به آن ميرسد را صفحه فرود گويند.
متن لينك(Link Text): متني كه شامل يك آدرس اينترنتي يا لينك ميباشد.
موتورهاي جستجوي متا (Meta Search Engine): موتورهاي جستجويي كه به جاي كاوش در وب و يافتن درخواستهاي جستجوگران، از فهرست وليستهاي دو يا چند موتور جستجوي ديگر استفاده مينمايند.
برچسبهاي متا (Meta Tags): برچسبها يا اطلاعاتي هستند كه در صفحات اينترنتي قرار داده ميشوند به منظور انتقال اطلاعات به كاوشگر (Crawler) موتورهاي جستجو، نمايشگرهاي اينترنت و برخي نرمافزارهاي كاربردي ديگر ميباشد و قابل رويت توسط جستجوگران نيست.
ليستهاي پرداختشده (Paid Listings): ليستهايي كه توسط موتورهاي جستجو به تبليغاتكنندهها فروخته ميشود.
لينك دوطرفه (Reciprocal Link): به يك لينك تبادلي بين دو وب سايت گويند.
صفحه نتايج (Results Page): پس از ورود يك درخواست توسط جستجوگر در موتورجستجو، صفحهاي كه نتايج در آن نمايش داده ميشود را گويند كه گاهي به نام SERPs نيز ناميده ميشود كه مخفف search Engine Result Pages ميباشد.
Robots.txt: فايلي كه صفحات اينترنتي را از ليست شدن و فهرستگيري توسط موتورهاي جستجو محفوظ ميدارد.
بازگشت سرمايه (ROI): درصد سود يا بازده برگشتي از يك فعاليت خاص را گويند و مخفف Return on Investment ميباشد.
بازاريابي موتورهاي جستجو (Search Engine Marketting): عمليات بازاريابي يك وبسايت از طريق يك موتورجستجو.
اصطلاح جستجو (Search Terms): كلمه يا كلماتي كه يك جستجوگر در قسمت جستجوي يك موتور جستجو وارد ميكند. به آن كلمات كليدي، اصطلاح درخواست شده يا Query نيز گفته ميشود.
فرمانبرداري (Submission): اجازه ورود URL وارد شده توسط جستجوگر به فهرست و ليست موتور جستجو را گويند.
معيارهاي تحليل يك وبسايت:
Evaluating Websites: Criteria & Tools
يك وبسايت خود بايد داراي موارد ذيل باشد:
1- مؤلف يا نويسنده (Author) آن مشخص باشد و بهترين روش آن است كه پيشينه علمي خود را قيد نمايد.
2- تاريخ انتشار (Date of Publication) سايت مشخص شده و بروز گردد. فاصله بين پستها در وب تاريخ انتشار آنهاست و آخرين تاريخ انتشار همان تازهترين پست است.
3- ويرايش، تجديد چاپ (Edition or Revision ) آن مشخص باشد.
4- ناشر (Publisher) آن مشخص باشد. از آنجا كه براي بررسي ناشر يك متن چاپي يا اينترنتي سه سطح Personal، Organizational و Convention قرار دارد، بررسي ناشر سايت در سطح Organizational قرار ميگيرد.
5- مخاطبشناسي (Internet Audience) يك سايت بايد مشخص باشد بدين معنا كه مطالب آن براي چه سطحي از مخاطبان نگاشته شده است.
6- استدلالات عيني (Objective Reasoning)
7- حوزه تحت پوشش (Coverage)
8- سبك نوشتار (Writing Style)
9- ارزيابي كيفي (Evaluating Review)
برای اطلاع بیشتر به مقاله دکتر شکرخواه مراجعه شود .

زبان HTML و برخي از دستورات آن
زبان HTML زبان ديدن صفحات وب است. بدين معنا كه اگر وب يك خانه باشد زبان اچتيامال نقشه آن خانه بشمار ميآيد.
در زبان HTML نويسي علامت < > به معناي شروع كن و </> به معناي تمام كن و ببند است. هر كدام از تگهاي HTML در اين علامتها قرار ميگيرند. در HTML دو نوع تگ وجود دارد.
تگهاي جفتي (Paired Tags) مثل
تگهاي طاق (Stand Alone Tags)
گونه های رسانه های آنلاین عبارتند از :
1- متن Text
2- عکس Photo
3- گرافیک Graphic
4- صدا Audio
5- ویدیو Video
درآنلاین عکس سه گونه به کار می رود :
1- Single (مشترک میان روزنامه های چاپی و آنلاین)
2- Gallery (در روزنامه های چاپی استفاده نمی شود) .
3- Slid Show (در روزنامه های چاپی استفاده نمی شود) . در این گونه یا اینکه خود عکس ها متحرک هستند (