انجام پایان نامه

درخواست همکاری انجام پایان نامه  بانک مقالات رایگان انجام پایان نامه

سفارش پایان نامه

|

انجام پایان نامه ارشد

 پایان نامه 

پایان نامه‏ کامپیوتر

انجام پایان نامه‏ ارشد کامپیوتر

تكامل وب و مقايسهء ابزارهاي جستجو در اينترنت
چكيده
اين مقاله تكامل وب را در رابطه با وب و فناوري‌هاي بازيابي اطلاعات بررسي مي‌كند. در اين بررسي بين عناصر مختلف وب در زمينهء نمايه‌سازي و صفحات جستجوي وب وجه تمايز وجود دارد. ده ابزار اصلي و مهم وب براساس معيارهاي انتخاب و تعداد اتصال‌ها با يكديگر مقايسه و ارزيابي شده‌اند. ابزارهاي جستجو مانند راهنماها و موتورهاي جستجوگر نيز مورد بررسي و مقايسه قرار گرفته‌اند.

كليدواژه : وب، راهنماهاي جستجوگر، موتورهاي جستجوگر

مقدمه
كلمه اينترنت مخفف "Interconnected Networks" و به معني شبكه‌هاي به‌هم‌مرتبط است. اينترنت سيستمي براي توزيع و تبادل اطلاعات در سطح جهان است كه براساس آخرين آمار موجود در حال حاضر 226 كشور به آن متصل هستند. اين مجموعه به همراه فناوري‌هاي ساده كاربردي، سبب كاهش هزينهء نشر الكترونيكي شده است (1).در هر صورت، وب يك عنصر منسجم و واضح مستقل نيست، بلكه دو عنصر مجزاي وب وجود دارند: وب قابل‌رويت و ديدني، و وب نامرئي و غيرقابل رويت(2).
براي فهم كاربرد اين دو عنصر و براي ارزيابي اطلاعات ضرورت دارد كه از موضوع خارج شويم و ببينيم چگونه صفحات وب توليد مي‌شوند.
دو نوع صفحهء وب وجود دارند: استاتيك و ديناميك.
صفحات وب استاتيك توسط طراح وب، در خدمات‌دهندهء وب نصب مي‌شوند و براي هر كس و هر چيزي كه وب سايت را مشاهده كند قابل دسترس‌اندو هر تغييري هم بايد به صورت دستي انجام شود.
صفحات وب ديناميك توسط رايانه با به‌كارگيري دستورهاي يك زبان دستنوشته(1) و اغلب «سي‌جي‌آي‌جاوا»(2)كه به عنوان پلي بين سرويسگرهاي پروتكل انتقال ابرمتن (3) و كاربران وب عمل مي‌كند، ايجاد مي شود.
دستورهاي يك زبان دستنوشته، نتايج را در يك صفحهء خالي وب جا مي‌دهند و به كاربر، صفحهء وب ديناميك را ارائه مي‌دهند. صفحات وب استاتيك اطلاعات عام و كلي را براي كاربر تهيه مي‌كند، در حالي كه صفحات وب ديناميك، اطلاعات منحصربه‌فرد را براي كاربر تهيه مي‌نمايند. صفحات وب استاتيك براي همهء كاربران قابل رويت‌اند و در دسترس مي باشند.


 
صفحات وب ديناميك    صفحات وب استاتيك
توسط رايانه توليد مي‌شوند    دستي توليد مي‌شوند.
اطلاعات منحصربه‌فرد است    اطلاعات عام و كلي است
قابل نمايه‌سازي نمي‌باشند    اكثر آن‌ها قابل نمايه‌سازي هستند
    

اولين مطالعه در موسسه تحقيقاتي «ان‌ئي‌‌سي» در پرينستون آمريكا در دسامبر سال 1997 نشان داد كه صفحات وب قابل رويت، حداقل 320 ميليون صفحهء وب را شامل مي‌شوند، در حالي كه دومين مطالعه تخمين زد كه تعداد صفحات وب رشد كرده و به 800 ميليون صفحه در فوريه سال 1999 رسيده‌اند. در هر صورت، اكثر ناشرين اطلاعاتشان را بر روي وب به وسيلهء پايگاه‌هاي اطلاعاتي بزرگ توزيع مي‌كنند. اين اطلاعات اساسا جنبه تجاري دارد (2).
موتورهاي جستجوگر(4) و راهنماهاي وب
2. 1. راهنماهاي وب
چه تفاوتي بين راهنماي وب و موتور جستجو وجود دارد؟
راهنماي وب:
الف. فهرستي از سايت‌هاي وب كه از قبل تعيين شده‌اند، مي‌باشد؛
ب. توسط ويراستاران جمع‌آوري شده؛
ج. براساس موضوع و عنوان طبقه بندي شده؛
د. انتخابي است.
با توجه به اين كه راهنماهاي وب توسط افراد جمع‌آوري مي‌شوند, تصميم‌گيري دربارهء كيفيت محتواي هر يك از سايت‌هاي وب قبلا انجام شده است. در نتيجه راهنماهاي وب در اينترنت بسيار مورد مراجعه قرار مي‌گيرند، زيرا كاربران به دنبال موضوعات خاصي در اينترنت هستند كه اين راهنماها، نقطهء شروع خوبي در تشخيص بهترين‌ها در وب مي‌باشند.
در كاربرد راهنماهاي وب، كاربر مي‌تواند در بين فهرست‌‌هاي راهنما حركت نمايد. راهنماهاي اصلي وب همچنين اجازهء عبور از ديگر موتورهاي جستجو را هم مي‌دهند. مثلا بزرگ‌ترين راهنماي وب، يعني «ياهو»، اجازهء عبور از موتور هاي جستجوي ديگر را مي‌دهد.
سايت‌‌هاي وبي كه به وسيلهء راهنماي وب نمايه‌‌سازي شده‌اند، به علت روند تكميل به صورت دستي، در آن راهنماها باقي مي‌مانند؛ مگر اين كه به احتمال بسيار ضعيف به صورت دستي حذف شوند. در حالي كه وجود دائمي يك ليست يا يك فهرست در موتور جستجو هميشه ضمانت نمي‌شود، اما ساختن و حضور دائمي يك فهرست در يك راهنماي وب مثل «ياهو» امكانپذير مي‌باشد.
2. 2. موتورهاي جستجوگر
وقتي كه يك موتور جستجوگر را به كار مي‌بريد، كاربر، پايگاه اطلاعاتي سايت‌هاي وب را جستجو مي‌نمايد. همه موتورهاي جستجوگر داراي سه جزء تركيبي هستند:
الف. «اسپايدرها»(5)كه سايت‌هاي وب را بررسي مي‌كنند،
ب. فهرست‌ها و نمايه پايگاه اطلاعاتي؛
ج. نرم‌افزار بازيابي اطلاعات.

2 . 2 .1. اسپايدرهاي موتورهاي جستجوگر
پايگاه اطلاعاتي موتورهاي جستجوگر ابتدا توسط «اسپايدرها» ساخته مي‌شود و توسط موتورهاي جستجوگر به مأخذ اصلي اعزام مي‌شود.«اسپايدرها» برنامه‌هايي هستند كه وب را به دنبال صفحات جديد وب جستجو مي‌نمايند، كلمات را نمايه‌سازي مي‌كنند و اتصال را به صفحات برقرار مي‌نمايند، سپس كلمات نمايه‌شده را با آد‌رسي كه به يك صفحهء وب يا هر منبعي كه بر روي وب جهاني و به طور كلي اينترنت قرار دارد اشاره مي‌نمايد,(6) مقابله مي‌كنند.
2. 2 .2. نمايهء پايگاه اطلاعاتي موتور جستجو
اين بخش عنصر اصلي از هر موتور جستجو است. اين همان چيزي است كه كاربر به دنبال آن است. در طي سال 1998 تعدادي از توليد‌كنندگان موتورهاي جستجو آغاز به كار كردند. اين شركت‌ها نمايه‌ها را مطابق با معيارهاي گوناگون ساختند. بطور مثال مي توان از نمايهء «دايركت هيل» و «گوگل» (7) نام برد و نيز «نمايهء ‌نام‌هاي حقيقي» (8) كه شركت‌ها را قادر مي‌سازد واژه‌هاي كليدي خود را براي حمايت از محصولات خود ثبت نمايند.
2 . 2 . 3 . نرم‌افزار بازيابي اطلاعات
تمامي موتورهاي جستجوگر، نرم‌افزار مختص به خود براي پاسخگويي به سوالات دارند.
موتورهاي جستجوگر مطابق با قوانين مشابه به شرح زير عمل مي‌نمايند: هر سايت وب شامل كلمات يا واژه‌هايي است كه سوءال كاربر را با آن‌ها مقابله مي‌كند. و در صفحهء نمايش، به صورت فهرست‌وار نمايش مي‌دهد و با توجه به سوال كاربر و ارتباط موضوعي، فهرستي از مطالب را طبقه‌بندي مي‌نمايد. تفاوت مختصري در چگونگي كار الگوريتم‌ها بين موتورهاي جستجو وجود دارد، كه دليلي بر اين مدعااست كه كاربران، با يك پرسش واحد, از موتورهاي مختلف نتايج متفاوتي را كسب مي‌نمايند. در هر صورت، دليل مهم ديگر اختلاف نتايج جستجو، نسبت پايين همپوشاني، در بين موتورهاي جستجو‌گر مي‌باشد.
3 . پورتال‌ها
«پورتال»(9) ها سايت‌هاي وبي هستند كه خود عرضه‌كنندهء خدمت خاصي نيستند، ولي مراجعين را به صورت ساده و دوستانه به اطلاعات و سايت‌هاي موردعلاقه‌شان هدايت مي‌كنند. «پورتال» ها نقاط اصلي براي راهبردهاي تجارت الكترونيكي هستند و به تدريج از سال 1994 به وسيلهء سه نوع شركت اينترنتي به وجود آمدند. اين شركت‌ها كه نقش اساسي در توزيع زنجيرهء اطلاعاتي براي كاربر ايفا مي‌كنند به شرح زير مي‌باشند:
الف. توليدكنندگان خدمات اينترنتي(10)
ب. سايت‌هاي جستجو(11)
ج. توليدكنندگان مرورگر(12)
سايت «اكسايت»(13) نمونه‌اي كه از يك سايت پورتال موفق است(1).
4. توسعه و تكامل فناوري جستجو
همهء ما تكامل زندگي بشر بر روي كره خاكي را به خاطر داريم. همانطور كه همگي ما مي‌دانيم، شكل‌هاي مختلف زندگي سلولي براي مدت‌هاي بسيار طولاني قبل از تكامل زيستي وجود داشته است. در هر صورت هنگامي كه به اين نقطه از تكامل دست يافتيم، تغييرات به فرم سازمان‌يافتهء آن در مدت زمان كم‌تري به انجام رسيد.
همين مطلب براي فناوري جستجوي وب نيز صادق است. با تاكيد بر روي پور‌تاليزيشن و تجارت الكترونيكي، اولين نسل سايت‌هاي جستجو، عملاً و به تدريج فراموش شدند و اين در حالي است كه آن‌‌ها تا سال‌‌هاي متمادي، حكومت اصلي را به عهده داشتند؛ اما بدليل اين كه نتوانستند خودشان را با تغييرات محيطي وفق بدهند، فراموش گرديدند و انواع جديدي از توليدكنندگان جستجو به بهره‌برداري رسيدند.

4 .1. موتورهاي جستجوي ماورا
موتورهاي جستجوي ماورا(14) به كاربر اين امكان را مي‌دهند كه از ميان موتورهاي جستجوي متعدد و راهنماهاي وب به طور مقارن و همزمان، جستجو نمايد (2و3).
محبوب‌ترين موتورهاي جستجوي ماورا به شرح زير مي‌باشند:

- Dogpile ( www.dogpile.com )
- Mamma ( www.mamma.com )
- 2Q ( www.2q.com )
- Infind ( www.infind.com )
- Insleuth ( www.isleuth.com )
- Surfy ( www.surfy.com  )
- Webtaxi ( www.webtaxi.com  )
4 .2. نسل اول موتورهاي جستجو كه توسط سايت‌هاي وب بصورت«اسپايدر», نمايه‌سازي را ايجاد كردند، انبوهي از واژه‌ها و كلمات را تجزيه و تحليل نمودند. راهنماهاي وب به طور دستي گردآوري شدند و از آوريل 1998 مورد بهره‌برداري قرار گرفتند: يكي از اين راهنماها به نام «دايركت هيل»(15)يك حركت ريشه اي را آغاز كرد و اصلاحاتي انجام داد و روش خود را «راه سوم»(16) ناميد.
اين راهنماي وب ادعا مي‌‌كرد كه در زمان جستجو، كنترل با كاربر است و نتايج به صورت طبقه‌بندي شده بر روي سايت وب نمايان مي‌شوند. اين موتور جستجو، آنچنان كه ادعا مي‌كرد نتوانست خدمات منحصربه‌فردي را ارائه نمايد. بنابراين موتور جستجوي ديگري به نام «هاتبات»(17)به جاي آن توليد شد (2).
4 .3. جستجوي زبان طبيعي
همانطور كه قبلا بحث شد، اولين نسل موتورهاي جستجو با مقابلهء واژه‌هايي كه توسط كاربران ارائه مي‌شدند عمل مي‌نمودند. آن‌ها به محتواي واژه‌هاي جستجو توجه نمي كردند. براي مثال به ارتباط منطقي بين واژه‌هاي جستجو و ديگر معناهاي لغوي توجه نمي‌شد، به علاوه، لغات را به صورت تحت‌اللفظي جستجو مي‌كردند و به واژه‌ها و توصيفگر‌هاي‌بولي‌ نظير and, or, not توجه‌ نداشتند. دو موتور جستجوي جديد يكي پس از ديگري در طول يك هفته آغاز به كار كردند. اين موتورهاي جستجو، به شرح زير زبان طبيعي را براي جستجو پيشنهاد كردند:
الف.Ask Jeeves www.askjeeves.com
اين موتور جستجو در اول ژوئن سال 1998 شروع به كار كرد و به عنوان اولين موتور جستجوي زبان طبيعي بر روي اينترنت معرفي شد. اين موتور جستجو سوءال كاربر را با استفاده از پايگاه اطلاعات هفت ميليوني سوءالات، پاسخ مي‌داد. اگر هيچ گونه مقايسه‌اي وجود نداشت، سپس نزديك‌ترين واژه از پايگاه براي كاربر ارائه مي‌شد و سوءال مي‌شد كه مناسب‌ترين آن را انتخاب كند. اين موتور جستجو همچنين كاربر را به موتورهاي جستجوي ديگري نيز راهنمايي مي‌كند، مانند «ياهو»، «ليكاس», «اينفوسيك» و «آلتاويستا».
ب. دومين موتور جستجو به نام Electric Monk چند هفته بعد آغاز به كاركرد. اين موتور جستجو با استفاده از زبان طبيعي، الگوريتم سوءالات كاربران را پاسخ مي‌گويد. اين الگوريتم با استفاده از اصطلاحنامه، به واژه‌هاي مرتبط نيز توجه مي‌كند. جستجو از طريق زبان طبيعي در اين موتور جستجوگر، سپس به صورت سوءالات مركّب بولي درآمد و به «آلتاويستا» تسليم شد.
4 .4. تجزيه و تحليل متكي بر اتصال
موتورهاي جستجوي نسل اول براي ساخت نمايه‌هاي عظيم با هدف پاسخگويي به هر نوع سوال ساخته شدند. آن‌ها به محتواي هر صفحهء خاص تأكيد داشتند كه چگونه اين صفحات به هم مربوط مي‌شوند و اتصال مي‌يابند. همانطور كه قبلا گفته شد، روش نمايه‌سازي آن‌ها به دليل بي‌توجهي به تركيب زبان، ساخت جملات و مترادف‌ها با شكست روبرو شد.
تجزيه و تحليل متكي بر اتصال سعي دارد كه با بررسي ارتباط بين صفحات، بر اين مشكلات فائق آيد. موتورهاي جستجوگر متكي بر اتصال به سرعت رشدكرده‌اند و از نظر كاربران اينترنت در حال حاضر از محبوبيت خاصي برخوردارند.
4.4.1.«گوگل»(18)
اين موتور جستجوگر نيز مانند «ياهو» توسط دانشجويان دانشگاه استانفورد ايجاد شد اين فناوري با استفاده از روشي با نام «رتبه‌بندي صفحه»(19) وب، به ديگر موتورهاي جستجو متصل مي‌شود. اگر شما، به عنوان يك نويسندهء سايت وب، به ديگر سايت‌هاي وب از جهت اهميت آن سايت‌ها متصل شويد، مي توانيد داوري‌ها و پيشنهادهايي دربارهء سايت ارائه دهيد. همانطور كه راهنماهاي وب نظير «ياهو» توسط ويراستاران به صورت دستي جمع‌آوري و تاليف گرديده‌اند. «گوگل» هم به دنبال اعلام قضاوت ميليون‌ها نويسندهء سايت وب به صورت خودكار طراحي شد.
البته اين موتور جستجو در مقايسه با «ياهو» با سايت‌هاي وب بيش‌تري دسترسي دارد. در حقيقت برخلاف ديگر موتورهاي جستجوگر، كه هر چه نمايه‌هاي آن‌ها گسترده‌تر مي‌شود، كم‌تر مفيد واقع مي‌شوند، «گوگل» ادعا دارد كه با گستردگي نمايه‌ها و عظيم‌تر شدن آن‌ها، به نتايج بهتري دست يافته است. از ديگر موتورهاي جستجو كه با استفاده از الگوريتم طبقه‌بندي عمل مي‌نمايند مي‌توان از«هاتبات» و «اكسايت» نام برد. «گوگل» تنها موتور جستجويي است كه به طور بسيار گسترده اي جستجو‌هايش متكي بر اتصال مي‌باشند. تخمين زده شده كه نمايهء اين موتور جستجو‌گر بين 70 تا 100 ميليون صفحه مي‌باشد، اما از طريق اتصال، قدرت دسترسي به بيش از 300 ميليون صفحهء وب نيز به كاربر اينترنت داده مي‌شود. دسترسي بيش‌تر و صحت نتايج جستجوي بيش‌تر سبب گرديده كه اين موتور جستجو در رديف ده موتور جستجوي محبوب در شبكهء اينترنت قرار گيرد.
4.4.2. (20)Clever
با توجه به «نمايه‌نامهء استنادي علوم»(21) (مطالعهء ارجاعي مقالات علمي با يكديگر) clever جستجوي واژه‌هاي كليدي را براساس تلفيق كلمات و ارتباط مطالب بررسي مي‌نمايد. اين موتور جستجوگر نيز مانند «گوگل» با استفاده از اتصال، به سوءالات پاسخ مي‌دهد. ولي برخلاف «گوگل» ابتدا سوءال را به ديگر موتور‌هاي جستجو نظير «آلتاويستا» تسليم مي‌كند و سپس كاربر را به صفحاتي كه از نتايج جستجو كسب شده‌اند راهنمايي مي‌نمايد. اين موتور جستجو توسط شركت «آي‌بي‌ام» ايجاد شده.
4.4.3. Focused Crawler
يكي ديگر از موتورهاي جستجويي كه توسط شركت،« آي‌بي‌ام» ايجاد شده. اين موتور جستجو البته به اندازهء clever گسترش پيدا نكرد. برخلاف ديگر موتورهاي جستجو نظير «گوگل» و clever، اين موتور جستجو مجموعه‌اي بسيار مناسب و در ارتباط با موضوع را از طريق وب جستجو مي‌نمايد. به زباني ديگر، اين موتور جستجو فقط سايت‌هاي وبي را جستجو مي‌كند كه در ارتباط با پرسش كاربر مي‌باشند.
جستجوي گروه‌هاي خبري
در حالي كه در حال حاضر وب به مثابه مخزن اوليهء دانش بشري بر روي اينترنت مي‌باشد، تنها مخزن هم به حساب نمي‌آيد. گروه‌هاي خبري، محلي است كه گروهي از افراد، تجربيات، افكار و دانش خود را در مورد يك موضوع مورد علاقه، براي بازيابي اطلاعات به اشتراك مي‌گذارند. تفاوت بين وب و گروه‌هاي خبري در اين است كه وب مجموعه‌اي از دانش بشري را به طور صريح و روشن ارائه مي‌كند. در حالي كه گروه‌هاي خبري مجموعه‌اي از دانش بشري را به طور ضمني و غيرصريح ارائه مي‌نمايند.
دانش صريح و روشن مي‌تواند به افراد و موءسسات كمك كند تا از اطلاعات و تجارب گذشته براي برنامه‌ريزي آينده كمك بگيرند، اما دانش غيرصريح و ضمني مجموعه‌اي از تجارب و عقايد و خلاقيت‌هايي است كه براي استخراج اطلاعات صريح و روشن مورد نياز مي‌باشد.
آدرس بعضي از گروه هاي خبري تخصصي:

DejaNews ( www.dejanews.com )
Reference.com ( www.reference.com )
Liszt’s New groups directory ( http://liszt.com/news )

4.4.4. اطلاعات شركت‌ها
سايت‌هاي زيادي دربارهء معرفي شركت‌ها و توليد‌كنندگان اطلاعات تجاري وجود دارند. هر محققي مي‌تواند از اين سايت‌ها بازديد كند. چنين سايت‌هايي داراي پايگاه‌هاي تجاري مي‌باشند. يك برر‌سي بر روي نام‌هاي شركت‌ها براساس عملكرد موتورهاي جستجوگر پيشرو و راهنماهاي وب براي انتقال نتايج مناسب براي پژوهشگران‌نشان‌داد‌كه «سراچ انجين واچ»(22)و«هاتبات‌» و «گوگل» در رده‌بندي، در رده‌هاي ابتدايي قرار مي‌گيرند.
در آگوست 1999، موتور جستجو‌گر «جامپ»(23) آغاز به كار نمود. اين موتور جستجوگر داراي يك نمايهء تخصصي است كه بر اطلاعات و خبرهاي مربوط به شركت‌ها تأكيد دارد. اين موتور جستجو‌گر فهرستي از شركت‌ها، شامل اطلاعاتي نظير عناوين شركت‌ها، قدمت، زمينهء موضوعي و آدرس پست الكترونيكي و ثبت اختراعات، و شركت‌هاي وابسته به آن شركت را نيز معرفي مي‌نمايد (2و3).








انجام پایان نامه

انجام پایان نامه کامپیوتر، انجام پایان نامه ارشد کامپیوتر، انجام پایان نامه، پایان نامه

برای دیدن ادامه مطلب از لینک زیر استفاده نمایید

 دانلود مقاله | انجام پایان نامه

سفارش پایان نامه