up
Search      menu
فنآوری اطلاعات :: مقاله موتور جستجوي فارسي PDF
QR code - موتور جستجوي فارسي

موتور جستجوي فارسي

موتور جستجوي وب چيست و چه کاربردي دارد؟

اوايل شهريورماه، خبر موتور جستجوي «ياحق» يکي از اخبار مهم فناوري اطلاعات در ايران بود. اولين بار رضا تقي پور، وزير ارتباطات و فناوري اطلاعات، با بيان اين که بسياري از کشورها داراي موتور جستجوگر بومي هستند، اعلام کرد که براي جوابگويي به نيازهاي داخلي، راه اندازي موتور جستجوگر ملي در برنامه پنجم توسعه اقتصادي، اجتماعي و فرهنگي کشور پيش بيني شده است. سپس هادي ملک پرست، مديرکل تحقيق و توسعه شرکت فناوري اطلاعات ايران، ضمن اعلام آغاز فاز مطالعاتي پروژه موتور جستجوگر ملي به نام «ياحق»، توضيحات بيشتري در اين زمينه ارائه کرد. اما قبل از پرداختن به جزئيات اين پروژه، بهتر است نگاهي داشته باشيم به خود موضوع موتورهاي جستجو و اين که چه نيازي به يک موتور جستجوي بومي وجود دارد.
موتور جستجوي وب چيست و چه کاربردي دارد؟
عبارت موتور جستجو مي تواند براي موارد مختلفي به کار رود و ما در اينجا با موتور جستجوي وب سروکار داريم. يک موتور جستجوي وب يا جويشگر، براي جستجو اطلاعات در شبکه جهاني وب طراحي شده است. نتايج جستجو معمولا به صورت فهرست نتايج به نمايش درمي آيد. اين اطلاعات شامل صفحات وب، تصاوير، اطلاعات و ساير انواع فايل ها مي شود. برخي از موتورهاي جستجو اطلاعات موجود در بانک هاي اطلاعاتي را نيز مي گردند. برخلاف دايرکتوري هاي وب، که توسط عامل انساني نگهداري و به روزرساني مي شوند، موتورهاي جستجو با روش هاي الگوريتمي يا ترکيبي از روش الگوريتمي و عامل انساني کار مي کنند. صفحات وب توسط يک پوينده وب (که به آن اسپايدر يا عنکبوت هم گفته مي شود) در موتور جستجو ذخيره شده و زماني که کاربر کلمه يا عبارتي را وارد مي کند، از ميان صفحات ذخيره شده، آن هايي که بيشترين هم خواني را با مورد جستجوشده دارند، به نمايش درمي آيند.
از اوايل سال ۱۹۹۳ با افزايش ميزان اطلاعات موجود در اينترنت، نياز به ابزاري براي جستجو در اين اطلاعات و يافتن محتواي مورد نظر احساس شد. اولين موتور جستجويي که راه اندازي شد، Aliweb نام داشت که به صورت بسيار ساده به کاربران اين امکان را مي داد که محل فايل هاي اصلي سايت هايشان را براي جستجوي ديگر کاربران در اين سايت وارد کنند. سال هاي بعد موتور جستجوهاي بهتري مانند Lycos، آلتاويستا و Excite شروع به کار کردند اما مهم ترين اتفاق در اين عرصه، ظهور گوگل بود که از سال ۱۹۹۸ به ميدان آمد. اين موتور جستجو امروزه پربيننده ترين سايت در جهان شناخته مي شود و تقريبا نام موتور جستجو با نام گوگل مترادف شده است. بعد از گوگل که اين روزها حدود ۸۵ درصد سهم بازار موتورهاي جستجو را در اختيار دارد، ياهو، بايدو، بينگ (جستجوگر مايکروسافت)، Ask و AOL قرار گرفته اند. به علت افزايش باورنکردني اطلاعات در وب، تقريبا همه کاربران به استفاده از موتورهاي جستجو نياز دارند. براي ماندن در اين بازار رقابت نيز سايت ها تلاش مي کنند هر روز امکانات تازه تري به موتور جستجو بيفزايند يا به بهينه سازي فرايند نمايش نتايج بپردازند.
● پيشرفت موتورهاي جستجو
آنچه در مورد نحوه عملکرد موتورهاي جستجو گفته شد، پايه و اساس آن بود. امروزه موتورهاي جستجو براي آن که بهترين نتايج را به کاربران نمايش دهند، از الگوريتم ها و فرمول هاي بسيار پيچيده اي استفاده مي کنند. به عنوان مثال، گوگل از يک الگوريتم انحصاري به نام پيج رنک يا رتبه صفحه استفاده مي کند. به طور خلاصه پيج رنک، ارزش و امتياز يک صفحه وب يا محتواي موردنظر را با پارامترهاي مختلف مثل اين که چقدر از طرف منابع معتبر و مهم به آن ارجاع داده شده و... تعيين مي کند. پيج رنک يک صفحه با عدد از صفر تا ۱۰ مشخص مي شود و هرچه پيج رنک يک صفحه بالاتر باشد شانس بيشتري براي قرارگرفتن در رتبه هاي اوليه نتايج جستجو دارد. در طول سال هاي گذشته گوگل همواره پارامترها و فاکتورهاي جديدي به فرمول پيج رنک افزوده که نمايش نتايج را دقيق تر کند.
گفته مي شود در الگوريتم پيج رنک بيش از ۲۰۰ فاکتور مختلف تاثير دارد. ياهو و برخي ديگر از موتورهاي جستجو نيز الگوريتمي خاص خود دارند.همچنين براي بهينه سازي نتايج، موتورهاي جستجو اطلاعاتي نظير اين که شما روي کدام نتايج کليک کرده ايد و... را نيز ذخيره مي کنند. به اين ترتيب مثلا کاربري که در مورد موضوعات مختلف به سايتي مانند ويکي پديا اعتماد دارد و روي نتيجه نمايش داده شده از اين سايت کليک مي کند، در دفعات بعدي ويکي پديا را در رتبه هاي بهتري خواهد ديد. همين طور به مرور زمان و با گزارش کاربران، سايت هاي ويروسي و سايت هايي که ممکن است به رايانه کاربر آسيب برسانند، از نتايج حذف مي شوند و به عبارتي در ليست سياه قرار مي گيرند. اين بهبود و اصلاح نتايج جستجو، فرايندي مداوم است که هر روز به بهترشدن يک موتور جستجو کمک مي کند. همين باعث شده که موضوع SEO يا بهينه سازي موتورهاي جستجو در سال هاي اخير مورد توجه صاحبان سايت ها قرار گيرد و آنها تلاش کنند با روش هاي مختلف، در رتبه هاي بهتري در موتورهاي جستجو قرار بگيرند.
● اساسا چه نيازي به موتور جستجوي بومي هست؟
حال پس از آشنايي مختصري با موتورهاي جستجو، مي توان وارد اين موضوع شد که با وجود سايت هاي جهاني و قدرتمندي مثل گوگل و ياهو، چه نيازي به موتور جستجوي ملي وجود دارد؟ ملک پرست در تشريح اهداف راه اندازي ياحق، از مواردي مانند تسهيل در ارائه خدمات سريع دستگاه هاي دولتي و اجرايي به مردم، کاهش هزينه ها، عدم انتقال اطلاعات کاربران به خارج از کشور و... نام برده است. در واقع اين اولين بار نيست که براي دسترسي به اهداف بالا و مشابه آن، يک موتور جستجوي بومي در کشوري راه اندازي مي شود.
هرچند گوگل نسخه هاي مختلف به زبان هاي زيادي از جمله فارسي دارد، اما پيش از اين در برخي کشورها مانند چين، فيليپين، استراليا، کره جنوبي، ژاپن، هند، ايسلند، امارات متحده عربي، مجارستان، اسلووني، روسيه، پرتغال، آنگولا، موزامبيک، سوييس، نروژ، سوئد، جمهوري چک و کانادا نيز موتور جستجوهاي بومي راه اندازي شده اند. البته در همين ابتدا يک تفاوت بزرگ ميان اين موتور جستجوهاي بومي با شکل ايراني اش وجود دارد. ياحق يک پروژه دولتي است که از طرف وزارت ارتباطات و فناوري اطلاعات پيگيري مي شود؛ در حالي که در پروژه هاي مشابه در ديگر کشورها، اغلب پروژه هايي خصوصي بوده اند. همچنين در برخي از اين سايت ها از همکاري موتور جستجوهاي بزرگ مانند گوگل و ياهو نيز استفاده شده، در حالي که ياحق قرار است يک پروژه کاملا مستقل باشد. در اينجا براي نمونه به سراغ يکي دو تا از اين موتورهاي جستجوي بومي مي رويم.
سايت Naver.com محبوب ترين درگاه جستجو در کره جنوبي است. Naver در اينجا جوينده وب معني مي دهد. اين سايت که در ژوئن ۱۹۹۹ توسط تعدادي از کارمندان سابق شرکت سامسونگ راه اندازي شد، امروزه ۷۰ درصد سهم بازار موتورهاي جستجو در کره جنوبي را در اختيار دارد، در حالي که گوگل تنها ۲ درصد بازار را در اين کشور تصاحب کرده است! Naver از موتور جستجوي ويژه خود استفاده مي کند و ابتکاراتي مانند Knowledge Search داشته که بعدها در بخش Answers ياهو ديده شد. امکانات و ابزارهاي مختلفي مانند اخبار، بازي، در کنار موتور جستجو در Naver عرضه شده است که براي کره اي ها کاربردي و مفيد است. در سال ۲۰۰۹ نسخه ژاپني Naver نيز عرضه شد که اولين حرکت آن ها براي بازارهاي خارج از کره جنوبي بود.
در حال حاضر طبق آمار سايت معتبر الکسا، Naver پربيننده ترين سايت اينترنتي در کره جنوبي است و در رده ۲۱۹ پربيننده ترين سايت ها در جهان قرار دارد. Naver رقبايي مانند Daum نيز دارد که تلاش مي کنند با ارائه خدمات بهتر، کاربران را به سوي خود جذب کنند. اما در ابتداي مطلب از تعدادي از موتور جستجوهاي مطرح نام برديم که بايدو نيز در ميان آن ها بود. بايدو يک موتور جستجوي بومي با بيش از ۶۰۰۰ کارمند در چين است که با ارائه خدمات به جمعيت بسيار زياد اين کشور، موفق شده پربيننده ترين سايت چين و ششمين سايت پربيننده جهان باشد. همچنين بايدو در کشورهاي کره جنوبي، الجزيره، تايوان و هند نيز به ترتيب داراي مقام ۶، ۷، ۱۰ و ۸۸ در فهرست پربيننده ترين سايت هاست. بايدو طبق نظر مسوولان دولت چين، تعدادي از سايت ها و موضوعات را سانسور مي کند. بنابراين موتور جستجوي بومي مبحث تازه اي نيست و قبلا نيز وجود داشته است، اما آيا تاکنون تلاش هايي مشابه براي ايران صورت پذيرفته است؟
موتور جستجوي فارسي
اين درست است که عبارت موتور جستجوي ملي با نام «ياحق» اولين بار در شهريورماه امسال مطرح شد، اما پيش از اين نيز موتور جستجوهاي فارسي مختلفي وجود داشته است. يکي از قديمي ترين آن ها، پارسيک به نشاني parseek.com است که از ارديبهشت ۱۳۸۱ راه اندازي شده و در حال حاضر در رده ۹۹ پربيننده ترين سايت ها در ايران قرار دارد که نشان مي دهد از آن استفاده زيادي مي شود. اين سايت امکانات ديگري چون اخبار، فرهنگ لغات و نرخ ارز نيز دارد.موتور جستجوي بعدي، ريسمون به نشاني rismoon.com است که عنوان «نخستين موتور جستجوي مستقل پارسي» را يدک مي کشد و امکان جستجو در وب، اخبار، اطلاعات ۱۱۸ و شعر و ادب را در کنار تقويم، تبديل تاريخ و فرهنگ فارسي معين فراهم مي کند. اين سايت هنوز در مرحله آزمايشي قرار دارد و در مقايسه با ديگر سايت هاي جستجوي فارسي، کاربران چنداني را به سوي خود جذب نکرده است.سايت بعدي، جس جو است که در نشاني jasjoo.com قرار دارد. جس جو که در رده ۲۴۹ پربيننده ترين سايت ها در ايران است ابزارهاي تازه اي مانند تحرير آنلاين نستعليق را به کاربرانش عرضه مي کند.
همچنين از سايت هاي ديگري چون قطره به نشاني ghatreh.com و امروز به نشاني today.ir نيز نام برد که هرکدام کاربران خاص خود را دارند. به نظر مي رسد که اگر قرار است «ياحق» موتور جستجويي مشابه آن چيزي باشد که در نمونه هاي موفق جهاني مي بينيم، مي توان با استفاده از همين تلاش هاي ذکر شده يا حمايت از آن ها به نتايج مطلوبي رسيد. اما بخش مهمي از کارکرد اين موتور جستجو که قرار است مرتبط با خدمات دستگاه هاي اجرايي و دولتي باشد، در مواردي که نام برده شد محقق نشده اند و اين شايد بزرگترين وجه تمايز موتور جستجوي ياحق با تجربه هاي پيشين در اين زمينه باشد. اين نکته نيز قابل ذکر است که اساسا موتور جستجو کاري بزرگ و سخت است و راه اندازي و بهبود و به روزرساني مداوم آن نيازمند برنامه ريزي و پيش بيني علمي است که اميد است در اين طرح و مشابه آن مورد توجه قرار گرفته باشد.
● نتيجه گيري
با توجه به آنچه گفته شد به نظر مي رسد تلاش هاي صورت گرفته در راستاي موتور جستجوي فارسي چندان مطلوب نبوده و بايد کار تازه اي انجام شود. اما اين موتور جستجو قرار است در اينترانت کشوري و با هدف ارائه راحت تر خدمات دستگاه اجرايي و دولتي راه اندازي شود که قطعا پاسخگوي تمامي نيازهاي کاربران فارسي زبان نخواهد بود. در واقع بخشي از نيازهاي کاربران که مرتبط با دستگاه هاي مختلف در کشور مي شود با اين موتور جستجو پاسخ داده خواهد شد و با اين تعريف، اين موتور جستجو کارکردي مشابه آنچه در کشورهاي ديگر مثال زديم نخواهد داشت. ولي اگر اين موتور جستجو با افزايش سطح فعاليت خود بتواند پاسخگوي طيف وسيع تري از نيازهاي کاربران باشد و در ميدان رقابت با غول هايي مانند گوگل و ياهو قرار گيرد، مي تواند با امتيازاتي چون هزينه دسترسي کمتر، توجه ويژه به نيازهاي کاربر فارسي زبان و... به يک طرح موفق تبديل شود.

معمول ترين راهها جهت افزايش نيروي توليدي موتور افزايش راندمان حجمي موتور ميباشد.به کمک افزايش راندمان حجمي بسته به تکنيک مورد استفاده ميتوان از ۵% تا ...

سلمان فارسي يا روزبه از صحابه ايراني مشهور حضرت محمد(ص)، پيامبر اسلام بود که حضرت محمد او را از اهل بيت خواند. او با اين که پسر يکي از زمين داران ايرا ...

يك موتور خطي در واقع يك موتور الكتريكي است كه استاتورش غير استوانه شده است تا به جاي اينكه يك گشتاور چرخشي توليد كند، يك نيروي خطي در راستاي طول استات ...

يک موتور الکتريکي ، الکتريسيته را به حرکت مکانيکي تبديل مي‌کند. عمل عکس آن که تبديل حرکت مکانيکي به الکتريسيته است، توسط ژنراتور انجام مي‌شود. اين دو ...

مطلب ( MATLAB ) يکي از زبانهاي برنامه نويسي سطح بالا با تمرکز بر روي تکنيکهاي محاسباتي است. اين نرم افزار محيطي مناسب براي انجام عملياتهاي رياضي، ايجا ...

۱) همه چيز در نحوه ي نوشتن با اطلاع از چگونگي نوشتن عبارات جستجو در موتورهاي جستجو، مي توانيد اطلاعات مورد نيازتان را به راحتي پيدا کنيد. به عنوان مثا ...

در کتاب ها و متون مختلف تعاريف متفاوتي از تبليغات آمده است، اما در تمامي آن تعاريف، اشتراکاتي وجود دارد. اين اشتراکات شامل موارد زير مي شوند: ▪ تبليغ ...

سرعت سرسام آور توليد اطلاعات از يک سو و ضرورت سامان دهي اين حجم روز افزون از سويي ، بشر را با چالش هاي جديدي روبرو ساخته است. پيشرفت هاي حاصل در فناور ...

دانلود نسخه PDF - موتور جستجوي فارسي