طراحی و پیاده سازی کامل موتور جستجوی بومی پارسی یاب با سرپرستی دکتر رضا ابراهیمی عضو هیات علمی گروه مهندسی کامپیوتر و گروهی از دانشجویان دانشگاه گیلان در قالب تیم نرم افزاری دانشکده فنی این دانشگاه انجام شده است. هم اکنون نسخه آزمایشی آن با ده ها هزار سند اینترنتی راه اندازی و اجرا شده است.
طرح موتور جستجوی پارسی یاب از اردیبهشت 1391 به عنوان فعالیت دانشجویی برای تجمیع اطلاعات رسانه های داخلی کشور در بستر اینترانت ملی آغاز شد. با گسترش و ارتقای این طرح ، بستری برای راه اندازی یک موتور جستجوی کامل و جامع فراهم شد.
پس از طی مراحل مطالعاتی بخش های طراحی معماری آغاز شد . پیاده سازی بخش های مختلف آن از قبیل خزنده، پایگاه های داده، ارتباطات وب، نمایه گذار(ایندکسر)، پردازنده پرس و جو، رتبه بندی، مدیریت ذخیره سازی، کنترلر، فرهنگ لغات، انباره تصاویر، پارسر، قوانین بهینه سازی (SEO)، بستر های زبانی، خودکار سازی، توزیع های ذخیره سازی و طراحی رابط کاربر به طور همروند آغاز گردید.
تا آذر 91 تقریبا تمامی این قسمت ها به پیاده سازی نهایی خود در فاز اول رسیدند و کار ذخیره سایت ها و اسناد وب در دستور کار قرار گرفت. هم اکنون با گذشت 45 روز از زمان ذخیره سازی در حدود 75 هزار صفحه ( 200 هزار سند اینترنتی) در پایگاه داده ذخیره شده است.
برخی از امکانات و نقاط قوت فعلی موتور جستجو پارسی یاب عبارتند از
- مدیریت پردازش موازی بیش از 10 خزنده به طور همزمان
- قابلیت پردازش دسته ای اسناد به طور آنلاین و آفلاین
- سرعت قابل توجه در درخت پردازش
- معناگرایی با تکیه بر زبان فارسی
- ساختار نمایه گذار (ایندکسر) معناگرا
- ادغام سرویس رتبه بندی با سرویس نمایه گذار (ایندکسر)
- پشتیبانی از زبان های فارسی، انگلیسی، عربی و ترکی
علاقمندان می توانند برای آشنایی بیشتر با موتور جستجوگر پارسی یاب به آدرس parsiab.guilan.ac.ir مراجعه نمایید.