آثار | مقاله کنفرانسی

عنوان:
بررسی و بهبود زمان ایندکس گذاری اسناد در Lucene

چکیده:
این مقاله در مورد کارایی فضا و زمان در موتور جستجوی مبتنی بر زبان جاوا با نام Lucene بحث می کند. آپاچی-لوسین (Apache Lucene) یک پایگاه داده غیر ساخت‌یافته (Non-structured) متن باز (OpenSource) برای ذخیره سازی و نمایه سازی (Index) اطلاعات متنی در حجم بالا می باشد. این پایگاه داده در موتورهای جستجوگر و سرویس دهنده در حوزه کلان‌داده‌ها مانند ناچ(Apache Nutch)، سولار(Apache Solr)،الستیکس (Elasticsearch) و تعداد بسیاری از ابزارهای دیگر مورد استفاده قرار می گیرد. در این مقاله سعی شده است تا با شناسایی پارامتر‌های تاثیرگذار زمان ایندکس کاهش داده شود. البته ابزار و روش استفاده از این پایگاه داده تاثیر مستقیمی در زمان ایندکس خواهد داشت که در بخش دوم این ابزارها بدون پرداختن به جزییات آنها بررسی شده و سپس با پارمترهای تاثیرگذار ارائه شده، سنجیده شده و در انتها تکنیکهای بهبود را با نمودارها سنجیده و در آخرین نسخه این پایگاه داده تست خواهیم کرد.

اشتراک گذاری نظرات