کتاب امانی از کتابخانه آیتالله خامنه ای قم
درباره | تگ | دسته ها | آرشیو | خانه |
|
کتاب امانی از کتابخانه آیتالله خامنه ای قم
کتاب امانی از کتابخانه آیتالله خامنه ای قم
عنوان:
بررسی و بهبود زمان ایندکس گذاری اسناد در Lucene
چکیده:
این مقاله در مورد کارایی فضا و زمان در موتور جستجوی مبتنی بر زبان جاوا با نام Lucene بحث می کند. آپاچی-لوسین (Apache Lucene) یک پایگاه داده غیر ساختیافته (Non-structured) متن باز (OpenSource) برای ذخیره سازی و نمایه سازی (Index) اطلاعات متنی در حجم بالا می باشد. این پایگاه داده در موتورهای جستجوگر و سرویس دهنده در حوزه کلاندادهها مانند ناچ(Apache Nutch)، سولار(Apache Solr)،الستیکس (Elasticsearch) و تعداد بسیاری از ابزارهای دیگر مورد استفاده قرار می گیرد. در این مقاله سعی شده است تا با شناسایی پارامترهای تاثیرگذار زمان ایندکس کاهش داده شود. البته ابزار و روش استفاده از این پایگاه داده تاثیر مستقیمی در زمان ایندکس خواهد داشت که در بخش دوم این ابزارها بدون پرداختن به جزییات آنها بررسی شده و سپس با پارمترهای تاثیرگذار ارائه شده، سنجیده شده و در انتها تکنیکهای بهبود را با نمودارها سنجیده و در آخرین نسخه این پایگاه داده تست خواهیم کرد.
پلتفرم و اکوسیستم کلان داده هدوپ متشکل از بخشهای
Hadoop
Spark
Hive
Hbase
Oozie
Falcon
Sqoop
Map-reduce
HDFS
Zookeeper
در چندین پروژه تجاری و پژوهشی با شرکتها و افراد مختلف مورد استفاده قرار گرفت.
در این حوزه ها کارهای تحقیقاتی و پژوهشی ادامه دارد.
سامانه جستجوی مبتنی بر solr به همراه تغیر در نوع الگوریتم رنک دهی بر پایه الگوریتم ارائه شده در مقاله الزویر تایید شده ۲۰۱۶
سامانه جستجوی سازمانی بر پایه موتور طراحی شده از پایه
این سامانه در شرکت کارانس ایرانیان با همکاری تیم R&D این شرکت طراحی و توسعه پیدا کرد.
ارائه یک فرایند تجاری ساده به وسیله سامانه مدیریت فرایند تجاری Bonita
bonitasoft
فروشگاه کتاب من
فروشگاه کتاب من یا SellMyBook مجموعه ای است که برای ارائه سرویس نقل و انتقال رایگان کتاب به همت گروهی از کتاب دوستان در قم و با همکاری افراد و نهاد های فرهنگی مانند برخی از مساجد قم اقدام به راه اندازی یک سامانه نقل و انتقال دست به دست کتاب های دست دوم و بی استفاده در گوشهی خانه ها کرده است.
SellMyBook با ایجاد فضای دوستانه و کتاب محور سعی بر تبادل کتاب های شخصی افراد با کمک مساجد عضو طرح کرده است.
این سامانه موفق به اخذ اعتبارنامه نماد اعتماد الکترونیکی ایران از وزارت صنعت معدت تجارت میباشد، و همچنین در حال اخذف اعتبارنامه ستاد ساماندهی وب سایت های ایرانی می باشد.
دیتاست رده بندی دیویی به زبان فارسی
دیتاست رده بندی دیویی از چند کتابخانه به شکل مستقیم خزش شد و در گیتهاب قرار داده شد.
این مجموعه که هم به شکل متن خام و هم به شکل فایل دامپ پایگاه داده قرار داده شده است، قابل استفاده در پروژه های برنامه نویسی خواهد بود.
از این دیتاست در مجموعه
فروشگاه کتاب من
استفاده است.
جیز
یک سیستم مدیریت محتوای وبی به زبان جاوا است.
این سیستم مدیریت محتوا توسط دوست عزیزم آقای جابلونسکی طراحی و به شکل متن باز در اختیار برنامه نویسان وب قرار گرفته است، اولین نسخه جیز در سال ۲۰۰۹ ارائه شد و پس از آن تا به الان که در نسخه ۳ به سر می برد روند رشد خود را ادامه داد.
در نسخه چهار بر آن شدم که پایگاه داده رابطهای را به جیز اضافه کرده و در این راه برای استفاده هر چه بیشتر دوستان و هموطنان فارسی زبان تقویم جلالی و پشتیبانی از فونت های فارسی را به آن اضافه کرده و در گیتهاب در دسترس عموم قراردادم، در این نسخهاز پوسته راستچین شده بوتاستراپی استفاده شد.
جیز به شکل متن باز منتشر شده و نسخه فارسی شده آن نیز که در این چند سال با پوسته های مختلف ارائه شد نیز به شکل متن باز قابل دسترسی می باشد.