انتخاب خودکار ایندکس برای پایگاه داده با استفاده از الگوهای پرتکرار بیشینه
محورهای موضوعی : مجله فناوری اطلاعات در طراحی مهندسی
1 - گروه کامپیوتر نجف آباد
کلید واژه: بهینه ساز پرس وجو, انتخاب خودکار ایندکس, الگوهای پرتکرار, الگوهای پرتکرار بیشینه, Auto indexing Selection, Query optimization, Frequent Patterns, Maximal Frequent Patterns,
چکیده مقاله :
: بهینه سازی دسترسی به داده ها، یکی از مسائل مطرح در سازمان ها و تجارت های رقابتی است و انتخاب ایندکس مفید یکی از تکنیک های مهم بهینه سازی پایگاه های داده آنها می باشد. با ایجاد پایگاه داده های بسیار بزرگ و نیاز به بهینه ساز پرس وجوی پیشرفته تر در سیستم های مدیریت پایگاه داده، نقش مدیر پایگاه داده به تنهایی برای پیدا کردن ایندکس های مناسب کافی نبوده وپیدا کردن خودکار ایندکسها توسط سیستم های مدیریت پایگاه داده مورد توجه محققین این حوزه قرار گرفت. تاکنون تکنیک های مختلفی، ازجمله تکنیک های داده کاوی برای پیدا نمودن خودکار ایندکس ها ارائه شده است. اما چالشی که در استفاده از تکنیک های داده کاوی وجود دارد این است که آیا همه ی ایندکس های پیدا شده مفید و لازم می باشند؟ پر واضح است که ایجاد ایندکس های غیر لازم از لحاظ زمانی و حافظه ای پر هزینه می باشند. به جهت حل این مشکل، دراین مقاله با استفاده از الگوهای پر تکرار بیشینه روش موثری برای کاهش زمان پیدا کردن خودکار ایندکس ها پیشنهاد شده است. همچنین در روش پیشنهادی با استفاده از وزن دهی مناسب به الگو های پیدا شده، ایندکس های غیر ضروری ایجاد نمی شوند. مانند کارهای قبلی، روش پیشنهادی با آزمایشات متعددی با در نظر گرفتن معیار ارزیابی TPC-H روی پرس وجو ها و داده های استاندارد ارزیابی شده است. نتایج آزمایشات نشان می دهد که پیدا کردن خودکارایندکس های مورد نیاز با استفاده از روش پیشنهادی نسبت به روش قبلی که از الگوهای پر تکرار استفاده می کند زمان کمتری نیاز دارد.
Data access optimization is one of the most important challenges for organizations and competitive businesses therefore selecting useful index is one of the significant techniques to optimize their databases. With the creation of very large databases and consequently need for more advanced query optimizer; database administrator role was not singly enough for finding suitable indexes in database management systems and finding indexes automatically by these systems was considered by researchers in this field. So far several techniques such as data mining techniques are proposed for finding indexes automatically. However there is a challenge in using data mining techniques, whether all indexes have been found are useful and necessary or not? Obviously creating unnecessary indexes is costly in terms of time and memory. For solving the problem, in this research has been proposed an effective way using Maximal frequent Pattern to reduce time for finding indexes automatically. Also in the proposed method using the allocated proper weight to the patterns which have been found, unnecessary indexes are not created. The proposed method like previous works is evaluated on standard data and queries by several experiments, considering the TPC-H benchmark assessment. Test results show that the automatic creation of required indexes using the proposed method compared to the previous method, which makes use of frequent patterns is less time required.
_||_