• فهرس المقالات Knowledge Discovery

      • حرية الوصول المقاله

        1 - A Hybrid Geospatial Data Clustering Method for Hotspot Analysis
        Mohammad Reza Keyvanpour Mostafa Javideh Mohammad Reza Ebrahimi
        Traditional leveraging statistical methods for analyzing today’s large volumes of spatial data have high computational burdens. To eliminate the deficiency, relatively modern data mining techniques have been recently applied in different spatial analysis tasks wit أکثر
        Traditional leveraging statistical methods for analyzing today’s large volumes of spatial data have high computational burdens. To eliminate the deficiency, relatively modern data mining techniques have been recently applied in different spatial analysis tasks with the purpose of autonomous knowledge extraction from high-volume spatial data. Fortunately, geospatial data is considered a proper subject for leveraging data mining techniques. The main purpose of this paper is presenting a hybrid geospatial data clustering mechanism in order to achieve a high performance hotspot analysis method. The method basically works on 2 or 3-dimensional geographic coordinates of different natural and unnatural phenomena. It uses the systematic cooperation of two popular clustering algorithms: the AGlomerative NEStive, as a hierarchical clustering method and κ-means, as a partitional clustering method. It is claimed that the hybrid method will inherit the low time complexity of the κ-means algorithm and also relative independency from user’s knowledge of the AGNES algorithm. Thus, the proposed method is expected to be faster than AGNES algorithm and also more accurate than κ-means algorithm. Finally, the method was evaluated against two popular clustering measurement criteria. The first clustering evaluation criterion is adapted from Fisher’s separability criterion, and the second one is the popular minimum total distance measure. Results of evaluation reveal that the proposed hybrid method results in an acceptable performance. It has a desirable time complexity and also enjoys a higher cluster quality than its parents (AGNES and κ-means). Real-time processing of hotspots requires an efficient approach with low time complexity. So, the problem of time complexity has been taken into account in designing the proposed approach. تفاصيل المقالة
      • حرية الوصول المقاله

        2 - Application of Rough Set Theory in Data Mining for Decision SupportSystems (DSSs)
        Mohammad Hossein Fazel Zarandi Abolfazl Kazemi
        Decision support systems (DSSs) are prevalent information systems for decision making in many competitive business environments. In a DSS, decision making process is intimately related to some factors which determine the quality of information systems and their relate أکثر
        Decision support systems (DSSs) are prevalent information systems for decision making in many competitive business environments. In a DSS, decision making process is intimately related to some factors which determine the quality of information systems and their related products. Traditional approaches to data analysis usually cannot be implemented in sophisticated Companies, where managers need some DSS tools for rapid decision making. In traditional approaches to decision making, usually scientific expertise together with statistical techniques are needed to support the managers. However, these approaches are not able to handle the huge amount of real data, and the processes are usually very slow. Recently, several innovative facilities have been presented for decision making process in enterprises. Presenting new techniques for development of huge databases, together with some heuristic models have enhanced the capabilities of DSSs to support managers in all levels of organizations. Today, data mining and knowledge discovery is considered as the main module of development of advanced DSSs. In this research, we use rough set theory for data mining for decision making process in a DSS. The proposed approach concentrates on individual objects rather than population of the objects. Finally, a rule extracted from a data set and the corresponding features (attributes) is considered in modeling data mining. تفاصيل المقالة
      • حرية الوصول المقاله

        3 - شناسایی ویژگی‌های داده درخور جهت کشف دانش از سیستم‌های کلان داده سلامت
        فاطمه سلیمانی روزبهانی علی رجب زاده قطری رضا رادفر
        هدف: هدف مطالعه حاضر ارائه و معرفی عوامل تأیید کننده مطلوبیت ویژگی‌های داده های مورد استفاده جهت کشف دانش از سیستم‌های کلان داده سلامت بوده است.روش پژوهش: پژوهش پیش رو مطالعه توصیفی-تحلیلی است. جامعه آماری متخصصان حوزه علوم داده، بیوانفورماتیک و تحلیل اطلاعات سلامت داخ أکثر
        هدف: هدف مطالعه حاضر ارائه و معرفی عوامل تأیید کننده مطلوبیت ویژگی‌های داده های مورد استفاده جهت کشف دانش از سیستم‌های کلان داده سلامت بوده است.روش پژوهش: پژوهش پیش رو مطالعه توصیفی-تحلیلی است. جامعه آماری متخصصان حوزه علوم داده، بیوانفورماتیک و تحلیل اطلاعات سلامت داخل و خارج از کشور بودند که با استفاده از روش گلوله برفی 655 نفر از آنها شناسایی شده، و برای آنها ابزار پژوهش پرسشنامه محقق ساخته ارسال شد که 247 پرسشنامه را تکمیل و برگرداندند. روش استفاده شده تحلیل داده‌ها، تحلیل عاملی اکتشافی و تأییدی با استفاده از نرم‌افزارهای0/26 SPSS و 8/8 Lisrel بوده است.یافته ها: نتایج تحلیل عاملی اکتشافی، شش عامل برای شناسایی ویژگی‌های داده درخور تبیین نمود که عبارتند از کیفیت داده، پایداری داده، سازگاری داده، ارزشمندی و دسترسی پذیری داده، کارایی داده و صحت و کامل بودن و روی هم رفته 68 درصد از واریانس کل داده ها را دربرداشته است. شاخص‌های برازش تحلیل تأییدی نشان داد که الگوی شش عاملی برازش قابل قبولی با داده ها دارد.نتیجه گیری: یافته های پژوهش حاکی از آن است که بر اساس مدل ارائه شده ویژگی‌های داده بر فرایند کشف دانش از سیستم‌های کلان داده سلامت تاثیر دارد و شش عامل شناسایی شده و 20 گویه سازنده این عوامل، می‌تواند ابزار مناسبی جهت شناسایی ویژگی‌های داده های مناسب برای کشف دانش از سیستم‌های کلان داده سلامت جهت به کارگیری موثر این سیستم‌ها باشد که با تاکید بر عدم وابستگی به فرمت داده، خصایص فراگیر داده های حوزه سلامت را دربرگرفته و توجه به آن می‌تواند به تشخیص و درمان زودهنگام بیماری‌ها کمک شایانی کند. تفاصيل المقالة