-
حرية الوصول المقاله
1 - A Hybrid Geospatial Data Clustering Method for Hotspot Analysis
Mohammad Reza Keyvanpour Mostafa Javideh Mohammad Reza EbrahimiTraditional leveraging statistical methods for analyzing today’s large volumes of spatial data have high computational burdens. To eliminate the deficiency, relatively modern data mining techniques have been recently applied in different spatial analysis tasks wit أکثرTraditional leveraging statistical methods for analyzing today’s large volumes of spatial data have high computational burdens. To eliminate the deficiency, relatively modern data mining techniques have been recently applied in different spatial analysis tasks with the purpose of autonomous knowledge extraction from high-volume spatial data. Fortunately, geospatial data is considered a proper subject for leveraging data mining techniques. The main purpose of this paper is presenting a hybrid geospatial data clustering mechanism in order to achieve a high performance hotspot analysis method. The method basically works on 2 or 3-dimensional geographic coordinates of different natural and unnatural phenomena. It uses the systematic cooperation of two popular clustering algorithms: the AGlomerative NEStive, as a hierarchical clustering method and κ-means, as a partitional clustering method. It is claimed that the hybrid method will inherit the low time complexity of the κ-means algorithm and also relative independency from user’s knowledge of the AGNES algorithm. Thus, the proposed method is expected to be faster than AGNES algorithm and also more accurate than κ-means algorithm. Finally, the method was evaluated against two popular clustering measurement criteria. The first clustering evaluation criterion is adapted from Fisher’s separability criterion, and the second one is the popular minimum total distance measure. Results of evaluation reveal that the proposed hybrid method results in an acceptable performance. It has a desirable time complexity and also enjoys a higher cluster quality than its parents (AGNES and κ-means). Real-time processing of hotspots requires an efficient approach with low time complexity. So, the problem of time complexity has been taken into account in designing the proposed approach. تفاصيل المقالة -
حرية الوصول المقاله
2 - Application of Rough Set Theory in Data Mining for Decision SupportSystems (DSSs)
Mohammad Hossein Fazel Zarandi Abolfazl KazemiDecision support systems (DSSs) are prevalent information systems for decision making in many competitive business environments. In a DSS, decision making process is intimately related to some factors which determine the quality of information systems and their relate أکثرDecision support systems (DSSs) are prevalent information systems for decision making in many competitive business environments. In a DSS, decision making process is intimately related to some factors which determine the quality of information systems and their related products. Traditional approaches to data analysis usually cannot be implemented in sophisticated Companies, where managers need some DSS tools for rapid decision making. In traditional approaches to decision making, usually scientific expertise together with statistical techniques are needed to support the managers. However, these approaches are not able to handle the huge amount of real data, and the processes are usually very slow. Recently, several innovative facilities have been presented for decision making process in enterprises. Presenting new techniques for development of huge databases, together with some heuristic models have enhanced the capabilities of DSSs to support managers in all levels of organizations. Today, data mining and knowledge discovery is considered as the main module of development of advanced DSSs. In this research, we use rough set theory for data mining for decision making process in a DSS. The proposed approach concentrates on individual objects rather than population of the objects. Finally, a rule extracted from a data set and the corresponding features (attributes) is considered in modeling data mining. تفاصيل المقالة -
حرية الوصول المقاله
3 - شناسایی ویژگیهای داده درخور جهت کشف دانش از سیستمهای کلان داده سلامت
فاطمه سلیمانی روزبهانی علی رجب زاده قطری رضا رادفرهدف: هدف مطالعه حاضر ارائه و معرفی عوامل تأیید کننده مطلوبیت ویژگیهای داده های مورد استفاده جهت کشف دانش از سیستمهای کلان داده سلامت بوده است.روش پژوهش: پژوهش پیش رو مطالعه توصیفی-تحلیلی است. جامعه آماری متخصصان حوزه علوم داده، بیوانفورماتیک و تحلیل اطلاعات سلامت داخ أکثرهدف: هدف مطالعه حاضر ارائه و معرفی عوامل تأیید کننده مطلوبیت ویژگیهای داده های مورد استفاده جهت کشف دانش از سیستمهای کلان داده سلامت بوده است.روش پژوهش: پژوهش پیش رو مطالعه توصیفی-تحلیلی است. جامعه آماری متخصصان حوزه علوم داده، بیوانفورماتیک و تحلیل اطلاعات سلامت داخل و خارج از کشور بودند که با استفاده از روش گلوله برفی 655 نفر از آنها شناسایی شده، و برای آنها ابزار پژوهش پرسشنامه محقق ساخته ارسال شد که 247 پرسشنامه را تکمیل و برگرداندند. روش استفاده شده تحلیل دادهها، تحلیل عاملی اکتشافی و تأییدی با استفاده از نرمافزارهای0/26 SPSS و 8/8 Lisrel بوده است.یافته ها: نتایج تحلیل عاملی اکتشافی، شش عامل برای شناسایی ویژگیهای داده درخور تبیین نمود که عبارتند از کیفیت داده، پایداری داده، سازگاری داده، ارزشمندی و دسترسی پذیری داده، کارایی داده و صحت و کامل بودن و روی هم رفته 68 درصد از واریانس کل داده ها را دربرداشته است. شاخصهای برازش تحلیل تأییدی نشان داد که الگوی شش عاملی برازش قابل قبولی با داده ها دارد.نتیجه گیری: یافته های پژوهش حاکی از آن است که بر اساس مدل ارائه شده ویژگیهای داده بر فرایند کشف دانش از سیستمهای کلان داده سلامت تاثیر دارد و شش عامل شناسایی شده و 20 گویه سازنده این عوامل، میتواند ابزار مناسبی جهت شناسایی ویژگیهای داده های مناسب برای کشف دانش از سیستمهای کلان داده سلامت جهت به کارگیری موثر این سیستمها باشد که با تاکید بر عدم وابستگی به فرمت داده، خصایص فراگیر داده های حوزه سلامت را دربرگرفته و توجه به آن میتواند به تشخیص و درمان زودهنگام بیماریها کمک شایانی کند. تفاصيل المقالة