استخراج اطلاعات از تصاویر متنی شناسایی شده از مجرای اینترنت یکی از مهمترین معضلات سیستمهای جمعآوری اطلاعاتی در حوزه تکنولوژی اطلاعات میباشد. این مسأله وقتی حادتر میگردد که بدانیم در بین انبوه تصاویر متنی تنها درصد ناچیزی از تصاویر متنی شناسایی شده، دارای ارزش اطلاعا چکیده کامل
استخراج اطلاعات از تصاویر متنی شناسایی شده از مجرای اینترنت یکی از مهمترین معضلات سیستمهای جمعآوری اطلاعاتی در حوزه تکنولوژی اطلاعات میباشد. این مسأله وقتی حادتر میگردد که بدانیم در بین انبوه تصاویر متنی تنها درصد ناچیزی از تصاویر متنی شناسایی شده، دارای ارزش اطلاعاتی میباشند. در این مقاله، جهت تجزیه و تحلیل تصاویر متنی و دسترسی به محتوای آنها، از یک روش طبقهبندی مبتنی بر ناحیهبندی تصویر استفاده شده است. در این الگوریتم به کمک یک روش ناحیهبندی دومرحلهای، نواحی تصویر شناسایی شده، سپس به کمک یک ساختار سلسلهمراتبی طبقهبندی، نوع ناحیه از لحاظ متنی یا عکسی (غیرمتنی) بودن مشخص میگردد. در ادامه با تعریف باارزش بودن متن یک تصویر متنی، سعی میشود تصویر متنی در یکی از دو گروه معنایی باارزش و بیارزش دستهبندی گردد. الگوریتم پیشنهادی بر روی یک پایگاه داده تصاویر متنی و غیرمتنی که از تصاویر موجود در اینترنت فراهم شده است، موردارزیابی قرار میگیرد. نتایج آزمایشها بیانگر کارایی روش پیشنهادی در طبقهبندی معنایی تصاویر براساس تعریف کاربر از باارزش و بیارزش بودن تصاویر متنی است. الگوریتم پیشنهادی، صحت طبقهبندی %98.8 برای طبقهبندی تصاویر متنی باارزش از بیارزش را فراهم کرده است.
پرونده مقاله