در دنیای امروز با عنایت به پیشرفتهای هوش مصنوعی، سامانههای سنتی موجود در تعامل با مخاطبین در تماسهای تلفنی کارآمد نخواهند بود و این کارآمدی با اتوماسیون و خودکارسازی فعالیتهای تکراری بهبود خواهد یافت. در این مقاله، ابزار ParsAirCall معرفی شده است که یک ابزار برای تش چکیده کامل
در دنیای امروز با عنایت به پیشرفتهای هوش مصنوعی، سامانههای سنتی موجود در تعامل با مخاطبین در تماسهای تلفنی کارآمد نخواهند بود و این کارآمدی با اتوماسیون و خودکارسازی فعالیتهای تکراری بهبود خواهد یافت. در این مقاله، ابزار ParsAirCall معرفی شده است که یک ابزار برای تشخیص خودکار گفتار فارسی اعداد در سامانههای فرودگاهی است که از یادگیری انتقالی عمیق برای بهبود عملکرد در محیطهای واقعی و عملیاتی سامانههای هوشمند تلفنی گویا در فرودگاههای کشور میباشد. ParsAirCall با تعداد کمتر پارامترها و منابع محاسباتی بهینهتر و نیز دقت بالاتر از مدلهای رقیب عمل میکند. به دلیل محدودیت دادههای موجود برای تشخیص گفتار در زبان فارسی، یک مجموعه دادگان 30ساعته تلفنی جمعآوری و برچسبگذاری شده و برای آموزش مدل نهایی مورد استفاده قرار گرفته است. آزمایشها روی هر دو مجموعه داده تلفنی جمعآوری شده توسط ما و پروژه Common Voice انجام شدند، که کارایی ParsAirCall را در دستیابی به 2.7% میزان WER در تشخیص اعداد در تماسهای تلفنی فرودگاهی را نشان میدهد. ParsAirCall میتواند به راحتی به عنوان یک سرویس در هر سیستمهای تلفنی فرودگاهی فارسی زبان ادغام شود، که آن را به یک ابزار قابل اجرا برای تشخیص اعداد در مراکز تماس و سیستمهای تلفنی فرودگاهی تبدیل کند.
پرونده مقاله