ارائه یک روش جدید فشردهسازی ویدیو مبتنی بر تبدیل ویولت و شبکههای عصبی مصنوعی
محورهای موضوعی : تبدیل موجک و کاربردهای آنمحمد رحمانیان 1 , احمد حاتم 2 , محمدعلی شفیعیان 3 *
1 - دانشکده برق، واحد بوشهر، دانشگاه آزاد اسلامی، بوشهر، ایران
2 - استادیار، دانشکده برق، دانشگاه هرمزگان، بندرعباس، ایران
3 - کارشناس ارشد دانشکده مهندسی برق دانشگاه شیراز، شیراز، ایران
کلید واژه: تخمین حرکت, فشردهسازی ویدیو, جبرانسازی حرکت, کدگذار و کدگشای ویدیو, استاندارد MPEG,
چکیده مقاله :
عمل فشردهسازی ویدیو با بهرهگیری از افزونگی زمانی و فضایی موجود در رشته ویدیو انجام میگیرد. این افزونگیها را میتوان به ترتیب با اعمال یک تبدیل، تخمین و جبرانسازی حرکت و کوانتیزاسیون بهگونهای کارآمد جبرانسازی نمود. استانداردهای موجود برای فشردهسازی ویدیو مانند MPEG مبتنی بر تبدیل کسینوسی بلوکی میباشند که در آن تصویر ورودی باید به صورت بلوکهایی درآید. بنابراین همبستگی در عرض مرزهای بلوک حذف نشده و این امر منجر به مقدار قابل توجهی نویز بلوکی میگردد. با استفاده از تبدیل موجک میتوان بر این پدیده غلبه نمود. اما چنین الگوی فشردهسازی از نظر زمان اجرا کمی کند است و برای غلبه بر این مشکل نیز از تبدیل موجک چندسطحی استفاده میشود. در واقع استفاده از تبدیل موجک باعث میشود که عمل تجزیه نمودن بر روی بُعد زمان نیز علاوه بر بُعد مکانی صورت گیرد. هدف از این مقاله دستیابی به یک الگوریتم فشردهسازی سریعتر و با نرخ فشردهسازی بالاتر میباشد. برای این منظور یک الگوریتم فشردهسازی ویدیو مبتنی بر تبدیل ویولت سه سطحی معرفی و شبیهسازی شده است. برای انجام عمل پیشگویی از شبکه عصبی استفاده شده است. نتایج شبیهسازیها مزایای استفاده از تبدیل موجک را آشکار میکنند. این نتایج نشان میدهندکه الگوریتم پیشنهادی از نظر زمان اجرا سریعتر و از نظر نرخ فشردهسازی کارآیی بهتری نسبت به استاندارد MPEG را از خود نشان میدهد. همچنین ویدیوی نهایی بهدست آمده دارای کیفیت دیداری قابل قبولی برای چشم انسان میباشد و به دلیل نیاز به حجم کم حافظه میتوان از آن در تجهیزات قابل حمل استفاده نمود.
Videos are made up of a temporal sequence of frames and are projected at a proper rate to create the illusion of motion. This means that there exists a high correlation between adjacent temporal frames so that when projected at a proper rate, smooth motion is seen. Correlation between adjacent temporal frames is called interframe correlation. In order to decode compressed video bit stream uniformly by various platforms and devices, the bit stream format must be predefined. Thus, there must be a standard for a video compressor, which will enable all standard-compliant compressed video data to be decoded anywhere. The goal is to propose a new video compression algorithm based on wavelet transform and neural networks. Using wavelet transform leads to factorization in temporal as well as spatial domain. The goal in this paper is to achieve a compression algorithm which would be faster and has more compression ratio. Neural networks are used for prediction which is one of the most important functions in any video compression scheme. Furthermore, the proposed algorithm is compared with MPEG standard. Simulation results show the befits of using wavelet transform which reveal that the proposed algorithm is faster and has better performance in some aspects compared to MPEG standard. The video which obtained from proposed algorithm has acceptable in human visual and since it needs less than space for storing, it is suitable for portable devices.
[1] Bovik, A., Handbook of Image and Video Processing, 2000, Academic Press.
[2] E. Moyano, "A new fast 3D wavelet transform algorithm for video compression. in communications", Proceeding of the IEEE/PACIRM, Vol. 1, pp. 156-159, Victoria, BC, 2001.
[3] J.R. Ohm, "Three-dimensional subbandcoding with motion compensation", IEEE Trans. on Image Processing, pp. 559-571, 1994.
[4] P.N.Topiwala, "Wavelet image and video compression", Kluwer Academic, 1998.
[5] T. Aziz, D.R.J. Dolly, "Motion estimation and motion compensated video compression using DCT and DWT", International Journal of Emerging Technology and Advanced Engineering, Vol. 2, No. 12, pp. 667-671, 2014.
[6] Y.S. Cheng, G.D. Huang, "Audio/video compression applications using wavelets", Proceedingsof the IEEE/IJCNN, pp. 2214-2218, Honolulu, HI, 2002.
[7] R. Adhami, "Video compression technique using wavelet transform", Proceeding of the IEEE/AERO, Vol. 4, pp. 449-455, Aspen, CO, 1996.
[8] J. Bridge, "Differential image compression". Dr. Dobbs’s Journal, pp. 38-48, 1991.
[9] M. Nema, L. Gupta, N.R. Trivedi, "Video compression using SPIHT and SWT wavelet", International Journal of Electronics and Communication Engineering, Vol. 5, No. 1, pp. 1-8, 2012.
[10] D.Z. Athmane, et al., "New video compression using MSPIHT3D transformation", Proceeding of the MIC-Telecom, Istanbul, Turkey, 2014.
[11] G.D. Bhokare, C.S. Gupta, V.M. Gadre, "Video compression using 3-band wavelet transform", in The National Conference on Communications, National Conference on Communications. pp. 321-326, 1996.
[12] D.V. Babu, N.R. Alamelu, "A novel morpho codec for medical video compression based on lifting wavelet transform", Asian Journal of Scientific Research,Vol. 7, No. 1, pp. 85-93, 2014.
[13] S.D. Thepade, N. Yadav, "Novel efficient content based video retrieval method using cosine-haar hybrid wavelet transform with energy compaction", Proceeding of the IEEE/ICCUBEA, pp. 615-619, Pune, Feb. 2015.
[14] Y. Xu, L. XU. "The performance analysis of wavelet in video coding system", Proceeding of the IEEE/ICMT, pp. 878-883, Hangzhou, July 2011.
[15] M. Lei, L. Hang, "Video compression algorithm based on wavele ttransform", Proceeding of the IEEE/, pp. 535-538, Shenyang, Aug. 2009.
[16] R.Y. Omaki, G. Fujita, T. Onoye, I. Shirakawa, "Embedded zerotree wavelet based algorithm forvideo compression", Proceeding of the IEEE/TENCON, Vol. 2, pp. 1343-1346, Cheju Island, 1999.
[17] K.S. Thyagarajan, "Still image and video compression with MATLAB", John Wiley & Sons, Inc, 2011.
[18] Z. Li, M.S. Drew, J. Liu, "Fundamentals of multimedia", United States of America: Pearson Prentice Hall, 2004.
_||_