0% Complete
صفحه اصلی
/
هفتمین کنفرانس بین المللی میکروالکترونیک ایران
FPGA-Based CNN Accelerator with High Computing Resource Utilization
نویسندگان :
Raziyeh Foroumandi
1
Behbood Mashoufi
2
Amir Fathi
3
1- دانشگاه ارومیه
2- دانشگاه ارومیه
3- دانشگاه ارومیه
کلمات کلیدی :
Convolutional neural networks (CNNs)،FPGA-based accelerator،parallel computing
چکیده :
The rapid advancement of Convolutional Neural Networks (CNNs) has created a growing demand for hardware accelerators capable of performing CNN inference efficiently. FPGA-based CNN accelerators are particularly attractive due to their high performance, low power consumption, and inherent reconfigurability. This work presents an FPGA-based CNN accelerator employing a multi-computing engine architecture for convolution operations to enhance computational efficiency and achieve high throughput. The design exploits multiple levels of parallelism with optimized parallelism parameters, a data reordering unit to ensure continuous data delivery to the Processing Element (PE) array without idle cycles, and an optimized buffer structure to maximize computing resource utilization. The proposed accelerator was evaluated on the Xilinx XC7VX690T FPGA using VGG16 benchmark. Results show computing efficiency of 98.92%, outperforming existing FPGA-based CNN accelerators.
لیست مقالات
لیست مقالات بایگانی شده
یک مبدل آنالوگ به دیجیتال مبتنی بر مدولاتور سیگما دلتا برای کاربردهای مهندسی - پزشکی با ENOB = 13. 2 bits ، پهنای باند 10 kHz و توان مصرفی 16.9 µ W
علی صداقت - حسین پاک نیت - نوید یثربی
طراحی شمارنده بالا پایین شمار سنکرون 8 بیتی بسیار سریع مبتنی بر شمارش در دولبه پالس ساعت با استفاده از ترانزیستورهای نانو لوله کربنی32 نانومتر
جواد جاویدان
Design of thermo-optic phase shifter in silicon nitride waveguide with focus on Heater dimensions
Reza Elyasi - Mehdi Khaje - Abdollah Eslami Majd
Impact of Geometrical and Process Design Parameters on the Performance of Schottky Barrier Reconfigurable Field Effect Transistor
Hamid Reza Heydari - Zahra Ahangari - Hamed Nematian - Kian Ebrahim Kafoori
طراحی آنتن پچ تراهرتز قابل تنظیم با استفاده از سوییچهای گرافنی برای کاربردهای گسترده فرکانسی
امیر امینی - موسی عبداله وند یاجلو - مهدی نوشیار
A differential ring VCO with a new structure for the pre-charger and pre-discharger method
Vahid Khodadadi Viaee - Mahdi Alijani - Adib Abrishamifar
Design of a High Voltage Common Mode Resilient FlexRay Receiver in 180nm/5V CMOS Process
Hamid Sadat Mansoury - Saeed Saeedi - Mojtaba Atarodi
Frequency Response and Design Based on gm/ID of Amplifier in CNFET Technology
S. Mohammadali Zanjani - Mehdi Dolatshahi - Massoud Dousti - Zahra Alaie - Ata Jahangir Moshayedi - Arash Mehrabi
A High-Precision Low-Dropout Regulator With High Current Efficiency and Slew-Rate Enhancement
Yeganeh Moradzadeh Rezaei - Mortaza Mojarad
Adaptive Oversampling-based CDR with Phase Correction for Low-Cost FPGAs
Amin Khalilzadegan - Asal Malekara - Amir Fathi - Mir Majid Ghasemi
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 43.4.0