0% Complete
صفحه اصلی
/
ششمین کنفرانس بین المللی میکروالکترونیک ایران
Comparison between Hardware/Software Co-design of RiscV Vector and Scalar Implementation of Deep Neural Networks
نویسندگان :
Seyed Kian Mousavikia
1
Morteza Mousazadeh
2
1- دانشگاه ارومیه
2- دانشگاه ارومیه
کلمات کلیدی :
Deep Neural Networks،Field Programmable Gate Array،Hardware/Software Co-Design،Parallel Processing،RiscV،Vector Co-processor
چکیده :
This paper compares a hardware/software co-design of a RiscV vector with a RiscV scalar implementation of a deep neural network (DNN). For the vector implementation, all building blocks of a DNN are vectorized and written in vector intrinsic coding format. Focusing more on the convolution function as the main source of the latency, this function is written in a special parallel processing-favor method in the vector intrinsic level to boost execution speed. For the comparison, a sample scalar RiscV core is selected and paired with a vector-based RiscV co-processor. Also, the same sample DNN is implemented only on the scalar processor to demonstrate the speedup better. The system was implemented and tested on a field-programmable gate array (FPGA). As a result, the vector implementation outperformed the scalar version by a factor of 3 in terms of latency by only negligibly increasing the utilized sources on the FPGA.
لیست مقالات
لیست مقالات بایگانی شده
یک چارچوب مبتنیبر EfficientNet به منظور تشخیص خودکار عیوب ویفر در تولید مدارهای مجتمع
علی سوری - سمیرا مودتی - محمد غلامی
A Nanowatt Low Voltage Subthreshold CMOS Voltage Reference Based On 2-T
Nima Dehghan - Mohammad Yavari
طراحی یک فلیپ فلاپ کم مصرف، پرسرعت و مقاوم در برابر خطاهای نرم برای فناوریهای نانومتری
سیده عارفه رضوی - وحید جمشیدی
A Review for Graphene, Graphene-based Materials, and Their Applications in Photonics and Optoelectronic Devices
Seyedeh Nastaran Talebzadeh - Saeed Golmohammadi - Seyyedeh Ladan Talebzadeh
OptiCore: A Novel Approach for Designing a Low Power Multi-Core Processor
Abolfazl Rajaiyan - Yas Hosseini Tehrani - Seyed Mojtaba Atarodi
Optimization and Characterization of CrossTalk in CMOS image sensors
Asma Mojarrad Alman abad - Hamzeh Alaibakhsh
Base Transit Time Investigation of InP/InGaAs HBT Optoelectronic Mixer Using Different Base Doping Profiles
Hassan Kaatuzian - Mehrdad Ghasemi - Mahdi NoroozOliaei
Low-Power Approximate Division: A Quasi-Logarithmic Approach
Reza Yousefnejhad - Reza Omidi
طراحی و شبیهسازی جمع کننده 64 بیتی سریع با استفاده از ترانزیستورهای نانو لوله کربنی (CNTFET)
علیرضا جعفری تازه کند - جواد جاویدان
طراحی و شبیهسازی یک فیلتر میان گذر باریک باند قابل تنظیم با استفاده از سلف فعال برای کاربرد در شبکههای بیسیم
محمد امین ملاکی - مهناز افضلی - ابوالفضل بیجاری
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 43.9.1