面向多模态大模型基础卷积算子优化赛题
本次赛题旨在异构加速平台上优化基础卷积算子,提升模型卷积侧的性能。通过实现和优化这些算子,参赛者可以熟悉异构平台下的优化流程及常见技术,包括profiling分析,GPU-Bound和I/O-Bound判别,多级流水及访存优化等。
了解详情
大语言模型llama3 8B推理性能的软硬件协同优化
本次赛题聚焦于大语言模型LLaMa 3 8B的推理性能优化,旨在通过软硬件协同策略显著提升模型的推理速度。参与者需要探索模型压缩、量化、算子优化等软件优化技术,基于新一代硬件架构设计出一套有效的优化方案,以实现在保证精度的同时,提升大模型在硬件上的推理性能。
了解详情