
用国产AI算力打造下一代沉浸式体验!
2026集创赛“华强x昇腾”企业命题火热报名中!本赛题由华强半导体发起、昇腾赋能,聚焦智慧文旅场景。参赛者需基于华为昇腾310B/310B+FPGA异构算力平台,结合卡通熊等经典IP,开发兼具沉浸交互与园区管控能力的具身智能体。
昇腾+FPGA的异构组合代表了国产算力自主可控的关键方向,实现了高性能与高灵活性的最优平衡。加入我们,将助您掌握从算法设计到硬件部署的全流程技能,积累高含金量项目经验。优秀方案将有机会真实落地,实现从“代码”到“产业产品”的跨越。
这不仅是一场竞技,更是用国产技术重塑文化体验的契机。让您的代码驱动卡通熊智能互动,为千万游客创造欢乐!诚邀各高校师生踊跃报名,共筑AI+文化创新未来!
【华强x昇腾杯赛题发布】用国产AI算力打造下一代沉浸式体验!2026集创赛昇腾携手华强共筑AI+文化融合创新平台!


一、赛题背景与核心目标解析
赛题要求参赛队伍基于华为昇腾310B/310P芯片,或“310B+FPGA”的异构硬件平台,完成视频图像的采集与处理。
系统的最终交付目标是一套具备高鲁棒性的智能视觉交互终端。该终端需具备动作识别与表情捕捉能力,并能与游客实现卡通熊等IP 的沉浸式演艺联动(如触发虚拟形象互动、剧情分支切换等)。这不仅是对深度学习算法的考验,更是对边缘设备算力调度、软硬协同设计以及工程落地能力的综合检验。
- 平台适配:要求基于指定的310B/310P或310B+FPGA的板卡或算力盒子,完成视频图像的采集与处理确保智能体的算力适配性与运行稳定性;
- IP互动功能:具备动作识别、表情捕捉能力,可与游客实现卡通熊等IP沉浸式演艺联动(如触发卡通熊等虚拟形象互动、剧情分支切换等);
- 场景适配:需适配乐园开放环境(如光照变化、人群密集、动态障碍物等),保证复杂场景下的功能有效性。

注:选择FPGA+310B的队伍,FPGA可以应用于图像的前端预处理,或者多路视频的融合输入等功能,以提升识别性能、扩展端口输入等。
- IP互动类指标
(1)动作识别准确率:针对挥手、欢呼、比心等常见互动动作;
(2)表情捕捉响应延迟:从捕捉游客表情(如微笑、惊讶、开心等)到触发卡通熊等IP互动反馈(如虚拟形象回应、灯光变化等);
(3)IP联动适配性:可稳定联动至少3种卡通熊等IP主题演艺形式(如虚拟角色对话、动作互动、剧情分支切换、AR合影特效),无联动失败或卡顿现象。
二、系统顶层架构设计(System Architecture)
为满足低延迟与高吞吐量的要求,系统需摒弃传统的“CPU 大包大揽”模式,构建高度流水线化的异构数据通路。
根据赛题要求,音视频输入可通过 HDMI/CMOS 接入,输出则通过 HDMI 或千兆以太网呈现。整体架构可划分为以下四个层级:
1. 感知输入层:推荐选用高帧率工业 CMOS 相机或 MIPI 接口模组,从物理源头切断 USB 总线带来的不可控延迟。
2. 图像预处理层:作为数据的“清洗站”与“整形器”,负责处理前端高频并发的像素流。
3. 核心推理层 (310B NPU):作为系统的“大脑”,接管标准化后的纯净视频流,利用硬件解码器与 NPU 完成复杂的张量计算与业务逻辑判断。
4. 沉浸表现层:接收处理结果,驱动外部大屏或虚幻引擎完成终端视觉渲染与物理联动输出(支持 HDMI/以太网输出)。

三、硬件协同与底层加速策略
软硬解耦,算力卸载。我们将传统的 CPU 图像预处理任务,拆分给 DVPP 和 AIPP 两个底层硬件模块进行“接力”:
1、DVPP 负责“物理整形”(动态调用)
思路:摒弃传统的 OpenCV 软解思路,直接调用 310B 独立的 DVPP 硬件单元。
作用:接收从 FPGA 传入的高清视频流后,纯靠硬件完成图像的缩放(Resize)、裁剪(Crop)或基础格式解码。这一步快速将大图处理成模型需要的物理尺寸(如 640×640),将 CPU 从最耗时的像素搬运中彻底解放出来。
2、AIPP 负责“数学转换”(静态固化)
思路:利用 310B NPU 特有的 AIPP 机制,将像素级的数学运算提前“编译”进 AI 模型中。
作用:原本需要用代码遍历像素去做的色域转换(如 YUV 转 RGB)、减均值、归一化(/255)等操作,现在变成了 NPU 推理前自动执行的底层指令。由于和模型推理深度融合,这部分预处理的时间损耗几乎可以忽略不计。
四、核心算法栈与优化策略
赛题对动作识别和表情捕捉的准确率及延迟提出了明确要求。需摒弃臃肿的大模型,构建目标驱动的轻量化级联网络。
1、动作识别:目标追踪与姿态估计
(1)考核指标:针对挥手、欢呼、比心等常见互动动作的识别准确率。
(2)技术路径:避免使用易受背景干扰的全局图像分类法。建议采用“轻量级目标检测 (如 YOLOv8) + 骨骼关键点提取 (Pose Estimation)”的二维路线。以“比心”为例,系统提取左右手腕与手肘的坐标,当多点在胸腔中心区域形成特定夹角与拓扑关系时,状态机即判定动作生效。
2、表情捕捉:极限提速的两段式级联
(1)考核指标:从捕捉游客表情(如微笑、惊讶、开心等)到触发卡通熊等IP 互动反馈(如虚拟形象回应、灯光变化等)的响应延迟。
(2)技术路径:全局运行超轻量级人脸检测算法获取目标边界框;随后利用 DVPP 抠出人脸 ROI 区域;最终将低分辨率切图送入基于 MobileNet/ShuffleNet 骨干的表情分类网络。该方案可将单帧推理耗时压缩至毫秒级,实现极低延迟。
五、沉浸式互动呈现与集成交付
系统需稳定联动至少 3 种卡通熊等IP主题演艺形式,无联动失败或卡顿现象。
1. 交互表现形式建议
(1)虚拟角色对话:根据游客特定动作,触发不同的语音播报与口型同步动画。
(2)剧情分支切换/动作互动:游客的欢呼声量或挥手频率作为交互输入,推动大屏内不同剧情线的演进。
(3)AR 合影特效:提取游客骨骼与人脸坐标,实现虚拟道具(如熊大头饰、气球)与真实游客画面的精准三维贴合。
2. 交互表现架构设计
负责将 AI 推理结果与交互特效具象化呈现。根据团队的技术栈深度与实际应用场景要求,建议将其分为两个梯度的实现方向:
方向一:端侧本地直显(基础交付路线)
(1)实现逻辑:利用边缘计算盒子自带的硬件显示接口,直接将叠加了 AI 识别框、骨骼关键点连线或基础 2D 互动 UI 的处理结果,通过 HDMI 输出至本地显示设备。
(2)核心优势:架构精简,数据传输链路极短,能够实现极致的低延迟显示,非常适合在项目早期快速完成系统闭环与基础功能验收。
方向二:前后端解耦的网络化实时渲染(高阶进阶路线)
(1)实现逻辑:设计一套完整的前后端分离软件架构。边缘端的 AI 进程仅作为纯粹的数据源,通过 10/100/1000Eth 网络接口 将结构化的判定结果(如动作标签、触发指令)推送至独立的后端业务分发服务。由后端统一下发控制指令,在前端大屏实时渲染卡通熊等IP的 3D 资产,并触发场景内的声光电联动反馈。
(2)核心优势:极大地丰富了沉浸式表现力,且将繁重的 UI 渲染任务从边缘 AI 推理芯片中彻底剥离;支持跨设备、多屏幕的分布式联动,完美契合真实主题乐园的高端演艺环境需求。
参赛福利政策
1. 全国总决赛获奖者: 获得实习/校招岗位直通面试的权益,面试通过后可获得实习/校招岗位offer。
2. 进入国赛的队伍每人可获得“方特园区”门票一张。(发放细节后续公布)
3. 华强x昇腾企业命题预计提供100套310B算力盒的借用,具体链接如下:
【腾讯文档】开发板借用申请|2026集创赛华强x昇腾企业命题
https://docs.qq.com/form/page/DRU5VdndvSU1hc09K

关于华强x昇腾
昇腾(Ascend)是国产人工智能处理器及全栈计算解决方案,打造全场景AI高效算力底座,打破高端AI算力国际垄断,是我国算力自主可控、支撑数字经济发展的核心基建。核心产品聚焦边缘推理场景:昇腾310B高能效低功耗,适配智慧文旅、安防、工业质检;昇腾310P强化推理与视频处理能力,支持复杂AI模型部署,可搭建异构计算平台,两款产品均深度适配国产软硬件生态,自主可控性强。
出题单位:华强半导体
华强半导体是国内电子元器件授权分销龙头,搭建全链条高效分销服务平台,秉持“诚信、创新、协作、共赢”理念,致力成为全球一流电子元器件分销商与生态赋能者。企业销售网络覆盖海内外核心区域,业务布局通讯、物联网、新能源、汽车电子等多元领域,拥有200余家优质原厂代理权,服务超2万家客户,联动行业头部企业。旗下华强世芯达提供一站式仓储、物流、报关服务,自有专业团队保障货品高效准时交付,全流程服务闭环。
关联生态:华强方特
华强方特是国内顶尖文化科技集团,深耕文化科技融合,构建“创研产销”全产业链,业务涵盖动漫、文旅、衍生品等板块,多次入选全国文化企业30强,方特主题乐园海内外布局广泛,游客量领跑全球。旗下《熊出没》是国民级原创动漫IP,2012年推出,主打亲子寓教于乐,传递友爱环保正能量。已推出多部动画及院线电影,全网点击量超3500亿,成功出海70余个国家和地区,登陆Disney、Netflix等国际平台,斩获中宣部“五个一工程”奖、金鸡奖等多项国家级重磅荣誉,实现IP全产业链价值落地。
* 华强集团官网:www.szhq.com
* 华强半导体集团官网:www.neusemi.com
* 华强方特官网:https://www.fantawild.com
华强x昇腾企业命题请咨询:Alisa17881472258
参赛钉钉群:“华强x昇腾”命题——第十届集创赛”群的钉钉群号: 165615006349


没有回复内容