重要时间节点提醒 | 2025年CCF-网易雷火联合基金

360影视 国产动漫 2025-05-29 13:52 2

摘要:为满足更多科研人员的申报需求,本年度2025年CCF-网易雷火联合基金申报截止时间统一延长至2025年6月7日,本文将详细介绍【课题创新型】项目的5个重点课题方向以及【业务创新型】项目。

2025年CCF-网易雷火联合基金申报截止时间延长至2025年6月7日。

为满足更多科研人员的申报需求,本年度2025年CCF-网易雷火联合基金申报截止时间统一延长至2025年6月7日,本文将详细介绍【课题创新型】项目的5个重点课题方向以及【业务创新型】项目。

【课题创新型】项目

1、面向挖掘机自动装车场景的端到端多模态大模型研究

课题针对挖掘机自动装车的场景,让机器智能决策任务,根据当前传感器输入(相机、激光、IMU、液压压力信息等)-->动作,以实现自动挖土装车任务;

观察:主视角图片、激光(可处理为高程图,即代表周围环境高度的灰度图)、关节角度、关节液压压力;

动作:挖机各个关节下一时刻的目标关节位置或者各个关节的驱动量。

关键指标

为量化模型性能,提出以下多维度评价体系:

1)核心效率指标:

- 装车效率:单次装满一车任务所需的时间不超过人工平均作业时间(225 秒)的 120%;

- 满斗率:挖掘装车一铲对应的铲斗满载率,达到人工满斗率的95%;

2)实时性和安全性:

- 推理速度:端到端延迟(从传感器输入到控制指令输出,要求≤100ms,基于nvidia Jetson Orin算力平台);

- 安全与可靠性:机械臂与卡车/障碍物的接近距离阈值违规次数,不超过95%的比例;

2、跨平台按需下载的共享文件系统实现

课题致力于构建一个跨平台(如PC、移动端、主机等)的共享文件系统,支持游戏资源的按需下载。

1)跨平台文件系统实现,实现Windows、MacOS、Linux平台上的自定义文件系统。

2)本地文件共享,在上述跨平台文件系统下实现本地文件的数据共享,对于两个不同路径但内容相同的文件,使用两个独立的文件描述符,但共享同一份二进制数据,以此实现本地文件共享功能。

3)文件二进制数据按需下载,部署线上文件数据服务器,支持根据文件描述符下载二进制数据到本地,对于不常用的本地文件,可以在本地只保留文件描述符,不存储文件二进制数据,从而实现文件按需下载功能。

关键指标

1)跨平台文件系统的完成度,要求实现Windows、MacOS、Linux 三个平台自定义文件系统。

符合预期:完成 Windows 单平台;

超出预期:完成 Windows、MacOS 两个平台;

远超预期:完成 Windows、MacOS、Linux 三个平台。

2)本地共享文件系统的完成情况和运行性能。

符合预期:本地共享文件系统功能完成;

超出预期:本地共享文件系统功能完成,本地文件正常操作耗时不超过 NTFS 文件系统的 30%;

远超预期:本地共享文件系统功能完成,本地文件正常操作耗时达到 NTFS 文件系统水平。

3)文件二进制数据按需下载功能的完成情况和并发性能。

符合预期:文件二进制按需下载功能完成,部署单点文件数据服务器,下载时能够跑满服务器带宽;

超出预期:文件二进制按需下载功能完成,部署文件数据服务器集群,能够支持 100 人的同时访问,跑满服务器带宽;

远超预期:文件二进制按需下载功能完成,部署文件数据服务器集群,能够支持 1000人的同时访问,跑满服务器带宽;

4)实现 svn、git、perforce 等版本管理软件改造,支持只下载文件描述符,进而节省仓库下载和更新时的带宽消耗。

符合预期:实现 svn 的改造;

超出预期:实现 svn、git 的改造;

远超预期:实现 svn、git、perforce 的改造。

3、适用于移动端的LTC面光源渲染优化

课题研究适用于移动端的基于 LTC(Lighting Texture Compression)的面光源渲染优化技术。通过改进 LTC 算法,在保证渲染质量的前提下,降低面光源渲染的计算复杂度,减少移动端设备的能耗和发热,提升游戏画面的光照效果和视觉质量,增强移动端游戏的竞争力。

基准:以 Unreal 引擎中实现的 LTC 面光为基准进行优化。

约束:移动端需采用OnePass延迟渲染方案(GBuffer与Lighting中间不能插入会打断OnePass的Raster或 ComputePass),光照模型可使用近似的 PBR 方案。

关键指标

1)效果:以 Unreal 中矩形面光为基准,光照能量级别无明显差异,各种角度下无肉眼可见瑕疵。

2)内存占用:额外内存占用不超过 5M。

3)性能

达到预期:耗时相比基准降低 20%。

超出预期:耗时降低 25%。

远超预期:耗时降低 30%。

4)优化方向

算法简化:在保证光照效果的前提下,简化 LTC 计算过程。

硬件加速:利用移动端 GPU 特性进行优化。

预计算:对部分光照数据进行预计算以减少实时开销。

4、ScreenProbe下的漫反射/高光降噪算法研究

课题基于ScreenProbe技术,深入研究漫反射和高光部分的降噪算法。针对游戏渲染中这两个部分的噪声特点,开发专门的降噪方法,提高渲染图像的细节质量,增强游戏画面的真实感,同时优化算法性能,减少对硬件资源的占用。

目标:研究一种高效的降噪算法,适用于 ScreenProbe GI 结果(Diffuse、Specular)。

约束:算法需不受硬件平台限制,以较低性能代价实现高品质降噪。

关键指标

1)效果:以 GroundTruth 为基准,相机剧烈移动时无明显噪点或拖影。

2)性能

达到预期:耗时在参考基准(一次 TAA+一次双边滤波)的 150%以内。

超出预期:耗时在参考基准的 100%以内。

远超预期:耗时在参考基准的 75%以内。

3)研究方向

相关性优化:利用 ScreenProbe 采样结果的相关性设计降噪算法。

混合滤波:结合多种滤波技术(如双边滤波、TAA)提升降噪效果。

5、基于长周期用户行为序列的内容推荐大模型算法研究

类型:游戏 AI,已有业务模型,从1到10

背景:网络游戏中有大量玩家参与各种玩法,能够积累大量的玩家行为数据,且在游戏中这些行为都是能够比较方便的记录下来进行积累的,这些用户行为数据,能够比较精准表征玩家的兴趣偏好。目前工业界常用的推荐算法模型,也会用到这些用户行为序列,然而,优于计算复杂度等条件的限制,使用的时间周期和行为维度比较少,比较难完整刻画玩家,因此,目前方案还比较依赖玩家的画像标签等稠密特征来补充较短序列信息量的确实问题。这带来了一个问题,稠密特征需要大量的特征工程,且不同场景的推荐系统不能迁移。随着大模型训练技术的发展,我们希望研究一套单纯基于玩家长周期行为序列作为特征的推荐算法建模思路,完全取代目前常用的特征工程方案,并取得超过目前方案的算法性能。

定义:

任务名称:基于长周期用户行为序列的内容推荐大模型算法研究

任务类型:认知任务

关键指标:

观察:玩家历史行为序列

状态:候选内容池,玩家 ID

输出:玩家对内容ID的偏好打分

指标(基于线上 AB 测试):

点击率提升 10%

点赞率提升 5%

完播率提升 5%

【业务创新型】项目

一.具身智能与群体智能领域

1、基于AI Agents的主动行为决策

本课题旨在构建一种面向目标(Goal-Oriented)的群体智能驱动的游戏剧情演绎框架,通过多智能体协同机制,实现基于预设游戏剧本框架的实时剧情推进与玩家行为反馈。具体而言,系统将基于游戏剧本、NPC 设定、场景地图等输入,构建具备自主决策能力的智能体 NPC 群体。每个智能体需具备独立的人格化特征,包括人设性格、背景故事、记忆系统、社 交关系网络等核心元素,并能够根据环境与事件动态调整行为策略。在此基础上,多个智能体通过协作机制,在特定剧情框架下对玩家的开放域行为做出合理反馈,通过主动交互与被动响应相结合的方式,协同推动剧情演绎。最终,系统将完成游戏原型实装,并通过用户体验评估验证其有效性与沉浸感提升效果。

任务类型:决策任务

观察:智能体人设、背景故事、记忆、社交网络等

状态:智能体当前数值、以及其他智能体数值

动作:智能体行为决策(游戏中可执行的宏观行为,如移动、使用道具、加入和退出队伍等)

课题指标

1)在给定测试数据集上,合理率达到 80%(85%,90%)以上,优质率达到 10%(20%,25%)以上,剧情生成模块的延迟控制在 5s(3s,1s)以内;

2)在开放式评测 demo 上,主观合理率达到 75%(85%,90%)以上,主观优质率达到 10%(20%,25%)以上,实时决策模块的延迟控制在 2s(1s,600ms)以内。

2、基于AI辅助结算的无人货柜视觉算法研究

市场上的无人货柜数量以每年 20%比例持续增长,受识别准确率和成本约束,目前无人货柜主要通过两个摄像头进行商品识别服务。本项目采用 AI 自动识别加人工兜底的方式进行商品结算,通过提高 AI 识别的准确率和覆盖率,进一步降低后台人工审核的成本,真正实现降本增效。

对于每个流水订单,自动分析整个视频流中出现的商品购买行为,用于辅助结算。主要内容包括:1.商品检测,2.商品的轨迹分析,3.商品识别,4.异常行为检测。输出包括:1.是否异常,2.是否结算,3.需要结算的商品种类和个数。

课题指标

1)效果指标:自然流水订单上基础效果 60%(70%,80%)以上结算率,98.5%(98.8%, 99%)准确率;

2)性能指标:平均时延小于视频长度一半时长。

3、基于人机协作的无人货柜结算的实时质量控制算法研究

随着新零售业态的快速发展,传统无人货柜普遍采用"用户自选+人工远程结算"模式, 然而,人工结算质量受操作者专注度、视觉疲劳、多任务处理能力等主观因素影响显著,现 有技术方案中,纯 AI 视觉识别方案受限于商品堆叠、光照变化等复杂场景,识别准确率仍 徘徊在 92%-95%之间;纯人工模式又难以保证质量稳定性。本研究提出构建人机协同的实时 质量控制体系,通过动态质量评估算法实时监测人工结算质量,建立基于置信度评估的 AI辅助决策机制,当检测到人工结算置信度低于阈值时自动触发 AI 复核,实现人工与智能系统的优势互补。

聚焦无人零售场景中货柜结算环节的质量控制问题,针对传统人工结算模式存在的质量 波动性和纯 AI 视觉方案的场景局限性,提出一种人机协同动态决策框架。通过构建实时质 量评估模型与 AI 辅助验证机制,实现以下核心目标:

1)动态质量感知:基于人工操作行为特征(如操作速度、视线轨迹、点击偏差)和 AI 识别结果(如商品种类,轨迹数量等),实时量化人工结算的置信度;

2)智能决策干预:设计风险订单识别算法,在人工置信度低于阈值时自动触发运营复核,形成人机结合的容错机制;

3)闭环优化体系:通过反馈学习机制持续优化人机分工策略(如高频易错货柜优先分配高准确率的人工),提升系统整体效能。

课题指标

1)风险订单准确率 95%+,召回率 95%+等

2)线上整体准确率 99%+

3)复杂场景识别覆盖率

4)运营成本降低 30% 5. 客诉率下降 30%

二.LLM & AIGC领域

1、面向大规模预训练模型的小型化部署优化方法研究

本课题旨在面向小规模和小并发场景,针对多专家协同的模型架构实现技术推理方法,采用投机采样、模型共享、算子优化、量化压缩、预加载等方法的研究,结合游戏的应用场景,构建面向超大规模预训练模型的小型化部署优化方案。

课题指标

1)效果:以官方满血版 DeepSeek 作为基准,在基准测试、主观评测中对齐原有方案效果,量化效果折损不超过 1%;

2)生成速度:TPOT (每 token 的生成时间)达到 30ms 以内;

3)吞吐指标:单服务器小并发场景下,300 tokens/秒、

2、基于大模型的剧情生成和 NPC 编排

本课题旨在构建基于大语言模型的游戏剧情动态编排与生成系统,实现非线性叙事的多分支、多结局生成与逻辑闭环管理,完成游戏原型实装与用户体验评估。具体而言,系统需根据游戏剧情设定、世界观背景、角色设定以及故事上文等输入,创作具备戏剧性、合理性与可玩性的非线性游戏剧情。同时,生成结构化剧本,将叙事要素分解为场景单元、剧情流、交互空间、触发条件与跳转逻辑等组件,支持动态剧情编排与玩家行为驱动的实时演化,推动游戏叙事体验的范式升级。

任务类型:决策任务

任务观察:游戏剧情设定、世界观背景、角色设定、故事上文等

任务状态:当前玩家和 NPC 的位置、情绪、好感度等数值

任务动作:叙事化剧本(场景单元、剧情流、交互空间、触发条件和跳转逻辑等)

课题指标

1)在给定测试数据集上,合理率达到 80%(85%,90%)以上,优质率达到 10%(20%,25%)以上,剧情生成模块的延迟控制在 5s(3s,1s)以内;

2)在开放式评测 demo 上,主观合理率达到 75%(85%,90%)以上,主观优质率达到 10%(20%,25%)以上,实时生成模块的延迟控制在 3s(2s,1s)以内。

3、小样本驱动的高表现力 TTS 系统设计与实现

随着人工智能技术的飞速发展,现有的 TTS 系统在处理高表现力语音(如带有情感、语气变化的语音)时,面临诸多挑战。特别是在训练样本有限的情况下,如何使 TTS 系统能够生成具有丰富情感色彩的语音,具备“能哭会笑”的能力,成为了当前研究的热点问题。具体而言,课题将围绕以下几个方面展开:

1)数据收集与预处理:有效利用互联网上的开源数据、合成数据等,形成高质量的训练样本,优化模型的生成能力。

2)模型设计与优化:设计适用于少量样本的 TTS 模型,探索无监督学习、迁移学习、元学习等技术,以提高模型在有限数据下的表现力。

3)多情感以及多种语音事件(Speech Events)的控制与生成:研究如何通过控制模型参数或输入特征,生成特定情感的语音,如悲伤、喜悦等,同时具备笑声、哭声、叹气等成分。

4)评估与优化:建立评估体系,对生成的语音进行主观和客观评估,不断优化模型性能。

课题指标

1)语音质量评估:采用多人主观测听,目标相对录音 MOS 不低于-0.2;采用客观评价音色相似度,在公共数据集上超越开源基线,音色余弦相似度大于 0.95;

2)数据效率:衡量模型在少量训练样本下的表现,基于公共数据集如 LibriSpeech 的分钟级子集,实现多情感多风格的语音合成,情感分类 acc 指标相比利用全量数据训练降低10%以内。

4、大模型应用中的智能调度算法研究

本课题旨在面对多样化的 LLM,如何在特定的应用场景中高效地选择合适的模型。在大模型应用中,选择合适的LLM不仅需要考虑模型的性能,如准确性、响应速度和鲁棒性,还需要权衡计算成本和资源消耗。因此,在实际应用中,如何在性能和资源消耗之间找到最佳平衡点是一个重要的研究课题。

为了解决这一问题,智能调度算法的研究显得尤为重要。智能调度算法可以根据不同应用场景的需求,动态地选择和分配合适的LLM资源。当用户查询输入后,智能调度算法会根据查询中的任务信息、当前系统资源状态以及预设的性能和成本目标,动态评估可用的大模型选项。通过综合考虑模型的准确性、响应速度、计算资源需求和API成本等因素,智能调度算法能够实时选择出当前最适合的大模型,以确保在满足性能要求的同时,优化计算资源的使用和成本效益。

课题指标

1)性能指标:智能调度算法响应时间控制在600ms 以内;

2)效果指标:相比于单一调度的最好模型提升10%(根据具体业务指标计算);相比于单

一调度的最好模型降低10%。

三.游戏与人工智能

1、游戏动作类场景的智能运镜

本课题旨在给定指定游戏的打斗过程和后台参数,希望生成逐帧相机位姿轨迹,让渲染的视频具有美感和观赏性

课题指标

在测试集数据上和游戏内置相机轨迹对比,生成对应视频双盲众包评测,胜率>90%。

2、模仿学习的对齐优化

模仿学习作为简单有效的技术手段,在游戏竞技机器人的训练中已经被广泛采用。然而,在实际的业务落地过程中,模仿学习方法常常会学到一些奇怪的行为模式,无法完全与业务方的期望对齐。本课题从基础的模仿学习技术出发,去研究能够真正与人类期望对齐的模仿学习方法,减少在训练模型过程中人工介入的工作,提升整体的游戏机器人开发效率。

任务名称:游戏竞技机器人决策任务

任务类型:决策任务

观察:游戏竞技机器人能在游戏中感知到的信息(如:雷达射线、HP、护甲、技能CD、视野内的对手信息)

状态:游戏竞技机器人在游戏中的完整状态信息(如:所在地点障碍物信息、HP、护甲、技能CD、所有的对手信息)

动作:游戏竞技机器人在游戏中可以执行的动作(如:移动、跳跃、视角转向、技能释放)

课题指标

1)模仿学习模型的测试集准确率,不低于60%;

2)模仿学习模型在实际游戏的图灵测试中,拟人率达到 90%;

3)模仿学习模型在游戏测试环境中,给定时间内产生的非预期行为的次数,相对 baseline减少80%;

4)模仿学习模型达到业务可用标准需要的迭代次数和总训练时间,相对 baseline缩减50%。

3、基于剧情文本描述的表情动画自动生成

在影视、游戏及虚拟现实领域,行业高度依赖动画师手动设计或基于动捕数据生成表情,成本高、效率低且耗时长。而现有的 AI 生成方案难以将剧本中的台词及表达的情感状态有机地结合在一起,因此无法满足工业化精度要求。本课题旨在突破“文本→表情”的自动化瓶颈,推动影视游戏工业化生产进入“剧本即动画”的新阶段。

给定一段完整的剧情文本(可能包含故事背景、场景描述、台词等),希望结合上下文生成一段目标角色相应的表情动画参数,使其能够表演出剧情所描述的内容。

课题指标

1)效果指标:在测试集剧情文本上和业内主流文本生成表情方案对比,双盲众包评测胜率>70% ;

2)性能指标:4090单卡推理速度>15fps。

4、基于多模态输入的序列化表情迁移系统

在虚拟直播、元宇宙社交及影视预演领域,高保真、低延迟的表情迁移技术是提升用户沉浸感的核心。纯视觉驱动的表情迁移(如 iPhone Animoji)依赖高质量面部捕捉,对遮挡/光照敏感,误检率高;纯音频驱动的系统缺乏面部情感语义,导致“声情不同步”问题。此外,现有方案以单帧优化为主,忽略表情动态演化规律,导致表情不自然感强。本课题旨在攻克多模态时序对齐与跨域特征融合难题,构建出一套试听融合、时序连贯、情感一致的表情迁移方案,满足互动娱乐产业对高表现力数字人的迫切需求。

给定一段视频(含半脸、遮挡、复杂光照等场景)及其对应的音频(可能包含说话、笑声、背景音等),生成一段目标角色的表情动画参数,使其能驱动角色复现出视频中演员的 面部表情。

课题指标

1)在测试集视频上和业内主流表情迁移方案对比,双盲众包评测胜率>70%;

2)音画情感一致性 F1 score>85%;

3)口型语音同步性主观感知评分>3.5 分(5分制评分(1=严重不同步,5=完美同步)。

5、基于人机协作的角色表情动画重定向

3D 角色表情动画制作是游戏生产中的重要一环,也是游戏品质精良与否的关键因素之一。近年来,表情动画的生产已受到学术界的广泛关注,但如何把某个角色的表情动画复用到不同绑定的其他角色,仍然是一个待解决的问题。业内常用方案通常依赖人工指定不同绑定角色若干表情的对应关系、并线性计算其他表情的对应关系。这一过程依赖大量人工反复调整,重定向之后的表情动画效果也有提升空间。本课题希望进一步研究3D角色表情重定向问题,实现更少的人工干预和更好的重定向动画效果。

给定绑定控制器维度不同的两个3D角色头部模型A和B、以及 A 角色的大量动画参数数据,希望生成B角色的相应动画参数,使得二者的表情动画一致。

课题指标

1)效果指标:在测试集动画数据上和业内主流表情重定向方案对比,双盲众包评测胜率>70%;

2)性能指标:L20或4090单卡推理速度>5fps。

6、智能NPC agent的记忆系统研究

游戏智能NPC系统能够通过设计玩家和NPC的多模态交互、提升玩家在游戏中的自由度、沉浸感。目前游戏中实际落地的智能 NPC 系统一般具备理解、对话、行为等基本能力,利用LLM的能力玩家在游戏中可以跟 NPC 在游戏中实际的行为交互。为了和用户建立长期的联系,记忆系统是非常重要的一部分,具体包括但不限于记忆摘要、记忆更新、记忆检索、记忆使用等,如何设计npc agent记忆系统是非常值得探索的。因此希望围绕智能NPC agent记忆系统研究申请CCF研究课题,致力于打造能长期跟用户交互的npc agent,并推动在游戏内的实际落地。

任务名称:基于记忆的智能NPC交互

任务类型:决策任务(任务--》状态--》动作)

观察:NPC信息、用户信息、NPC与用户关系、游戏世界观

状态:游戏场景状态

动作:产生游戏中的NPC交互行为,包括对话、行为等

课题指标

1)指标:基于记忆系统的 npc 交互(对话、行为)的合理率、优质率;基于记忆的链路交互时延。

2)预期水平

达到预期(基于记忆的交互合理率达85%,优质率达10%;链路交互时延在3s内);

超出预期(基于记忆的交互合理率达90%,优质率达15%;链路交互时延在2s内);

远超预期(基于记忆的交互合理率达95%,优质率达20%;链路交互时延在 1.5s内)。

7、基于游戏Replay的自瞄外挂检测模型方案研究

在雷火FPS类游戏的测试中,我们发现使用自瞄外挂的玩家占比较高,随着这些游戏在25年的逐步上线,基于用户游戏内行为的自瞄挂检测方案的效果在反挂防控中变的非常重要。目前伏羲自研了一套检测方案,等待游戏上线后验证效果并逐步迭代。但基于业界经验,fps类游戏外挂防控任务艰巨,需要投入大量人力。因此,我们希望通过构建课题的方式,引进外部方案作为自研方案的补充,一方面希望外部方案能够达到落地上线水平,提供检测结果。另一方面,也可以作为自研方案的思路借鉴,不断打磨自研方案。

任务名称:基于游戏Replay的自瞄挂检测模型

任务类型:认知任务(观察--》状态)

观察:游戏smdata中记录的玩家数据,包括准星轨迹序列,准星偏角序列,是否开镜,射击位置等

状态:用户行为状态(正常or作弊)/ 用户作弊嫌疑程度 ([0, 1])

课题指标

1)离线指标:训练&测试集基础效果Pre:90%,Recall:80%;

2)线上指标:线上验证Pre:80%,Recall基于线上构造数据集达到60%;

3)性能指标:单次请求延时

如何申报

(1)“课题创新型”项目

来源:CCFvoice

相关推荐