- 01游戏AI智能体
- 02群体智能
- 03通用决策AI工具链
- 04自动驾驶决策系统
- 05交通信号控制
- 06复杂计算图优化
- 07多模态数据处理
- 08强化学习算法框架设计
- 09分布式深度强化学习系统设计和优化
01 / 09
游戏AI智能体
支持RTS, FPS, SPORTS等游戏AI的快速训练,能进行陪玩,托管,高端局AI挑战。
02 / 09
群体智能
高效的大规模强化学习训练框架,从智能体的自我博弈出发,随着训练逐渐扩充至拥有上百数量智能体的联盟。通过智能的匹配机制和大量的对局,能快速产生实力从低到高和策略各异的大量个体。
03 / 09
通用决策AI工具链
DI-zoo提供丰富的强化学习算法实现。它包含了充分调优的训练配置、高效的算法实现和预训练的模型库,帮助研究者和工程师快速开启强化学习的学习、验证想法以及生产业务基线模型。
04 / 09
自动驾驶决策系统
我们搭建了决策 AI 与自动驾驶之间的桥梁,将学术界前沿的决策算法应用于自动驾驶任务中,并通过实车数据转化而来的场景进行训练与分析,打通学术界与产业界之间的壁垒。
05 / 09
交通信号控制
将决策人工智能技术应用于城市级的交通信号灯控制、潮汐车道变更等场景中,实现通行效率的最大化,达到了比传统信控通车效率提升 8%~47%的实际路测效果。
06 / 09
复杂计算图优化
通过复杂计算图的数据流优化、结构轻量化以及大规模训练的稳定性优化,实现高性能、低资源开销的复杂计算图训练优化。
07 / 09
多模态数据处理
针对不同模态数据的复杂信息提取结构设计,快速实现多种模态数据的有效特征提取和高效融合,赋能基于多模态信息的模型训练优化。
08 / 09
强化学习算法框架设计
针对各类深度强化学习算法的计算模型,设计抽象通用的强化学习编程模型,结合多种决策规划方法构建混合型AI,可便捷地应用到多种环境和多种计算尺度下,从而提升强化学习算法的通用性和易用性。
09 / 09
分布式深度强化学习系统设计和优化
结合AI算法特性和系统设计方法,提高分布式强化学习训练的数据吞吐和资源利用率,设计高效稳定的分布式通信系统,针对性优化数据传输和模型传输等核心性能瓶颈,构建能够支持各类型决策问题的通用训练平台,并设计相关的基准测试集,为AI+System创建更多形态。
01 / 09
游戏AI智能体
支持RTS, FPS, SPORTS等游戏AI的快速训练,能进行陪玩,托管,高端局AI挑战。
02 / 09
群体智能
高效的大规模强化学习训练框架,从智能体的自我博弈出发,随着训练逐渐扩充至拥有上百数量智能体的联盟。通过智能的匹配机制和大量的对局,能快速产生实力从低到高和策略各异的大量个体。
03 / 09
通用决策AI工具链
DI-zoo提供丰富的强化学习算法实现。它包含了充分调优的训练配置、高效的算法实现和预训练的模型库,帮助研究者和工程师快速开启强化学习的学习、验证想法以及生产业务基线模型。
04 / 09
自动驾驶决策系统
我们搭建了决策 AI 与自动驾驶之间的桥梁,将学术界前沿的决策算法应用于自动驾驶任务中,并通过实车数据转化而来的场景进行训练与分析,打通学术界与产业界之间的壁垒。
05 / 09
交通信号控制
将决策人工智能技术应用于城市级的交通信号灯控制、潮汐车道变更等场景中,实现通行效率的最大化,达到了比传统信控通车效率提升 8%~47%的实际路测效果。
06 / 09
复杂计算图优化
通过复杂计算图的数据流优化、结构轻量化以及大规模训练的稳定性优化,实现高性能、低资源开销的复杂计算图训练优化。
07 / 09
多模态数据处理
针对不同模态数据的复杂信息提取结构设计,快速实现多种模态数据的有效特征提取和高效融合,赋能基于多模态信息的模型训练优化。
08 / 09
强化学习算法框架设计
针对各类深度强化学习算法的计算模型,设计抽象通用的强化学习编程模型,结合多种决策规划方法构建混合型AI,可便捷地应用到多种环境和多种计算尺度下,从而提升强化学习算法的通用性和易用性。
09 / 09
分布式深度强化学习系统设计和优化
结合AI算法特性和系统设计方法,提高分布式强化学习训练的数据吞吐和资源利用率,设计高效稳定的分布式通信系统,针对性优化数据传输和模型传输等核心性能瓶颈,构建能够支持各类型决策问题的通用训练平台,并设计相关的基准测试集,为AI+System创建更多形态。