25.09版本网址
仓库 |
Gitee |
GitHub |
DeepSpark |
||
DeepSparkHub |
||
DeepSparkInference |
DeepSparkHub
模型与算法
● 新增了10个大模型训练微调示例,其中7个强化学习示例使用了OpenRLHF和verl工具箱。
修复更新
● 修复了BERT TensorFlow模型在TensorFlow升级后不支持estimator的问题(#ICWA6Y)。
● 修复了ResNet50 TensorFlow模型在TensorFlow升级后,不兼容normalization_layers的问题(#ICWA59)。
● 修复了ResNet50 Pytorch模型使用DALI情况下的steps数异常问题 (#ICV31B)。
● 更新了AlexNet、GoogLeNet等模型所支持的最高SDK版本。
● 同步了Colossal-AI、Deepspeed和Megatron-Deepspeed框架的最新代码。
版本关联
DeepSparkHub 25.09版本中使用verl的模型对应IXUCA SDK 4.4.0版本,其余模型对应SDK 4.3.0。
感谢以下社区贡献者
sanghui_ilu,李一力,郝燕龙,胡方健,lsy789,张汉涛,fanglaipeng,majorli6,honglyua。
DeepSparkInference
模型与算法
● 新增了19个推理小模型示例,其中支持IGIE推理引擎的12个,支持IxRT推理引擎的7个。
● 新增了11个大语言模型推理示例,涉及vLLM、FastDeploy、LMDeploy等框架。
修复更新
● 修复了BERT Large SQuAD模型链接404问题 (#ICSF66)。
● 修复了4.3.0容器环境下部分模型的依赖缺失问题。
● 修复了MViTv2-base模型推理异常的问题。
● 更新了CLIP模型的最新代码。
● 更新了ByteMLPerf工具箱中optimizer的代码出处 (#ICKHTC)。
● 更新了4.3.0适用大/小模型推理的Docker使用说明 (#ICLDBK)。
版本关联
DeepSparkInference 25.09对应天数软件栈4.3.0版本。
感谢以下社区贡献者
YoungPeng,fhfang,郭寒冰,qiang.zhang,majorli6,honglyua。
新开源项目
● ix-Volcano-Plugin:基于Volcano调度器开发的调度扩展,专为天数GPU集群设计,可在多节点环境下为多GPU任务实现最优的拓扑调度策略。
● TIS-ixRT-Backend:天数智芯ixRT推理引擎对接Triton推理服务框架的推理后端。
● TIS-IGIE-Backend:天数智芯IGIE推理引擎对接Triton推理服务框架的推理后端。