首页
DeepSeek模型
DeepSeek资讯
DeepSeek-R1-Distill-Qwen-32B
¥1.26/ M Tokens
立即体验
DeepSeek-R1-Distill-Qwen-32B 是基于 Qwen2.5-32B 通过知识蒸馏得到的模型。该模型使用 DeepSeek-R1 生成的 80 万个精选样本进行微调,在数学、编程和推理等多个领域展现出卓越的性能。在 AIME 2024、MATH-500、GPQA Diamond 等多个基准测试中都取得了优异成绩,其中在 MATH-500 上达到了 94.3% 的准确率,展现出强大的数学推理能力
相关导航
DeepSeek-V3-0324
输入:¥2/ M Tokens;输出:¥8/ M Tokens
DeepSeek-R1-Distill-Qwen-7B
免费
DeepSeek-R1-Distill-Qwen-1.5B
免费
DeepSeek-R1:671B
输入:¥4/ M Tokens;输出:¥16/ M Tokens
DeepSeek-V2.5
¥1.33/ M Tokens
DeepSeek-V3
输入:¥2/ M Tokens;输出:¥8/ M Tokens
相关文章
DeepSeek-R1-Distill-Qwen-32B:开创AI辅助决策新纪元
DeepSeek-R1-Distill-Qwen-32B:重新定义语言模型的智能边界
DeepSeek-R1-Distill-Qwen-32B:开启智能时代高效AI新纪元
DeepSeek-R1-Distill-Qwen-32B:重新定义人工智能的边界
DeepSeek-R1与Qwen-32B深度蒸馏模型:迈向普惠AI的新里程碑