依据官方介绍,DeepSeek 还凭借常识蒸馏技能,运用 R1 模型生成的数据优化了多个 Llama 和 Qwen 变体。用户可经过以下方法在 watsonx.ai 上运用 DeepSeek 蒸馏模型:
在 watsonx.ai 的“按需布置”目录中,IBM 供给 Llama 蒸馏版,用户都能够布置专用实例以进行安全推理。
用户还可经过“自定义根底模型”导入功用,上传 DeepSeek-R1 其他变体,例如 Qwen 蒸馏模型。
规划:其“链式思想”逻辑有助于处理需求逐渐推理的使命,很合适智能体(agentic)使用。
数学问题求解:具有处理杂乱数学问题的才能,在科研、工程和科学核算等范畴体现杰出。
IBM watsonx.ai 供给灵敏的开源模型定制选项,支撑 DeepSeek-R1 在不同环境下的布置,并简化智能体开发、微调、RAG、提示工程等工作流。此外,watsonx.ai 内置安全机制,保证用户使用的安全性。
据IT之家此前报导,IBM 首席执行官本月初曾宣布长文称,他们(DeepSeek)仅用约 2000 枚英伟达芯片,以大约 600 万美元的本钱训练了最新的模型,远低于职业预期。这再次证明,小型、高效的模型也能带来实践效果,无需依靠巨大而贵重的专有体系。