通义企业大模型:从通用大模型到企业大模型的探索与实践

下载图标
通义企业大模型:从通用大模型到企业大模型的探索与实践.pptx
pptx文件
2.0M

阿里云朱鹏程探讨通义企业大模型构建路径,聚焦通用大模型向企业场景迁移的核心挑战:知识注入与能力激活。提出知识注入需优化训练结构(如Freeze Out Place技术),实现100%注入率;能力激活强调自建SFT数据,通过主动迭代生成与降噪,克服公开数据局限性。实践表明,结合相似任务(10%占比)可有效提升能力,自研方案在问答能力上超越GPT4及传统RAG,验证了企业知识深度整合与能力定向优化的可行性,推动大模型在企业级应用中的高效落地。

© 版权声明
THE END
喜欢就支持一下吧
点赞12 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容