通义企业大模型:从通用大模型到企业大模型的探索与实践.pptx
pptx文件
2.0M
阿里云朱鹏程探讨通义企业大模型构建路径,聚焦通用大模型向企业场景迁移的核心挑战:知识注入与能力激活。提出知识注入需优化训练结构(如Freeze Out Place技术),实现100%注入率;能力激活强调自建SFT数据,通过主动迭代生成与降噪,克服公开数据局限性。实践表明,结合相似任务(10%占比)可有效提升能力,自研方案在问答能力上超越GPT4及传统RAG,验证了企业知识深度整合与能力定向优化的可行性,推动大模型在企业级应用中的高效落地。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
暂无评论内容