7月2日,“2023全球数字经济大会-人工智能高峰论坛”在北京举办。度小满CTO许冬亮等嘉宾受邀发表演讲,并围绕“AI大模型应用的‘发展之道’”话题展开讨论。 ...
7月2日,“2023全球数字经济大会-人工智能高峰论坛”在北京举办。度小满CTO许冬亮等嘉宾受邀发表演讲,并围绕“AI大模型应用的‘发展之道’”话题展开讨论。
“对比于通用大模型的能力而言,金融行业非常需要垂直行业大模型”,许冬亮表示,“在数据层面,金融行业因为安全及隐私保护要求数据大多存储在本地,通用大模型在金融能力上缺乏必要的训练数据。另外一方面,金融行业在风控、精度等方面要求较高,系统又比较复杂,再加上金融相关数据实时性的要求很高,所以从这几个维度去看,通用大模型的金融常识、生成的可控性和准确性都达不到这个行业的最低要求,需要针对金融机构定制的行业大模型去发挥效力”。
今年五月,度小满宣布正式开源国内首个千亿级中文金融大模型“轩辕”。轩辕大模型是在1760亿参数的Bloom大模型基础上训练而来,在金融名词理解、金融市场评论、金融数据分析和金融新闻理解等任务上, 表现出明显的金融领域优势,在金融任务测试集中相较于基座模型效果提升70%以上。
许冬亮认为,“轩辕”大模型运用独创的hybrid-tuning方式,基于度小满实际业务场景积累的海量金融数据进行训练,保证在提升金融能力的同时,不会损失通用能力。
度小满“轩辕”大模型在金融任务评测中,全面超越了主流的开源大模型,赢得了150次回答中63.33%的胜率。在通用能力评测中,轩辕有10.2%的任务表现超越ChatGPT 3.5, 61.22%的任务表现与之持平,涉及数学计算、场景写作、逻辑推理、文本摘要等13个主要维度。
金融机构对行业大模型的应用热情高涨。许冬亮透露,“轩辕”大模型开源一个月的时间,已经有上百家金融机构在试用。他认为,行业大模型将帮助积极拥抱大模型的中小金融机构缩小与头部机构的技术差距。“金融行业有非常多的中小机构,它们的业务规模和科技能力都和头部机构有明显差距,在大模型时代,所有金融机构都能用先进的金融大模型来解决自己的业务问题,大家重新站在同一起跑线上,这是中小机构跨越‘数字鸿沟’和‘智能化鸿沟’的机遇”。