金融行业也希望能出现有亮点、有价值的爆款应用,但现在还面临大模型能力、算力和安全合规等问题。
今年的政府工作报告中,加快发展新质生产力被列为2024年的首项政府工作任务。
3月28日,在中国计算机学会(CCF)数字金融分会、重庆市大数据应用发展管理局、上海金融与发展实验室指导下,马上消费金融等共同举办的“大模型驱动下的金融新质生产力创新论坛”上,围绕“大模型与金融新质生产力发展”,多位嘉宾阐述了自己的观点。
重质重新,更重生产力发展
所谓新质生产力,即有别于传统生产力的新型生产力,是以科技创新为主的生产力,是摆脱传统增长路径、符合高质量发展要求的新型生产力。
欧洲科学院外籍院士、清华大学人工智能研究院常务副院长孙茂松表示,“新质生产力”最重要的是在“质”而不是“量”。人工智能在“质”上区别于过去,它需要使产品或从事的事情与众不同,有了新的动力,这是“因质而新,因新生变”。
科技部战略研究院、科技与经济社会发展研究所所长陈志说:“我对新质生产力的理解可以总结为‘一三二’。一是‘一条主线’,即我们的最终目标是要发展,解决中国现阶段的安全、发展方面的问题;三是‘三个层次’,要从微观、中观和宏观这三个层面来理解,抓工作来看,最核心的是中观的产业怎么发展、微观的企业怎么实现技术转型升级;二是‘两个重点’,要从实现‘未来的产业’过渡到实现‘中国产业的未来’,需要通过人工智能孕育一些新的增长点,也要用人工智能去赋能所谓的‘传统产业’,这些是一定要考虑的。”
通用和垂直模型并存
新质生产力具有高科技、高效能、高质量的特征,人工智能在其中的作用当仁不让。当前,国外大模型技术日新月异,国内AI及大模型的发展方向在哪?
有观点认为,“现在国内有200多个大模型,就好像200多把锤子,但找不到适配的钉子”,缺标杆应用是一大问题。
中信证券人工智能负责人徐崚峰表示,2023年是中国大模型的元年,用“百模大战”形容并不为过,但企业最终还是希望能够有产出,在实际场景中产生价值,所以今年应该是“场景为王”的一年,很多科技公司甚至底层大模型厂商都在花大量精力研究大模型应用的场景。
徐崚峰强调,底层大模型未来一定会大浪淘沙,可能有几家或十多家活下来,应用方面也会更加聚焦。
星展银行中国有限公司首席信息官宫霄峻指出,国内大模型起步稍晚,但未来的机会仍然很多,主要集中在三方面:数据积累、经验总结和算力提升。“大模型想要做好,数据积累需要很多人、很多场景去对大模型完成培训,显然我们有足够的基础数据完成这一使命;在模型的运用上,我们可以看到国外很多早期实践遇到的问题,可以对经验教训进行总结;我们还需要花一定时间,在算力上完成突破,并通过云计算等方式弥补这一能力。”他称。
事实上,在SORA这样的模型出现后,多模态大模型的发展已成为不可避免的趋势。结合国内现实情况来看,“通用和垂直模型并存”在中长期将成为重要趋势。
陈志称,从目前人工智能渗透的领域来看,还都是偏向于产业里软性的部分(比如服务业),或者工业里软性的部分(比如研发和设计),针对长尾场景特别是工业数据的处理是相对困难的。他预言,在to C阶段,大模型或人工智能需要一个类似于iPhone这样的时刻,需要一个核心终端和老百姓衣、食、住、行产生关联,如果做不到这一点,人工智能可能仍会处于潜伏期或者低潮期。
锁定应用领域
无论大模型技术发展到何种程度,如果无法进入具体应用的领域或产业,就只是停留在表面。
孙茂松表示,大模型的特点,一是生成能力特别强,另一个是具备幻觉。如何把大模型用顺?用他的话来理解,“离诗人越近,用得越顺;离工程师越近,用得就越有挑战。”
孙茂松进一步解释,因为大模型的长处是可以启发人,人在此基础上再去做一些调整,这会大大提高生产效率和质量。但如果事情是一锤子买卖,大模型做了就是最终结果,不允许人去反应,这就会带来一系列挑战。
徐崚峰表示,金融行业也希望出现有亮点、有价值的爆款应用,但现在还面临大模型能力、算力和安全合规等问题。金融行业大模型应用通常包含文字问答和数据问答两个方面,其中数据问答是很难去校验的;算力方面,很多证券公司缺乏足够算力,导致一些工作无法推进;另外,国内很多公司都在用私有云,但会面临算力成本高、模型成本高,以及高性能GPU缺乏等问题,将数据放在公有云又会产生合规性问题,如何在保障数据合规前提下,充分融合私有云和公有云能力,是一个亟需解决的问题。