(资料图片)

金选·核心观点

事件简评

Bloomberg于2023年3月30日发布金融行业大模型BloombergGPT,该模型采用与ChatGPT相同的主流架构Only-Decoder Transformer,基于海量金融行业数据和通用领域开源数据集训练,模型参数规模为500亿。BloombergGPT的训练数据总量约为5,300亿词,其中金融行业数据约为2,720亿词,约占所有训练数据的54.2%,来源包括网络、新闻、公司公告与财务报表以及彭博自己的新闻库。出于数据安全和模型滥用风险考虑,BloombergGPT尚未以任何形式对外开放访问。 目前,以ChatGPT和百度文心等为代表的生成式AI在通用任务上取得了不亚于人类的表现。然而,这类AI在行业任务上的表现相对一般,主要受限于以下原因:第一,行业知识在训练数据中的比例相对较低,模型中的行业知识相对匮乏,导致行业任务表现较差;第二,行业任务与通用任务的思维逻辑存在显著差异,金融行业语境下对某些信息的解读与通用语境下存在显著不同,例如“某公司裁员5000人”在通用语境下常被理解为负面消息,但在金融行业语境下有时可以被理解为推升公司业绩的积极信号。基于海量金融行业数据训练得到的BloombergGPT能够更好地完成金融新闻正负面判别、Bloomberg查询语言生成、金融信息抽取总结、投资机会挖掘等金融领域相关任务。 投资逻辑 金融行业可能成为垂直GPT率先落地的场景。 未来,彭博有计划将他们训练BloombergGPT的细节方法披露出来,这可能对我国头部科技公司如同花顺、恒生电子等公司的行业大模型训练带来启发,其他垂直行业也可以借鉴相关经验。我们发现来自Bloomberg自己资料库的数据仅占比0.7%,在数据层面并没有断层明显的优势,其他公司也可以搭建类似数据库来进行模型训练。 多个应用场景可能受益于金融GPT的落地。 BloombergGPT主要在情感倾向分析、是非题、主体提取及股票代码匹配、问答题等方面进行了测评,未来可能应用的场景包括:1)新闻情感倾向分析及内容生成。可以辅助金融机构判断市场对某一事件的观点,辅助量化策略和投资决策;2)金融领域知识问答及股票代码匹配。可以辅助金融机构进行信用评估、辅助投资人筛选新闻相关概念股、辅助分析师进行领域知识学习及提升资料阅读效率等;3)财务报表分析及会计审计辅助。可以辅助金融机构生成基础的财务分析报告和招股书、辅助投研人员报表配平、辅助会计和审计方面的工作。 投资建议 我们认为金融行业可能成为垂直GPT率先落地的场景,且金融行业应用场景相对较为丰富。看好拥有研发实力、海量数据及流量入口的公司,建议关注同花顺、恒生电子、财富趋势、顶点软件和凌志软件。 风险提示 金融大模型研发不及预期;行业应用落地不及预期;软硬件资源使用受限。

推荐内容