美东时间3月30日,全球最大的财经资讯公司彭博社发布最新公告称,该公司开发了专为金融领域量身打造的拥有500亿参数的大型语言模型(LLM)——BloombergGPT。以下为公告具体内容,由ChatGPT-4翻译完成:
在金融自然语言处理任务方面,BloombergGPT在同等规模的开放模型中表现出色,且不牺牲通用LLM基准的性能。
【资料图】
彭博发布了一篇研究论文,详细介绍了BloombergGPT的开发过程,这是一种新型大规模生成人工智能(AI)模型。这种LLM专门针对广泛的金融数据进行训练,以支持金融行业内各种自然语言处理(NLP)任务。
基于LLM的人工智能(AI)的最近进展已经展示了许多领域令人兴奋的新应用。然而,金融领域的复杂性和独特术语需要一个特定领域的模型。BloombergGPT代表着为金融行业开发和应用这种新技术的第一步。该模型将协助彭博改进现有的金融NLP任务,如情感分析、命名实体识别、新闻分类和问答等。此外,BloombergGPT将为整合彭博终端上的大量数据提供新机会,以更好地帮助公司的客户,同时将AI的全部潜力带入金融领域。
十多年来,彭博在金融领域的人工智能、机器学习和自然语言处理方面一直处于领先地位。如今,彭博支持大量且多样的NLP任务,这些任务将受益于一个新的金融感知语言模型。彭博研究人员开创了一种混合方法,将金融数据与通用数据集相结合,以训练一个在金融基准上取得最佳成绩的模型,同时在通用LLM基准上保持竞争力。
为了实现这一里程碑,彭博的机器学习产品和研究小组与公司的人工智能工程团队合作,利用公司现有的数据创建、收集和策划资源,构建了迄今为止最大的特定领域数据集之一。作为一家金融数据公司,彭博的数据分析师已经收集和维护了40年的金融语言文件。团队从这个庞大的金融数据档案中提取信息,创建了一个包含英语金融文件的3630亿标记的综合数据集。
该数据集与一个3450亿标记的公共数据集结合,创建了一个包含超过7000亿标记的大型训练语料库。使用这个训练语料库的一部分,团队训练了一个具有500亿参数的仅解码器因果语言模型。生成的模型在现有的金融特定NLP基准、一套彭博内部基准和来自流行基准(例如BIG-bench Hard,知识评估,阅读理解和语言任务)的通用NLP任务的广泛类别上进行了验证。值得注意的是,BloombergGPT模型在金融任务方面大幅超越了类似规模的现有开放模型,同时在通用NLP基准上的表现相当或更好。
BloombergGPT在金融特定和通用任务两个广泛类别的NLP任务上的表现
彭博首席技术官Shawn Edwards表示:
“我们认为具有金融领域特点的大型生成性LLM具有巨大价值,原因有很多——少量样本学习、文本生成、对话系统等。我们很高兴能开发出第一个专注于金融领域的LLM。BloombergGPT将使我们能够解决许多新类型的应用,同时它的性能优于为每个应用定制的模型,且上市时间更快。”
彭博机器学习产品和研究团队负责人Gideon Mann解释说:
“机器学习和NLP模型的质量取决于你输入的数据。得益于彭博在四十年间策划的金融文件,我们得以精心打造一个大型、干净、特定领域的数据集来训练一个最适合金融用途的LLM。我们很高兴能够利用BloombergGPT改进现有的NLP工作流程,同时也思考新的方法将这个模型投入使用,为我们的客户带来惊喜。”
该文由GPT-4翻译完成
风险提示及免责条款:市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负