世界最新：金融圈大事！彭博研究人员推出BloombergGPT

美东时间3月30日，全球最大的财经资讯公司彭博社发布最新公告称，该公司开发了专为金融领域量身打造的拥有500亿参数的大型语言模型（LLM）——BloombergGPT。以下为公告具体内容，由ChatGPT-4翻译完成：

在金融自然语言处理任务方面，BloombergGPT在同等规模的开放模型中表现出色，且不牺牲通用LLM基准的性能。

【资料图】

彭博发布了一篇研究论文，详细介绍了BloombergGPT的开发过程，这是一种新型大规模生成人工智能（AI）模型。这种LLM专门针对广泛的金融数据进行训练，以支持金融行业内各种自然语言处理（NLP）任务。

基于LLM的人工智能（AI）的最近进展已经展示了许多领域令人兴奋的新应用。然而，金融领域的复杂性和独特术语需要一个特定领域的模型。BloombergGPT代表着为金融行业开发和应用这种新技术的第一步。该模型将协助彭博改进现有的金融NLP任务，如情感分析、命名实体识别、新闻分类和问答等。此外，BloombergGPT将为整合彭博终端上的大量数据提供新机会，以更好地帮助公司的客户，同时将AI的全部潜力带入金融领域。

十多年来，彭博在金融领域的人工智能、机器学习和自然语言处理方面一直处于领先地位。如今，彭博支持大量且多样的NLP任务，这些任务将受益于一个新的金融感知语言模型。彭博研究人员开创了一种混合方法，将金融数据与通用数据集相结合，以训练一个在金融基准上取得最佳成绩的模型，同时在通用LLM基准上保持竞争力。

为了实现这一里程碑，彭博的机器学习产品和研究小组与公司的人工智能工程团队合作，利用公司现有的数据创建、收集和策划资源，构建了迄今为止最大的特定领域数据集之一。作为一家金融数据公司，彭博的数据分析师已经收集和维护了40年的金融语言文件。团队从这个庞大的金融数据档案中提取信息，创建了一个包含英语金融文件的3630亿标记的综合数据集。

该数据集与一个3450亿标记的公共数据集结合，创建了一个包含超过7000亿标记的大型训练语料库。使用这个训练语料库的一部分，团队训练了一个具有500亿参数的仅解码器因果语言模型。生成的模型在现有的金融特定NLP基准、一套彭博内部基准和来自流行基准（例如BIG-bench Hard，知识评估，阅读理解和语言任务）的通用NLP任务的广泛类别上进行了验证。值得注意的是，BloombergGPT模型在金融任务方面大幅超越了类似规模的现有开放模型，同时在通用NLP基准上的表现相当或更好。

BloombergGPT在金融特定和通用任务两个广泛类别的NLP任务上的表现

彭博首席技术官Shawn Edwards表示：

“我们认为具有金融领域特点的大型生成性LLM具有巨大价值，原因有很多——少量样本学习、文本生成、对话系统等。我们很高兴能开发出第一个专注于金融领域的LLM。BloombergGPT将使我们能够解决许多新类型的应用，同时它的性能优于为每个应用定制的模型，且上市时间更快。”

彭博机器学习产品和研究团队负责人Gideon Mann解释说：

“机器学习和NLP模型的质量取决于你输入的数据。得益于彭博在四十年间策划的金融文件，我们得以精心打造一个大型、干净、特定领域的数据集来训练一个最适合金融用途的LLM。我们很高兴能够利用BloombergGPT改进现有的NLP工作流程，同时也思考新的方法将这个模型投入使用，为我们的客户带来惊喜。”

该文由GPT-4翻译完成

风险提示及免责条款：市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负