👋
大家好,我是Andre,欢迎订阅我的新闻通讯《数据驱动的风投》。这份通讯旨在通过数据和AI帮助你成为更好的投资者。每
周二
,我会发布“洞察”栏目,解析最相关的创业研究和报告;每
周四
,我会发布“随笔”栏目,分享关于数据驱动创新和AI在风投中的实用见解。跟随我们的步伐,了解创业投资如何变得更加数据驱动,为什么这很重要,以及这对你意味着什么。
当前订阅人数:
24,305,比上周增加170人
本期内容由
Affinity
赞助 - 让顶级公司脱颖而出的交易来源策略
Affinity的2024年投资基准报告显示,顶级风投公司提供持续的互动并投资于现有的关系网。结果?他们能第一时间获得最好的交易机会。了解如何在7月11日通过Affinity将这一策略付诸实践。此次网络研讨会将由Episode 1 Ventures、Illuminate Financial和Dealroom的专家分享见解和建议。
立即注册
根据我们的
2024年数据驱动风投景观
,三分之二的数据驱动风投公司已经在其价值链中使用了LLM。虽然我们的调查涵盖了一些高层次的应用,如筛选和尽职调查、来源或报告,但许多读者希望了解更具体的用例。
今天,我很高兴与大家分享一篇
论文
,这是我昨晚发现的,提供了关于LLM在金融和投资领域更详细应用的概述。该论文由
普林斯顿大学
(Yuqi Nie, John M. Mulvey, H. Vincent Poor)、
牛津大学
(Yaxuan Kong, Xiaowen Dong, Stefan Zohren)和
Squirrel AI
(Qingsong Wen)的一组研究人员撰写。
图1. 我们论文结构的概述,重点关注模型、应用、数据、代码和基准测试,以及挑战和机遇(摘自论文)
加入超过24,300名来自a16z、Accel、Index、Sequoia等风投公司的思想领袖。
专注于金融领域的大型语言模型概述
通用领域的大型语言模型(如
GPT系列、Llama系列和BERT
)在众多自然语言处理任务中表现出色,促使了金融领域专用大型语言模型的发展。这些专用模型在大量金融数据上进行训练,增强了它们理解和生成金融相关内容的能力。
其中一个著名的金融大型语言模型是
Ploutos
,它源自GPT-4,旨在解释股票走势预测。Ploutos整合了多模态数据和专家分析,生成定量策略和准确的股票预测,尽管面临专家选择偏差和计算复杂性等挑战。
BERT通过其深度双向架构革新了自然语言处理,其金融变体如
FinBERT-19、FinBERT-20和FinBERT-21
在情感分析和金融文本挖掘方面特别有效。另一个变体,
Mengzi-BERTbase-fin
,专注于使用20GB的金融新闻和研究报告进行金融应用。
Google的T5模型,采用文本到文本框架,也在金融领域有了适应版本
BBT-FinT5
,专为中国金融行业量身定制。该模型在金融领域的语言理解和生成任务中表现出色,但在其他领域可能有限。
ELECTRA
引入了生成器-鉴别器框架,用于高效的语言模型训练,导致了
FLANG
,一个在情感分析和实体识别方面表现出色的金融专用变体。
BLOOM
,一个多语言大型语言模型,启发了金融适应版本如
BloombergGPT和XuanYuan 2.0
,在金融任务中提供了增强的性能,并在通用语言任务中保持了竞争力。
Llama
系列模型,包括金融变体如
InvestLM和FinGPT
,为金融应用提供了专门的能力,其中InvestLM提供了与商业模型相当的投资建议。
Meta的Llama 3于2024年推出,具有最先进的性能和推理能力,预计会有更多的金融变体。其他金融大型语言模型,如
FinTral、SilverSight、DISC-FinLLM、CFLLM和FinVIS-GPT
,利用大量的金融数据集和先进的训练技术进行准确的金融分析。
这些模型正在变革投资策略、风险管理、预测和客户服务等领域。然而,重要的是要认识到它们的局限性和偏见,并结合人类的专业知识和判断,以确保有效的金融决策。
图2. 从2019年开始的金融专用大型语言模型(LLMs)概述,按其基础模型类型和其他分类(摘自论文)
大型语言模型在金融和投资中的五大应用
#1 语言任务
这一组应用可以分为文本工作和基于知识的分析。
文本工作:
早期基于循环神经网络(RNN)和长短期记忆(LSTM)的模型在语言理解方面表现出一定能力,但在处理长期依赖和大数据集方面存在困难,尤其是在金融领域,准确和简洁的摘要至关重要。
大型语言模型(LLMs)利用变压器架构,显著推进了这一领域的发展,通过有效管理长期依赖和处理海量数据集,使其在
总结和提取复杂金融叙述中的相关信息
方面表现出色。
最近的研究利用大型语言模型(LLMs)来总结和提取金融文档信息,通过
将长文档分成较短的段落,并使用像Longformer-Encoder-Decoder(LED)这样的模型进行高效分析
,解决了许多挑战。
此外,在
管理多样化的文档结构方面也取得了进展,例如将PDF转换为机器可读的文本
,尽管这可能会改变空间布局并丢失关键信息;为了解决这个问题,像JP Morgan的DocLLM这样的布局感知解决方案已经被开发出来。
在命名实体识别(NER)方面,LLMs显著提升了
特定金融实体的提取和分类
,超越了传统方法,并在情感分析、信用评分和合规性等任务中展示了高准确性和效率。
基于知识的分析:
总结和提取金融文档中的关键信息对于
理解和处理冗长文本中的关键数据
至关重要。一旦提取出相关信息,就可以用于解决下游的金融任务,重点是构建金融关系和文本分类。
金融关系构建,特别是通过知识图谱,将提取的实体组织和链接起来,从而实现复杂的分析和模式识别
。知识图谱通过将实体之间的关系表示为节点和边,促进了更深入的洞察和预测。文本分类,包括行业/公司和文档/主题分类等任务,组织了非结构化数据,以提取有价值的见解并增强金融决策。
#2 情感分析
LLMs在解读金融语言复杂性方面表现出色,能够熟练
处理非正式表达、表情符号、网络迷因和专业术语
,这对于准确分析各种格式的情感至关重要。
它们可以
处理多模态数据,包括图像、音频和视频
,将非语言线索整合到情感分析中,以全面了解财报电话会议等金融背景。它们能够彻底分析大量文档,确保不会遗漏任何带有情感的信息,从而增强对财务报告和叙述的情感评估。
此外,LLMs在应对对抗性攻击方面表现出更强的韧性,减轻了误导性情感指标的影响,确保了情感分析结果的可靠性。LLMs的最新进展显著提升了从
社交媒体、新闻、公司披露以及政策和经济指标等多种数据源进行情感分析
的能力。
图4. 选定的代表性论文,按各种数据源分类的金融情感分析任务(摘自论文)
#3 时间序列分析
深度学习彻底改变了时间序列分析,提供了强大的工具来建模和预测序列数据。像LSTM网络和CNN这样的著名深度学习模型能够有效捕捉时间序列数据中的时间依赖性和异常。
最近,LLMs在时间序列任务中越来越受欢迎,通过从文本数据生成附加特征和生成描述性统计数据,提升了模型的准确性。LLMs能够直接分析时间序列数据,这得益于其Transformer架构在
理解和处理序列数据方面的能力
。
一些显著的研究展示了LLMs在
预测、异常检测、分类、数据增强和插补
等任务中的有效性,展示了其多功能性和在高级金融分析中的潜力。随着LLMs研究的进展,我们可以期待这些模型在金融时间序列领域的应用继续取得进展。
图5. 金融时间序列分析的插图(取自论文)
#4 金融推理
大型语言模型(LLMs)在支持金融推理方面发挥着关键作用,它们通过处理和综合大量的金融数据,帮助进行
战略财务规划、投资建议、咨询服务和决策制定
。
它们通过识别模式和趋势来增强数据分析,帮助进行预测建模以预测市场状况,并通过分析个人财务状况提供个性化的咨询服务。此外,LLMs还提供实时监控和警报,通过用户友好的界面如聊天机器人提高可访问性和参与度。
将LLMs整合到金融推理中有助于简化财务规划和决策过程,使金融分析更加高效、准确和个性化。
图6. 各种金融推理任务的插图(取自论文)
#5 基于代理的建模
基于代理的建模(ABM)在模拟复杂系统,特别是金融领域中,代表了一个重要的进步。ABM涉及创建在定义环境中交互的自主代理,从而使复杂现象从底层涌现,这对于捕捉金融市场中的多样化行为特别有用。
将LLMs与ABM结合,增强了代理的认知功能,使它们能够解释大量的非结构化数据,如金融新闻和报告,从而实现更现实和自适应的模拟。这种协同作用产生了稳健的投资策略、改进的市场预测和更好的政策分析。
LLMs与ABM的结合还有助于自动化金融流程和多代理系统,提高金融任务和决策的准确性。总体而言,LLMs显著增强了ABM在金融领域的能力,带来了更准确、高效和现实的模拟和策略。
图7. 与基于代理的建模相关的金融任务示意图(摘自论文)
与可能受益的人分享这篇文章。
分享
结论
简而言之,这篇论文探讨了包括GPT系列和FinBERT在内的大型语言模型(LLM)如何在自然语言处理(NLP)任务中表现出色,这得益于其复杂的算法和广泛的预训练。它们在检测复杂情感状态和提供准确解释方面的能力,特别有助于理解市场情绪和做出明智的决策。
在语言任务中,LLM
将复杂的金融文件简化为简明的摘要
,提高了信息处理效率。情感分析作为一个关键的金融应用,受益于LLM
从各种来源量化市场情绪
,从而影响市场动向和投资决策。LLM还显示出在
金融时间序列分析、预测市场趋势、检测异常和分类金融数据
方面的潜力,尽管其有效性仍有争议。
LLM最有前途的方面之一是其
推理能力
,这支持了金融规划、生成投资建议,并通过处理大量金融数据来辅助决策。LLM还应用于
基于代理的建模,模拟市场行为、经济活动和金融生态系统动态
。
尽管前景广阔,LLM在金融领域的应用也面临
如回测中的前瞻性偏差、法律问题、数据污染、信号衰减和可解释性问题
等挑战。解决这些挑战对于确保LLM在金融应用中的伦理和有效部署至关重要。
希望你和我一样喜欢这篇论文。
保持动力,
Andre
PS:如果你想获得更多类似内容并与志同道合的同行交流,请加入我们的新社区
The Lab
感谢您阅读本期内容。如果您喜欢这篇文章,请点赞或评论,并分享给您的朋友。如果您不喜欢,您可以随时
更新您的偏好设置
,只接收每周四的“随笔”,每周二的“见解”,或两者都接收。请在下方订阅,并在
LinkedIn
或
Twitter
上关注我,以便不错过任何数据驱动的风投更新。
您对我的每周通讯有何看法?
喜欢
|
很棒
|
不错
|
一般
|
停更
如果您有任何建议,想让我推荐一篇文章、研究、您的技术栈或发布一个职位,请联系我!我很乐意在下期内容中包含这些信息
😎