这是一篇金融学硕士论文,跨学科研究的深化将为金融文本情感与股价崩盘风险关系的研究开辟新的视野。加强与行为金融学、心理学、社会学、复杂网络理论等学科的交叉融合,从微观个体行为决策机制、心理认知偏差矫正,到宏观市场网络结构、社会文化因素对情绪传播与风险演化的综合影响等多层面深入剖析金融市场情绪与风险的内在联系。运用心理学实验与行为模拟方法,探究投资者在不同金融文本情感刺激下的决策过程与心理变化;借助复杂网络分析技术,揭示金融市场情绪在投资者网络中的传播路径、扩散速度与影响范围,构建更系统、全面的金融市场情绪风险理论体系,为金融市场风险管理提供更具前瞻性与科学性的理论支撑与实践指导。
第 1 章 引言
本章明确了研究的背景、意义、内容和方法等,为后续章节的理论分析和实证研究奠定基础。通过阐述研究的背景和意义,说明金融文本情感分析在股价崩盘风险研究中的重要性。基于对国内外相关文献的综述,梳理金融文本情感分析、股价崩盘风险及二者关系的研究现状,指出已有研究的不足和本文的切入点。最后概述了研究内容、方法、主要工作与创新点,以及论文的基本结构。
目录
摘要
abstract
第1章 引言
第2章 理论分析与研究假设
第3章 研究设计
第4章 实证结果分析
第5章 结论与展望
参考文献
1.1 研究背景和意义
1.1.1 研究背景金融市场的波动性和不确定性是投资者面临的主要挑战之一,而股价崩盘风险则是其中最极端且最具破坏性的表现形式之一。股价崩盘通常伴随着资产价格的急剧下跌和市场信心的崩溃,对经济和社会产生深远影响。随着金融市场复杂性和信息传播速度的加快,股价崩盘风险的研究逐渐成为学术界和实务界关注的焦点。传统的研究方法主要依赖于经济指标、历史数据和金融模型来研究股价崩盘风险的影响因素,但这些方法往往忽视了市场情绪在股价崩盘风险中的重要作用。事实上,市场情绪不仅是价格变动的重要驱动因素,也可能在特定条件下成为引发市场崩盘的催化剂。研究表明,在市场崩盘前夕,投资者的恐慌、过度乐观或悲观情绪往往会通过信息传播和群体行为放大市场波动,进而加剧股价崩盘风险(Fan Yunqi 等,2022;姚加权等,2022)。因此,如何准确捕捉和分析市场情绪,并将其纳入股价崩盘风险的影响因素分析框架中,成为当前研究的一个重要方向。然而,传统的金融文本情感分析方法存在显著局限性。现有研究大多依赖于手工标注的情感词典或单一数据源来分析市场情绪,这些方法在处理复杂金融文本时往往难以捕捉隐式情感、专业术语以及社交媒体中的短句和俚语(李合龙等,2023)。此外,市场情绪的来源是多样化的,包括新闻报道、社交媒体讨论、互动评论等,单一数据源难以全面反映市场情绪的全貌。这些局限性导致传统方法在分析股价崩盘风险时往往是不够准确和片面的。

近年来,随着自然语言处理技术的飞速发展,大模型在处理大规模和复杂文本数据方面显示出显著优势。大模型能够学习到更加复杂和细腻的情感模式,从而为金融文本中的情感分类提供了新的视角(陈炫婷等,2024)。通过运用大模型分析金融文本情感,可以更精准地识别文本中的正向和负向情感,进而为股价崩盘风险的预测提供更可靠的情绪数据支持。
1.1.2 研究意义
在理论层面上,本文丰富了市场情绪理论,将金融文本情感引入市场情绪的分析中,系统地分析市场情绪对股价崩盘风险的影响。本文通过量化金融文本中的情感信息,揭示市场情绪与股市波动之间的内在联系,为市场情绪理论提供新的实证证据和理论支持。相较于已有的研究,本文从多种文本来源构建不同的情绪指数,更好地揭示了多维度的市场情绪。此外,本文推动了特定领域情感分析技术的应用发展,用大语言模型的金融文本情感分析技术对市场情绪进行量化,探索了大模型在金融领域中的应用,提升了市场情绪指数构建的准确性和效率,从而为其在金融研究中的应用提供了借鉴。在现实意义方面,本文利用基于大语言模型的金融文本情感分析技术,量化市场情绪,分析其对股价崩盘风险的影响,为投资者和监管者提供了前瞻性的市场风险预警工具,提升了市场风险的预警能力。通过对市场情绪的实时监测和分析,帮助投资者和监管机构更准确地预测和应对市场波动,提升了市场风险管理能力。此外,本文研究结果可以指导投资决策,建议投资者注重把握市场情绪的变化,优化投资策略,降低投资风险,理解市场动态,做出更加科学的投资决策,从而提升投资回报。本文研究结果有助于稳定市场,帮助政府或监管机构及时发现和化解市场潜在的风险,采取更加有效的措施维护金融市场的稳定,促进金融市场的健康发展。
第 2 章 理论分析与研究假设
本章旨在为金融文本情感对股价崩盘风险的影响研究奠定坚实的理论基石,并基于理论推导提出合理的研究假设。通过对金融文本情感和股价崩盘风险的相关概念进行精准界定,梳理有效市场假说、行为金融学理论、信息不对称理论等经典理论与本文的关联,深入剖析市场情绪影响股价崩盘的内在逻辑。在此基础上,运用理论演绎与归纳的方法,分别针对投资者情绪、媒体情绪、管理层语调与股价崩盘风险的关系提出具体假设,为后续实证研究指明方向,明确从理论层面探究市场情绪在金融市场风险形成中作用机制的基本思路。
2.1 相关概念界定
2.1.1 金融文本情感金融文本情感是指在金融领域相关的文本信息中所蕴含的投资者、媒体、管理层等市场主体对市场行情、公司业绩、经济政策等方面的情感态度和情绪倾向。它可以通过文本中的词汇选择、语气表达、语义逻辑等方式体现,包括积极、消极和中性三种基本情感类别。积极情感通常表示对市场或公司的乐观预期、认可和支持;消极情感则反映出悲观、担忧或不满;中性情感意味着相对客观和中立的描述,不带有明显的情感偏向。准确识别和量化金融文本情感对于理解市场情绪变化、预测市场走势和评估风险具有重要意义。在实际金融市场中,金融文本情感的表现形式极为丰富多样。在投资者的股吧评论中,可能会出现“这支股票潜力巨大,肯定会涨”这样的积极表述,也会有“这公司业绩不行,要赶紧抛售”的消极言论。而在新闻报道中,对于宏观经济形势的描述可能会使用“经济复苏态势强劲”的积极措辞,或者“经济增长面临严峻挑战”的消极表达。管理层在业绩说明会上的语调也会传递出不同的情感信号,如“我们对公司未来充满信心,新的业务拓展进展顺利”体现积极情感,“公司目前遇到一些困难,但正在努力解决”则可能带有一定的消极或中性情感。为了更精确地量化金融文本情感,除了现有的基于词汇和模型的方法外,还可以考虑结合文本的语义深度和语境信息。通过语义分析技术挖掘词语间的语义关联与情感倾向的细微差别,并结合宏观经济背景、行业发展趋势等语境因素。
第 3 章 研究设计
本章主要围绕如何科学严谨地开展金融文本情感与股价崩盘风险关系的实证研究展开。详细阐述样本选取的依据与过程,介绍采用 ChatGLM3-6B 大语言模型进行情感分析的技术优势与适配性,说明运用计量经济学方法构建模型时,如何定义被解释变量、解释变量及控制变量。
3.1 样本选取和数据来源本文以 2018—2022 年间股票代码为 300001—300200 的创业板股票为研究样本,剔除了 ST 和*ST 股票。本文选取该样本的主要原因有以下两点:(1)创业板市场自设立以来就呈现出显著的“三高”特征:高市盈率、高发行价和高募资额。尽管近年来机构投资者参与度逐步提升,但市场仍以中小投资者为主,由于投资者结构中散户占比较高,非理性投资行为普遍存在,导致创业板市场的波动性持续高于主板市场(王昶等,2017)。(2)本文金融文本情感来源于多种文本,利用大语言模型计算情感得分,考虑到文本数量、模型算力和随机性问题,选取了创业板股票代码前 200 的股票。股吧文本数据通过爬虫程序收集东方财富股吧获得,新闻文本数据通过《中国重要报纸全文数据库》手工获得,全景网文本数据通过爬虫程序收集全景网业绩发布会获得。股吧文本数据涵盖了股票代码为 300001 至 300200 的 181 只股票,时间跨度为 2018 年 1 月 1 日至 2022 年 12 月 31 日,共计 5 年的股吧评论。原始数据包含阅读量、评论数、标题、发帖时间和股票代码等信息,总计 10423744 条评论。为了降低数据处理的复杂性,通过算法每天随机抽取 10 条评论,若某天评论数不足10 条,则保留当天所有评论。经过筛选后,最终得到 2366588 条数据。训练集包含 6013 条人工标注的数据,标注了属性、情感词和情感极性,情感极性分为三类,积极为 1,中性为 0,消极为-1。将该训练集输入大模型进行训练,人工审核准确率后确定合适参数,随后利用训练好的模型对所有数据进行情感极性分类,得到每条评论的情感极性结果。该极性结果用于构建投资者情绪。新闻文本共包含股票代码为 300001-300200 共 181 只股票从 2018 年 1 月 1 日到 2022 年 12 月 31 日 5 年的新闻数据,参考王昶等(2017)、范小云等(2022),选择了《中国证券报》《证券日报》《证券时报》《上海证券报》四大证券报作为媒体报道主体,共 15621 篇。证券新闻文本经常出现一篇文本中包含多个公司,且情感并不一致,按照篇章去进行情感分类会对个体公司情感判别不准确,因此本文采取按照句子级别进行情感标注的方式。首先按照上市公司名称在所有新闻文本的篇章范围内进行检索,通过分句识别代码将包含公司名称的句子找出作为数据集共 36170 条,然后再进行人工标注。训练集共包含 698 条人工标注的数据,标注了情感词和极性,情感极性分为三类,积极为 1,中性为 0,消极为-1,将该训练集喂给大模型后,人工审核准确率后确定合适参数,随后利用训练好的模型对所有数据进行情感极性分类,得到每句新闻的情感极性结果。该极性结果用于构建媒体情绪。
第 4 章 实证结果分析
本章重点在于运用统计分析和计量经济学工具对收集的数据进行处理与分析,以验证前文提出的研究假设。先通过描述性统计展示变量的基本特征,让读者对数据有直观认识。随后,运用回归分析方法分别考察投资者情绪、媒体情绪、管理层语调与股价崩盘风险在不同时间跨度下的关系,并进行异质性分析,探究不同性质情绪的影响差异。最后,采用替换变量等稳健性检验手段确保研究结果的可靠性。整体基于实证数据,按照从初步统计到深度回归分析再到结果验证的逻辑,揭示金融文本情感对股价崩盘风险影响的实际情况与规律。4.1 描述性统计表 4.1 为变量的描述性统计结果。被解释变量负收益偏态系数的均值为-0.34,收益上下波动比率的均值为-0.19,说明在研究区间内所选样本的股价崩盘风险较高,而且对比最大值和最小值发现,个股之间的股价崩盘风险差异明显;投资者文本情绪均值为-0.78,媒体情绪为 1.31,管理层语调为 0.18,结合最大值最小值观察可以发现三种文本情绪中投资者情绪偏消极,而媒体情绪偏积极但是个股差异性较大。
第 5 章 结论与展望
本章首先对全文研究进行系统总结,概括金融文本情感与股价崩盘风险关系研究的关键发现,梳理研究过程中采用的方法、取得的成果及创新点,明确研究结论在金融市场风险研究领域的贡献与意义。基于结论为各类市场参与者提供了实用建议,从数据、模型和跨学科等方面规划了未来研究方向,为深化金融市场风险研究、促进市场稳定奠定了基础并指引了路径,在理论与实践的衔接上发挥了关键纽带作用,有力推动该领域持续发展。5.1 结论本文围绕金融文本情感对股价崩盘风险的影响展开深入探究,综合运用多种研究方法与数据来源,得出以下结论。投资者情绪对股价崩盘风险影响的短期效应比较显著,对当月、下月以及当年都会产生显著影响,但对下一年度无显著影响。在短期内,积极的投资者情绪可有效降低当期股价崩盘风险,表现为增强市场流动性、稳定股价。然而,从长期视角看,过度乐观的投资者情绪可能催生市场泡沫,进而增加未来股价崩盘风险,揭示了投资者情绪在市场动态演进过程中的双刃剑效应。投资者文本异质信念在当月加剧市场波动与股价崩盘风险,因投资者意见分歧引发频繁交易,破坏市场稳定。随着时间推移,市场逐渐调整,其对下月股价崩盘风险的影响转为抑制,体现了市场自我调节机制下投资者信念的动态变化规律。媒体情绪与股价崩盘风险的关联呈现明显的时间差异。在当年,积极的媒体情绪有助于稳定市场,降低股价崩盘风险,其通过传播乐观信息引导投资者预期。但长期来看,持续的媒体乐观报道可能掩盖市场潜在风险,致使投资者过度自信,当负面信息最终暴露时,市场情绪急转直下,导致下年股价崩盘风险急剧上升,凸显了媒体在金融市场信息传播与情绪引导过程中的复杂角色与长期影响。管理层语调在市场风险防控中发挥着重要作用。尽管在当年管理层语调与股价崩盘风险无显著相关性,但在次年其积极信号能够显著降低股价崩盘风险,表明管理层对公司前景的自信且有效的表达在可有效稳定投资者信心、优化市场预期,成为公司抵御市场风险的重要支撑因素。
参考文献
[1] Fan Yunqi, et al."Investor Sentiment and Stock Price Crash Risk: Evidence fromChina."Global Economic Review 50.4(2021):310-339.
[2] 姚加权,冯绪,王赞钧,纪荣嵘,张维.语调、情绪及市场影响:基于金融情绪词典[J].管理科学学报,2021,24(05):26-46.
[3] 李合龙,任昌松,柳欣茹,汪存华.金融市场文本情绪研究综述[J].数据分析与知识发现,2023,7(12):22-39.
[4] 陈炫婷,叶俊杰,祖璨,等.GPT 系列大语言模型在自然语言处理任务中的鲁棒性[J].计算机研究与发展,2024,61(05):1128-1142.
[5] LOUGHRAN T ,MCDONALD B .When Is a Liability Not a Liability? TextualAnalysis, Dictionaries, and 10-Ks[J].The Journal of Finance,2011,66(1):35-65.
[6] 李永帅,王黎明,柴玉梅等.基于双向 LSTM 的动态情感词典构建方法研究[J].小型微型计算机系统,2019,40(03):503-509.
[7] 万琪,于中华,陈黎等.利用新词探测提高中文微博的情感表达抽取[J].中国科学技术大学学报,2017,47(01):63-69.
[8] 卫青蓝,何雨, 宋金宝."基于语义规则的自适应情感词典自动构建算法."北京航空航天大学学报 1-11.doi:10.13700/j.bh.1001-5965.2023.0367.
[9] 于琴, 张兵, 虞文微. 新闻情绪是股票收益的幕后推手吗[J]. 金融经济学研究, 2017, 32(6): 95-103.
[10]冯婧雯.ESG 评级、公司外部关注与股价崩盘风险.2023.浙江大学,MA thesis.
[11] 姜 富 伟 , 孟 令 超 , 唐 国 豪 . 媒 体 文 本 情 绪 与 股 票 回 报 预 测 [J]. 经 济 学 ( 季刊),2021,21(04):1323-1344.
[12]王 婷 , 杨 文 忠 . 文 本 情 感 分 析 方 法 研 究 综 述 [J]. 计 算 机 工 程 与 应用,2021,57(12):11-24.
[13]Baid P, Gupta A, Chaplot N. Sentiment analysis of movie reviews using machinelearning techniques[J]. International Journal of Computer Applications, 2017,179(7):