南风金融网 - 中原最权威行情财经门户

热门关键词:  缪学刚  www.ymwears.cn  xxx    
热门: 北大数字金融公开课内容回 对付勒索软件的利器:二级 还在为云存储掏冤枉钱?那 直播预告 | “经世微语课堂 中国个体经营户总量测算与 中国个体经营户研究系列报

【MLinEcon文献推送10】用机器学习算法敏感预测证券市场

来源:南风金融网 作者:南风金融网 人气: 发布时间:2020-02-11 12:37:59

原文信息



马黎珺,伊志宏,张澈.廉价交谈还是言之有据?——分析师报告文本的信息含量研究[J].管理世界,2019,35(07):182-200.


推文作者|高俊(上海财经大学商学院博士研究生)




一、



作为资本市场上重要的信息中介,证券分析师在提高市场信息透明度、引导长期价值投资、优化资源配置等方面发挥着举足轻重的作用,其研究报告日益成为众多投资者的信息来源和决策依据,在某些情况下的影响力甚至超过企业管理层所披露的财务报告。深入挖掘分析师报告的内容及其经济后果对于促进我国资本市场发展具有重要意义。


然而,已有研究主要是针对盈余预测、推荐评级、目标股价、企业现金流量、收入等财务报表项目的预测等定量信息探究分析师报告对投资者决策的影响,缺乏对定性信息的探究。另外,针对分析师报告种定性信息的效应,部分学者认为其不过是定量信息的“膨胀”,只是“廉价交谈”;但也有学者认为定性内容可能体现出定量信息所无法展示的逻辑推理和细节证据,从而为投资者提供增量信息,且近年来得到一些西方学者的论证。


那么证券分析报告中的定性信息究竟是廉价交谈还是言之有据?西方学者的观点是否适用于我国独特的证券市场?针对上述问题,本文作者利用采用机器学习领域已较为成熟的一种分类算法——支持向量机,对 2009~2015 年的分析师报告进行了文本分类和情感分析,并将分析师报告的文字内容分为历史语句和前瞻性语句,探究分析师报告的市场影响力及该影响力究竟源自“新信息挖掘”还是对管理层信息披露的“第三方验证”。




二、文献回顾和研究假设




本研究的主要关注点在于探究分析师报告中前瞻性语句引起的市场反应,根据对已有文献的梳理,提出了对立假设:


H1a:前瞻性语句的情感越积极(消极),分析师报告公布后的正面(负面)市场反应越强烈。


H1b:前瞻性语句的情感与分析师报告公布后的市场反应无显著关系。


大量文献表明,新披露信息的质量、投资者已有的信息集大小以及投资者的信息处理能力都会影响某一新信息的市场反应,因此,研究进一步控制并探究这三个方面对前瞻性语句市场反应的影响,并提出假设2~4:


H2:当分析师报告的可信度较高、可读性较强、及时性较好时,前瞻性语句情感的市场反应会显著强化。


H3:当被跟踪企业的信息透明度较低时,前瞻性语句情感的市场反应会显著强化。


H4:当被跟踪企业中公募基金的持股比例较高时,前瞻性语句情感的市场反应会显著强化。


文章还探究了定量信息和定性信息的交互作用,文章推测,前瞻性语句与定量指标的逻辑一致与否也可能影响投资者的决策,提出假设5:


H5:前瞻性语句的情感越积极(消极),定量指标正向(负向)修正的市场反应越显著。




三、研究设计



1.前瞻性语句的测量:


界定前瞻性语句内涵:(1)分析师对行业发展趋势及企业竞争格局的预测;(2)分析师基于企业发展战略,对企业未来机遇和挑战的预测;(3)分析师对企业未来经营计划及经济后果的预测;(4)分析师对企业未来资金需求和使用计划的预测;(5)分析师对企业未来风险的预测。


操作:首先随机抽取了一定量的分析师报告逐句进行人工标注 ,人工判断每个句子是否属于前瞻性语句,以及它所包含的情感属于积极、中性还是消极;选择标准如下:体现预测过程(预计/预期/预测/估计/希望/看好);出现未来时点(届时、未来、将来、今后、明年、两年内、2 年内、3 年后、2020 年);暗示即将发生的动作(企业将/拟/有望/计划/承诺/打算)。


具体方法:采用机器学习领域已较为成熟的一种分类算法——支持向量机(Support Vector Machine)对训练数据集进行学习,建立文本分类模型,并使用该模型对大样本的分析师报告语句进行分类,分为积极/中性/消极的前瞻性语句或其他语句,分类的准确率和召回率分别为 94.55%和85.03%,将此类“伪前瞻性语句”单独进行了人工标注,使计算机将这些语句作为反例来学习,这有助于提高机器识别的精度。


构建前瞻性语句情感的衡量指标:

FLS=FLS_POS-FLS_NEG


2.模型构建:

检验H1a和H1b:

CAR(0,n)=α0+α1FLS+α2ΔEF+α3ΔREC+α4ΔTP+α5TONE+α6CAR(-10,-1)+α7SIZE+α8BM+αi Industryi +αj Yearj+ε


累积超额收益(测度市场反应)




检验H2~H4:

CAR(0,n)=α0 +α1 FLS+α2 FLS×INTRSTVAR+α3 INTRSTVAR+α4 ΔEF+α5 ΔREC+α6 ΔTP+α7 TONE+α8CAR(-10,-1)+α9 SIZE+α10 BM+αi Industryi +αj Yearj+ε


INTRSTVAR 分别表示研究报告:

质量特征(CHAR)、被跟踪企业的信息透明度(OPA)以及公募基金持股比例(FUND)


检验H5:

CAR(0,n)=α0+α1FLS×ΔEF×UPEF+α2 FLS×ΔREC×UPREC+

α3 FLS×ΔTP×UPTP+α4 ΔEF×UPEF+α5 ΔREC×UPREC+α6 ΔTP×UPTP+

α7 UPEF+α8 UPREC+α9 UPTP+α10 FLS+α11 ΔEF+α12 ΔREC+α13 ΔTP+

α14 TONE+α15 CAR(-10,-1)+α16 SIZE+α17 BM+αi Industryi +αj Yearj +ε


UPEF 为哑变量,在 ΔEF 大于 0 时取 1,表示分析师对盈余预测进行了正向修正;反之取 0。UPREC和 UPTP 的定义方式与 UPEF 类似。


3.数据:以 2009~2015年针对我国 A股上市公司发布的所有分析师报告原文为研究样本;所使用的股票交易、企业财务等数据来源于国泰安经济金融研究数据库。分析师报告文本及相关定量数据来源于深圳市今日投资数据科技有限公司。




四、实证结果



FLS 的估计系数在所有列中都显著为正,即前瞻性语句的情感积极程度与分析师报告公布后的累计超额收益显著正相关。这表明,在控制了定量指标的影响之后,前瞻性语句仍具有增量信息含量,因此它并不是对定量信息的简单“膨胀”或二次解释,而是为投资者提供了额外的决策依据。该结果支持了 H1a。


另外,模型2和3的结果也证实了假设H2~H5。说明,前瞻性语句向市场传递了增量信息;这一关系在企业信息透明度较低、分析师报告质量较高以及投资者信息处理能力较强时更加显著,文字信息发挥市场影响力需要一定的作用条件。同时,当文字信息与定量信息能够相互佐证时,市场对分析师报告中各类信息的反应会显著强化。





五、稳健性检验和进一步研究



为了确保结论的可靠性,研究还将从多个角度对本文的主要结论进行稳健性检验。分别是:(1)通过提取分析师报告中那些形似前瞻,却并不属于前瞻性语句的“伪前瞻性语句”,进行了一项安慰剂检验(Placebo Test);(2)用两种方法对特定分析师报告中前瞻性语句的情感进行调整,排除是因为分析师的盈余预测和推荐评级存在一定的乐观偏差,使得前瞻性语句的情感偏积极;(3)变更累计超额收益的衡量方式;(4)区分前瞻性语句的类型,将前瞻性语句区分为积极语句(FLS_POS)、消极语句(FLS_NEG)、行业层面语句(FLS_IND)和企业层面语句(FLS_FIRM),分别检验它们所引发的市场反应,研究他们的影响差异。


最后,文章还进一步实证探究了前瞻性语句与企业基本面的关系和前瞻性语句的影响因素。




六、贡献



本文的主要理论贡献在于丰富了分析师报告的信息含量方面的文献。已有文献在评价分析师报告的信息含量时,只关注定量信息而忽略了文字信息,而本文揭示了文字信息对市场的重要影响,有助于我们全面、客观地认识分析师对市场资源配置效率的影响。


对我们的启示在于,在我们的研究中,我们可以学习通过机器学习算法利用文本信息构建比定量信息更有信息传递价值的变量,并通过规范地实证分析过程探究其影响。


排? ? 版 | 石庆宇

审?? ?核 |?郭? ?峰

责任编辑:南风金融网

最火资讯

首页 | 财经资讯 | 金融理财 | 价格行情

Copyright © 2012-2015 南风金融网门户站 版权所有 Power by DedeCms 豫ICP备12016580号  技术支持:南风金融网

电脑版 | 移动版