2024-2000年上市公司企业数字技术风险暴露数据、数据风险暴露

360影视 国产动漫 2025-06-26 06:36 3

摘要:测算方式:参考《经济研究》陆瑶(2025)老师的做法,,采用 FinBERT 大语言模型①对企业年度报告中部分涉及数字技术安全的相关论述进行文本情感识别,从而构建企业—年份层面的数字技术风险指标。大语言模型是指用于处理自然语言信息的大型人工智能模型,其中,Fi

1.资料名称:2024-2000年上市公司企业数字技术风险暴露数据、数据风险暴露、网络风险暴露数据
2.测算方式:参考《经济研究》陆瑶(2025)老师的做法,,采用 FinBERT 大语言模型①对企业年度报告中部分涉及数字技术安全的相关论述进行文本情感识别,从而构建企业—年份层面的数字技术风险指标。大语言模型是指用于处理自然语言信息的大型人工智能模型,其中,FinBERT是国内首个在金融领域大规模语料上训练的开流模型。这类模型利用注意力机制,得出对每个词上下文敏感的表示,能够捕获文本中的长距离依赖性和复杂关系,从而更细致地理解和生成语言,具体内容如下图,测算起来比较复杂
最终结果是三个指标

(1)数字技术风险暴露,企业MD&A涉及数字技术风险的文本中,负面文本的负面情感概率最大值与正面文本的正面情感概率平均值之间的差值

(2)数据风险暴露,企业MD&A涉及数据风险的文本中,负面文本的负面情感概率最大值与正面文本的正面情感概率平均值之间的差值
(3)网络风险暴露,企业MD&A涉及网络风险的文本中,负面文本的负面情感概率最大值与正面文本的正面情感概率平均值之间的差值出处:草莓科研

3.资料范围:4.5万个样本,5408家企业,包括原始数据、部分计算代码(python,数据处理非常复杂,需要较强数据处理技术和安装包,因此代码仅供参考不教学)、测算说明及最终结果,大家可以验证一下确保准确性!此数据用的是上市公司年报做的,因为年报包括管理层讨论与分析(MD&A),这样做是为了相对更全一些,另外计算结果如下图所示(计算结果用软件导出就是这样,大家看好后在下单)
4.参考文献:
陆瑶,施函青,周欣怡.中国企业数字技术风险暴露对企业价值的影响——来自大语言模型的文本分析证据[J].经济研究,2025,60(02):73-89.

此数据为科研课题组自用数据,非仅仅只有一个结果胡编乱造(根据参考文献瞎编结果根本就没有研究价值,不能反映真正的数字技术风险,实证围绕着错的结果根本就毫无意义浪费大家时间),真正的原创一手认真整理数据,数据处理较为复杂大家可以自行试试!






出处:草莓科研

来源:草莓科研服务

相关推荐