摘要:测算方式:参考《经济研究》陆瑶(2025)老师的做法,,采用 FinBERT 大语言模型①对企业年度报告中部分涉及数字技术安全的相关论述进行文本情感识别,从而构建企业—年份层面的数字技术风险指标。大语言模型是指用于处理自然语言信息的大型人工智能模型,其中,Fi
1.资料名称:2024-2000年上市公司企业数字技术风险暴露数据、数据风险暴露、网络风险暴露数据
2.测算方式:参考《经济研究》陆瑶(2025)老师的做法,,采用 FinBERT 大语言模型①对企业年度报告中部分涉及数字技术安全的相关论述进行文本情感识别,从而构建企业—年份层面的数字技术风险指标。大语言模型是指用于处理自然语言信息的大型人工智能模型,其中,FinBERT是国内首个在金融领域大规模语料上训练的开流模型。这类模型利用注意力机制,得出对每个词上下文敏感的表示,能够捕获文本中的长距离依赖性和复杂关系,从而更细致地理解和生成语言,具体内容如下图,测算起来比较复杂
最终结果是三个指标
(1)数字技术风险暴露,企业MD&A涉及数字技术风险的文本中,负面文本的负面情感概率最大值与正面文本的正面情感概率平均值之间的差值
(2)数据风险暴露,企业MD&A涉及数据风险的文本中,负面文本的负面情感概率最大值与正面文本的正面情感概率平均值之间的差值
(3)网络风险暴露,企业MD&A涉及网络风险的文本中,负面文本的负面情感概率最大值与正面文本的正面情感概率平均值之间的差值
3.资料范围:4.5万个样本,5408家企业,包括原始数据、计算代码(python)、测算说明及最终结果,大家可以验证一下确保准确性!
4.参考文献:
陆瑶,施函青,周欣怡.中国企业数字技术风险暴露对企业价值的影响——来自大语言模型的文本分析证据[J].经济研究,2025,60(02):73-89.
资料来源:草莓科研
来源:草莓科研服务