中心新闻

CIFER新闻 | 基于AI模型的“美国对华政策态度”数据库

发布时间:2023年07月28日         来源:         点击次数: 8次         【 打印

摘要:

清华大学五道口金融学院讲席教授、国际金融与经济研究中心 (CIFER) 主任鞠建东与清华大学五道口金融学院国际金融与经济研究中心 (CIFER) 博士后研究员李元琨围绕 “量化美国对华政策态度” 这一议题, 基于美国对华提案文本和美国总统演讲视频,采用BERT语言模型和微表情模型等前沿AI模型技术,构建美国对华政策态度多维度数据库,分别产出基于AI语言模型测度美国对华政策态度美国对华产业政策态度以及基于AI微表情模型测度美国总统对华态度(←点击文字阅读)的系列研究。该数据库和系列成果对于理解美国对华政策,应对美国对华技术遏制,促进中美双边经贸关系有着重要应用价值。




截至2022年,中国和美国的GDP占世界总量的43.47%。从2008年到2020年,中国GDP的增量占全球GDP增量的78.15%。中美关系是当今世界最重要和最复杂的双边关系,甚至决定了未来几十年的世界经济走势 (Foreign Affairs, 2022) 。但现有对中美问题方面的文献仍然集中在使用分析事件数据的测算方法,针对中美重大事件进行分析,缺乏系统性对中美双边关系进行高频结构性量化研究,而近年来,美国不断出台反华提案企图遏制中国崛起,美国对华提案持续影响中美双边关系,对华提案也成为分析中美双边关系的关键路径。


课题组首先基于自2000年以来的2935项美国涉华提案,运用AI领域BERT语言模型和机器学习模型CatBoost测度美国对华政策态度,并通过多种方法对指数进行了验证。数据库指标说明,美国对华政策态度在2016年后持续下降,但是在2022年有所回升;美国对华政策态度存在分化,共和党议员对华政策态度的恶化主导了美国对华态度变差;通过测度美国对其他八国的态度发现,美国近年加强了对盟友的友好关系并缓和了传统对立国家的紧张关系,这与美国对华政策态度的急剧下降形成鲜明对比;主题分析发现,中国与美国在经济、基础科学、医疗等领域仍然有合作空间,但是对于文化、技术等领域也要注意美国对华的政策打压 (详见推送1) 


课题组运用BERT模型实体识别技术和行业描述文本得到各行业的产品关键词,用此关键词进一步识别了各提案所涉及的相关行业,将提案层面对华政策态度分解到了各提案-行业层面。数据库指标说明,美国对华各行业政策态度分化严重,在2015年前美国对华纺织业、造纸业、木材业等中低端制造业的政策较差,但在提出中国制造2025后,美国对计算机、装备制造和电子信息等行业政策态度较差;在2015年之后,中国产业政策态度和美国对华产业政策态度呈现显著负相关;美国对华产业政策态度和中国企业创新呈现显著负相关,美国对华产业政策主要通过抑制中国自美进口,进而促使中国企业突破性创新的增长。 (详见推送2) 


课题组基于AI微表情模型测度美国总统对华态度。Mehrabian (1971) 曾提出了著名的沟通7-38-55法则:话语传达了7%的信息,语气传递了38%,而面部表情则占55%。课题组率先创新得使用拥有1800万张人脸图像的Glint360K数据集和SMIC数据集,基于YOLOv5模型训练出高效准确的人脸检测器,结合来自奥卢大学 (University of Oulu) 的SMIC微表情数据集进行微表情识别训练,得到能够即时面部微表情识别分析的软件和算法。课题组正在将这一算法应用到美国总统涉华演讲之中进行分析,以求分析出美国总统语言之外的对华“潜意识” (详见推送3) 


该数据库和系列研究已经撰写相关工作论文Measuring the U.S. Industrial Policy Sentiment Toward China,并申请专利“一种基于YOLOv5的微表情检测器”,申请软件著作权“基于YOLOv5的微表情检测器V1.0”。该数据库和系列成果对于理解美国对华政策,应对美国对华技术遏制,促进中美双边经贸关系有着重要应用价值。