学术研究
台湾清华大学黄裕烈教授来我院做学术讲座
时间:2019-06-21 浏览次数:14

620日上午,台湾清华大学计量财务金融学系黄裕烈教授应我院经济研究所邀请,于台湾研究院507会议室举办《文字探勘在台湾经济预测中的应用》专题讲座。讲座由经济所所长王华教授主持,经济所师生积极参与。

大数据时代,数据分析不拘泥于数字,也可以从文字的角度,通过文字探勘(text mining) 的技巧,从中发现一些有趣的结果。黄裕烈教授以信息的客观形式为引,指出文字形式的资料量远多于其他信息形式。然而,文字的数字化存在固有困难,中文文字处理尤为如此,存在许多不同于英文文字处理的复杂性。例如,中文断字不清楚,相同字词在不同情境下的语意也有所不同。因此,黄裕烈教授首先分享了中文断字的常用方法,以及著名断字套件Jieba的操作应用,并向在座师生进行了现场演示,使大家留下了深刻的印象。

随后,黄裕烈教授介绍了文字探勘在经济学中的重要应用——经济政策不确定性(Economic Policy UncertaintyEPU指数),包括EPU指数的编制方法、学术应用、优点和局限性等。经济议题分析离不开市场,但是市场的开放程度却又受到经济规模的异质性、政治形势和政策选择的影响,这是市场无法短期控制的因素。这种不确定性往往成为干扰市场自由运作的重要因素。因此,通过文字探勘,编制出的EPU指标可以有效地衡量不确定性因素。因为经济政策的不确定性,是影响投资和消费等经济变量的重要因素。

在此基础上,黄裕烈教授报告了台湾EPU指数的编制方法、与其他经济体EPU指标的相关性,以及EPU指数在台湾经济预测中的应用等。在简要介绍英文文字探勘的方法后,黄裕烈教授进一步分享了文字探勘在诸多领域的经典应用。例如美联储会议文件文本的信息挖掘,甚至包括《红楼梦》作者的统计推断等等。黄裕烈教授还提出了他对文字探勘实际操作步骤的精要整理,给现场师生带来了颇多启迪。

在提问环节中,黄裕烈教授对于文本探勘的局限性、台湾EPU指数的信息来源选取、文本探勘的技术要求等议题与现场师生进行了深入的互动交流。最后,王华教授对本次讲座进行了总结,并对黄裕烈教授致以诚挚的感谢。


(文/郭联邦 /施宇 责任编辑:李文韬)


Top