新闻动态

新闻动态
“面向人文社科的自然语言处理”工作坊成功举办
2021/06/30      浏览:

为推动我国人文社科学者进一步了解自然语言处理基础知识,帮助青年教师和学生掌握大数据在文本分析中的应用,研究生院于2021年6月16日至6月26日举办“面向人文社科的自然语言处理”工作坊——“我为师生办实事”实践活动之 “乐学有你”第十二期博士生学术沙龙。工作坊由重庆邮电大学“网络智能研究所”网络行为研究方向负责人、硕士研究生导师刘洪涛副教授主讲,西安外国语大学“领军学者”、“计算话语研究”博士二级学科带头人、博士研究生导师汪顺玉教授主持。西安外国语大学计算话语研究团队成员、2020级外国语言文学硕士研究生拔尖创新班以及对自然语言处理感兴趣的硕博研究生和青年教师等参加了本次工作坊。

     

本次工作坊分为六次课程,共计十八个学时。第一节自然语言处理的理论基本框架中,刘洪涛博士讲解了自然语言处理的理论框架,并用R语言代码演示文本预处理,如分词、分句、词性标注、去除停用词等方法;第二节文本挖掘(基础一)讲解了文本挖掘的基础技术之一:关键词提取,并结合《红楼梦》文本,用R语言代码演示基于统计特征的关键词提取方法;第三节文本挖掘(基础二)介绍了文本挖掘的基础技术之一:文本摘要生成,并结合互联网公司招聘文本,用R语言代码演示抽取式摘要生成法。在第四节多篇文本挖掘(基础篇)中,主讲人介绍了多篇文本挖掘技术:文本聚类和分类,并结合垃圾邮件分类实例,用R语言代码演示文本分类方法;第五节文本挖掘(情感分析)中,主讲人围绕情感分析技术,结合美国历任总统国情咨文文本,用R语言代码演示了基于情感字典的文本级别情感计算方法;第六节文本挖掘(潜在语义分析,latent semantic analysis,LSA)主讲人演示了潜在语义分析LSA算法,并结合具体实例,用R语言代码演示基于LSA的文本相似度计算方法。

     

汪顺玉教授在工作坊总结讲话中对主讲人刘洪涛副教授带来的精彩分享表示感谢,并鼓励参会研究生与主讲教师多进行沟通交流,为计算话语研究打好基础。参会师生纷纷表示通过参加此次工作坊进一步了解了计算话语分析的研究方法,受益匪浅,收获颇多。

本学期以来,学校深入实施研究生培养质量提升工程,大力推进卓越研究生教育,积极助力人文社科学者对自然语言处理知识的掌握,着力为广大青年教师和学生打造学习交流平台,为新时代背景下利用文本挖掘技术进行人文学术研究贡献了力量。(文/图:闵杰、赵秋盈;审核:汪顺玉、王仁锋)

网站声明:转载或引用本文,须注明本文出处,违者必究