为推动我国人文社科学者进一步了解自然语言处理基础知识,帮助青年教师和学生掌握大数据在文本分析中的应用,西安外国语大学研究生院拟于2021年6月16日至6月26日举办“面向人文社科的自然语言处理”工作坊,诚挚邀请大家共同探讨新时代背景下如何利用文本挖掘技术进行人文学术研究。
主讲人:刘洪涛 (重庆邮电大学 副教授)
主持人:汪顺玉 (西安外国语大学 教授)
直播链接:https://owl.h5.xeknow.com/s/23pcDV
参与人:西安外国语大学计算话语研究团队成员
2020级外国语言文学硕士研究生拔尖创新人才
对自然语言处理感兴趣的硕博研究生和青年教师
主讲人简介:
刘洪涛,博士,副教授,硕士研究生导师,重庆邮电大学“网络智能研究所”网络行为研究方向负责人。2007年6月毕业于西南大学获博士学位,2013年3月至2014年2月英国伦敦大学学院国家公派访问学者。主持国家社科基金2项,2013年“政务微博引导下的网络舆情演化规律研究”,2018年“基于情感分析的社交网络影响力传播研究”,公开发表学术论文20余篇,其中SCI,EI检索10篇,CSSCI检索5篇。担任《电子学报》,《通信学报》,《IEEE ACCESS》等多个期刊的特约审稿人。
主持人简介:
汪顺玉,二级教授,博士生导师,西安外国语大学“领军学者”,“计算话语研究”博士二级学科带头人。先后主持国家社科重点项目、教育部人文社科项目、陕西省研究生教育改革项目、重庆市哲学社会科学规划课题、重庆市教委教改重点课题、教育考试院课题10余项。学术兴趣包括语言测试与评价、学术翻译、计算话语研究、社会研究方法。
主办单位:西安外国语大学研究生院
西安外国语大学计算话语研究团队
课程计划
时间 |
课程内容 |
课时安排 |
2021年6月16日,19:00-22:00 |
(一)自然语言处理的理论基本框架 1. 自然语言处理的理论简介 2. 文本预处理和特征提取、词性标注、去停用词 3. 分词的定义、基本方法、代码实现 4. one-hot 、词袋的实现 5. 分句的定义、基本方法、代码实现 |
3课时 |
2021年6月17日,19:00-22:00 |
(二)文本挖掘(基础一) 1.关键词提取简介 2. 有监督的关键词提取 3. 无监督的关键词提取 4. 典型应用场景下关键词提取的实现 |
3课时 |
2021年6月19日,14:00-17:00 |
(三)文本挖掘(基础二) 1文本摘要生成简介 2. 有监督的文本摘要生成 3. 无监督的文本摘要生成 4. 典型应用场景下文本摘要生成的实现 |
3课时 |
2021年6月23日,19:00-22:00 |
(四)多篇文本挖掘(基础篇) 1. 文本聚类定义、基本方法、代码实现 2. 文本分类定义、基本方法、代码实现 3. 典型应用场景下的实现 |
3课时 |
2021年6月24日,19:00-22:00 |
(五)文本挖掘(情感分析) 1. 文本情感分析简介 2. 文本向量化 3. 情感词库 4. 主观性文本 5. 典型应用场景下的实现 |
3课时 |
2021年6月26日,14:00-17:00 |
(六)文本挖掘(潜在语义分析 latent semantic analysis) 1. 潜在语义简介 2. 话题向量 3. 单词-文本矩阵 4. 非负矩阵分解算法 5. 典型应用场景下的实现 |
3课时 |