Skip to content

Latest commit

 

History

History
 
 

2180250_自然语言处理导论

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
 
 
 
 

自然语言处理导论

21222 学期 潘刚

简介

此课程是软件工程专业公共选修课(专业公共选修指专业选修中不属于三个方向的选修课),课程讲授自然语言处理和深度神经网络等基础知识,主要内容包括概述、数学基础、形式语言与自动机及其在 NLP 中的应用、语料库与语言知识库、语言模型、词法分析与词性标注、语法理论、句法分析、语义分析、深度学习和 NLP、深度学习基础、卷积神经网络、深度学习与自然语言处理等。

课程内容、考试内容和其他专业同名课程略有不同。

平时

8 周授课,无平时作业,无签到,有 4 次实验,在 飞桨 AI Studio 平台完成,内容分别为波士顿房价预测、谣言检测、循环神经网络应用和 CRNN 文字识别模型。实验内容比较简单,设置实验的目的也是让大家对机器学习、深度学习等主流技术有更直观的了解,培养学生的兴趣。

21222 学期由于疫情原因,课程全程线上进行,有回放。

考试

  • 形式:开卷、中文、允许携带可以计算对数的计算器
  • 时间:2 小时
  • 题型:大题

2019 级考试题目:

一、

  1. 熵相关计算(H(X)、H(X|Y)、I(X;Y))
  2. D(p||q) 计算
  3. P、R、F1 计算

二、

  1. 编辑距离
  2. 合一运算
  3. 格框架

三、

  1. (1) 自动分词的最大匹配法;(2) 自动分词的最少分词法(最短路径法)
  2. 概率上下文无关文法,比较两棵句法分析树的概率
  3. 二元文法模型求句子的概率,数据平滑
  4. TF-IDF
  5. (1) NLP 技术应用举例;(2) 为什么近十年机器学习技术爆发

成绩

4 次实验 + 期末考试

评价

课程内容围绕自然语言处理这一核心,全面地介绍了 NLP 相关的基础知识和基本理论,在课程的最后也加入了对深度学习、神经网络等内容的介绍和讲解。课程整体内容不难,虽然有很多比较复杂、晦涩、深奥的知识,但听了潘老师的讲授之后应该都会理解。

潘老师是我很敬佩的老师,他曾经讲授的《面向对象程序设计》和这门《自然语言处理导论》都给我留下了很深的印象。老师讲课十分关心同学们的感受,虽然线上授课无法相见,但我仍能感受到潘老师对学生的热情和对知识的融会贯通。

十分推荐大家选这门课hhh

经验

开卷考试,允许携带打印的纸质版课件(期末考试前老师会发布精简版的课件,为考试范围)。个人建议期末复习时根据课程回放理解课件内容,记清楚每个重点知识在哪个课件的哪个位置,这样会提高考试时查阅资料的速度。本课程由于开卷考试,不需要记忆太多内容,所以课程重点是理解自然语言处理的基础知识和基本理论,有更加直观的感受。