鲍勃BOB体育课题名称
= 基于自然语言处理的COVID-19虚假新闻检测 =
项目简介
鲍勃BOB体育前不久有一则新闻称:一半的加拿大人被COVID-19的阴谋论所愚弄,这个消息真的令人心碎。
世界卫生组织(WHO)称,与COVID-19相关的信息流行病与病毒本身同样危险。同样地,阴谋论、神话和夸大的事实可能会产生超出公共健康范围的后果。多亏了Lead Stories,Poynter,FactCheck.org,Snopes假新闻 专项,EuVsDisinfo等项目可以监视、识别和检查散布在世界各地的虚假信息。
假新闻检测任务对逻辑的判断,以及常识的学习都有着很高的要求。判断一则新闻是否是假新闻假新闻 专项,需要判断文章内部的逻辑是否自洽,同时因为新闻多会涉及一些专有名词/专业术语,因此也需要学习外部的知识库来辅助判断。结合这两点特性,假新闻检测是当前的热点任务,也仍极具挑战性。
鲍勃BOB体育在本项目中,导师将以“虚假新闻识别”为课题假新闻 专项,向同学们介绍深度学习和自然语言处理的基础知识,并引导大家在假新闻检测任务中应用学到的知识,探索新的算法、模型和技术。
适合人群
● 希望申请国外计算机科学、数据科学等相关学科,但相关经历不够丰富,或者转专业科研入门的本科生;
鲍勃BOB体育
● 对人工智能、自然语言处理感兴趣,想要完成一段科研项目的本科生;
● 建议有一定的编程基础,熟悉Python(如果不熟悉我们将提供网课预习,需要你做好学习一门编程语言的准备)。
科研导师
= Dr. JIN 博士 =
美国麻省理工学院人工智能方向博士。
项目安排
本项目为线上Workshop, 导师授课+练习实战结合,完成课题学习、研究实战探索及报告撰写。
Phase 1 预习阶段
导师提供必要的阅读材料、课程及练习题,为在线课程做预习,补充知识短板。
Phase 2 导师授课
Week 1:深度学习与神经网络基础
● 本部分课程旨在让同学们了解神经网络的基本原理,通用的神经网络架构,神经网络的训练/优化。 课后作业将通过简单的图片分类任务让同学们体验神经网络的搭建和训练假新闻 专项,并借此练习使用python以及深度学习工具包的技巧。
● 神经网络基本概念。
● 通用神经网络结构。
● 神经网络的训练/优化。
Week 2-3:自然语言处理中的深度学习
● 偏重于讲解深度学习模型在自然语言处理任务中的应用; 概述分布式词表示模型,卷积神经网络及循环神经网络,端到端生成模型,记忆神经网络,在一系列自然语言处理任务,包括词表示学习、文本分类、情感分析、机器翻译、智能问答、阅读理解、对话系统等任务中的实际应用; 介绍自然语言处理领域重要的工具包和数据集,为大家今后的科研学习做准备;
● 自然语言处理任务概述
● 词表示模型
● 句子/文本建模
● 端到端模型
● 预训练语言模型
Week 4:自然语言处理应用专题
● 介绍针对自然语言处理的一系列最新的研究和学界、业界提出的新任务; 讲解已有的科研工作、产品以及数据集;同时提出可能的科研方向供大家探讨;
● 情态分析
● 自然语言推理
● 智能问答
● 机器翻译
● 文本总结
● 最终课题:虚假新闻识别系统
Phase 3 线上研讨
Week 5:导师介绍虚假新闻识别系统的研发意义以及现有的方法概述假新闻 专项,布置课下科研任务,选择某一公开数据集作为任务目标,鼓励学生课下做文献调研并提出自己的系统构建想法。
Week 6: 学生分组进行课上答辩,介绍文献调研情况并展示自己构建的模型。课下开始针对自己的想法进行代码实现,并通过实验得到模型的效果。
Phase 4 报告撰写+导师反馈
week 7:完成报告撰写,导师做出最终反馈。
时间安排
开课时间:2022.5.7开课
项目收获
● 导师签字的项目结业证书;
● 通过分组合作,锻炼团队合作的能力,提前适应海外高效的学习模式;
鲍勃BOB体育● 收获一段与AI相关的实战科研经历,产出一份AI相关的实战科研报告;