112分钟
深度学习进阶——从词向量到NLP文本特征
在深度学习的应用过程中,我们会面对大量的数据处理场景,为了让 NLP 更好的进行任务处理,我们需要寻找一种更高效的方式去定义词与词之间的相似及差异,其中词向量技术通过将词语转化为稠密向量,并使其作为深…
在深度学习的应用过程中,我们会面对大量的数据处理场景,为了让 NLP 更好的进行任务处理,我们需要寻找一种更高效的方式去定义词与词之间的相似及差异,其中词向量技术通过将词语转化为稠密向量,并使其作为深度学习模型的特征进行输入,能够显著提高数据处理效率。
本门课程,我们将进行词向量技术的系统学习,课程从词向量的基础构造出发,详细介绍了使用Gensim构造词向量及词向量模型的具体操作,帮助学员建立对词向量的认知与理解。
与此同时,课程还为我们介绍了NLP文本特征方法的对比,通过多模型的分析与比较,进一步深化学员对NLP文本特征分析的理解,实现技术进阶。
一、使用Gensim库构造词向量
二、维基百科中文数据处理
三、Gensim构造word2vec模型
四、测试模型相似度结果
五、影评情感分类
六、基于词袋模型训练分类器
七、准备word2vec输入数据
八、使用gensim构建word2vec词向量
九、自然语言处理任务概述
十、词袋模型
十一、TF-IDF模型
十二、word2vec词向量模型
十三、深度学习模型
唐宇迪
同济大学硕士,华东理工大学博士