112分钟

深度学习进阶——从词向量到NLP文本特征

在深度学习的应用过程中，我们会面对大量的数据处理场景，为了让 NLP 更好的进行任务处理，我们需要寻找一种更高效的方式去定义词与词之间的相似及差异，其中词向量技术通过将词语转化为稠密向量，并使其作为深…

登录查看更多信息

课程分类: 人工智能 | 技术开发
适用人群: 分析师, 工程师, 研究员
课程标签: 自然语言处理,词向量,文本特征

在深度学习的应用过程中，我们会面对大量的数据处理场景，为了让 NLP 更好的进行任务处理，我们需要寻找一种更高效的方式去定义词与词之间的相似及差异，其中词向量技术通过将词语转化为稠密向量，并使其作为深度学习模型的特征进行输入，能够显著提高数据处理效率。本门课程，我们将进行词向量技术的系统学习，课程从词向量的基础构造出发，详细介绍了使用Gensim构造词向量及词向量模型的具体操作，帮助学员建立对词向量的认知与理解。与此同时，课程还为我们介绍了NLP文本特征方法的对比，通过多模型的分析与比较，进一步深化学员对NLP文本特征分析的理解，实现技术进阶。

一、使用Gensim库构造词向量二、维基百科中文数据处理三、Gensim构造word2vec模型四、测试模型相似度结果五、影评情感分类六、基于词袋模型训练分类器七、准备word2vec输入数据八、使用gensim构建word2vec词向量九、自然语言处理任务概述十、词袋模型十一、TF-IDF模型十二、word2vec词向量模型十三、深度学习模型

唐宇迪

同济大学硕士，华东理工大学博士