# NLP_course **Repository Path**: xkx9431/NLP_course ## Basic Information - **Project Name**: NLP_course - **Description**: No description available - **Primary Language**: Python - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2020-04-20 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # NLP course nlp 课程 目录 ## 课程1 An introduction to AI #### 人工智能概述,发展历史, #### 语法树相关知识 ## 课程2 概率模型 #### 概率模型 #### 机器学习模型引论 #### 自动决策模型 #### 自动机理论 作业:下载维基语料库 ,尝试比较相似语句在不同语言模型概率大小 ## 课程3 智能搜索 #### 深度搜索、广度搜索、启发式搜索 作业:实现北京自动地铁换乘系统(车站信息获取,不同换乘策略实现) ## 课程4 动态规划 #### 动态规划方法论 #### 动态规划实例——背包问题 作业:编辑距离,外卖小哥路径规划问题 ## 课程5 自然语言处理初步1 #### Word2Vecter #### Key word #### NER #### Dependency Parrsing 作业: 理解 Word2Vec 基本原理和提出背景,使用Gensim训练词向量,并进行同义词分析;词向量的T-SNE可视化 ## 课程6 自然语言处理初步 #### 项目1 新闻人物言论自动提取 ## 课程7 搜索引擎初步 #### 7.1文本与信息检索初步 #### 7.2 布尔搜索 #### 7.3 PageRank 作业:寻找专业性的论坛,快速制作网络爬虫,并通过倒排索引的方法构建一个搜索引擎。 ## 课程8 机器学习初步 #### 8.1 机器学习的历史和发展原理 ##### 机器学习的背景和原理 ##### 机器学习的主要流派 ##### 机器学习的现状分析 #### 8.2 过拟合和欠拟合 ##### Bias 和 Variance ##### 模型能力的分析 ##### 数据能力的分析 ##### 过拟合和欠拟合的原理和策略 #### 8.3 训练集、测试集、准确度 ##### 数据对学习模型的影响 ##### 训练集、测试集、准确度之间的关系 作业: 总结过拟合、欠拟合的原因;以及学习Scikit-learning;keras,tensorflow ## 课程9-11 经典机器学习模型 9.1 经典机器学习模型 - 9.1.1 回归和分类 - 9.1.2 Logstic Regression(逻辑回归) - 9.1.3 KNN模型, - 9.1.4 SVM 9.2 机器学习常见实践问题分析 - 9.2.1 天气预测 - 9.2.2 文本分类 - 9.2.3 图像分类 - 9.2.4 机器阅读理解 - 9.2.5 博弈问题 ### 课程10-11内容: + SVM及核方法 + 贝叶斯方法 + 决策树 + XGBoost + 非监督学习 + 项目代码分析 ## 课程12 kmeans ,word2vec advanced #### 0. Supplement: Why the Bayes we called Naive Bayes? #### 1. K-means & Hierarchy Cluster #### 2. Embedding and Word2Vec Review #### 3. The constraint of naive Word2Vec #### 4. Hierarchy Softmax and Negative Samples #### 5. Other Word2Vec Methods: + Glove + Cove + EMLO + Bert ## 课程13 Neural Networks (神经网络)模型 #### 13.1 神经网络 + 13.1.1 Loss函数,Backpropagation + 13.1.2 梯度下降 + 13.1.3 softmax, cossentropy + 13.1.4 Optimizer 优化器 #### 13.2 神经网络的实践分析 + 13.2.1 模型的稳定性 + 13.2.2 模型的可解释性 + 13.2.3 模型的运行分析 #### 13.3 实例分析:手动从零实现一个神经网络模型 + 13.3.1 实现神经元 + 13.3.2 实现拓扑排序 + 13.3.3 实现 Backpropagation + 13.3.4 实现神经元权重自动调整 + 13.3.5 利用完成的神经网络模型进行真实机器学习任务 #### homework : 1 tensorflow 代码实战(udacity,hands on tf;极客时间) 2.手动实现一个神经网络 3. 基于keras 实现CNN网络,并完成对MNIST数据的分类操作 ## 第14课 CNN卷积神经网络 引言. 项目2的介绍 #### 1 卷积神经网络与 Spatial Invariant + 1.1 卷积神经网络的历史背景 + 1.2 卷积神经网络空间平移不变形(Spatial Invariant)的原理 + 1.3 卷积神经网络与 weights sharing + 1.4 卷积神经网络的原理及Python 实现 #### 2 Pooling, Dropout 与 Batch Normalization + 2.1 Pooling +2.2 Dropout + 2.3 Batch Normalization #### 4 CNN 的可视化 #### 5 经典 CNN 模型分析: + 5.1 LeNet + 5.2 AlexNet + 5.3 GoogLeNet + 5.4 ResNet + 5.5 DenseNet #### 6 Transfer Learning 迁移学习 6.1 迁移学习的背景 6.2 迁移学习的方法 6.3 Python 实现迁移学习的最佳实践 ### 课程15 RNN循环网络 + 1. 序列模型的提出背景; + 2. 循环网络(RNN)的提出基本原理; + 3. 梯度爆炸和弥散(exploding & vanish) + 4. LSTM和GRU + 5. tensorflow和keras中RNN的使用 + 6. Transfer Learning