# Word-Embedding
**Repository Path**: wangjiabao952/Word-Embedding
## Basic Information
- **Project Name**: Word-Embedding
- **Description**: Word2vec, Fasttext, Glove, Elmo, Bert, Flair pre-train Word Embedding
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 1
- **Forks**: 0
- **Created**: 2020-02-26
- **Last Updated**: 2021-12-11
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
# Word-Embedding
Word2vec,Fasttext,Glove,Elmo,Bert and Flair pre-train Word Embedding
本仓库详细介绍如何利用Word2vec,Fasttext,Glove,Elmo,Bert and Flair如何去训练Word Embedding,对算法进行简要分析,给出了训练详细教程以及源码,教程中也给出相应的实验效果截图
1、环境
------------
* python>=3.5
* tensorflow>=1.13
2、Word Embedding教程快速链接
------------------
* [Word2vec中文词向量训练](https://github.com/zlsdu/Word-Embedding/blob/master/word2vec/word2vec_report.md)
* [Fasttext中文词向量训练](https://github.com/zlsdu/Word-Embedding/blob/master/fasttext_report.md)
* [Glove中文词向量训练](https://github.com/zlsdu/Word-Embedding/blob/master/glove_report.md)
* [Elmo英文和中文词向量训练](https://github.com/zlsdu/Word-Embedding/blob/master/elmo/elmo_report.md)
* [Bert句向量和词向量训练](https://github.com/zlsdu/Word-Embedding/blob/master/bert_report.md)
* [Flair词向量训练](https://github.com/zlsdu/Word-Embedding/blob/master/flair/flair_report.md)
3、实验数据简介
-------------------
* stop_words.txt: 停用词数据,用于数据预处理使用
* wiki.zh.text.jian: wiki百科简体中文原始数据,wiki.zh.text.jian.fenci: wiki百科简体中文分词后数据,wiki百科数据主要在word2vec的skipgram模型中使用,数据量较大,已放百度网盘,地址: [链接](https://pan.baidu.com/s/1DeIaIO35eWzZP75YRGNU9w), 密码: bvmw
* toutiao_word_corpus.txt: 头条公开的新闻类分类数据,word2vec的gensim库实验、fasttext算法、glove算法中有使用
4、欢迎关注公众号
------------------
