Bert for sentence embedding

基础介绍 Intro

该借鉴了https://github.com/649453932/Bert-Chinese-Text-Classification-Pytorch 构建的BERT基础框架。

使用方法：

1.数据与模型导入：

数据 data preparation

必须和我THUCNews/data中的数据格式一致。分别替换成为你的数据即可。 Must be in the same form of my data.

模型 model preparation

链接：https://pan.baidu.com/s/1jHF-zDibrDQZz5BZDRWpSA?pwd=5a8m 提取码：5a8m 下载后全部放到Pre_trained那个文件夹下。

2.运行操作：

训练并测试：

python run.py --model bert

结果存放在sentence_npy中，以npy格式存储，读取方法详见check.ipynb文档。

3.后续分析文件说明：

3.1 check.ipynb

读取embedding结果，并且进行cosine similarity计算等任务

3.2 embedding_from_package.ipynb

通过package导入embedding结果，可以作为本项目的备选。该项目更加完善

Name		Name	Last commit message	Last commit date
Latest commit History 15 Commits
ERNIE_pretrain		ERNIE_pretrain
THUCNews/data		THUCNews/data
__pycache__		__pycache__
bert_pretrain		bert_pretrain
models		models
pytorch_pretrained		pytorch_pretrained
sentence_npy		sentence_npy
README.md		README.md
check.ipynb		check.ipynb
embedding.txt		embedding.txt
embedding_from_package.ipynb		embedding_from_package.ipynb
prediction_result.txt		prediction_result.txt
run.py		run.py
run.sh		run.sh
train_eval.py		train_eval.py
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Bert for sentence embedding

基础介绍 Intro

使用方法：

1.数据与模型导入：

数据 data preparation

模型 model preparation

2.运行操作：

训练并测试：

3.后续分析文件说明：

About

Releases

Packages

Languages

ChrisYuanGao/Bert-Novelty

Folders and files

Latest commit

History

Repository files navigation

Bert for sentence embedding

基础介绍 Intro

使用方法：

1.数据与模型导入：

数据 data preparation

模型 model preparation

2.运行操作：

训练并测试：

3.后续分析文件说明：

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages