文本分类
数据集:清华NLP组开源的THUNews
算法:TFIDF + LightGBM
以图搜图
数据集:kaggle开源animals-10
算法:EfficientNetB0在imageNet上的迁移学习
问答系统
数据集:自行爬取的百度百科各词条基本信息栏
算法:命名实体识别 + Word2Vec
我们实现了一个功能较为完善的搜索引擎系统,包含前端网页、后端服务器,内网穿透等提高用户交互性的设计以及文本搜索、文本分类、以图搜图、问答系统等功能接口的实现。
前端部分由另一名同学实现,原生html css js vue,仿百度界面
地址:https://github.com/WJW53/WenHai_SE
A search engine with text search & image search & text classify & simble QA