-
Notifications
You must be signed in to change notification settings - Fork 242
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
ValueError: empty vocabulary; perhaps the documents only contain stop words #2
Comments
用python3重跑 |
@YouChouNoBB 嗯,好的,非常感谢。昨天晚上我跑了好几次都是这个问题,早晨我重新跑了下,没有问题了。为什么会这样呢? |
研究了一下 |
@YouChouNoBB 好的,非常感谢,但还是有点疑问,每次都读入的数据都一样,前面报这个错后面就不报了? |
不太清楚这个问题 |
@YouChouNoBB 好的,非常感谢,后来就没有碰到这种问题。 |
用anaconda3跑也出现了这种情况,python3.6,能从程序上改下么? |
@YouChouNoBB 你好,我顺便想问一下,代码会把单独的数字当成stop words过滤掉,但是单独数字在数据里面是有物理意义的,所以应该不能被过滤掉吧? |
是的,对于这种数据建议单独处理 |
@YouChouNoBB @klvn930815 你们好,我想问一下为什么独热编码会把单独的数字当成stop words,我没查到相关资料,能给下相关资料的链接吗?非常感谢你们的指教。 |
升级下sklearn包试试 |
@YouChouNoBB 你好我没太理解你的意思,升级sklearn包就可以知道独热编码为什么把单独的数字当成stop words了吗?有没有相关的资料链接呢?非常感谢 |
为什么我直接跑这个baseline,没有改动,会报这个错呢?非常感谢你的回答!
cv.fit(data[feature]),获取词频向量时候报错的。
The text was updated successfully, but these errors were encountered: