首页 炼丹房 帖子详情
词向量word2vec之CBOW算法
收藏
快速回复
炼丹房 文章头脑风暴 2717 32
词向量word2vec之CBOW算法
收藏
快速回复
炼丹房 文章头脑风暴 2717 32

自然语言处理之词向量算法CBOW的原理与实现。项目请移步至AI Studio项目集:https://aistudio.baidu.com/aistudio/projectdetail/306925

有什么问题请大家及时指正,也欢迎大家来参观我的主页。

0
收藏
回复
全部评论(32)
时间顺序
AI-BAI
#22 回复于2020-03
云玩家 #21
终于明白你为啥能上, 因为你在aistudio做了后还在社区宣传, 就有很多人会看, 然后我没有宣传, 别人都不知道我做了

对,多做宣传,好多人不但在社区发,还在qq、微信里宣传,宣传太重要了。

0
回复
AIStudio810258
#23 回复于2020-03
最近准备做个文本聚类的东西

期待,期待。

0
回复
AIStudio810258
#24 回复于2020-03
最近准备做个文本聚类的东西

能写一点儿paddle框架计算词向量余弦相似度的实例代码?

0
回复
AIStudio810258
#25 回复于2020-03
AI-BAI #18
你的模型是不是loss持续增加

开始下降,降到0.2左右再训练就开始增加了。但是预测相似度最近的词总是感觉不理想。你写的那个比老师给的基线的要好。king会出IV四世,飞利浦这样国王的名字之类的。

0
回复
AIStudio810258
#26 回复于2020-03
AI-BAI #17
这个就是CBOW的模型

我fork的是老版本

0
回复
AIStudio810258
#27 回复于2020-03

我看你预测时用的余弦相似度求的最相近的预测词,正向计算时用的是点乘。正向计算时能用余弦距离算loss优化模型么?我改成scikit-learn库算出来的余弦距离替换了原来得点乘结果总报错。

https://ai.baidu.com/forum/topic/show/958179

0
回复
AIStudio810258
#28 回复于2020-03

我正向计算时用余弦相似度算上下文词与中心词的相似度了,感觉没太大提高,还弄得牛速。

0
回复
AIStudio810258
#29 回复于2020-03

现在做标题分类比赛呢么?

0
回复
zkung
#30 回复于2020-03
AI-BAI #22
对,多做宣传,好多人不但在社区发,还在qq、微信里宣传,宣传太重要了。

可以对aistudio加大力度宣传哈哈哈哈

0
回复
Hee
#31 回复于2020-03
AI-BAI #22
对,多做宣传,好多人不但在社区发,还在qq、微信里宣传,宣传太重要了。

宣传 ✖️
水帖 ✔️

0
回复
AI-BAI
#32 回复于2020-03
现在做标题分类比赛呢么?

开学了,没什么时间做了

0
回复
AI-BAI
#33 回复于2020-03
Hee #31
宣传 ✖️ 水帖 ✔️

可以可以

0
回复
在@后输入用户全名并按空格结束,可艾特全站任一用户