词向量
数码居士010 发布于2018-10 浏览:1688 回复:1
0
收藏
快速回复
最后编辑于2018-10

“电脑” 跟 “计算机“ 应该算是同义词吧,欧氏距离为什么那么大? 余弦值也超大

 

相似度接口返回值:{"log_id": 7140416346834279964, "score": 0.158198, "words": {"word_2": "计算机", "word_1": "电脑"}};

 

向量表示

电脑: [0.0432656, -0.584009, -0.366765, -0.175803, 0.374726, -0.172602, 0.414963, -0.349391, 0.708222, 0.729403, -0.808542, 0.0586837, 0.0955856, -0.145025, -0.0853858, -0.0985646, -0.0832982, 1.00302, 0.375536, 0.274439, 0.772542, 0.310928, 0.084781, -0.0255181, 0.435767, -0.105897, 1.15279, -1.10442, -0.645092, -0.693284。。。

 

计算机:[1.13782, 0.133132, 0.606663, -0.276127, -0.0869582, 0.152388, 0.402227, -0.0619454, 0.0248012, -0.158777, 0.164176, 0.777216, -0.33656, 0.10057, -0.834457, -0.00704953, 0.838536, -0.164243, 1.08486, 0.88821, 0.105231, 0.0881425, 0.183562, 0.0976049, -0.244432, -0.780504, -0.843212, -0.40389, -0.0266721, -0.208972。。。

收藏
点赞
0
个赞
共1条回复 最后由xianlu199回复于2018-10
#2xianlu199回复于2018-10

向量距离的大小和训练数据有关。在确定的领域使用词向量,最好使用相关领域的数据自己训练。

0
TOP
切换版块