关于paddlenlp simnet网络识别机构简称和全称的文本匹配相似度的问题
收藏
对于(工行、工商银行)能够识别出全称:中国工商银行股份有限公司
对于(农行、农业银行)能够识别出全称:中国农业银行股份有限公司,而不是识别出:中国农业发展银行
对于上述的需求,各位大佬在数据集和模型上的选择有哪些好的想法?
我现在的思路是建立pairwise数据集,例如工行,遍历所有工行的简称\t中国工商银行股份有限公司\t遍历所有其他银行,这样的数据集训练出来的结果不知道怎么样。
0
收藏
请登录后评论