其实我觉得NLP稍微难一些
抽象,歧义多,一词多义,表达方式多这些都是他的特点,但是我觉得最难得还是主观性太强
我们在日常生活表达的时候都只会说个大概,听者会自动补全描述语。并且,在不同的环境下,同样的句子你可能补全的也不一样。
这只是个人观点。我也想听听大家的观点,欢迎大家留言
你已经是研究生,该学会自己发顶会paper了
就是就是!
我只想毕个业,其他的不敢奢望。
我不是研究NLP的,但还是忍不住要发表一下意见,虚心请研究NLP的大佬指正。
我甚至认为机器无法精确识别人的语言的问题在于人类的语言本身不够精确。就比如手写数字识别问题,有人写的6比8还像8,这就不是识别算法这一层次的技术能解决的问题。
嗯,同感,最终还是“通用人工智能”。我们已经在卷积网络的水平上通用了,好像也有人把transformer用于图像识别了,GPT3还不知道。下一步看怎么在图片和文字的表示上通用吧。
咱们先谈赶上,再谈超越哈哈哈。
是的。。。比如手写数字识别吧,最后会发现模型认错的几个字换人类也认不出来
验证码不就是这样嘛,有些噪声加上去放大了看都认不出来
CV太火了吧
理解起来相对简单点
越是实践研究的人越是知道每一小步突破的艰辛,而电影院的观众给人工智能的起步价是“终结者”~~
我甚至(不成熟的)认为,像这种程度的错误样本应当剔除出数据集。因为其只能误导模型,对鲁棒性的提升毫无价值。我觉得,鲁棒性是帮助模型认识一些“四不像”,“指鹿为马”的样本是没有任何学习价值的。
我觉得这样的验证码可以用于“二阶验证”。凡是那种盯着“四不像”验证码可劲儿分析的,十有八九是机器人,正常的地球人类一定是一看那样的验证码就pass掉~~
可能一般人觉得cv更具感官刺激吧,毕竟一般人都认为:有图有真相
哈哈哈,这个比喻绝了。
就业还是学习内卷就完了
感觉是的,就是噪音……除非有上下文
事实上好像很多大佬打比赛有时会处理掉这些数据,说不定测试集上跑分还能涨
那么问题来了,这种数据怎么处理掉呢?人力去挑吗?让计算机看也看不出来啊。
在判错的里面挑呀
你已经是研究生,该学会自己发顶会paper了
就是就是!
我只想毕个业,其他的不敢奢望。
我不是研究NLP的,但还是忍不住要发表一下意见,虚心请研究NLP的大佬指正。
我甚至认为机器无法精确识别人的语言的问题在于人类的语言本身不够精确。就比如手写数字识别问题,有人写的6比8还像8,这就不是识别算法这一层次的技术能解决的问题。
嗯,同感,最终还是“通用人工智能”。我们已经在卷积网络的水平上通用了,好像也有人把transformer用于图像识别了,GPT3还不知道。下一步看怎么在图片和文字的表示上通用吧。
是的。。。比如手写数字识别吧,最后会发现模型认错的几个字换人类也认不出来
验证码不就是这样嘛,有些噪声加上去放大了看都认不出来
CV太火了吧
理解起来相对简单点
越是实践研究的人越是知道每一小步突破的艰辛,而电影院的观众给人工智能的起步价是“终结者”~~
我甚至(不成熟的)认为,像这种程度的错误样本应当剔除出数据集。因为其只能误导模型,对鲁棒性的提升毫无价值。我觉得,鲁棒性是帮助模型认识一些“四不像”,“指鹿为马”的样本是没有任何学习价值的。
我觉得这样的验证码可以用于“二阶验证”。凡是那种盯着“四不像”验证码可劲儿分析的,十有八九是机器人,正常的地球人类一定是一看那样的验证码就pass掉~~
可能一般人觉得cv更具感官刺激吧,毕竟一般人都认为:有图有真相
哈哈哈,这个比喻绝了。
就业还是学习内卷就完了
感觉是的,就是噪音……除非有上下文
事实上好像很多大佬打比赛有时会处理掉这些数据,说不定测试集上跑分还能涨
那么问题来了,这种数据怎么处理掉呢?人力去挑吗?让计算机看也看不出来啊。
在判错的里面挑呀