NLP和CV哪个更难？

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

小泽自信起来发布于2020-03

其实我觉得NLP稍微难一些

抽象，歧义多，一词多义，表达方式多这些都是他的特点，但是我觉得最难得还是主观性太强

我们在日常生活表达的时候都只会说个大概，听者会自动补全描述语。并且，在不同的环境下，同样的句子你可能补全的也不一样。

这只是个人观点。我也想听听大家的观点，欢迎大家留言

全部评论(309)

没入门的研究生

#102 回复于2020-08

AIStudio810260 #101

在判错的里面挑呀

这工作量也不小啊。。。

AIStudio810266

#103 回复于2020-08

这个帖子大致是和谁是世界上最好的编程语言类似的讨论吗哈哈哈

thinc

#104 回复于2020-08

__y__ #97

就业还是学习内卷就完了

不走技术岗还是有很多坑位的吧

thinc

#105 回复于2020-08

没入门的研究生 #102

这工作量也不小啊。。。

确实，预处理工作都是很费时费力的

AIStudio810260

#106 回复于2020-08

没入门的研究生 #102

这工作量也不小啊。。。

比赛周期那么长或多或少有这方面因素吧

AIStudio810258

#107 回复于2020-08

AIStudio810260 #99

事实上好像很多大佬打比赛有时会处理掉这些数据，说不定测试集上跑分还能涨

我还听说有的大佬为了刷分，专门把一些难区分的样本另用模型处理，然后再集成在一起

AIStudio810258

#108 回复于2020-08

AIStudio810260 #99

事实上好像很多大佬打比赛有时会处理掉这些数据，说不定测试集上跑分还能涨

手写字符集排名前几个100%的，据说就这么刷出来的。。。

AIStudio810258

#109 回复于2020-08

AIStudio810258 #108

手写字符集排名前几个100%的，据说就这么刷出来的。。。

只是这种处理除了刷分没啥别的意义，并不能提升多少泛化能力

AIStudio810260

#110 回复于2020-08

AIStudio810258 #108

手写字符集排名前几个100%的，据说就这么刷出来的。。。

虽然没啥实际意义，但是告诉我们数据集标注真的很重要……

AIStudio810260

#111 回复于2020-08

AIStudio810258 #109

只是这种处理除了刷分没啥别的意义，并不能提升多少泛化能力

看情况吧，有些标注错误也是这么发现了，比如AI识虫比赛的大佬就把标错的虫子检出来了……

AIStudio810259

#112 回复于2020-08

提问意义不大啊，

thinc

#113 回复于2020-08

AIStudio810258 #108

手写字符集排名前几个100%的，据说就这么刷出来的。。。

比赛是比赛，落地是落地，刷分还得靠tricks

thinc

#114 回复于2020-08

AIStudio810258 #107

我还听说有的大佬为了刷分，专门把一些难区分的样本另用模型处理，然后再集成在一起

太强了

AIStudio810258

#115 回复于2020-08

AIStudio810260 #111

看情况吧，有些标注错误也是这么发现了，比如AI识虫比赛的大佬就把标错的虫子检出来了……

这是个好思路，可以辅助做数据清洗

AIStudio810258

#116 回复于2020-08

AIStudio810260 #110

虽然没啥实际意义，但是告诉我们数据集标注真的很重要……

标注错误率会成为模型精度的天花板么？

AIStudio810258

#117 回复于2020-08

thinc #114

太强了

是很强，

就是我觉得这种策略是权宜之计吧，

AIStudio810258

#118 回复于2020-08

thinc #114

太强了

如果用太多个别处理，就又回到手动编写逻辑的老路了吧

就变成“人工智能”了～～

AIStudio810258

#119 回复于2020-08

thinc #113

比赛是比赛，落地是落地，刷分还得靠tricks

嗯，就是这么回事

没入门的研究生

#120 回复于2020-08

AIStudio810258 #116

标注错误率会成为模型精度的天花板么？

这是肯定的吧。不知道每年有多少费用用在了数据的标注上。

AIStudio810260

#121 回复于2020-08

AIStudio810258 #116

标注错误率会成为模型精度的天花板么？

感觉这是必然的。目标检测已经有这种情况，图像分割就更不用说了。之前发现了个很好的图像分割场景，然而一想到像素级的标注问题就头大。

话说打比赛的时候，测试集要是有标注错误咋办，哈哈