近期在AI Studio上用脚本跑任务,突然想到一个脚本任务的优化思路。
首先,目前脚本任务使用门槛确实稍微高了点,主要几个大的难关:
1. 没有终端,这个对不熟悉linux的用户特别致命,路径全程靠脑补(而且路径和Notebook项目是一样的,你以为cd AAA以后,下一行代码的当前路径就变了?No!)
2. 代码要一个个传,但是数据集的坑位就两个
2.1 也就是说,如果代码文件特别多,那么数据集坑位就剩一个啦,很多时候真不够啊
2.2 同时这个问题还叠加了(问题1),用数据集放代码是吧?那后面的解压缩后路径、目录结构、文件位置请自行脑补……
3. 如果不想一个个传,比如git clone PaddleDetection这种模型库,也要面临版本更新的风险。比如我之前用PaddleSeg的项目,为适配2.0,整个目录结构都改了,新读者fork了旧项目发现跑不起来了……
4. YAML文件不能预览和编辑,这个小问题挺影响体验的(当然,能打到这关的重度用户已经很少了,哈哈哈),参考https://ai.baidu.com/forum/topic/show/981125
分析一下上面的问题,依我个人理解,脚本任务当前的设计,要加个终端有点难,就算有,恐怕也是类似BML CodeLab那种伪终端(BML可以用终端本地调试,至少不用脑补路径,但云上跑还是把代码提交上去的)。
但是第2、3可能不需要太伤筋动骨就能改造,建议就是加个放代码包的坑位,让用户按要求把代码打包成zip文件,加载脚本任务的时候自动解压,显示到前端。比如我有个PaddleDetection.zip吧,放到代码包坑位,脚本任务加载了解压、显示,在脚本任务上就可以像用IDE一样玩耍了。当然代码包肯定要限制下大小,如果刚好能把完整的PaddleDetection.zip这种上传是最好的,如果不能,我觉得可以指导下用户,比如把这些模型库的doc文档目录、一些图片拿掉,可以省下很多空间。
转念一想,感觉Notebook不也可以加个代码包坑位嘛,哈哈哈。
毕竟我这种重度使用git clone 模型库的用户,公开的项目很害怕模型库代码改动啊……而且Notebook公开项目一般是很难把PaddleDetection模型库放进去的,文件数太多、模型文件经常放在模型库目录下,占用空间也很容易超标。
(狗头跑路)
You get it.
深“渊”用户的深度体会~~
资深坑姐
emmmmm,不如用“坑”,哈哈哈
没有没有,维护项目更新需求雪花般飞来,小崩溃啊
好家伙,好主意,好坑。
呃呃呃有歧义啊……
产品经理已收到
产品经理睡不着了
666
跟着大佬捡工具的方便~
我觉得是开发睡不着
明白了 姐 你真坑 对吧
那你想个词,栏位?
我感觉会不会哪天悄悄地又更新了
这个提议不错哈。
可以啊,支持支持
说不定哪天就更新了,期待
可 哈哈
非常有可能的