AI口述绘图是否可实现?
收藏
AI口述绘画使用者仅需说出想要绘制物体的名称,机器人便可以进行相关素材的匹配
0
收藏
请登录后评论
多模态模型,或者先给物体打下标签试试?
现在正朝着那个方向发展
现在用语音识别+clip试试?难度很大吧
好几个模型串接
应该可以的,先语音转文字,然后文字转图像。
可以实现,但是难点在于训练数据。
Deep Learning is all about embedding everything。
如果是文字和图像匹配,就是文本embedding,图像embedding,然后二者求余弦相似度等等作为loss.
如果是生成,就接生成模型,然后用实际图片做标签。
但是没有数据一切都是空谈,数据又要人工制作。。。