关于教程《零基础实践深度学习》中的一处疑问
收藏
如题,在教程《零基础实践深度学习》中第7.2节“Transfomer网络结构”中,图2下方的表述:
模型在处理输入xi时,先计算其它输入对xi的影响(qj⋅ki),用αij表示
是否有误?是否应该是:
(qi⋅kj)
0
收藏
请登录后评论
在线等