损失出现在最后,后面的层训练较快
数据在最底部
底部的层训练较慢
底部层一变化,所有都得跟着变
最后的那些层需要重新学习多次
导致收敛变慢
批量归一化
2025/4/28
加载过慢请开启缓存 浏览器默认开启
损失出现在最后,后面的层训练较快
数据在最底部
底部的层训练较慢
底部层一变化,所有都得跟着变
最后的那些层需要重新学习多次
导致收敛变慢