重み減衰(weight decay)をAdamのモーメント更新から“切り離して”扱う最適化手法として最も適切なものはどれか。 AdamW X Facebook はてブ LINE Pinterest コピー 2025.12.30