大規模モデルの出力分布(ソフトターゲット)を教師として、小規模モデルを学習させる手法として最も適切なのはどれか。 知識蒸留 X Facebook はてブ LINE Pinterest コピー 2025.12.30