ぼっちエンジニアのWeb工房

RLHF（Reinforcement Learning from Human Feedback）の説明として最も適切なものはどれか。

RLHF

X Facebook はてブ LINE Pinterest コピー

2025.12.30

シェアする

X Facebook はてブ LINE Pinterest コピー

Siro-Yamanekoをフォローする

関連記事

データ拡張

noising（ノイズ付与）が狙う一般的効果として最も適切なのはどれか。

ε-greedy方策の説明として適切なものはどれか。

モデル評価

混同行列における「偽陰性（FN）」の説明として適切なものはどれか。

KLダイバージェンス

KLダイバージェンスの定義として最も適切なものはどれか。

ミニバッチの性質

ミニバッチサイズを小さくすると一般に起こりやすい影響として最も適切なものはどれか。

少量の画像データで分類器を作りたい。ImageNet等の事前学習モデルを流用して学習する代表的アプローチはどれか。

BERTの学習・利用の特徴として最も適切なものはどれか。

融資審査モデルで「郵便番号」を特徴量に入れたところ、特定集団に不利な判定が増えた。公平性の観点で最も本質的な懸念はどれか。

検索

最近の投稿

最近のコメント

表示できるコメントはありません。

アーカイブ

表示するアーカイブはありません。

カテゴリー

カテゴリーなし

ぼっちエンジニアのWeb工房

© 2026 ぼっちエンジニアのWeb工房.

ホーム
検索
トップ
サイドバー

タイトルとURLをコピーしました