173. なぜAIは平気でズルをするのか？

カートのアイテムが多すぎます

ご購入は五十タイトルがカートに入っている場合のみです。

カートに追加できませんでした。

しばらく経ってから再度お試しください。

ウィッシュリストに追加できませんでした。

しばらく経ってから再度お試しください。

ほしい物リストの削除に失敗しました。

しばらく経ってから再度お試しください。

ポッドキャストのフォローに失敗しました

ポッドキャストのフォロー解除に失敗しました

173. なぜAIは平気でズルをするのか？

無料で聴く

ポッドキャストの詳細を見る

このコンテンツについて

AI倫理と報酬ハッキングについて話しました。

目標設定の落とし穴 / AIがズルをする理由 / 報酬ハッキングとは何か / テトリスAIが永遠に終わらない裏技 / ロボットが“掴まない”ことで報酬を得た話 / 人間も同じ失敗をしている / 手段が目的化する瞬間 / ハック思考と前提条件の分解 / スタートアップで前提を外す重要性 / 倫理とイノベーションの境界線

# 参考

Learning from human preferences | OpenAI

https://openai.com/index/learning-from-human-preferences/

Reward hacking - Wikipedia

https://en.wikipedia.org/wiki/Reward_hacking

📮 お便りはこちらから

https://forms.gle/FjfvyGc9Ua8uBPR99

🐦 Twitter

https://twitter.com/HRM_09

📻ゴロゴロ起業ラジオ

https://open.spotify.com/show/7gw8wScrBTfiVdP6KTagsb

まだレビューはありません