
「AIの評価」ベンチマーク #2-2
カートのアイテムが多すぎます
ご購入は五十タイトルがカートに入っている場合のみです。
カートに追加できませんでした。
しばらく経ってから再度お試しください。
ウィッシュリストに追加できませんでした。
しばらく経ってから再度お試しください。
ほしい物リストの削除に失敗しました。
しばらく経ってから再度お試しください。
ポッドキャストのフォローに失敗しました
ポッドキャストのフォロー解除に失敗しました
-
ナレーター:
-
著者:
このコンテンツについて
AI Shift Academy(#シフアカ)
テーマ第2弾は「AIの評価」
かつて「人間らしさ」を問うたAI評価は、翻訳や要約など具体的なタスクの性能を競う時代へ。
そして、AI版センター試験とも言える「ベンチマーク」が登場し、開発競争が加速します。
今回の放送では、AI評価方法の歴史から、日本語特有のデータセット問題、そして国産ベンチマーク「JGLUE」の開発秘話までを深掘り!
ChatGPTの登場で評価の常識も激変し、今やAIがAIを評価する時代に…⁉
AI開発の裏側がわかる、知的好奇心をくすぐるエピソードです。ぜひお聴きください!
▼おたよりはこちらから
まだレビューはありません