Skip to main content

スピーカー

Galina Naydenova (ガリーナ・ナイデノワ)

バイオグラフィー

インパクトスタートアップ、教育機関、NGOと連携する、経験豊富で有能な機械学習エンジニア兼AIコンサルタントです。 テクノロジーと教育の分野で20年以上の経験を持ち、生涯学習と開発に力を入れています。 彼女は英国高等教育アカデミーの特別会員であり、学習分析と自然言語処理の分野で複数の論文の共著者です。 現在は東京を拠点として、世界最大級のインパクトプラットフォームの一つであるOmdenaの日本支部のリーダーを務めており、テクノロジーと AI の力を借りて、チームが協力して地球規模の問題の解決策を見つけています。

プレゼンテーション

大規模言語モデルの評価とアプリケーションの品質確保

 

大規模言語モデル (LLM) の出力の評価には常に困難がつきまといます。理由は、それが複雑なコンポーネント群で構成されていることと、品質に複数の評価軸が存在することです。 信頼性の高い出力とユーザー体験を実現するためには、ベンチマーク、フレームワーク、メトリクス、そして人間によるフィードバックを上手く使うことが肝要です。