Skip to main content

スピーカー

Dusanka Lecic(ドゥシャンカ)

略歴

ドゥシャンカは Levi9 IT Services 社でテストリード兼部門マネージャーを務めています。過去 9 年間、複数のプロジェクトに積極的に関わり、日々多彩な技術とツールを活用しています。知識を共有し、さまざまなテスト関連の取り組みをサポートすることを好みます。

また、工学博士(Ph.D. in Technical Science)として学術活動にも注力しており、学会向け論文や技術記事を多数執筆。ソフトウェア開発における最新トレンドとテストの重要性を継続的に発信しています。

発表について:
- 言語:英語

バグを超えて:チャットボットを効果的にテストするには

 

近年、私たちは多くの AI ツールがアプリケーションの構築とテストに与える影響を目の当たりにしました。しかし同時に、QA としては AI アプリケーションをどのようにテストすべきか を理解する必要があることも実感しています。従来のようにポジティブテストケースを 1 つ、ネガティブテストケースをいくつか用意するだけの手法は通用しません。生成 AI(GenAI)アプリケーションのテストは予測が難しく、まったく異なるアプローチが求められるのです。私たちはそれを的確に扱い、「テスト済みで高品質だ」とプロフェッショナルとして胸を張って言えるでしょうか?

本プレゼンテーションでは、チャットボットアプリケーションを例に、品質を保証するテスト手法とリスクの扱い方を明確に示します。Retrieval-Augmented Generation(RAG)アプリを題材に、

  • 実装方法
  • ベクターデータベースの活用法
  • 取得したコンテンツと生成したコンテンツの比較方法

を解説し、高品質なテスト結果を得る手順を示します。

さらに、テストプロセスを支援するエージェントやツールの活用に踏み込み、アプリケーションの文書を扱いやすいチャンクに分割して精査する手法を紹介します。生成内容の正確性と関連性を確保するうえで、ベクトル類似度検索 がいかに重要かも取り上げます。これらの高度な技術を駆使すれば、QA は AI アプリケーションを効果的にテストし、最高水準の品質と信頼性を確保できます。

最後に、GenAI テストと従来型アプリケーションのテストの違いを強調します。従来テストがあらかじめ定義されたポジティブ/ネガティブケースに依存するのに対し、GenAI テストでは予測不能な出力を扱いながら 論理的一貫性・事実の正確性・文脈の妥当性 を保証しなければなりません。そのためには、AI アプリケーションがもたらす固有の課題を管理する革新的なテスト戦略とツールが不可欠です。