生成AIの評価手法〜LangChain, guidance, Azure AI Studioの比較・統合

note（ノート）

・2023/12/28

Picks

このまま本文を読む

本文を読む

選択しているユーザー

岩原盛一
フリーランスディレクター
・2024年02月14日
#生成AI評価手法 #生成AI

確かに従来の評価手法では難しそう。

注目のコメント

佐々木励
AI企業旅する魔法使い
・2023年12月28日
技術的にディープだけど大事なことをまとめました

生成AIを活用したアプリケーション開発が急増しています。そんな中、開発におけるプロンプト・チューニングの手法は広まりましたが、テストについての知見は情報が散在しています。

そこで、生成AIアプリケーションの開発ツールとして注目されている、LangChain, guidance, Azure AI Studioを比較しながら、ツールに依存しない評価手法として統合していきます。（GoogleのGenerative AI Studioも要注目ですが、現時点では評価機能が弱いので対象外）

なぜ生成AIアプリケーションの評価が重要なのか？
なにを評価するのか？
どのように評価するのか？
阿部務
某上場企業内部統制部門部長
・2023年12月28日
生成AIが統制行為に使われた場合（生成AIによるジャッジなどが会社としての正式かつ最後のジャッジに使われる場合）、内部統制の評価者としてはその生成AIの有効性を評価する必要があるのは以前から認識しています。

この記事にある観点は非常に参考になりますが、内部統制の評価という観点からすれば少し足りないところがある気がします。

内部統制評価だと、例えばITアプリケーションコントロールの評価の前提にITGCの有効性があったり、人間による統制行為（プロセスレベル）に対する評価の前提に全社的な内部統制の有効性があります。

生成AIをどちらで捉えるかも現時点では判断つきませんが、どちらかで捉えて、前提部分の有効性も評価しないといけないだろうな、とは思っています。
小峰弘雅
株式会社ベイカレント・コンサルティング／カーボンニュートラルチーム JDLA研究会「AIデータと個人情報保護」／副座長
・2023年12月28日
よくまとまっていて参考になる。
開発者向けに見えるけど、
ユーザーが色んなプロンプトを試す上でも役に立つ内容でした。

.css-5ddv2h{font-feature-settings:'palt';letter-spacing:0.06em;}生成AIの評価手法〜LangChain, guidance, Azure AI Studioの比較・統合

コメント

選択しているユーザー

注目のコメント

生成AIの評価手法〜LangChain, guidance, Azure AI Studioの比較・統合