これはインタラクティブなノートブックです。ローカルで実行するか、以下のリンクを使用できます:
を使用した評価でのHuggingFace Datasetsの使用preprocess_model_input
Note: This is a temporary workaround
このガイドでは、Weave評価でHuggingFace Datasetsを使用するための回避策を示します。
このプロセスを簡素化するためのよりシームレスな統合の開発に積極的に取り組んでいます。
このアプローチは機能しますが、外部データセットの操作をより簡単にする改善と更新が近い将来に期待できます。
セットアップとインポート
まず、Weaveを初期化し、実験を追跡するためにWeights & Biasに接続します。HuggingFaceデータセットの読み込みと準備
- HuggingFaceデータセットを読み込みます。
- データセットの行を参照するためのインデックスマッピングを作成します。
- このインデックスアプローチにより、元のデータセットへの参照を維持できます。
Note:
インデックスでは、hf_hub_name
とhf_id
をエンコードして、各行に一意の識別子があることを確認します。
この一意のダイジェスト値は、評価中に特定のデータセットエントリを追跡および参照するために使用されます。
処理と評価関数の定義
Processing pipeline
preprocess_example
:インデックス参照を評価に必要な実際のデータに変換しますhf_eval
:モデル出力のスコア付け方法を定義しますfunction_to_evaluate
: 評価される実際の関数/モデル
評価の作成と実行
- hf_indexの各インデックスに対して:
preprocess_example
HFデータセットから対応するデータを取得します。- 前処理されたデータは
function_to_evaluate
. - 出力は
hf_eval
. - 結果はWeaveで追跡されます。