WeaveDocumentation Index
Fetch the complete documentation index at: https://wb-21fd5541-feature-automate-reference-docs-generation.mintlify.app/llms.txt
Use this file to discover all available pages before exploring further.
Datasetは、LLMアプリケーション評価のための例を整理、収集、追跡、バージョン管理して簡単に比較できるようにします。プログラムでもUIでもDatasetを作成して操作できます。
このページでは以下について説明します:
- PythonとTypeScriptでの基本的な
Dataset操作と始め方 - PythonとTypeScriptで
Datasetを作成する方法(Weave calls - UIで
Datasetで利用可能な操作
Datasetクイックスタート
以下のコードサンプルは、PythonとTypeScriptを使用して基本的なDataset操作を実行する方法を示しています。SDKを使用して、以下のことができます:
- を作成する
Dataset - を公開する
Dataset - を取得する
Dataset - 内の特定の例にアクセスする
Dataset
- Python
- TypeScript
他のオブジェクトからDatasetを作成する
- Python
- TypeScript
Pythonでは、次に、
Datasetは、Weave callsなどの一般的なWeaveオブジェクトや、pandas.DataFrameなどのPythonオブジェクトからも構築できます。この機能は、特定の例から例のDatasetを作成したい場合に便利です。Weave call
1つまたは複数のWeave callからDatasetを作成するには、コールオブジェクトを取得し、from_callsメソッドのリストに追加します。Pandas DataFrame
PandasDatasetオブジェクトからDataFrameを作成するには、from_pandasメソッドを使用します。を元に戻すには、Datasetを使用しますto_pandas。Hugging Face Datasets
Hugging FaceDatasetまたはdatasets.Datasetオブジェクトからdatasets.DatasetDictを作成するには、まず必要な依存関係がインストールされていることを確認してください:from_hfメソッドを使用します。複数の分割(「train」、「test」、「validation」など)を持つDatasetDictを提供すると、Weaveは自動的に「train」分割を使用し、警告を発します。「train」分割が存在しない場合は、エラーが発生します。特定の分割を直接提供することもできます(例:hf_dataset_dict['test'])。を Hugging Face weave.Datasetに戻すには、Datasetメソッドを使用しますto_hf。UIでDatasetを作成、編集、削除する
UIでDatasetを作成、編集、削除できます。
新しいDataset
- 編集したいWeaveプロジェクトに移動します。
- サイドバーでTracesを選択します。
-
新しい
Datasetを作成したい1つまたは複数のコールを選択します。 - 右上のメニューで、Add selected rows to a datasetアイコン(ゴミ箱アイコンの隣にあります)をクリックします。
- 表示されるChoose a datasetドロップダウンから、Create newを選択します。Dataset nameフィールドが表示されます。
- Dataset nameフィールドに、データセットの名前を入力します。Configure dataset fieldsのオプションが表示されます。 :::important データセット名は文字または数字で始まり、文字、数字、ハイフン、アンダースコアのみを含むことができます。 :::
-
(任意)Configure dataset fieldsで、データセットに含めるコールからのフィールドを選択します。
- 選択した各フィールドの列名をカスタマイズできます。
- 新しい
Datasetに含めるフィールドのサブセットを選択したり、すべてのフィールドの選択を解除したりできます。
-
データセットフィールドの設定が完了したら、Nextをクリックします。新しい
Datasetのプレビューが表示されます。 - (任意)Dataset内の編集可能なフィールドをクリックして、エントリを編集します。
- Create datasetをクリックします。新しいデータセットが作成されます。
-
確認ポップアップで、View the datasetをクリックして、新しい
Datasetを表示します。または、Datasetsタブに移動します。
編集するDataset
-
編集したい
Datasetを含むWeaveプロジェクトに移動します。 -
サイドバーからDatasetsを選択します。利用可能な
Datasetが表示されます。
-
Object列で、編集したい
Datasetの名前とバージョンをクリックします。Datasetの名前、バージョン、作成者、Dataset行などの情報を表示するポップアウトモーダルが表示されます。
-
モーダルの右上隅にあるEdit datasetボタン(鉛筆アイコン)をクリックします。+ Add rowボタンがモーダルの下部に表示されます。
-
&#xNAN;+ Add rowをクリックします。既存の
Dataset行の上部に緑色の行が表示され、Datasetに新しい行を追加できることを示します。
-
新しい行にデータを追加するには、その行内の目的の列をクリックします。デフォルトのid列は
Dataset行では編集できません。Weaveが作成時に自動的に割り当てるためです。Text、Code、およびDiffのフォーマットオプションを含む編集モーダルが表示されます。
-
新しい行でデータを追加したい各列に対してステップ6を繰り返します。
-
Datasetに追加したい各行に対してステップ5を繰り返します。 -
編集が完了したら、モーダルの右上隅にある
DatasetをPublishをクリックして公開します。または、変更を公開したくない場合はCancelをクリックします。
公開すると、更新された行を含む新しいバージョンのDatasetがUIで利用可能になります。
削除するDataset
-
編集したい
Datasetを含むWeaveプロジェクトに移動します。 -
サイドバーからDatasetsを選択します。利用可能な
Datasetが表示されます。 -
Object列で、削除したい
Datasetの名前とバージョンをクリックします。Datasetの名前、バージョン、作成者、Dataset行などの情報を表示するポップアウトモーダルが表示されます。 -
モーダルの右上隅にあるゴミ箱アイコンをクリックします。
Datasetの削除を確認するポップアップモーダルが表示されます。
-
ポップアップモーダルで、赤いDeleteボタンをクリックして
Datasetを削除します。または、CancelをクリックしてDatasetを削除しないようにします。 これでDatasetは削除され、WeaveダッシュボードのDatasetsタブに表示されなくなります。
新しい例を追加するDataset
- 編集したいWeaveプロジェクトに移動します。
- サイドバーでTracesを選択します。
-
新しい例を作成したい
Datasetsを持つ1つ以上のコールを選択します。 - 右上のメニューで、Add selected rows to a datasetアイコン(ゴミ箱アイコンの隣にあります)をクリックします。オプションで、Show latest versionsをオフに切り替えて、利用可能なすべてのデータセットのすべてのバージョンを表示します。
-
Choose a datasetドロップダウンから、例を追加したい
Datasetを選択します。Configure field mappingのオプションが表示されます。 - (任意)Configure field mappingで、コールからのフィールドと対応するデータセット列のマッピングを調整できます。
-
フィールドマッピングの設定が完了したら、Nextをクリックします。新しい
Datasetのプレビューが表示されます。 - 空の行(緑色)に、新しい例の値を追加します。idフィールドは編集できず、Weaveによって自動的に作成されることに注意してください。
- Add to datasetをクリックします。または、Configure field mapping画面に戻るには、Backをクリックします。
-
確認ポップアップで、View the datasetをクリックして変更を確認します。または、Datasets タブをクリックして、あなたの
Dataset.
その他のデータセット操作
- Python
- TypeScript