Dataset
s는 LLM 애플리케이션 평가를 위한 예제를 구성, 수집, 추적 및 버전 관리하여 쉽게 비교할 수 있도록 도와줍니다. 프로그래밍 방식으로 또는 UI를 통해 Dataset
s를 생성하고 상호 작용할 수 있습니다.
이 페이지에서는 다음을 설명합니다:
- 기본
Dataset
Python 및 TypeScript의 작업 및 시작 방법 - Python 및 TypeScript에서
Dataset
생성 방법 및 Weave calls - UI에서
Dataset
에 사용 가능한 작업
Dataset
quickstart
다음 코드 샘플은 Python 및 TypeScript를 사용하여 기본 Dataset
작업을 수행하는 방법을 보여줍니다. SDK를 사용하여 다음을 수행할 수 있습니다:
- 생성
Dataset
- 게시
Dataset
- 검색
Dataset
- 특정 예제에 접근
Dataset
다른 객체에서 Dataset
생성
Python에서 그런 다음
Dataset
s는 Weave calls와 같은 일반적인 Weave 객체와 pandas.DataFrame
s와 같은 Python 객체에서도 구성할 수 있습니다. 이 기능은 특정 예제에서 예제 Dataset
를 생성하려는 경우에 유용합니다.Weave call
하나 이상의 Weave 호출에서Dataset
를 생성하려면 호출 객체를 검색하고 from_calls
메서드의 목록에 추가하세요.Pandas DataFrame
PandasDataset
객체에서 DataFrame
객체를 생성하려면 from_pandas
메서드를 사용하세요.다시 Dataset
를 변환하려면 to_pandas
를 사용하세요.Hugging Face Datasets
Hugging FaceDataset
또는 datasets.Dataset
또는 datasets.DatasetDict
객체에서 생성하려면 먼저 필요한 종속성이 설치되어 있는지 확인하세요:from_hf
메서드를 사용하세요. 여러 분할(‘train’, ‘test’, ‘validation’ 등)이 있는 DatasetDict
를 제공하면 Weave는 자동으로 ‘train’ 분할을 사용하고 경고를 발생시킵니다. ‘train’ 분할이 없으면 오류가 발생합니다. 특정 분할을 직접 제공할 수 있습니다(예: hf_dataset_dict['test']
).를 Hugging Face weave.Dataset
를 다시 Hugging Face Dataset
로 변환하려면 to_hf
메서드를 사용하세요.UI에서 Dataset
생성, 편집 및 삭제
UI에서 Dataset
s를 생성, 편집 및 삭제할 수 있습니다.
새 Dataset
- 편집하려는 Weave 프로젝트로 이동하세요.
- 사이드바에서 Traces를 선택하세요.
-
새
Dataset
를 생성하려는 하나 이상의 호출을 선택하세요. - 오른쪽 상단 메뉴에서 Add selected rows to a dataset 아이콘(휴지통 아이콘 옆에 위치)을 클릭하세요.
- 다음의 Choose a dataset 드롭다운에서 Create new를 선택하세요. Dataset name 필드가 나타납니다.
- 다음의 Dataset name 필드에 데이터셋 이름을 입력하세요. Configure dataset fields 옵션이 나타납니다. :::important 데이터셋 이름은 문자나 숫자로 시작해야 하며 문자, 숫자, 하이픈 및 밑줄만 포함할 수 있습니다. :::
-
(선택 사항) Configure dataset fields에서 데이터셋에 포함할 호출의 필드를 선택하세요.
- 선택한 각 필드의 열 이름을 사용자 지정할 수 있습니다.
- 새
Dataset
에 포함할 필드의 하위 집합을 선택하거나 모든 필드를 선택 해제할 수 있습니다.
-
데이터셋 필드 구성을 완료한 후 Next를 클릭하세요. 새
Dataset
의 미리보기가 나타납니다. - (선택 사항) Dataset에서 편집 가능한 필드를 클릭하여 항목을 편집하세요.
- 다음의 Create dataset를 클릭하세요. 새 데이터셋이 생성됩니다.
-
확인 팝업에서 View the dataset를 클릭하여 새
Dataset
를 확인하세요. 또는 Datasets 탭으로 이동하세요.
다음을 편집하세요 Dataset
-
편집하려는
Dataset
가 포함된 Weave 프로젝트로 이동하세요. -
사이드바에서 Datasets를 선택하세요. 사용 가능한
Dataset
가 표시됩니다. -
다음의 Object 열에서 편집하려는
Dataset
의 이름과 버전을 클릭하세요.Dataset
의 이름, 버전, 작성자 및Dataset
행과 같은 정보를 보여주는 팝업 모달이 표시됩니다. -
모달의 오른쪽 상단 모서리에서 Edit dataset 버튼(연필 아이콘)을 클릭하세요. + Add row 버튼이 모달 하단에 표시됩니다.
-
다음의 + Add row를 클릭하세요. 기존
Dataset
행 상단에 녹색 행이 표시되어Dataset
에 새 행을 추가할 수 있음을 나타냅니다. -
새 행에 데이터를 추가하려면 해당 행 내에서 원하는 열을 클릭하세요. 기본 id 열은
Dataset
행에서 편집할 수 없으며, Weave가 생성 시 자동으로 할당합니다. Text, Code, 및 Diff 옵션이 있는 편집 모달이 나타납니다. -
새 행에서 데이터를 추가하려는 각 열에 대해 6단계를 반복하세요.
-
다음에 추가하려는 각 행에 대해 5단계를 반복하세요
Dataset
. -
편집을 마치면
Dataset
를 게시하려면 모달의 오른쪽 상단 모서리에 있는 Publish를 클릭하세요. 또는 변경 사항을 게시하지 않으려면 Cancel를 클릭하세요.게시되면 업데이트된 행이 있는
Dataset
의 새 버전을 UI에서 사용할 수 있습니다.
다음을 삭제하세요 Dataset
-
편집하려는
Dataset
가 포함된 Weave 프로젝트로 이동하세요. -
사이드바에서 Datasets를 선택하세요. 사용 가능한
Dataset
가 표시됩니다. -
다음의 Object 열에서 삭제하려는
Dataset
의 이름과 버전을 클릭하세요.Dataset
의 이름, 버전, 작성자 및Dataset
행과 같은 정보를 보여주는 팝업 모달이 표시됩니다. -
모달의 오른쪽 상단 모서리에서 휴지통 아이콘을 클릭하세요.
다음의 삭제를 확인하라는 팝업 모달이 표시됩니다
Dataset
. -
팝업 모달에서 빨간색 Delete 버튼을 클릭하여
Dataset
를 삭제하세요. 또는 Cancel를 클릭하여Dataset
를 삭제하지 마세요. 이제Dataset
가 삭제되어 Weave 대시보드의 Datasets 탭에서 더 이상 볼 수 없습니다.
다음에 새 예제를 추가하세요 Dataset
- 편집하려는 Weave 프로젝트로 이동하세요.
- 사이드바에서 Traces를 선택하세요.
-
새 예제를 만들려는
Datasets
가 있는 하나 이상의 호출을 선택하세요. - 오른쪽 상단 메뉴에서 Add selected rows to a dataset 아이콘(휴지통 아이콘 옆에 위치)을 클릭하세요. 선택적으로 Show latest versions를 끄면 사용 가능한 모든 데이터셋의 모든 버전을 표시할 수 있습니다.
-
다음의 Choose a dataset 드롭다운에서 예제를 추가하려는
Dataset
를 선택하세요. Configure field mapping 옵션이 표시됩니다. - (선택 사항) Configure field mapping에서 호출의 필드를 해당 데이터셋 열에 매핑하는 방식을 조정할 수 있습니다.
-
필드 매핑 구성을 완료한 후 Next를 클릭하세요. 새
Dataset
의 미리보기가 나타납니다. - 빈 행(녹색)에 새 예제 값을 추가하세요. id 필드는 편집할 수 없으며 Weave에 의해 자동으로 생성됩니다.
- 다음의 Add to dataset를 클릭하세요. 또는 Configure field mapping 화면으로 돌아가려면 Back를 클릭하세요.
-
확인 팝업에서 View the dataset를 클릭하여 변경 사항을 확인하세요. 또는 Datasets 탭을 클릭하여 업데이트 내용을 확인하세요
Dataset
.