이것은 인터랙티브 노트북입니다. 로컬에서 실행하거나 아래 링크를 사용할 수 있습니다:
Not Diamond를 사용한 LLM 프롬프트 커스텀 라우팅
이 노트북은 Weave를 다음과 함께 사용하는 방법을 보여줍니다 Not Diamond의 커스텀 라우팅 평가 결과를 기반으로 LLM 프롬프트를 가장 적합한 모델로 라우팅합니다.프롬프트 라우팅
복잡한 LLM 워크플로우를 구축할 때 사용자는 정확도, 비용 또는 호출 지연 시간에 따라 다른 모델에 프롬프트를 보내야 할 수 있습니다. 사용자는 Not Diamond를 사용하여 이러한 워크플로우에서 프롬프트를 필요에 맞는 적절한 모델로 라우팅하여 정확도를 최대화하면서 모델 비용을 절감할 수 있습니다. 어떤 데이터 분포에서도 단일 모델이 모든 쿼리에서 다른 모든 모델보다 우수한 성능을 보이는 경우는 드뭅니다. 여러 모델을 결합하여 각 LLM을 언제 호출할지 학습하는 “메타 모델”을 만들면 개별 모델의 성능을 능가하고 비용과 지연 시간까지 줄일 수 있습니다.커스텀 라우팅
프롬프트용 커스텀 라우터를 훈련시키려면 세 가지가 필요합니다:- LLM 프롬프트 세트: 프롬프트는 문자열이어야 하며 애플리케이션에서 사용되는 프롬프트를 대표해야 합니다.
- LLM 응답: 각 입력에 대한 후보 LLM의 응답입니다. 후보 LLM에는 지원되는 LLM과 사용자 정의 모델이 모두 포함될 수 있습니다.
- 후보 LLM의 입력에 대한 응답 평가 점수: 점수는 숫자이며, 필요에 맞는 어떤 메트릭이든 될 수 있습니다.
훈련 데이터 설정
실제로는 자체 평가를 사용하여 커스텀 라우터를 훈련시킬 것입니다. 그러나 이 예제 노트북에서는 the HumanEval 데이터셋에 대한 LLM 응답을 사용하여 코딩 작업을 위한 커스텀 라우터를 훈련시킬 것입니다. 먼저 이 예제를 위해 준비한 데이터셋을 다운로드한 다음, 각 모델에 대한 LLM 응답을 EvaluationResults로 파싱합니다.커스텀 라우터 훈련
이제 EvaluationResults가 있으므로 커스텀 라우터를 훈련시킬 수 있습니다. 계정 생성과 API 키 생성을 확인한 다음, 아래에 API 키를 입력하세요.


커스텀 라우터 평가
커스텀 라우터를 훈련시킨 후에는 다음을 평가할 수 있습니다- 훈련 프롬프트를 제출하여 샘플 내 성능을 평가하거나,
- 새로운 프롬프트나 보류된 프롬프트를 제출하여 샘플 외 성능을 평가
