dspy.Evaluate
dspy.Evaluate(*, devset: List[dspy.Example], metric: Optional[Callable] = None, num_threads: Optional[int] = None, display_progress: bool = False, display_table: Union[bool, int] = False, max_errors: int = 5, return_all_scores: bool = False, return_outputs: bool = False, provide_traceback: Optional[bool] = None, failure_score: float = 0.0, **kwargs)
DSPy Evaluate 类。
此类用于评估 DSPy 程序的性能。用户需要提供评估数据集和指标函数才能使用此类。此类支持在提供的数据集上进行并行评估。
参数
名称 | 类型 | 描述 | 默认值 |
---|---|---|---|
devset
|
List[Example]
|
评估数据集。 |
必需 |
metric
|
Callable
|
用于评估的指标函数。 |
None
|
num_threads
|
Optional[int]
|
用于并行评估的线程数。 |
None
|
display_progress
|
bool
|
是否在评估期间显示进度。 |
False
|
display_table
|
Union[bool, int]
|
是否以表格形式显示评估结果。如果传入一个数字,评估结果将在此数量之前被截断显示。 |
False
|
max_errors
|
int
|
在停止评估前允许的最大错误数。 |
5
|
return_all_scores
|
bool
|
是否返回 |
False
|
return_outputs
|
bool
|
是否返回 |
False
|
provide_traceback
|
Optional[bool]
|
评估期间是否提供跟踪信息。 |
None
|
failure_score
|
float
|
如果评估因异常失败而使用的默认分数。 |
0.0
|
源代码在 dspy/evaluate/evaluate.py
中
函数
__call__(program: dspy.Module, metric: Optional[Callable] = None, devset: Optional[List[dspy.Example]] = None, num_threads: Optional[int] = None, display_progress: Optional[bool] = None, display_table: Optional[Union[bool, int]] = None, return_all_scores: Optional[bool] = None, return_outputs: Optional[bool] = None, callback_metadata: Optional[dict[str, Any]] = None)
参数
名称 | 类型 | 描述 | 默认值 |
---|---|---|---|
program
|
模块
|
要评估的 DSPy 程序。 |
必需 |
metric
|
Callable
|
用于评估的指标函数。如果未提供,则使用 |
None
|
devset
|
List[Example]
|
评估数据集。如果未提供,则使用 |
None
|
num_threads
|
Optional[int]
|
用于并行评估的线程数。如果未提供,则使用 |
None
|
display_progress
|
bool
|
是否在评估期间显示进度。如果未提供,则使用 |
None
|
display_table
|
Union[bool, int]
|
是否以表格形式显示评估结果。如果未提供,则使用 |
None
|
return_all_scores
|
bool
|
是否返回 |
None
|
return_outputs
|
bool
|
是否返回 |
None
|
callback_metadata
|
dict
|
用于评估回调处理程序的元数据。 |
None
|
返回值
类型 | 描述 |
---|---|
评估结果根据标志以不同格式返回 |
|
|
|
|
|
|
|
|
源代码在 dspy/evaluate/evaluate.py
中
91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 |
|