Testing and Evaluation
# 测试与评估
# 示例
这里 (opens new window) 提供了一个客户支持代理的集成测试示例。
该示例对应于第一级:单元测试 (opens new window)。
# 推荐阅读
- 你的 AI 产品需要评估 (opens new window)
- 创建一个推动业务成果的 LLM 评判模型 (opens new window)
- RAG 管道评估实用指南(第一部分:检索) (opens new window)
- RAG 管道评估实用指南(第二部分:生成) (opens new window)
- 金标准数据集对 LLM 评估有多重要? (opens new window)
- 案例研究:基于参考和无参考的 RAG 管道评估 (opens new window)
- 如何评估复杂的生成式 AI 应用:细化方法 (opens new window)
- 生成合成数据以测试 LLM 应用 (opens new window)
更多信息即将发布。
编辑 (opens new window)
上次更新: 2025/04/01, 01:48:12