了解可观测性
可以通过多种方式来衡量生成 AI 的响应质量。 一般情况下,可以考虑三个维度来评估和监视生成 AI。 这些包括:
- 性能和质量评估器:评估生成的内容的准确性、基础性和相关性。
- 风险和安全评估程序:评估与 AI 生成的内容相关的潜在风险,以防范内容风险。 这包括评估 AI 系统生成有害或不适当内容的倾向。
- 自定义评估器:符合特定需求和目标的行业特定指标。
Azure AI Foundry 支持 可观测 性功能,这些功能可提高生成 AI 响应的性能和可信度。 评估器 是 Azure AI Foundry 中的专用工具,用于衡量 AI 响应的质量、安全性和可靠性。
一些评估者包括:
- 基础性:衡量响应与检索的上下文的一致程度。
- 相关性:衡量响应与查询相关的程度。
- 流畅性:衡量自然语言质量和可读性。
- 一致性:测量逻辑一致性和响应流。
- 内容安全:全面评估各种安全问题。
接下来,让我们在 Azure AI Foundry 门户中试用生成 AI 功能。