狭义 LLMOps

狭义的LLMOps不包括大模型的训练，相关的项目应关注两点产品适应性:

LLMOps的初创公司主要关注LLM应用栈的开发,可以大致分为以下几类:

下面是一些符合上面要求的一些 LLMOps 平台

服务了 20 多家企业级客户，包括联合利华这样的公司。

内置版本控制和日志记录: 可以在Playground中进行实验，并记录每次的变化和修改，以便跟踪模型的演化过程。
试验新的提示、模型和超参数设置: 在Playground中尝试不同的提示文本、模型架构和超参数设置，以寻找最佳的组合。
使用NLP指标、基于LLM的评估模块、单元测试和人工反馈: 使用自然语言处理（NLP）指标对模型性能进行评估，利用基于语言模型的评估模块，执行单元测试以确保模型质量，并结合人工反馈进行优化。
测试提示模型变体: 针对专有数据集测试不同的提示模型变体，以确定哪种模型变体在特定任务上表现最佳。
可视化自定义指标、比较数据切片、检测异常: 可以根据需要定制指标并对其进行可视化，比较不同数据切片的性能，识别异常情况。
找到改进生产中模型的方法: 通过检测最终用户与软件开发工具包（SDK）的交互，找到改进生产中模型的方法。
微调所有主要模型提供商的自定义模型: 通过微调各种主要模型提供商的自定义模型，优化模型的成本、延迟和性能。
添加对生产数据的更正: 在生产环境中，可以轻松添加对实际生产数据的更正，以提高模型的准确性。
被动收集高质量数据集: 通过被动地收集高质量数据集，用于进一步的微调和模型蒸馏（distillation）。

是一种无代码工具，允许使用 ChatGPT 等模型设计、测试和部署 AI 工作流程，设计并测试工作流程后，可以一键将其部署为 API，此外还可以优化提示、收集数据并微调 LLM 工作流程，已经有付费企业用户在使用了。

狭义LLMOps