分享
AIGC Weekly #66
输入“/”快速插入内容
AIGC Weekly #66
🔗 原文链接:
https://quail.ink/op7418/p/aigc-wee...
作者:
歸藏
Midjourney提示词:smooth blurry dark blue gradient --ar 16:9 --style raw --stylize 0
💎查看更多风格和提示词
上周精选 ✦
Open AI 发力模型定制
OpenAI又有动作了,推出了一系列新功能和程序,让开发者在微调和创建定制模型时有更多的控制权和灵活性。
主要功能包括:
•
在每个训练周期中保存完整的微调模型检查点,这可以显著减少后续重训练的需要,尤其是在模型出现过拟合时尤为重要。
•
引入了一种全新的并排比较式Playground界面,它允许开发者在单个提示下,直观地比较和评估不同模型或微调状态的输出质量和性能。
•
支持与第三方平台(本周起首先与Weights and Biases合作)集成,使开发者能够将详细的微调数据与他们使用的其他技术栈共享。
•
每个训练周期结束时,将通过验证数据集(而非之前的样本批次)计算得到的性能指标,如token损失和准确率,从而更好地展示模型性能并提供关于模型泛化能力的反馈。
•
现在,开发者可以直接在Dashboard上配置可用的超参数,而不再局限于仅通过API或软件开发工具包(SDK)进行设置。
•
对微调Dashboard进行了多项改进,包括配置超参数的功能,查看更详细的训练度量,以及能够根据先前的配置重新运行任务。
Cohere推出了大型语言模型Command R+
专为企业级工作负载设计,优化了高级检索增强生成(RAG)功能,以减少错误生成,并支持10种关键语言的多语言覆盖。
详细信息:
在 Command R+ 中,新增了多步骤工具使用功能,允许模型在多个步骤中结合多种工具来完成困难的任务。
Command R+ 甚至可以在尝试使用工具但失败时(例如遇到工具中的错误或故障时)进行自我纠正,使模型可以多次尝试完成任务,提高成功率。
Command R+ 针对高级 RAG 进行了优化,新模型提高了响应的准确性,并提供可减少幻觉的在线引用。
Command R+首先在Microsoft Azure上提供,不久后也将在Oracle Cloud Infrastructure (OCI)以及未来几周内的其他云平台上提供。