AIGC Weekly #48

🔗 原文链接： https://quail.ink/op7418/p/aigc-wee...

时间：27 Nov, 2023

common.docs_name - LarkCCM_Docs_Menu_Image

提示词：close up of a green banana leaf, light green and light amber, sigma 35mm f/1.4 dg hsm art, environmentally inspired. --ar 16:9 --style 8YHZ0RGqm 💎查看更多风格和提示词

❤️上周精选

Stability AI发布视频生成模型 Stable Video Diffusion

上周Stability AI发布了他们预告了很久的视频生成模型，并且开源了相关模型的权重，从Stability AI发布的测试结果看 SVD 的效果在外部评估中超过了 Runway 和 Pika 这类目前最先进的视频模型。​

我第一时间一进行了测试，从测试结果来看确实非常好，画面内容的运动非常自然，并且可以自己判断哪些内容应该进行运动，同时视频清晰度也可以保证。

但是目前发布的权重文件还有一些问题，包括硬件要求相较于 Animatediff 等还是太高，同时视频生成时优先倾向于进行镜头的移动。​

不过Stability AI的 CEO 说这周会发布更多的权重文件来解决镜头移动的问题。​

你现在可以在这个 Colab 链接上尝试 SVD：https://colab.research.google.com/github/mkshing/notebooks/blob/main/stable_video_diffusion_img2vid.ipynb

如果你的电脑显存够的话也可以使用这个 Comfyui 的工作流在本地尝试：https://comfyanonymous.github.io/ComfyUI_examples/video/

Anthropic发布Claude 2.1

上周在与 Open AI 的合并邀请中Anthropic非常稳健的发布了Claude 2.1模型，Claude 2.1升级主要包括下面几个方面200K Token 的上下文窗口、模型幻觉率的显着降低、系统提示以及新测试功能：工具使用。​

200K 上下文窗口 ：限制为 200,000 个Token，即大约 150,000 个单词或超过 500 页的材料。用户现在可以上传整个代码库等技术文档、S-1 等财务报表，甚至是《伊利亚特》或《奥德赛》等长篇文学作品。通过能够与大量内容或数据进行交互，Claude 可以进行总结、执行问答、预测趋势、比较和对比多个文档等等。​

模型幻觉显著降低 ：与之前的 Claude 2.0 模型相比，虚假陈述减少了 2 倍。这使企业能够构建高性能的人工智能应用程序，解决具体的业务问题，并以更高的信任度和可靠性在其运营中部署人工智能。Claude 2.1 在理解和总结方面也做出了有意义的改进，特别是对于需要高精度的长而复杂的文档，例如法律文件、财务报告和技术规范。在评估中，Claude 2.1 证明错误答案减少了 30%，并且错误地得出文档支持特定主张的比率降低了 3-4 倍。​

API工具使用 ：Claude 现在可以跨开发人员定义的函数或 API 进行编排、搜索网络资源以及从私有知识库检索信息。用户可以定义一组工具供 Claude 使用并指定请求。然后，模型将决定需要哪种工具来完成任务并代表他们执行操作。​

系统提示 ：允许用户向 Claude 提供自定义指令以提高性能。系统提示设置有用的上下文，增强Claude承担特定个性和角色的能力，或以更可定制、符合用户需求的一致方式构建响应。​

关于上下文的问题Greg Kamradt针对 Claude 的 200K 上下文和 GPT-4 的 128K 上下文进行了一些测试获得了一些有趣的结果。Claude离追上 GPT-4 还有很长的路要走啊。图片来自 LatentSpace 的本地化。

Claude 2 的测试结果：

1.
上下文长度小于24K时效果最好，几乎不会有信息遗忘​

2.
上下文长度超过24K就开始变差，90K后，效果很差，一大半信息会遗忘​

3.
最头部和最顶部的1%效果最好，不会被遗忘​

GPT-4 的测试结果：

1.
在上下文长度小于 73K Tokens时，不会有信息遗忘​

2.
在上下文长度超出 73K 后，位于中间7%-50% 区间的信息可能会被遗忘​

AIGC Weekly #48 ​

AIGC Weekly #48