分享
AIGC Weekly #48
输入“/”快速插入内容
AIGC Weekly #48
🔗 原文链接:
https://quail.ink/op7418/p/aigc-wee...
时间:27 Nov, 2023
提示词:close up of a green banana leaf, light green and light amber, sigma 35mm f/1.4 dg hsm art, environmentally inspired. --ar 16:9 --style 8YHZ0RGqm
💎查看更多风格和提示词
❤️上周精选
Stability AI发布视频生成模型 Stable Video Diffusion
上周Stability AI发布了他们预告了很久的视频生成模型,并且开源了相关模型的权重,从Stability AI发布的测试结果看 SVD 的效果在外部评估中超过了 Runway 和 Pika 这类目前最先进的视频模型。
我第一时间一进行了测试,从
测试结果来看
确实非常好,画面内容的运动非常自然,并且可以自己判断哪些内容应该进行运动,同时视频清晰度也可以保证。
但是目前发布的权重文件还有一些问题,包括硬件要求相较于 Animatediff 等还是太高,同时视频生成时优先倾向于进行镜头的移动。
不过Stability AI的 CEO 说这周会发布更多的权重文件来解决镜头移动的问题。
你现在可以在这个 Colab 链接上尝试 SVD:
https://colab.research.google.com/github/mkshing/notebooks/blob/main/stable_video_diffusion_img2vid.ipynb
如果你的电脑显存够的话也可以使用这个 Comfyui 的工作流在本地尝试:
https://comfyanonymous.github.io/ComfyUI_examples/video/
Anthropic发布Claude 2.1
上周在与 Open AI 的合并邀请中Anthropic非常稳健的发布了Claude 2.1模型,Claude 2.1升级主要包括下面几个方面200K Token 的上下文窗口、模型幻觉率的显着降低、系统提示以及新测试功能:工具使用。
200K 上下文窗口
:限制为 200,000 个Token,即大约 150,000 个单词或超过 500 页的材料。用户现在可以上传整个代码库等技术文档、S-1 等财务报表,甚至是《伊利亚特》或《奥德赛》等长篇文学作品。通过能够与大量内容或数据进行交互,Claude 可以进行总结、执行问答、预测趋势、比较和对比多个文档等等。
模型幻觉显著降低
:与之前的 Claude 2.0 模型相比,虚假陈述减少了 2 倍。这使企业能够构建高性能的人工智能应用程序,解决具体的业务问题,并以更高的信任度和可靠性在其运营中部署人工智能。Claude 2.1 在理解和总结方面也做出了有意义的改进,特别是对于需要高精度的长而复杂的文档,例如法律文件、财务报告和技术规范。在评估中,Claude 2.1 证明错误答案减少了 30%,并且错误地得出文档支持特定主张的比率降低了 3-4 倍。
API工具使用
:Claude 现在可以跨开发人员定义的函数或 API 进行编排、搜索网络资源以及从私有知识库检索信息。用户可以定义一组工具供 Claude 使用并指定请求。然后,模型将决定需要哪种工具来完成任务并代表他们执行操作。
系统提示
:允许用户向 Claude 提供自定义指令以提高性能。系统提示设置有用的上下文,增强Claude承担特定个性和角色的能力,或以更可定制、符合用户需求的一致方式构建响应。
关于上下文的问题Greg Kamradt针对 Claude 的 200K 上下文和 GPT-4 的 128K 上下文
进行了一些测试
获得了一些有趣的结果。Claude离追上 GPT-4 还有很长的路要走啊。图片来自
LatentSpace
的本地化。
Claude 2 的测试结果
:
1.
上下文长度小于24K时效果最好,几乎不会有信息遗忘
2.
上下文长度超过24K就开始变差,90K后,效果很差,一大半信息会遗忘
3.
最头部和最顶部的1%效果最好,不会被遗忘
GPT-4 的测试结果
:
1.
在上下文长度小于 73K Tokens时,不会有信息遗忘
2.
在上下文长度超出 73K 后,位于中间7%-50% 区间的信息可能会被遗忘