AIGC Weekly #84
输入“/”快速插入内容
AIGC Weekly #84
🔗 原文链接:
https://quail.ink/op7418/p/aigc-wee...
⏰ 剪存时间:2024-08-1 2
作者:歸藏
上周精选 ✦
FLUX 的周边生态发展迅速
前段时间由于 SD3 的问题,开源的图片生态发展一度停滞,值得关注的新项目和模型几乎没有。
FLUX 上周发布后这个态势被快速改变了,由于其优秀的图片质量,高昂的训练成本并没有阻止开源社区。
而且由于在其偏向真实的美学调教风格,也使生成的
发布会写实图片
在推上的热度爆发使得 FLUX 模型快速出圈。再加上
Runway 把那张 AI 生成的照片变成视频
让更多人对现在图像和视频模型的发展进度有了更多的了解。
目前 Xlabs 已经发布了基于 FLUX 的 Controlnet 模型和 Lora 模型
的训练脚本
。
他们还顺便发布了一个 FLUX 的 Canny Controlnet 模型,另外这里还有 Instant ID 作者的新组织 InstantX 训练的一个
Canny 模型
也可以试试。
Xlabs 也跟 Lora 训练脚本一起发布了他们的多个 Lora,其中这个火遍推特的图片就是用那个
写实 Lora
做的。
具体的 Lora 包括 mjv6_lora、动漫 Lora、写实 Lora、迪士尼Lora、风景_lora、艺术 Lora
Xlabs Lora 下载:
https://huggingface.co/XLabs-AI/flux-RealismLora
另外社区也开始利用这些训练脚本训练 Lora 了,比如这个
动漫 Lora
。
SD 模型训练工具
simpletuner
支持了 FLUX Lora 的训练,如果你想要训练 FLUX Lora 模型的话可以用这个。
一个全面的 FLUX
的 Comfyui 工作流
,支持 FLUX Lora、ControlNet 的加载,支持文生图、图生图。
Figure 发布 Figure 02 人形机器人
Figure 上周发布了 Figure 02 人形机器人,他们说这是世界上最先进的 AI 硬件。2023 年 2 月他们就完成了 Figure 02 的概念设计,用了 18 个月才将这个机器人变成实体。
语音到语音
:能够通过内置麦克风和扬声器连接自定义 AI 模型与人类对话。
摄像头
:AI 驱动的视觉系统由 6 个内置 RGB 摄像头组成。
手部
:第四代手具有 16 个自由度并具有人类等同的力量。
内置大语言模型 (VLM)
:使机器人摄像头能够快速进行常识性视觉推理。
电池
:机器人躯干内的 2.25 千瓦时定制电池组提供超过 50% 的能量。
CPU/GPU
:提供比上一代多 3 倍的计算和 AI 推理能力。