AIGC Weekly #84

⏰ 剪存时间：2024-08-1 2

作者：歸藏

上周精选 ✦

FLUX 的周边生态发展迅速

前段时间由于 SD3 的问题，开源的图片生态发展一度停滞，值得关注的新项目和模型几乎没有。​

FLUX 上周发布后这个态势被快速改变了，由于其优秀的图片质量，高昂的训练成本并没有阻止开源社区。​

而且由于在其偏向真实的美学调教风格，也使生成的发布会写实图片在推上的热度爆发使得 FLUX 模型快速出圈。再加上 Runway 把那张 AI 生成的照片变成视频让更多人对现在图像和视频模型的发展进度有了更多的了解。

目前 Xlabs 已经发布了基于 FLUX 的 Controlnet 模型和 Lora 模型的训练脚本。

他们还顺便发布了一个 FLUX 的 Canny Controlnet 模型，另外这里还有 Instant ID 作者的新组织 InstantX 训练的一个 Canny 模型也可以试试。

Xlabs 也跟 Lora 训练脚本一起发布了他们的多个 Lora，其中这个火遍推特的图片就是用那个写实 Lora 做的。

具体的 Lora 包括 mjv6_lora、动漫 Lora、写实 Lora、迪士尼Lora、风景_lora、艺术 Lora​

另外社区也开始利用这些训练脚本训练 Lora 了，比如这个动漫 Lora 。

SD 模型训练工具 simpletuner 支持了 FLUX Lora 的训练，如果你想要训练 FLUX Lora 模型的话可以用这个。

一个全面的 FLUX 的 Comfyui 工作流，支持 FLUX Lora、ControlNet 的加载，支持文生图、图生图。

Figure 上周发布了 Figure 02 人形机器人，他们说这是世界上最先进的 AI 硬件。2023 年 2 月他们就完成了 Figure 02 的概念设计，用了 18 个月才将这个机器人变成实体。​

语音到语音 :能够通过内置麦克风和扬声器连接自定义 AI 模型与人类对话。​

摄像头 :AI 驱动的视觉系统由 6 个内置 RGB 摄像头组成。

手部 :第四代手具有 16 个自由度并具有人类等同的力量。

内置大语言模型 (VLM) :使机器人摄像头能够快速进行常识性视觉推理。​

电池 :机器人躯干内的 2.25 千瓦时定制电池组提供超过 50% 的能量。​

CPU/GPU :提供比上一代多 3 倍的计算和 AI 推理能力。

AIGC Weekly #84​