分享
校园AIPO系列共学 2024年10月17日
输入“/”快速插入内容
校园AIPO系列共学 2024年10月17日
飞书用户8537
2024年10月24日修改
会议信息
会议主题:校园AIPO系列共学
会议时间:10月17号(周四) 19:48 - 22:01 (GMT+08)
参会人:
参会人信息统计
智能纪要
智能纪要依据会中总结与录制内容生成,不代表平台立场,请谨慎甄别后使用
📄
总结
会议讨论了 AIPO 共学课中模型训练的诸多方面,涵盖流程、参数、数据集等内容。主要内容包括:
•
AIPO共学课之厚德云模型训练分享
◦
AIPO共学课倒数第二节
:10月17日是AIPO共学课倒数第二节,由黄忠忠分享厚德云模型训练,8点开始直播。
◦
线下活动安排
:10月20日下午2点到6点,全国35个学校将同时启动AIPO线上模拟创投活动,北京有清华、北大等学校举办分会场。
◦
模型训练流程
:包括处理数据集、设置参数训练、生成模型和生图等步骤。
◦
数据集获取渠道
:有网上收集、购买、使用无版权问题的如古画等,原则是想生成什么图就找对应数据集,且要清晰、主体元素干净、风格统一。
◦
数据集处理
:包括基础处理如裁剪保证清晰和分辨率,更重要的是写标注。
•
模型训练的数据标注与流程
◦
设置模型触发词
:模型触发词可自定义,如BD icon等,完整形式可以是一句话,建议以王flags模型为主。
◦
统一标注风格与应用场景
:例如未来高科技3D天然风格,用于互联网首页图像等,并概括主题内容、描述物体特征等。
◦
利用GPT辅助描述并人工审核
:可以让GPT按要求描述,人工审核修改,之前课程有相关教学,后续会提供参考提示词。
◦
模型训练的准备与流程
:完成数据集描述后进入训练流程,选择模型训练分类和数据集,创建并上传数据集压缩包,注意数据名与图片命名一致。
◦
选择训练模式和参数
:新手选用普通基础模式,训练集质量重要,训练参数中总步数与训练集图片数量相关,触发词可任意设定但要避免概念混乱。
•
模型训练相关问题探讨
◦
训练参数选择
:一般不需要太多轮数的模型,可增加单张重复次数。训练步数影响学习效果,可先用默认参数跑一轮模型查看结果,过拟合则减少步数。
◦
训练成本
:训练时间越久,消耗算力越多,占用显卡时长越长,费用越贵。训练会员有插队加速功能。
◦
训练集的重要性
:训练集的质量和数量是模型泛化性的关键因素,好的训练集和标注能使默认参数训练效果不错,差的训练集和标注多次测试参数效果也可能不好。
◦
秋叶启动器的训练
:秋叶启动器中,CONF UI 有可训练的工作流,Web UI 目前无法进行训练。
◦
快速打标方法
:可使用 GPT 和微软的打标器,也可在开源网站购买个人创作者的数据集,专业网站购买需注意授权问题。
◦
自己弄数据集
:自己学习不商用时版权限制宽松,可在花瓣上搜索获取,如搜 3D 图标。
•
关于AI模型训练的介绍与讲解
◦
Eagle插件批量收藏3D图表
:通过Eagle插件可批量收藏画板图片,该插件为付费软件。
◦
不同步数训练时间不同
:Luna训练中,3000步约两小时跑完,6000步约四小时,1500步约一小时。
◦
使用MZ数据集训练Flux
:购买MZ会员充值后,其数据集可商用,是常见的训练集获取方法,但要注意版权问题。
◦
云服务器训练流程
:选择GPU市场和L20服务器,创建镜像,注意服务器开启后会一直计费,需手动关机才停止。
◦
训练集收集要求
:如参加Luna模型大赛,不同主题有不同的训练集收集方向,如中国神话画卷、真实人像等。
◦
训练模型的时机
:当需求无法通过现有模型满足或无法很好完成时,才需要训练模型。
◦
角色一致性表现
:Launch模型训练可吸收角色并保持一致性,效果取决于训练水平和数据集质量。
◦
云服务器训练集设置
:在指定位置新建训练集文件夹,设置单张图片学习次数等参数,上传训练集。
•
AI模型训练与相关活动介绍
◦
模型训练参数设置
:训练模型时,新手只需修改训练集路径和训练轮数等少量参数,如将训练集路径中的'金龙'改为'3D icon blue',并注意保存。
◦
模型训练启动与等待
:修改训练脚本参数后,在终端输入代码启动训练脚本,等待模型正式训练,此过程中可加载图像。
◦
CCS全球社区峰会
:这是国际盛会,11月16日到17日在东京举办,可报名参加,AIPO活动冠军可获赞助前往,优秀作品可展出。
◦
AIPO活动相关
:完成11次作业中的8次及以上可在10月25日前获得结业证书,模型训练优胜者和优秀作业提交者有机会获得炼丹科技实习邀请及工资。
•
关于模型训练及Confii的介绍与讨论
◦
模型训练的展示与讲解
:展示了模型训练的过程,如在线版本的运行步数和时间,提到训练完的文件存储路径可更改,服务器权限可能影响查看tensorboard,但不影响训练进程。
◦
Confii的应用场景
:如在图书插画生成、家具商品图生成等方面,能够降本增效,保证风格一致性。
◦
Confii的学习资源
:包括明天晚上8点的直播课、社区共学课程、B站上的系列教程等。
•
关于后德云活动及相关事宜的讨论
◦
后德云活动的训练和奖励
:参加后德云活动的训练免费,还有机会获奖,包括会员福利等,今天参加共学获客,准备素材练习Laura并投稿,明天可能获奖。
◦
活动的报名和参与方式
:深圳的视觉大会分论坛活动,报名可能已满,但公众展区无名额限制;参加后德云活动可加官方群满足条件领取免费训练会员,活动限定了Laura创作的六个类型。