分享
AIGC Weekly #90
输入“/”快速插入内容
AIGC Weekly #90
🔗 原文链接:
https://quail.ink/op7418/p/aigc-wee...
⏰ 发表时间:2024-9-30
作者:歸藏
上周精选 ✦
Open AI 内斗落幕,元老全部退出
Open AI 的宫斗基本已经完全落幕了,去年内斗的时候硬挺 Sam 的 CTO
Mira 也宣布离职
,跟 Mira 一起离职的还有三个 Open AI 的老人。
Sam 也发了一条内容稳定了一下军心,顺便宣布了Open AI 新的高层领导任命,Mark、Jakub、Kevin、Srinivas、Matt、Josh。
同时 Sam 还在准备 65 亿美元的新一轮融资,完成后 Open AI 的估值会到 1500 亿美元,这轮闹剧结束后传言说苹果不再跟进这一轮融资了。
WSJ 还放出了
一份 Open AI 内部的爆料
:
•
Ilya 辞职的时候,OpenAI 高管担心他们的离开可能引发更大规模的人员流失,因此努力尝试让 Sutskever 回来。但是后面又反悔了,没让 Ilya 回去。
•
为了在 Google 年度开发者大会之前推出 GPT-4o,安全团队只有 9 天时间测试模型,连续工作 20 小时,没有时间复查他们的工作。
•
Brockman 经常要求对长期计划的项目进行临时变更,这迫使包括首席技术官 Murati 在内的其他高管不得不出面协调。
另外纽约时报还放出了
Open AI 针对这轮融资给投资人看的数据
:
•
2023年8月月收入达到3亿美元,比2023年初增长了1700%
•
2024年预计年收入约37亿美元
•
截至2023年6月,月活跃用户约3.5亿,相比2023年3月的1亿有大幅增长,ChatGPT付费用户约1000万
•
2023年预计为7亿美元,2024年预计将增长至27亿美元
•
2024年预计亏损约50亿美元(不包括股权薪酬等某些大额支出)
Meta 发布 Llama 3.2 多模态 LLM
Meta Connect 2024 上小扎基本坚定了 Meta 接下来一段时间的发展方向,核心就是 AI 和 AR,大家都开始赌 AI 领域计算平台的新入口了,不然还是给苹果微软做嫁衣。
主要
发布了四个模型
Llama 3.2 11B 和 90B 两个多模态 LLM,还有 1B 和 3B 两个小型语言模型:
•
11B 和 90B,支持图像推理用例,例如文档级理解,包括图表和图形、图像的描述以及视觉定位任务。
•
Llama 3.2 视觉模型在图像识别和视觉理解任务中与 Claude 3 Haiku 和 GPT4o-mini 比都具有竞争力。
•
Llama 3.2 1B 和 3B 支持 128K Token的上下文,并在移动设备常见任务比如摘要、总结、指令遵循上都很强,同时针对 Arm 处理器进行了优化。
•
发布Llama Stack 发行版,集成了单节点、本地、云和设备,支持即插即用的 RAG 和工具启用的应用程序。
软件层面也有一些 AI 应用的更新:
•
用户和 Meta AI 进行语音聊天,同时可以切换很多名人的声音。
•
正在测试在Facebook 和 Instagram 动态中自动推送 AI 生成的内容,Meta AI 专为你创建的图像。
•
Meta AI 现在还可以获取图片的信息,之后还可以通过文本提示对已有的图片进行局部编辑。
•
如果将你已有的图片分享到Instagram Story的时候,Meta AI 还会主动为照片生成背景。
•
Meta AI 翻译工具:可以自动翻译 Reels 的音频,支持增加口型同步。目前支持英语和西班牙语互相翻译。