分享
AIGC Weekly #85
输入“/”快速插入内容
AIGC Weekly #85
🔗 原文链接:
https://quail.ink/op7418/p/aigc-wee...
⏰发布时间:2024-08-19
作者:歸藏
上周精选 ✦
谷歌发布Pixel 手机以及 AI 功能
谷歌上周集中发布了他们的 24 年硬件内容包括
新的 Pixel 9 手机
,
Pixel 9 Pro Fold
,
Pixel Watch 3
和
Pixel Buds Pro 2
。
同时出了硬件之外大部分的时间都是在讲 AI 跟硬件的结合,而且其中的重头戏 Gemini live 已经在美国开始推送了,而且新手机上立刻可用,在 AI 硬件的进度上安卓这次领先苹果不少。
主要的 AI 内容有:
•
Gemini 升级推出 Gemini Live,支持实时语音对话和摄像头视频沟通,而且跟系统内置 APP 深度打通,比如可以直接通过 Gemini 展示谷歌地图内容和记录 Todo。
•
Pixel 的摄影和视频加了 AI 功能,Add Me 可以帮助你拍合照,支持 20 倍的 AI 变焦功能,Magic Editor 支持用 AI 编辑你的照片,Auto Frame扩图可以重新构图照片。
•
Pixel Studio AI 画图应用,imagen3 模型驱动,可以通过输入提示词生成图片和编辑生成的图片。
•
新的 Pixel Weather 应用程序使用AI来补充传统的天气报告,可以获得更准确的天气预报,比如雨何时开始和停止。
•
Keep 支持让 Gemini 帮你创建列表比如一些事情的详细待办。
•
Pixel Screenshots 支持帮你保存、组织和回忆你手机里面所有截图的信息,截图可检索这个太重要了,这是手机上最方便的记录形式。
•
通话备注支持帮你整理和保存对话中的关键信息,激活的话通话的人会收到通知。
•
Pixel Watch 使用机器学习自动检测睡眠并开启睡眠模式。
•
Pixel Watch 3 引入脉搏丢失检测功能,可以检测心脏突然停止跳动时发生的脉搏丧失事件。
•
Pixel Buds Pro 2 耳机支持 AI 降噪技术,降噪幅度是上一代产品的两倍。
•
Pixel Buds Pro 2,可以在不拿出手机的情况下获得 Gemini 的帮助,Gemini 可以在耳机里面跟你对话,这个在面试和演讲作弊很有用啊,户外没办法用手机的场景也很有用。
xAI 发布
Grok-2 系列模型
老马的 XAI 发布 Grok-2 Beta 版本。在LMSYS的成绩超过了Claude 3.5 Sonnet 和 GPT-4-Turbo。
Grok-2 和 Grok-2 mini 目前在 𝕏 上测试,这个月可以通过 API 使用。
𝕏 上的 Grok 界面也获得了更新,𝕏 Premium 和 Premium+ 用户都可以访问新模型。图片生成能力用的最近非常火的 FLUX 图像生成模型。
XAI 还说他们内容使用类似LMSYS的流程来对模型进行评估,在每次互动中,AI 导师模型会看到 Grok 生成的两个回应。根据指南中概述的具体标准选择更优秀的回应。专注于评估模型在两个关键领域的能力:遵循指示和提供准确的事实信息。
Grok-2 在推理检索内容和工具使用能力方面显示出显著改进,例如正确识别缺失信息、推理事件序列以及丢弃无关的帖子。
这一点在结合推特内容分析上明显变好了,你可以
让 Grok 分析你的内容以及互动来改善账号的运营情况。
他们下一步将会发布 Grok 多模态模型的预览。
Genie:新的世界最强 AI 编程 Agent 产品
Genie 宣布自己打造出了世界上最强的 AI 编程 Agents 产品。在 SWE-Bench 评估中获得了 30.08% 的分数,在 SWE-Lite 中获得了 50.67%。可以完美模拟人类工程师的认知过程、逻辑和工作流程。
Genie 的设计目标是使其具有 “自主性”,能够根据所见内容逻辑行动。为了实现这一点,数据集需要能够代表这种逻辑行动,包括在未知代码库中找到执行任务所需的先决信息。