分享
AIGC Weekly #91
输入“/”快速插入内容
AIGC Weekly #91
🔗 原文链接:
https://quail.ink/op7418/p/aigc-wee...
⏰ 发表时间:2024-10-07
作者:歸藏
上周精选 ✦
Open AI 发布 Canvas 功能和实时API
Canvas
Open AI 在产品和交互上终于开窍了。在 Claude Artifact 的基础上迭代优化发布了 Canvas。
主要为了解决沟通和长文写作在原来的交互下不兼容的问题。不过最重要的能力直接渲染代码结果还没有,估计还在开发,不过这也太慢了 Poe 都支持了。
可以对预览界面的结果通过交互按钮快速修改。也支持选中部分结果跟 ChatGPT 对话之修改这一部分。界面右侧根据输出结果是文字还是代码有不同的快捷方式。
当输出结果是文本的时候快捷按钮是:
•
建议编辑:ChatGPT 提供内联建议和反馈。
•
调整长度: 编辑文档长度使其更短或更长。
•
更改阅读级别:调整阅读级别,从幼稚园到研究生院。
•
添加最终修饰:检查语法、清晰度和一致性。
•
添加表情符号:为强调和色彩添加相关的表情符号。
当输出结果是代码的时候快捷按钮是:
•
审核代码: ChatGPT 提供了改进代码的内联建议。
•
添加日志:在代码中插入打印语句以帮助调试代码。
•
添加注释:添加注释以使代码更容易理解。
•
修复错误:检测和重写有问题的代码以解决错误。
•
将代码转换为其他语言:将代码转换为 JavaScript、TypeScript、Python、Java、C++或 PHP。
Realtime API
OpenAI 还在最近的 DevDay 上宣布了Realtime API、提示缓存、模型蒸馏和视觉微调。
与 ChatGPT 的高级语音模式类似,实时 API 支持使用 API 中已支持的六种预设语音(在新窗口中打开)进行自然语音对话。但是非常贵。
实时 API 使用文本标记和音频标记。文本输入Token的定价为每 100 万美元 5 美元,每 100 万个输出Token定价为 20 美元。音频输入的价格为每 100 万个Token 100 美元,输出的价格为每 100 万个Token 200 美元。
微软发布新版Copilot
微软憋了半年多的大招终于发布了,对Copilot进行了彻底的重构,基本可以看作一个跟系统结合更深入的ChatGPT,尤其是可以查看你现在系统打开的网页图片等内容,这个很强。
随时拉起的实时语音功能也非常方便,主要内容有:
Copilot Voice
:看起来是 ChatGPT高级语音的微软版本界面更加舒服,四种声音可以选择。
Copilot Daily
:用你选择的声音在早上阅读新闻和天气,而且还有更多个性化内容,比如你的待办。
Personalized Discover:会在首页引导你提问问题,随着你跟 Copilot 交流的数量变多,这里的问题也会跟你更相关。
Microsoft Edge 中的 Copilot
:
内置到 Microsoft Edge 浏览器中,帮助回答问题、总结页面内容、翻译文本或重写句子。
通过在地址栏中简单输入@ copilot,可以快速跟 copilot 交流。
Copilot Vision
:可以理解正在查看的网页,包括文本和图像,并可以回答有关内容的问题,建议下一步操作。
系统级的视觉助手还是很厉害的,希望微软可以优化好。
Think Deeper
:Copilot 可以推理更复杂的问题。
深度思考在做出回应之前需要更多时间,能够提供详细和逐步的回答以解决具有挑战性的问题。