OpenAI最早今秋发新模型；智谱发布类GPT-4o模型…｜本周模型与应用

发布日期：2024-09-19 13:19

来源类型：抖音视频 | 作者：西田敏行

【澳门金牛版正版资料大全免费】【新澳开奖记录今天结果】【2024年新澳门王中王资料】【管家婆最准一肖一码】【新澳彩开奖结果查询】【澳门正版资料免费网】【4949澳门免费资料大全特色】【2024今晚澳门特马开什么号】【今晚新澳最准确的生肖】【2O24澳彩管家婆资料传真】

【494949澳门今晚开什么】【2024新澳免费资料】 【新澳门天天彩2024年全年资料】

撰文：杨秋秋、陆彦君、王小淳

编辑：王杰夫

Key Points

本周应用与模型

夸克桌面端发布，打包了多款生产力AI工具；

亚马逊计划于10月推出AI Alexa订阅服务；

Google更新Gemini，推出个性化定制Gems，并且重新推出图像生成功能；

Meta计划推出代号为Puffin的混合现实眼镜，重量只有Quest 3的1/5；

Midjourney要做AI硬件，模样不同寻常；

OpenAI计划最早今年秋季推出「草莓」模型，推理能力大升级；

智谱AI推出GLM-4-Plus，像GPT-4o那样与模型实时视频来解决问题；

Google发布首个AI游戏引擎GameNGen，用模型模拟游戏过程。

本周应用与产品

夸克桌面端发布，打包了多款生产力AI工具

8月27日，阿里智能信息事业群旗下夸克发布PC/Mac端应用，升级并整合了多项AI功能。据介绍，用户可以在电脑上随时随地调用AI回答、AI写作、AI PPT、AI文件总结等各项AI功能。此前，夸克已在App端推出全新AI搜索。

在功能上，夸克支持通过多种方式进行AI搜索，用户可以通过超级搜索框、快捷键、划词、截屏等多种方式针对页面中的内容进行提问。夸克还推出了AI写作功能，支持文案、PPT、简历等多种文章写作，同时支持Word一键转成PPT。此外，夸克还向用户开放了AI总结功能，能够总结文件、视频和网页，整理全文概要并声称对应脑图。用户还可以对内容进行多轮追问，以快速掌握内容要点。

夸克表示，与移动端应用将AI搜索作为核心不同，桌面端将更注重生产力AI工具包这一属性。

参考链接

https://mp.weixin.qq.com/s/kbtKmc08vSarT_kXszKUkw

亚马逊计划于10月推出AI Alexa订阅服务，每月10美元

随着GPT-4o等多模态模型的推出，亚马逊一直期待重新推出其语音助手Alexa。8月26日，有报道称亚马逊计划在10月推出AI Alexa语音助手订阅服务，该项目在亚马逊内部代号为「Banyan」，此项目原计划在今年8月完成。

AI Alexa能够识别新用户的声音，并向用户询问有关个人信息的问题，使订阅服务更具交互性。例如，用户告诉AI Alexa有关家人的饮食限制，语音助手在提供食谱建议时可能会考虑到这一点。此外，AI Alexa还将上线「智能简报」功能，为用户提供每日由AI生成的新闻摘要。升级后的AI Alexa需要付费订阅，其价格可能为每月10美元，原始版本的「classic Alexa」仍可免费使用。

参考链接

https://www.washingtonpost.com/technology/2024/08/26/amazon-ai-alexa-launch-subscription-election/

Google更新Gemini，推出个性化定制Gems，并且重新推出图像生成功能

8月28日，Google宣布推出两项此前在Google I/O大会预览的新功能，分别是可让用户创建个性化 AI 专家的功能「Gems」和最新的图像生成模型「Imagen 3」。这两项功能目前仅对Gemini Advanced、Business和Enterprise订阅用户推出。

Gems是一项新功能，支持用户自定义Gemini聊天机器人以充当任何选定领域的专家。用户可以针对自己的需求定制Gems，并提供说明、命名Gem并与其交互，用户可以简化项目、产生想法并更有效地管理任务。据介绍，为了帮助用户入门，Google针对不同场景推出几个预设Gems，如学习教练、职业指南、写作编辑等。

此外，新的图像生成模型Imagen 3将在未来几天内在Gemini Apps中推出，并扩展其对所有语言用户的可用性。Google强调，Imagen 3引入了具有内置安全措施的高级功能，并包含了为AI生成的图像添加水印的SynthID。而此前下架的人像图像生成功能也将陆续推出。

在今年年初，Google宣布暂停Gemini的人像图像生成功能，因为该工具在生成人物图像时，出现了「不符合历史事实」的场景，包括不正确的种族描述，如以「美国开国元勋华盛顿」为主题的图片中，出现了妇女和有色人种。

参考链接

https://blog.google/products/gemini/google-gemini-update-august-2024/

Meta计划推出代号为Puffin的混合现实眼镜，重量只有Quest 3的1/5

8月29日，有报道称Meta计划推出新型混合现实（MR）设备，代号为Puffin。知情人士称，Puffin的研发处于早期阶段，产品预计2027年发售。

Puffin重量不到110克——约为Ray-Ban Meta智能眼镜的两倍，但只有Quest 3头显的1/5。与Quest不同，Puffin不配备手持控制器，用户将通过手势和眼球运动与其交互。Puffin还将使用相对较薄、视野较宽的「煎饼镜片」，向用户传递自然世界的影像。

Meta的此项计划是在AR、VR和MR设备的前景受到质疑之际提出的——尽管Meta的Quest头显已经有一定知名度，但其尚未成为大众市场购买的产品；Apple也因零售价超过3500美元的Vision Pro市场表现不佳，暂停了这款头显第二版的研发。与此同时，包括Snap和Google在内的几家科技公司花费数年时间开发带有AR功能的眼镜，但它们都遭遇了技术上的挫折（尤其是显示技术方面），尚未到达可以销售产品的阶段。

Meta现实实验室的员工表示，本月早些时候他们向Meta CEO Zuckerberg和CTO Bosworth展示了新型眼镜式MR设备的创意。会后员工们决定继续开发Puffin，并取消了一款正在开发中的高端MR头显。

参考链接

https://www.theinformation.com/articles/meta-considers-mixed-reality-glasses-code-named-puffin

Midjourney要做AI硬件，模样不同寻常

8月29日，人工智能图像生成公司Midjourney在社交媒体X发帖，正式宣布进军硬件领域，邀请人才加入其在旧金山新成立的硬件团队。Midjourney在回帖中透露，目前有多个项目正在推进，研发的硬件设备「不是吊坠形态」，也不是简单的可穿戴设备，能让用户「置身其中」。

Midjourney的创始人兼首席执行官David Holz对硬件并不陌生——他曾是动作追踪技术公司Leap Motion的联合创始人。去年12月，Midjourney聘请Apple前硬件经理Ahmad Abbas担任硬件部门主管。Abbas在Apple工作五年间，参与研发了混合现实头显Vision Pro，他曾在脑机接口公司Neuralink任职，还曾在Leap Motion与Holz共事。

早在今年1月，就有消息称Midjourney正在开发硬件产品，专注于收集3D数据。Holz在X发帖称，公司正在研发一种「球体」（orb），并在与Discord的对话中提到，自己设想中的orb是一种可用于生成和管理3D空间的设备。

参考链接

https://x.com/midjourney/status/1828839444130214208

https://the-decoder.com/apple-vision-pro-engineer-to-build-the-mid-journey-orb/

本周模型

OpenAI计划最早今年秋季推出「草莓」模型，推理能力大升级

8月27日，据报道OpenAI或将在今年秋季推出代号为「草莓」的新模型，将显著提升推理能力。「草莓」的前身就是神秘的「Q*」模型，它可以解答从未见过的数学问题，这是目前的AI聊天机器人无法做到的。

「草莓」强大的推理能力可以改进GPT-4，还会帮助OpenAI开发下一代旗舰模型「Orion」，确保OpenAI在大模型领域中的领先地位。具体来说，OpenAI正在使用较大版本的「草莓」模型生成更高质量的合成数据，用来训练Orion，这样可以打破从现实世界获取真实数据的局限，减少OpenAI模型的幻觉。

由于现有的AI在航空航天、结构工程等数学密集型领域内并不擅长解决问题，能够处理数学推理任务的AI可能是一个具有潜力的应用。Google和其他初创公司也在努力开发AI的推理能力。上个月，DeepMind表示，其AI将在国际数学奥赛中击败大多数人类参赛者。Anthropic表示，由于推理能力的提高，其最新的大模型可以编写更复杂的软件代码，并回答有关图表和图形的问题。

参考链接

https://www.theinformation.com/articles/openai-races-to-launch-strawberry-reasoning-ai-to-boost-chatbot-business

智谱AI推出GLM-4-Plus，像GPT-4o那样与模型实时视频来解决问题

8月29日，智谱AI在国际数据挖掘与知识发现大会（KDD）上推出了其最新基座大模型GLM-4-Plus，并宣布即将在清言App推出「视频通话」功能。从测试结果来看，GLM-4-Plus大多数任务上做到逼近GPT-4o的能力甚至在某些任务上实现了超越GPT-4o的表现。而在功能上，GLM-4-Plus新增了的视觉模态能力，也与OpenAI的GPT-4o再次成功对标。

本次推出的GLM-4-Plus新增视频和网页理解能力，能够理解、分析复杂的视频或网页，并作出总结。此外，GLM-4V-Plus还具备一定的时间感知能力，能够概括总结具体时间节点的内容。

在珂卉：

7秒前：用户还可以对内容进行多轮追问，以快速掌握内容要点。

李允书：

3秒前：com/s/kbtKmc08vSarT_kXszKUkw亚马逊计划于10月推出AI Alexa订阅服务，每月10美元随着GPT-4o等多模态模型的推出，亚马逊一直期待重新推出其语音助手Alexa。

奥斯汀·克鲁特：

6秒前：参考链接https://www.

Jacyszyn：

9秒前：com/midjourney/status/1828839444130214208https://the-decoder.

抖音视频

CNCC 智能无线感知：感知可以非侵扰且无所不在吗？

美司令宣称可为菲舰艇“护航”，中方：美国不得支持纵容侵权行为

比燃油车更易起火？一酒店禁止新能源车进地下车库！

泡泡玛特盲盒有错别字？客服：故意为之

OpenAI最早今秋发新模型；智谱发布类GPT-4o模型…｜本周模型与应用

OpenAI最早今秋发新模型；智谱发布类GPT-4o模型…｜本周模型与应用

推荐文章