作者 |董道利邮箱 | dongdaoli@pingwest.com 人和动物有什么区别?这是一个很难回答的问题,但人类要成为“万物之灵”,需要具备三个品质。首先,学习如何使用工具。当我们的祖先第一次拿起一根棍子并点燃火时,他们走上了一条与其他物种完全不同的道路。二是分工合作。没有人是万能的,所以让猎人打猎,让工匠制造工具。这种社会分工的纽带最终使人类建立了文明。除此之外还有第三项技能:反思。动物在死亡时会不断修改基因以适应环境,而人类可以通过思考和自动纠正主动规避风险并迭代更好的解决方案。在当今伟大模式盛行的时代,我们似乎再次面临着人类进化的反思。 GPT-5没有达到大家的期望AGI 站。人们已经从完美的幻想中冷静下来,开始重新思考现有的大型模型如何突破极限。单一模型就像一个才华横溢但有些笨拙的学习者,能够撰写文章并生成代码,但无法像人类社会那样有效地协作或自我纠正。因此,一种新的范式开始出现。 MGX 正是在这种背景下诞生的。这不是一个大型模型,而是一个虚拟的多智能体团队。有人负责理解需求,有人负责画架构,有人写代码,有人专注研究。更重要的是,他们就像人类一样,积极使用工具、分工、协作、反思、引发错误。如果说GPT是智能的复制品,那么MGX就是模拟社会的实验。与市场上突然出现的许多AI编码产品不同,MGX背后的团队DeepWisdom在任何意义上都不是“另一家AI编码初创公司”。甚至是在此之前,已经出现了几部基于研究的杰作。例如,团队曾经创建了 OpenManus,Manus 的替代版本。它是由五位程序员在三个小时内开发出来的,并引发了业界的激烈争论。该团队还开发了MetaGPT,这是一个受到广泛关注的流行开源项目。创始人兼首席执行官吴成林也拥有技术背景,曾在腾讯等公司领导过拥有数十亿用户和数千亿数据的复杂人工智能项目。他也是开源多智能体框架MetaGPT的创建者。 1 MGX 代理团队实测 MGX,官方名称为MetaGPT,特别之处在于,您只需输入您的需求,系统就会自动为您生成一个虚拟团队。这个功能可以直观地体现在MGX主页上。图 A 中的区域显示了 MGX 默认配置的虚拟机。黄脱脱是麦克,队长,兰脱脱是艾尔,工程师。例如,子脱脱是产品经理Emma,鲁脱脱是数据分析师David,白脱脱是架构师Bob。还有一个叫 Iris 的人,他是一名深度研究员,但还没有出现在主页上。每个代理商都有自己的责任,就像一个小企业一样。图a区域B中的输入框使用户可以灵活地“召唤”不同的代理来完成任务。正如你在照片中看到的,迈克、艾玛和亚历克斯受邀合作。在图 C 中,提供了一个开关,允许用户禁用代理团队功能。关闭后,MGX 体验将恢复为传统的 AI 编程工具体验,仅留下模型助手。 1 测试 1:为旅游网站创建数据库。要求:创建一个国庆旅游指南网站。用户输入想去的地点后,可以选择多种路线,包括文化路线、自然路线、美食路线等。出行路线将自动生成。对于我们的第一次测试,我们要求 MGX 创建一个国庆旅游指南网站。要求是用户输入目的地。系统可以自动生成不同类型的路线,例如文化、自然、美食等。团队负责人 Mike 创建了初始示意图,工程师 Alex 快速创建了功能齐全的演示,但仅使用来自北京和上海的数据。 MGX 对任务页面使用两列结构。用户可以在左侧看到每个代理的工作方式,并在右侧查看项目的预览。然后我打电话给我的数据分析师 David,并要求他针对该项目运行一份数据报告。移动Jupyter笔记本来创建数据报告。此过程包括建立指标、可视化和相关性分析。这对于数据分析来说非常有趣。注:@David将进行全网数据分析,制作报告,并协助开发旅游景区网站全国热门城市都有活动。根据报告,Emma创建了一份全面的需求文档,涵盖用户故事、竞品分析、推荐算法、营销思路,并提出了清晰的个性化推荐框架。注意:@Emma根据数据分析报告更改要求。我们选择高质量的分析和推荐算法设计来探索细节。我们可以看到,Emma非常有信心,在内容质量上超越小红书,在个性化方面领先穷游、携程等应用。关于推荐算法的设计,得到了GPT的高度评价,“按城市类型→候选聚合→自定义重定位”的思路思路清晰,可扩展性点明确(可以代替generate * Route,计算Custom Score),适合作为MVP的骨干。总之,他有产品经理的气息。毕竟,工程师Alex我们已经决定了d重新制作网站。可以看到,新版国庆旅游指南内容更加丰富,也有了评分系统。与其他人工智能编程网站一样,MGX 也提供实现和其他功能。是的,项目网站:https://mgx-w6xvo6ydqlh.mgx.world。此外,MGX 还提供了视觉元素选择模式,以避免随机“抽牌”变化。以URL重命名为例。输入您选择的元素,单击要更改的区域,然后在左侧面板中完成编辑。该面板支持文本内容、边距、字体样式和颜色等详细信息。 1测试2:详细调查+幻灯片任务1演示了不同代理之间的合作。从网站的结果来看,我们可以看到这次合作确实改善了功能。看看 MGX 的新的深入研究功能。注意:比较小米17系列和iPhone 17系列就像创建一个网站。仔细检查 MGX 可以发现左列和右列。安娜之后代理分析需求后,创建积压计划并将其传递给用户。如果用户确定没有问题,可以允许MGX继续运行。有兴趣阅读这份MGX报告的读者可以直接下载。研究报告链接:https://pan.baidu.com/s/1hzHceoQRv-DlMujKqN87eA?pwd=5byv 该报告从定位、性能、图像、显示、续航等方面对小米17和iPhone 17进行了全面对比,总结了各自的优势和适合人群。这里我们重点说一下结论。讨论内容与各公司新闻稿基本一致,主要参数没有明显错误,尤其是云端推荐。基本上一切都有记录。可以说,这是一份令人满意的调查报告。定位层面:小米17系列采取“全面对标iPhone”策略,试图突围高端市场,依托高性价比和图像、续航、充电等“纸上参数”的优势。同时,iPhone 17系列延续“平衡稳定”的路线,聚焦全球市场和长期使用体验。性能水平:iPhone 17中的A19 Pro芯片单核性能扎实,但小米8搭载的骁龙17至尊版在整体和多核性能得分上有明显优势(安兔兔得分超过400万分)。影像层面:小米17系列采用大底传感器与徕卡合作,进一步凸显在夜视、背光、色彩表现、自拍和后屏方面的创新。 iPhone 17系列提供了更多创意视频拍摄的专业功能,包括ProRes RAW和Apple Log 2。 显示级别:均为旗舰级别。小米17在发光材料、亮度(3500尼特)、护眼技术以及“妙享后屏”交互等方面都有更多创新。电话e 17系列专注于LTPO自适应刷新率、防反射玻璃和更小的Face ID组件。续航和充电:小米17系列的电池容量明显更大(高达7500mAh),支持100W秒有线充电和50W无线快充。 iPhone17Pro Max的电池仅有4823mAh,充电功率高达40W,但依靠芯片和系统优化来保持较长的续航时间,并支持无线充电MagSafe/Qi2和反向有线充电。大众推荐lico:小米17系列:在硬件参数(拍照、续航、快充)上寻求最大性能的用户,以及想以低价体验旗舰性能、从iPhone到An的用户。适合考虑转用Droid的用户。 iPhone 17系列:适合注重系统稳定、长久、无广告体验和流畅性能、深度融入苹果生态的用户,尤其是那些有专业视频创作需求的人。接下来,在来源方面,MGX引用了36个来源,而在同一语言下,GPT5研究模型引用了18个来源。在信息来源上,MGX更倾向于国内来源,而GPT5则更倾向于国外来源。随后,调查报告以幻灯片的形式展现出来。用MGX制作的幻灯片一般都没有那么好,比如专门制作PPT的人工智能软件。可能会出现页面上字符重叠等错误。可以理解的是,MGX 尚未成立设计师机构。然而,值得注意的是,与创建网站或详细报告相比,在 MGX 中创建幻灯片时存在明显的反射行为。例如,工程师Alex表示,用户界面的渲染部分比较差,没有显示详细的对比内容或交互图形。如果用户决定解决这个问题,他们将清楚地看到新版本的幻灯片 h作为交互功能。幻灯片查看:https://mgx-yi53lrvz5ac.mgx.world1 测试3:制作坦克战游戏时,增加人数真的会增加威力吗?事实上,测试1和2主要展示了MGX的能力。如果你想运行更复杂的项目,你需要多伦更好的提示和对话框。在测试了所有三种类型之后,我们回答了大家最担心的问题:“多智能体真的很棒吗?”第三个测试是开发“坦克战”小游戏。我做了两个实验。一项实验指定所有智能体都将参与,另一项实验仅允许 MGX 选择哪些智能体参与。提示:如何制作一款坦克战游戏@Mike@Emma@Bob@Alec@David提示:制作一款坦克战游戏,理想情况下,团队负责人Mike负责整体任务分配,产品经理Emma负责设计游戏的各个功能,Bob负责游戏在架构上,David负责提供数据支持,工程师Alex负责游戏的最终实现。游戏。然而,结果并不一致。perados。多人合作版本分工混乱,甚至需要数据分析师编写代码,最终导致游戏无法运行。但是,您可以运行 Alex 自己完成的版本。由一组特工创建的游戏:https://mgx-2z8q7fvfvbr.mgx.world 仅由 Alex 创建的游戏:https://mgx-sk39olbo6s.mgx.world 这项裁决非常具有代表性。首先,运行多个代理时,没有明确的责任划分。尽管每个MGX代理都有自己的职责,但由于用户干扰强制呼叫而发生了“串扰”。当项目陷入混乱时,团队领导迈克站了出来。实际场景是一个没有项目经理可以做出决策的项目。如MGX官网动画所示,d每个任务都需要调用不同的代理。总体而言,MGX 展示了多智能体协作的潜力。在测试旅游网站和研究报告时,我们将特定功能组织到单个模型中以获得更完整的结果。小游戏等高度合作的任务也暴露了分工混乱、机制不稳定的缺点。也许一个成熟的团队领导者Mike只会选择正确的人做正确的事,而不管用户@@ed了多少座席。 DeepWisdom团队畅谈“下一代智能体”的发展方向。多个代理的真正价值不在于“堆叠人员”,而在于实现动态分工和优化路由,塑造适当的SOP并交错关键功能,例如自我评估、内存管理和环境之间的操作。它包括按层次完成事物的能力。 MGX的实践清晰地展示了一条不同寻常的进化路径与今天讨论的许多“产品即模型模型”不同。作为产品进行建模就像直接向用户提供通用的“超级大脑”。在这个模型中,模型的功能极限成为了产品的上限,迫使用户成为“快字工程师”,完成分解任务、编排流程、整合结果等复杂任务。这严重限制了在复杂的现实场景中部署人工智能的能力,因为现实世界的问题通常无法用单一技能解决。多智能体的思想对之前的模型进行了补充和分解。我们还将通过创建有效合作的“专家团队”来改变人与计算机之间的交互,降低创建复杂任务的门槛。用户与AI的关系是用户将自己的项目委托给AI“团队”。这让我们离提供独立人工智能又近了一步。人工智能也从模仿“个体个体智能”到模仿“组织智能”。这无疑将为当今许多AI产品和模型的下一步演进提供新的灵感。 单击“爱”即可。
特别提示:以上内容(包括图片、视频,如有)由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注:以上内容(包括图片和视频,如有)由网易用户上传发布。好是一个社交媒体平台,仅提供信息存储服务。