"字节版 Manus "有多能打?量子位实测在此。
△扣子智能体生成的行径先容网页
咱们用光了一天的对话额度,侦探了扣子空间(Coze Space)的信息整理、任务现实、器具调用等多项手段。
收场,仍处在早期测试中的扣子空间合座弘扬也曾相配惊艳,在自主任务运筹帷幄和辛劳征集方面弘扬可以,也曾具备不休好多信得过任务的后劲。
不外在指示死守方面,如故比较"有我方的主张"。
肤浅先容一下,扣子空间是字节在刚刚昔时的周末推出的智能体调解系统,官方主打"你和 AI Agent 协同办公的最好式样"。
由于放出来的 demo 后果惊艳,昔时几天里还出现了挤爆行状器的场面。
而第一波拿到邀请码的红运儿,在体验后也第一时分共享了使用感受:
对比智能体如实是一个大飞跃。
更得当用来分析陈述,主要作用是匡助用户搭起合座框架。
天然,当作红运儿之一,咱们也马上进行了一波实测。
有脑有手的通用智能体
扣子平台的通用智能体,分红了探索和运筹帷幄两种模式,官方的先容是这么的:
本色用下来的话,探索模式更注目效率,而运筹帷幄模式则会对任务进行详实拆分,档次愈加清亮。
自动整理征集信息,一句话制作网页 /PPT
先来看探索模式,咱们让它整理了一下波音 747 系列飞机的发展历程。
可以看到,智能体凭据给出的话题自行膨大延长了许多搜索词并现实了检索,临了变成了一份翰墨陈述。
把握整理好的辛劳,可以径直制作出一个网页(或者 PPT 也可以),页面包含了比较丰富的内容,排布简单,好意思不雅性也说得昔时。
况兼除了翰墨内容,生成网页时智能体还补充了产量统计图和要津时分线。
有脑还有手,自主运筹帷幄现实任务
在运筹帷幄模式下,扣子智能体不仅会整理辛劳,还复古在凭空沙盒环境中驾御电脑、浏览网页,现实订票等操作。
比如咱们让它赞理订一张翌日(23 日)下昼从北京到上海的高铁票。
比较有真义的是,智能体一运转的动作是搜索高铁票该奈何订,不明晰是模子我方确切不知谈,如故这里强制设定了检索过程,但总之,要是真遭遇不会的手段,通过检索来弥补也不失为一种计谋。
12306 平台需要登录才智进行订票,智能体或者准确识别到这种情状,并指示咱们手动给与。
不外,可能是沙盒环境受到了阻挡,在现实检索之后页面并未披露收场,因此系数历程未能获胜完成。
但从智能体的操作过程来看,网页信息识别和运筹帷幄现实智商也曾很可以了。
接入 MCP,智能体不再"鳏寡茕独"
除此以外,扣子也复古 MCP 公约,并接入了飞书文档、GitHub、MySQL 数据库、天气、舆图等一系列 MCP 应用。
于是结合 MCP,咱们来系数大活。
上周,量子位中国 AIGC 产业峰会 2025 收效举行,咱们将其会议历程和嘉宾信息整理到了一份文档当中,条目智能体将这些材料整理出一份网页版会议指南。
况兼还调用了舆图、天气和语音合成三个 MCP 插件,在网页中加入天气预告、交通指南和嘉宾先容语音播报。
可以看到,智能体领先把握器具从文档中索要出文本,然后通过 MCP 公约调取了天气、舆图等信息。
由于任务比较复杂,制作耗时也比较长,初版制品长这么:
这个版块,条目的内容齐有呈现,但是行径历程莫得死守条目的方法,天气预告的日历也别离。
是以咱们针对这两点条目智能体进行修改,修改的过程莫得一步到位,而是经过了多轮调解。
以及到后头修改的过程才发现,扣子智能体一运转偷懒并莫得合成嘉宾先容的语音,仅仅在网页里放了按钮,单独指出之后才运转合成。
不外最终如故得到了稳健期待的页面,该有的内容齐往常展现,滑动和点击检察笃定的功能齐收效竣事,合成的音频也能往常播放。
诚然合座经历了不短的时分,但关于一个十足不懂网页制作的用户而言,扣子智能体也曾很好地不休了器具有无的问题。
在时分上,一个可以改造的处所是让可以并行进行的任务同期进行,比如这个任务当中的语音合成本色上是孤立于网页诡计的,而智能体现在弃取的是串行格式,带来了不少的非凡耗时。
回来一下,当作一个通用智能体,扣子智能体的任务运筹帷幄比较合理,辛劳征集智商也弘扬可以,不外在指示死守方面,如故比较"有我方的主张"。
天然当作通用智能体,优先考量是提高手段的丰富度,尽可能灭绝更多的任务,是以在具体任务细节上,也还有不少提高空间。
更懂行的行家智能体
是以,在通用 Agent 以外,扣子空间还提供了「行家模式」。
Beta 测试版首页,现在有两个行家 Agent:
用户商议行家:模子学习了字节资深用研行家、家具司理等共享的用研使命时间;
华泰 A 股不雅察助手:扣子团队与华泰证券联接孵化的 Agent,让模子学习了若何分析上市公司和发展后劲等专科常识。
咱们实测下来发现,摄取了更多私东谈主数据和第三方数据的行家 Agent,在实用性方面如实大有提高,尤其在靠近复杂任务过程中易出错的问题,它老是能自主发现诞妄并不绝尝试改造。
不外由于波及的限制如实比较专科,任务耗时也大大加多,访佛股票分析的任务时常需要运行几十分钟。
以下为具体实测过程。
0 家具训诲也能作念出完好用户调研
假如有一个新入行的家具司理,想要诡计一个北京地区的户外行径 APP,需要对用户需求进行调研。
尽管莫得使命训诲,也可以使用肤浅形貌来生成一份用户访谈提纲。
然后咱们又赓续在输入框中下达新指示:
再帮我生成一份调研问卷。
从念念考过程可以看到,靠近一个比较否认的需求,它能通过自主运筹帷幄(诡计约 30 个问题的调研问卷)进一步明确任务。
而且评估其生成后果,从别称资深户外畅通喜欢者的角度来看,这份调研陈述可谓终点完好——
7 个大类、30 个小问题,从用户基本信息到户外畅通参与情况、行径信息与获取等等,均商酌到了。
接下来,鉴于咱们现在缺乏信得过问卷收场,是以又给它扔了个"缺乏":
能径直帮我生成一份凭空完好用户调研数据,并最终身成一份用户分析陈述吗?
苟简几分钟后,这个 Agent 我方生成了一份凭空用户数据:
横向圭臬项需要万古分拖动才智看完好,竖向共有 100 条数据:
天然,过程中 Agent 也我方发现了诞妄,并屡次尝试改造。
合座而言,这个用户商议 Agent 具备问卷数据分析、访谈纪要回来、调研问卷生成、访谈提纲生成这四大智商,即使零家具训诲也能通过合手续对话竣事我方的调研需求。
每天齐能收到专属股票早报
而另一个股票行家 Agent,由于波及的限制比较复杂,官网披露平均任务耗时为42 分钟。
能作念的事儿包括底下这些:
这里咱们肤浅测试了其早报生收服从。
复古遴选 3 支关爱的股票(这里就不具体展示选了哪些了),以及三个关爱的板块,然后给出当日 A 股早报。
有真义的是,比拟之前的用户调研 Agent,这个智能体则愈加严慎了,过程中还需要用户手动阐述其阶段性完成情况,然后才赓续现实。
而且系数过程征集了大量数据:
不外比较缺憾的是,扫尾发稿前(也曾跑了一个多小时),可能由于行状器资源问题,暂时莫得跑出最终收场。
但是,从其他网友对该智能体的测试来看,据称后果惊艳。
(股票功能)实测蛮惊艳的
小结一下,比拟通用 Agent,行家 Agent 在实用性方面如实更胜一筹。
就家具的初步诡计来看,和"扣子空间"这个名字相呼应,扣子团队但愿打造一个"通用 Agent 和行家 Agent 调解的系统"。
不外按照扣子团队的永远联想,最终主义则如故打造一个洞开的 Agent 系统——
当用户提议需求时,系统能自动转折最合适的一位或多位行家 Agent 协同完成任务。
而抛开永远不谈,仅就当下这个测试版扣子空间而言,收获于它在自主运筹帷幄和任务驱动方面的加强,关于绝大多数本色情况,它也曾是一个可以上手、能用的 Agent 系统了。
One More Thing
这一次,字节在扣子空间上还搞了一波"裂变玩法"。
咱们实测过程中发现,在现实完第一个任务之后,还可以得到五个邀请码。
况兼当五个邀请码一谈用完后,还能得回更多邀请阅历。
是以比拟其他家那种十足阻滞的测试,扣子空间的体验阅历也更容易得回。
临了,有得回邀请码的童鞋来说说你的使用体验吗?
一键三连「点赞」「转发」「防御心」
宽待在议论区留住你的主张!
— 完 —
� � 点亮星标 � �
科技前沿进展逐日见赌钱平台
Powered by 手机赌钱平台-登录入口 @2013-2022 RSS地图 HTML地图