炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!
(来源:网易科技)
上周,Anthropic 推出了他们的最新 Agent 产品 Claude Cowork。刚上线就被大伙儿一通狂吹,什么 AGI 真神降临,打工人的末日要来了。。。上次见到此等盛况,还是在 Manus。
世超赶紧去官网翻了翻,发现这 Claude Cowork 好像是有点东西。
什么归纳桌面文件,总结会议记录,还能深度研究直出报告,整理数据资料做 PPT。。。总之就是啥活儿都能干,难搞的办公杂活儿它都能搞。
各种社交平台上,更是清一色的好评买家秀:
“Claude Cowork 两分钟改变了我的人生。”
“我快哭了,Claude Cowork 爱你哟!”
更绝的是,Anthropic 还自爆 Cowork 内含 100% AI 代码,没有一点人工,只用 10 天就搓出来了。
你说这谁不想看看,一致好评的纯血 AI Agent 到底有多神?
所以,这回世超斥巨资 100 刀深度了体验一波 Claude Cowork,顺手和付费版 Manus 做了个对比。用完我只想说,贵有贵的道理,但真不至于这么贵。。。
先夸一波 Claude Cowork 的界面设计,还是很简洁舒适的。右侧边栏会显示任务进行到哪一步,任务过程中生成的工作文件也可以随时访问。不像一些 Agent 只能慢悠悠出个结果,AI 在后台摸了半天鱼都不知道。
吹完界面,世超要上点真东西了。我们准备测一测它官网给出的四大示例,包括数据分析、文档创建、研究分析、文件和文档管理。
先是数据分析和文档创建,这俩功能放年末有啥用处,大伙儿懂得都懂。每年这个时候,估计不少差友都得来点年终总结,这玩意儿简直是对记忆力、语言组织和 Excel 熟练度的三重考核。
但现在,Claude Cowork 就擅长干这类数据收集整理,技术含量极低,纯纯麻烦浪费时间的活儿。
比如世超让它统计总结一下 2025 年差评君 B 站的视频数据,再把 Excel 直接喂我嘴里。
Cowork 先向我申请了浏览器操作权限,然后就像咱平常收集资料一样,通过 MCP 浏览了一会儿差评君首页。
十五分钟后,它默默返回了一个 Excel,里面的数据不仅包含一整年的所有 83 个作品,而且每条播放量、点赞、弹幕数、评论、投币、收藏、转发,全对。
世超截一部分给大伙儿看看:
这种长程、多条目的任务,其实正是大多数 Agent 最容易翻车的地方。因为这种任务考验的不是 Agent 聪不聪明,而是它能不能在长时间里记得住目标、对得齐细节、还一次都不出错。
我们又用 Manus 1.6 Max 试了试同样的任务,结果 Manus 只统计出了 75 个视频的相关数据,总数都对不上,别的更别提了。
接下来,世超体验了一下大伙儿强推的文件文档管理。不少人都说用它一口气删了几千个截图,清理了桌面一堆乱麻,救大命了。作为一个究极 J 人,世超的桌面本来是相当干净的。只不过今天为了测评 Cowork 多出来不少录屏,系统默认按时间命名,堆一起实在有点难绷。
这回,我先让 Cowork 把三分钟以下的废片删掉,初筛一下。这里向系统申请删除权限花了两分钟,全程三分钟左右。
再把录屏按任务内容重命名,只要一分半,素材立刻拥有姓名。
说实话,录屏一多,一个个打开辨认重命名,是相当麻烦的事儿,这活儿世超平常十分钟都整理不完。
在这里和 Anthropic 商量一下,如果一个月 10 块,我愿意专门为了 Cowork 这个功能开连续订阅嗷。
最后,世超又测了测 Cowork 的研究分析,掏出经典旅游规划问题,指定时间地点,让它推荐机酒和路线。
八分钟不到,Cowork 把结果整理出了一份 docx 文档。总的来说,行程规划没啥问题,比 Manus 要更细一点。
但不幸的是,在机酒价格上 Cowork 还是翻车了。
它的信源出现了问题,价格全是按日常价算的。而实际上春节的机票已经涨到了 4000 以上,酒店也普遍标低了 200 到 400。
相比起来,Manus 的行程预算偏高,但更接近春节出行的真实价格。
世超又测了一些其它的例子,比如生成 30 页 PPT,写个三维弹球游戏,或者总结最近 AI 领域的新闻,只能说偶尔有错误,但大部分任务中规中矩地完成了,没有很惊艳。
不过,放在今天这个整体还不太成熟的 Agent 赛道里,它确实已经算是完成度靠前的那一档了。
说到这里,其实一个所有 Agent 都绕不开的尴尬问题已经初现端倪了 —— 不是它能不能干活,而是你敢不敢信它的结果。
哪怕 Claude Cowork 在同行里已经算很优秀的产品,世超用起来依然提心吊胆,因为你很难信任一个神一刀鬼一刀 Agent。
尤其是 Agent 和普通大模型还不太一样。我们期待它交付的,不是原始材料,而是已经被高度整理、压缩,甚至直接给出结论的成品。一旦中间某个环节出了问题,用户往往很难逐条核验,我甚至不知道该从哪一步开始怀疑。
于是就出现了一个很微妙的状态,Agent 的确帮你省了做任务的时间,但你又不得不花更多精力去检查和验证。
那么问题来了,Agent 炒了这么久,为什么一直做不好?
原因其实也不复杂。今天的大多数通用 Agent,本质上做的事情都差不多:调用工具、执行步骤、读取结果,再把这一切包装成一份看起来很完整的交付物。这件事,对 AI 来说并不算难。
真正困难的,是 AI 能不能在长任务、复杂分支和大量细节中,始终对齐目标、不丢状态、不出幻觉,这也是为什么很多 Agent 看着很忙,结果却总差一口气。
而 Cowork 能比其他 Agent 稍微稳一点,核心原因也不神秘。它底层用的是自家专门为写代码、跑流程、盯细节打磨过的 Claude Code。这种模型本身就更擅长处理长上下文、明确约束和多步骤执行,Agent 只是把这点优势放大了而已。
所以你会发现,Agent 的门槛并不高,大家都能做;但 Agent 的上限也不高,大家也都做得不太好。
在这样一个背景下,Anthropic 把 Cowork 卖这么贵,多少有点犯罪了。
很快啊,开源社区给出了回应,专治各种漫天要价。GitHub 上先是冒出了一个 Openwork,目标很明确,要做一个开源、可扩展的 Cowork 风格系统,刚开源就冲上了 Hacker News 热榜第一。紧接着又来了 AionUI,免费、开源、支持多模型,功能差不多,还不要钱。
结果最先扛不住的反而是 Anthropic 自己。Cowork 上线不过一周,就从 100 美元 Max 会员独占,下放到 20 美元 Pro 也能用,狠狠背刺了一波世超。
所以接下来,世超也会继续把这些开源方案跑一遍,给大家做一轮横向对比。看看在 Agent 这条路上,这钱花得到底值不值,又有多少是真的冤。
撰文:莫莫莫甜甜
编辑:江江