来源:钛媒体
中国、硅谷、模型、具身、AI硬件和AI Agent,这些标签共同组成了今年创投圈最炽热的氛围,而这些看似独立的标签之间更有着关系整个AI创业生态的联动密码。当身上贴有这些标签的头部创业者们汇聚一堂,在阿尔法公社创始合伙人许四清的引导主持下各抒己见,我们得以透视2025全球的华人AI创投圈到底发生了哪些令人兴奋的变化。
嘉宾简介
诺亦腾机器人创始人兼CEO 戴若犁
戴若犁是诺亦腾机器人创始人/首席执行官,毕业于中国科学技术大学(9705)与香港中文大学,获机械与自动化工程博士学位。戴博士在动作捕捉、人机交互以及机器人遥操作、具身智能数据平台构建等领域拥有超过15年的前沿创新经验。在创立诺亦腾机器人之前,他联合创办了诺亦腾科技(Noitom Ltd.),作为公司技术与产品的第一负责人,成功交付数万套动作捕捉系统,服务全球50多个国家用户,帮助公司取得约70%的全球专业动作捕捉市场份额,确立行业领导地位。截至发稿诺亦腾机器人官宣完成数亿元人民币的Pre-A+轮融资,本轮融资由启明创投领投,五源资本、君联资本等机构参与投资。
无界动力创始人兼CEO 张玉峰
张玉峰是无界动力的创始人兼CEO,曾任地平线副总裁、智能汽车事业部总裁、公司董事及经营管理委员会成员,于2025年创立无界动力,该公司专注于构建机器人“通用大脑”与“操作智能”,突破“手、眼、脑”协同的关键瓶颈,让具身智能成为可广泛部署、持续进化的基础设施。公司首代机器人平台已在工业制造与商业服务两大方向取得实质性突破。无界动力首轮3亿元天使融资,由红杉中国、线性资本领投,高瓴创投、地平线、华业天成、钟鼎资本、BV百度风投、同歌创投等跟投。据悉,天使+轮融资已接近完成,累计融资额超5亿元。
Looki创始人兼CEO 孙洋
孙洋是Looki的创始人兼CEO,毕业于卡耐基梅隆大学计算机专业,曾任职于Google,Amazon,Momenta和美团。Looki创立于2024年,旨在通过打造AI的“眼睛”与“耳朵”,将AI无穷潜力融入并赋能于每个人的日常生活。Looki首款产品L1自今年8月在海外上市以来,已取得了卓越的销售业绩与用户口碑;Looki L1已于12月16日正式登陆国内市场。目前,公司已完成天使、天使+和Pre-A三轮共计超千万美元的融资。投资机构包括BAI资本、钟鼎资本、阿尔法公社和同歌创投。
元理智能创始人兼CEO 张帆
张帆是元理智能的创始人兼CEO,毕业于法国巴黎十一大,主修人工智能。2022年创立元因智能,被智谱AI并购,2023年加入智谱AI担任COO,2025年6月离职智谱AI,创立元理智能,聚焦商业强化学习,致力于将模型能力转化为数字化劳动力,为企业提供可量化的生产力解决方案。元理智能已于近日完成近千万美元种子轮融资,由蓝驰创投领投,光源创业者基金跟投。
Aha创始人兼CEO Kay Feng
Kay Feng是Aha的创始人兼CEO,深耕达人营销与AI和SaaS行业7年,以对行业结构的深刻理解,打造出全球首个“AI员工式”达人营销平台Aha。目前已服务300多家客户,覆盖AI领域的全球领先企业与高速成长的创业公司。18岁时,Kay辍学加入Dora AI创始团队,作为市场负责人,推动产品从0成长至50万用户,成为23年增长最快的AI产品之一。Aha已获得锦秋基金、金沙江创投的投资、联想创投和初心资本等多家知名机构的总计千万美金级别投资。
阿尔法公社创始合伙人、CEO 许四清
许四清,阿尔法公社创始合伙人、CEO,毕业于中国科学技术大学和中国科学院,分别获得学士和硕士学位。他曾三次创业,2010年作为COO成功带领创业公司在美国纳斯达克上市。许四清曾担任创新工场投资合伙人、奇虎360首席营销官,后加入中经合任董事总经理负责中国的投资和管理工作,2015年创立天使投资机构阿尔法公社。许四清拥有20年以上IT、互联网及通讯行业的工作经验, 曾开创微软公司华南区业务并就任第一任总经理,担任中国网络通信有限公司数据业务总经理、艺龙旅行网首席市场营销官等职务。许四清共5次获得“福布斯中国最佳创投人top100”称号。
中美创业与资本环境的体感
问题一:2025年您所在的赛道,中美创业环境有什么不一样?华人团队有什么独特的优势?
戴若犁:过去我们服务的更多是影视和体育行业的时候,还是会发现在理念的先进性,或者是说客户的发展阶段方面,美国的领先性还挺明确的,而且基本上都是海外的业务要大于国内的业务。而我们目前的感受和以前完全不一样,至少在机器人这行业里,中美是没有代差。
虽然大背景是没有代差,但实际这个生意做起来还是有挺大区别的。我们做的业务是典型的TO B的业务,TO B业务的本质其实是甲乙双方的劳动力成本置换,或者说是能力的置换。在不同市场环境下,TO B业务的推进逻辑会有明显差异,这与当地的劳动力成本结构、客户组织方式以及技术分工习惯都有关系。相对来说,美国的业务会更好做一些。
在中国市场,企业全栈/全链路自研是一种思维定势,更希望TO B合作企业提供概念验证。但美国的客户或者说全球其他劳动力成本相对较高地区的客户,他们对于垂直整合这件事情的追求就没有这么强势,或者没有那么执着,客户更倾向于基于清晰分工和长期合作关系来推进项目。
所以对我们来说,中国的生意体量大,中国的客户离我们更近,但是海外的客户可能毛利更高,也更容易沉淀长期合作项目,所以市场体感上还是有挺大的区别的。
纯粹说机器人行业,中国市场参与的主体的更多,投资阶段分布更广,覆盖了更多相当早期的企业。而美国市场的资本集中度相对更高,马太效应更强。
张玉峰:第一点,我觉得首先从团队来讲,中国的团队是更兼备聪明和勤奋的。我举一个我最熟悉的新能源汽车和自动驾驶行业的例子,三年疫情期间,海外的很多企业团队都处于停摆状态,甚至直到今天,欧洲的一些团队还在居家办公。但这三年期间,最起码在我所熟悉的新能源汽车和智能驾驶行业,实现了非常快速的追赶和超越。比如我们用八个月时间,帮助一家新势力车企把ADAS自研从立项到量产上车,到头一年就达到十万量级这样一个速度,是非常能说明问题的。
然后第二点,我觉得国内目前的市场和行业的格局,对于打磨产品是一个非常好的机会。国内的B端客户和消费者对于新产品新技术的容忍度和接纳程度都非常好,同时B端客户对于一个新产品导入的要求和期待又非常高。他们可以给资源,给支持,同时也给很大的压力。这种卷法带来的结果,就是我们可以通过与B端客户深入的联合共创,来快速产出有竞争力的产品,再去批量化地复制,包括走向海外。
孙洋:在AI硬件赛道,中国在硬件的产业链上肯定是有优势的。其实大家更多的探索是AI硬件会以一个什么样的方式去切入大家的日常生活,给用户带来更大价值。这是一个相对早期,相对模糊的方向,对于创业团队来说更需要保持的敏捷,是头脑敏捷和实验的敏捷,更多在于想象力和taste方面的探索。
说回中国团队的优势,我觉得软硬之间的结合这件事情,是中国团队毫无疑问的得天独厚优势。美国的软件非常强,AI非常强,但硬件上明显的一个短板。我们也看到很多美国的同行做的AI硬件产品,最后并没有收到市场的正反馈。他们大多数只是兜售了一个比较强的AI概念,但交货有可能一年了也无法交货。
Kay Feng:我们自己本身服务了很多中国科技公司的出海,以及很多欧美本土市场的科技公司。这两类创业公司的市场逻辑有一些明显的不同。欧美的客户在软件领域,或者说TO B领域的垂直专业性和服务深度非常高,公司数量多,资本关注度也高。在每一个细分场景其实都有做的很深的公司,他们的切入口都非常小,但深度做的很深,市场的策略也很垂直。另一方面我们能看到中国出海的创业者们,大部分还是偏向TO C,他们更希望以一个整体的角度去做增长。当然,这得益于中国过去互联网时代积累下了一批流量玩法和增长人才,他更习惯和擅长从这个角度去考虑公司的市场。而欧美TO B公司的增长逻辑和方法论,也同样得益于上一代SaaS类产品的经验和基础。
而最新的变化是,今天新的这一波中国出海科技公司,他们的决策行为已经越来越接近于欧美本土的客户了。
张帆:很多投资人问我的第一个问题都是中国TO B到底能不能干?我觉得,不是中国的TO B不好干,是中国的软件不好干。咱们看那些国内互联网广告平台,大家都在心甘情愿的在付费嘛。我觉得中国软件企业不好干,是由于中国的企业的数字化还没有那么成熟,以至于他无法判断一个单点在整个链路里的贡献,所以只能是通过整个链条的结果来判断价值。而AI是一个非常好的切入点。在AI出现以前,我们卖软件其实都是一个不显性的价值呈现。但今天AI让我们有机会把软件的显性价值做出来。比如我们今天真的能将AI转化为一个数字员工,那它到底能给企业带来多少价值,是完全显性的。这也是为什么我们一直认为AI在TOB上并不是对标软件市场,而是对标劳动力市场。
第二个点来讲,我觉得中国的优势在于大家对于新技术的拥抱,比绝大多数海外国家要更快的。像欧洲很多人还在还用诺基亚的功能机。过去我们服务过很多全球性企业,我们会发现即使我们的基座模型并没有美国那么好,但是我们在这些跨国项目上所产生的结果,都会作为客户全球合作的标杆。中国对于新技术的拥抱和开放,是在刻骨子里的。
在大模型的方向上,中美其实还是蛮一致的。在国内,无论是智谱,字节,阿里、kimi等等,基础模型都做的很好,可能只用了海外模型的十分之一甚至更少的算力,就得到了今天这样的结果,普及率也非常高。可能唯一的区别在于,今天中国企业对于模型应用的转化率是比海外团队快得多的,所以我们从应用反馈回来的认知也会更多。
问题二:2025年公司或者AI圈最让您兴奋的事情是什么?
张帆:让我最兴奋的事,其实是强化学习的跑通。其实强化学习本身并不是个新技术,但是在去年Q4,几乎所有的人都在讨论一个话题,就是人类数据不够用了。甚至连illiya也在公开发言说人类的语料是化石燃料,用完就没了。但你会发现,今年已经没人聊这个话题了,根本的原因其实是在于强化学习的跑通。特别是应用在今天大量的数学,大量的coding,GUI已经得到了非常强的验证。
之前的情况是,人标的东西你才可以学,如果人标不了,你就学不了。所以严格意义上,机器永远超不过人。但是强化学习的出现,让我们开始从alphago走向alphago zero,让我们突破了人类的认知边界。这件事儿带来了一个极大的变量,我认为也由此开启了AI的下半场。
Kay Feng:2025 年行业中让我最兴奋的一件事是:Agentic AI第一次在真实业务里跑通了。之所以说这是今年,不是因为agent这个概念新,而是因为支撑它跑在真实业务里的关键技术条件,直到 2025 年才同时具备。第一是长期任务和上下文记忆真正跑通了;第二是工具调用和执行稳定性发生了质变;第三是从人类示范,转向结果驱动的自我优化。 回到公司来看,作为 Agentic 的TO B产品,今年我们从业务数据上真的能看到Aha作为一个平台的飞轮效应被点燃,我们达人侧的入驻速度,呈现了一个指数级的增长,半年内就从0上涨到5万。然后另一方面,就是全球那些最顶尖的AI客户和头部大厂都能选择我们这样一家成立才半年的公司。
孙洋:我觉得最兴奋的两个点就是Google的回归和Gemini 3的出现,其实这两个也是一回事啊。我觉得Google的回归是让整个25年的模型赛道拨乱反正。大家之前会看到Open AI已经开始做一些硬件,但其实我觉得模型还远远没到天花板,Google的回归也让大家重新聚焦回模型能力的进一步提升。而Gemini 3的出现也符合我们的预期,在多模态能力又前进了一大步。去年大家所看到是,都是假的多模态,今年Gemini 2开始大家又在做图片帧的动态,然后直到Gemini 3的出现,视频的能力又进一步增强,这是符合我们对模型发展趋势的预判的。
张玉峰:技术的发展层面上,其实让我最兴奋的今年能看到视频生成大模型,真的能将越来越多的物理规律展现,内嵌到其生成的视频中了。这不仅是对Scaling Law的进一步佐证,同时也对未来具身行业的数据补充,给予了我们很大的信心。
从我们无界动力来说,最令我兴奋的,还是成立不到半年时间,我们就成功的让一群背景各异的超级个体们快速融合成了一支执行效率极高的团队,也基本上完成了每个环节的从零到一。
戴若犁:2025年,我女儿考上了一个她特别喜欢的学校,这个肯定是第一啊。然后我们讲回科技圈。过去来跟我们聊数据业务的业内同仁一般都在聊几千小时,顶多上万小时的数据。但是就最近美国有一家公司叫Generalist,这家公司大力出奇迹,自己独立验证了一把Scaling Law,他们用了27万小时的数据做了训练,并且在这27万小时之内没有看到任何训练收益的放缓。这件事情之后,来找我们聊的业内同仁们的数据单位也都变成了以十万小时为单位。这也让具身这个行业整体认识到Scaling Law的边界其实还很远很远,这件事还是挺让人兴奋的。
问题三:您觉得中美的科技资本环境有何差异?
戴若犁:美国的早期阶段融资中,如果是用SAFE(Simple agreement for equity)这样的方式融钱,机制相当简化,这是很伟大的。他们也更愿意在小圈子里边闭环,整个融资的事情就在一个微信群或者group里就能完成,更强调对创新和试错的支持,对于创始人的压力相对比较小。
张玉峰:我感觉关于坚信一个技术或坚信一个方向长期投入,也就是资本的耐心方面,美国整体上还是一个更加包容的状态,这一点确实值得我们继续学习,但也并不是一个特别大的问题。
孙洋:我觉得其实在硅谷,在美国的VC圈,投资一些高风险的项目来获得高回报这件事上,大家收到过很多的正反馈。而在国内,大家可能更愿意投一些共识类的项目。但我觉得在今天中美在AI这个赛道上,基本上一个同样的起跑线。希望中国的VC能够更大胆地去支持创业者去做一些非共识的事情啊,和冒风险的事情。
张帆:今天国内的资本市场过度相信共识,我觉得无论是创业还是技术,其实只有反共识才能带来竞争力。我们都在追求做更大的芯片,更大的集群,更多的token,token的单价更低,然后我们要做C端,我们要1~2人的公司,快速能拿个100万美金的ARR坦率讲,我觉得这些其实都是偏向于线性思维。
许四清:中国在早期投资领域还有很多值得向硅谷学习和借鉴,从投资行为来看,硅谷的风险投资中,有接近一半集中在早期投资;中国的这个比例是他们的1/5-1/7,从这个角度看,我们还需要加强。
深度对话:具身、模型、硬件与Agent
To 戴若犁
许四清:诺亦腾本来占了动捕差不多全球七成的市场份额,你为什么把这个诺亦腾机器人拆出来单独做呢?这个想法的出发点是什么?
戴若犁:传统的动作捕捉技术服务的都是一些小而美的行业,像影视特效,人机交互,重度科研,体育运动,医疗健康,它的天花板并没有那么高,但是很刚需,整个行业的迭代也不会太快。而机器人这个行业的进步是非常快的,这个行业的成长速度,已经是指数级的速度。
所以我们会需要用不同的团队,不同的思路,不同的企业的经营方式,也需要用不同的估值和募资的体量去支持这件足够大的事情。当这件事足够大的时候,其实是特别值得最好的团队一起进来的,所以就决定成立一家新公司。
许四清:大量的机器人公司在自己做动作捕捉,为什么需要你?
戴若犁:核心其实还是专业化分工和成本问题。就像台积电和富士康存在的核心的原因其实是有大量的成本摊销。对于绝大部分的机器人公司来说,数据的Infra的团队本身不是核心,但却是一个长期、高投入、高经验要求的团队,因此规模体量可能也较小,往往很难在资源、规模和经验积累方面形成效率优势。
而我们可以在多个客户和项目之间去摊销长期的研发成本,我们专精这件事情的同事持续积累在数据采集、处理与交付上的经验。所以从各个层面上面来说,诺亦腾机器人(Noitom Robotics)作为一个三方的数据服务商,还是有稳定的市场空间的。我们的核心的理念是:做核心用户的非核心任务的核心供应商,这可以说是我们做TO B的精髓。
许四清:展望机器人行业未来十年,你最期待出现怎样的颠覆性的进步和变革?
戴若犁:我现在最希望看到的,就是人形机器人的通用性能够在商业领域被验证。
目前其实不管是英伟达还是特斯拉,他们对于人形机器人的执着其实是都是建立在底层假设第一性的基础上。但事实上,迄今为止商业领域中不同场景的经济性和适用性仍在探索阶段。一边是专机,也就是专门设计的特型机器人,另一边是真人,这个中间的夹缝,是否真的可以通过人形机器人找到稳定可持续的应用空间,我认为仍然需要时间来检验。
如果在未来五到十年内,能够看到人形机器人在部分商业场景中形成清晰的价值闭环,我会认为这是对整个行业非常重要的一步。
许四清:再继续追问一下,您认为机器人的商业化验证最有可能先发生在商业领域还是工业领域?
戴若犁:我认为应该是在家庭领域。我个人一直不认为工业生产制造当中的那个夹缝足够宽,能够让人形机器人找到落地的价值。因为在工业领域里,特别确定性的任务就会走向专机,而特别泛化而困难的柔性的任务就会走向人类,所以中间的夹缝会非常的小。反而是在家庭场景里,虽然实现困难,但是还是会有很多机会。特别是一些在家庭里所谓时空分离的机会,比如扫地机器人这种场景。时空分离下对于容错性,安全性,隐私性等各方面的容忍程度都会高一些,又不像在工业领域里非常容易被自动化流水线专机和便宜的人类劳动力去替代,所以这个夹缝会稍微宽一点点。
许四清:最后一个问题,针对刚才提到的27万小时的训练数据,在你看来真实数据和仿真数据之间是一种什么关系呢?
戴若犁:来自于真实世界的真实数据和合成仿真数据,这两条路径肯定是一个协作状态。
我们从最底层来说,机器人需要从数据中学习的东西可以粗暴地分为两类,一类叫做规则rules,另外一类叫做先验叫prior。这两类东西里,规则是可以枚举和合成的,但人类先验是无法枚举和合成的。从这个底层逻辑来说,很难说真实数据或者仿真数据单一能解决所有问题,大概率这两者其实是需要合作的。
To 张玉峰
许四清:无界动力提出的通用基础模型和通用专家模型双线驱动,那你们是如何构筑你们在这两个场景里的核心竞争力呢?
张玉峰:先回应一下刚才戴总和许总聊的这个话题。我觉得首先,面向具身的基础模型或者基座模型,最终还是要在真实场景中去得到锻炼迭代。只在仿真或者在实验室去做,永远难以接近真实场景所需的泛化能力和精准度,也很难普及开来。我们必须要通过实际的部署来实现规模化,其实无论是对于大语言模型还是具身来讲,规模化还是一个非常重要的话题。
其次,从路径上来看,其实我们可以快速回顾一下智能驾驶。过去十年的时间里,有像Waymo这样的企业,希望一下就能把复杂的事情做到无人化;也有像Tesla这样的企业,走渐进式路线,从一开始仅能做到车道线保持,然后学会了变道、并线、上下匝道再到城区驾驶,整个过程中都在不断地采集数据。我们会认为,渐进式的路线其实是我们具身智能公司能够去形成突破并构建护城河非常关键性的选择。其实人工采集的训练数据量即使达到27万小时,相比我们整个人类的语料数据量还是差很多。将来为了更大数量级的数据采集,要付出的代价会越来越高。它的成本性、可持续性到底如何,我还是抱有一个问号。
不同于大语言模型或者自然语言处理那个时期,存在着很多既有的专家模型。大模型的出现,就基本上把专家模型全都并掉了,实现了快速的“由专到通”。但这件事的前提是有可获取的、海量的数据,所以比较容易通过新的算法范式去训练大模型兼并掉各种专用小模型。但是具身智能现在面临的挑战是优质的、尤其是真实场景的真机数据非常稀缺,所以很难一蹴而就,我们还是要坚定地走渐进式的发展路线。
再说到场景选择,其实从场景到任务,本身有两个维度,一个是场景的复杂度和多样性,一个是任务和包括被操作物体的复杂度和多样性。家庭场景属于四象限里最靠这个右上角选择,也就是场景本身和任务对象都更复杂的区域。确实有很多企业在深耕这个场景,但更多的企业,包括Tesla、Figure等,虽然嘴上讲着要进家庭场景,但身体还是很老实地扑在了B端场景,包括工业,商业服务等。这些场景都能够让我们在目前技术不成熟、数据量缺少的情况下,通过做一定的减法,就能够较快的实现落地闭环的。
说到我们自己为什么有双线驱动策略,其实是要用好这个通用基座模型的通识能力来支持我们的垂类专家模型,使得其能够在半结构化的工业制造或者商业服务场景去产生价值,再进一步去激活整个数据闭环,实现商业支撑,在这个长坡厚雪的赛道上打一场更持久的仗。
我们的信心来自于我们在过往自动驾驶行业中,研发交付超1000万套的智能驾驶软硬件产品。然后我们希望通过这种持续的渐进式的路径,结合技术场景,利用好生态,把我们具身智能的护城河持续的拓宽。
许四清:你认为具身智能的突破是否就依赖世界模型的突破?还是有什么其他路径?
张玉峰:世界模型这两年确实非常火,然后也衍生出很多不同的子概念,也容易让人混淆。大的类别上肯定有显式的仿真模拟真实世界的生成式世界模型,比如李飞飞老师正在做的事情或者可交互的视频生成类大模型,同时也有内嵌在模型算法里隐性的,为决策提供物理规律先验的隐式世界模型。
先说结论,我认为世界模型是具身智能走向通用的一个非常强大的必要条件。从生物的智能进化路径上看,自从哺乳动物进化出新皮质,就拥有了对自身运动和内部状态,以及对外部世界的预测想象能力,这实际上就是世界模型。这个世界模型和像Sora这样像素级别构建虚拟空间的显式世界模型不太一样,它不需要耗费那么大的资源来做像素级还原,但是却能基于对物理规律的认知,让包括我们在内的哺乳动物拥有预测、想象、揣测、模拟这个世界可能的变化并更好地在现实世界完成动作的能力。
所以具身智能如果要走向更像人一样去思考,去模拟,去预测。从终局来讲,其实需要一个类似于人和高等动物一样内置的隐式世界模型。不仅让机器人知道要做什么动作,还要理解为什么做这个动作,而且能够去模拟想象做这个动作之后会发生什么事情。
我们无界动力当前更多的是在隐式世界模型方向上做研发,把它内嵌在负责动作执行的VLA模型里。同时显式世界模型也是有意义的,对于目前数据短缺情况下(基于真实数据增广)提供高质量的数据补充也非常有帮助。现在自动驾驶行业也用这种世界模型来做一些corner case 数据的增广和生成,sim2real gap相比以前小了非常多。在隐式和显式当中,我们更侧重于投入在隐式的世界模型上,同时在显式的世界模型上也会有相应的一定量的投入。
To 孙洋
许四清:Looki的第一代产品是以记录生活作为切入点的,现在产品也非常受欢迎,那这一代产品对Looki而言,是探索人机交互的一个起点呢?还是会继续把单一产品做到极致?
孙洋:应该说是一个起点吧。我们的核心就是在给AI做眼睛和耳朵,然后让AI在物理世界里生活。大家可以把具身理解为,它有像人一样的大脑,然后再加上四肢,能做一些事情。其实Looki在做的事情,就是先把四肢去掉,看能不能先把第二大脑的功能实现
对于第二大脑而言,Looki只是一种形态,未来也可能还会有其他的形态。这其实是随着整个硬件供应链和产业链的发展而改变的,怎么做到低功耗,怎么能做到无感化,怎么能融入大家的穿搭里去,形态上未来一定还会有各种各样的这种延展。
从功能上来讲,其实也会随着模型能力的增强,包括我们自己搭的记忆infra系统的升级,不断地生长共进。我们最终还是希望搭建一个叫human-centered AI,也就是以人为中心的AI。这件事情的价值在于,今天人类所有和AI的交互还是要锁在对话框里边,对于普通用户来说,每天生活里面发生的所有事情,我都要转换成语言,转换成prompt,然后才能给到AI的对话框。那我们换一个思路,为什么不能把AI从对话框里拿出来,让AI自主能看到和听到物理世界里发生的事情,这个过程将不再需要用户再去做一个prompt转换。
我们有一个口号叫做:这个世界就是AI的prompt。这是我们的核心理念,这是一步一步去延展的。我们先把大脑做好,可能最后再把四肢做好,未必说Looki在五年十年后不去做这件事情。通过一个消费电子产品让大家先用起来,数据飞轮能够转起来,我觉得把启动器找到这件事儿是最重要的。
下一代产品我们会做proactive AI或者叫real time proactive AI:更适时的主动式的AI。今天我们L 1的产品是需要三段式的,先记录,然后上传AI分析,最后给你反馈记忆。到第二代产品L2的时候,适时发生的所有事情AI都能够快速给予反馈。L3会是更远期的设想,我们觉得五年之后,模型的能力会让今天所有的互联网服务都变成Agent,但整个的Agent网络里面会出现一个新的角色,这个新的角色就是一个中心的General Agent。这个agent它本身不能实现任何的服务,但是它是非常懂用户。当用户给他下达一个简单的指令,General Agent会把这条指令延展成非常丰富的context,然后去对接其他服务型Agent。
许四清:你认为中国的硬件产品在走向全球化的时候,最大的挑战是什么?
孙洋:我觉得对于AI硬件来说,今天最大的挑战还是在于data compliance数据合规。因为今天的AI硬件更多都是一个数据的入口,这件事情让数据的合规性变得非常重要。比如说最基本的,你要把数据留在当地;第二,你要做该做的数据审计;然后第三,基于不同的国家,还要对数据所有权有一些规定。而这些对于之前的消费类硬件来说,并没有相关的积累。
To Kay Feng
许四清:Aha快速地构筑了非常好的AI科技达人的网络,你们是如何实现这个快速增长的?
Kay Feng:其实第一个点是这个市场本身的需求就非常强烈。我们服务客户的时候,本质上客户花的是他的营销预算,我们看到营销预算里的一个最大的变化是过去大家可能把钱更多地花在广告上,但现在其实更多的预算在往达人营销迁移。新一代的很多科技产品、AI产品,其实一半以上的预算都投放在了达人营销上,而不是传统的投流广告上。所以这里面就产生了每年上百万美金的达人投放预算,但是这个投放过程在过去是非常低效的,这也成为客户本身一个非常亟待解决的问题。所以你只要能做到一个比过去的agency更高效,规模更大,然后体验更好的产品,那客户就一定会来尝试。
另一个角度上,在平台开始有客户之后,就会开始有新的达人上来接单,而它是一个自动化的流程。所以那就意味着其实客户越多,达人就会越多,达人接过一单之后,对平台有信任,那客户那一侧的体验显然就会更好,那就会有更多客户进来。这其实就构建起来了一个飞轮,他们相互之间不断地撬动,所以这也是一个双边网络的独有优势。
许四清:你们在美国遇到类似的竞品多吗?
Kay Feng:其实从我们目前的情况来看,真正意义上的竞争对手更多还是传统的人工模式竞争。这是因为我们现在主要服务的是中型及以上规模的客户,在过去,这类客户在达人营销上的主流解决方案,基本只有两种:
一种是外包给 agency,另一种是少数公司选择自己搭建一个比较大的内部团队。
从行业背景来看,达人营销本身和传统广告有比较大的差异。
很多 agency 的核心能力,其实来自创意广告,或者是上一代以Google、Facebook投流为核心的代理体系,它们在投放和创意上都非常成熟,但并不完全是为达人营销这种高协作、高执行密度的工作形态而设计的。
而达人营销这个领域,长期以来并没有形成特别强势、规模化的Agency形态,一个很现实的原因是:它本身就是一件高度依赖人力执行的事情。
在创意广告里,一个成熟的人可以管理非常大的预算体量,一个人就可以承接100万美金的预算;但在达人营销里,预算规模一旦上来,对应的执行人力几乎是线性增长的,要做100万美金的达人营销,可能就需要100个人来做。
所以其实今天在欧美,客户反而会更迫切地寻找能降低对人工规模依赖的解决方案,因为如果想规模化,他的人力成本是真实存在的。
To 张帆
许四清:你原来做通用大模型,现在你要做商业的强化学习,是否可以与大家分享一下你对模型的看法和心得吗?
张帆:首先我觉得一个有意思的点就是在于,我觉得商业强化学习跟基座模型,它不是一个赛道,它是一个延展关系。市场上一直有一个两种逻辑的争论,一种逻辑说将来会有一个超级大一统的模型解决everything;另外一种逻辑说将来市场上会出现无数的垂类模型,来解决不同的事情。这两种到底哪种会是未来。
我们先看看人类是怎么做的,我们会发现人类从5000年前到今天,其实人的脑容量没有明显的变化,但是今天的人类比5000年前的人单人的生产力大了1000倍。你可以发现,进化论并没有把我们每个人进化成一个200斤的脑袋,而是让我们维持原有的脑袋的size,但是我们解决问题的能力依然可以远超原古时代的人类。这个核心的原因和变化就叫做分工,分工之后就是协作。
分工的逻辑是在于让每个模型独立训练,协作的逻辑是在于让所有独立训练的模型解决统一的目标,从个体智能转化为群体智能。所以你会发现整个社会的本质上是一个超级MOE,这也是我们的底层逻辑。
我觉得在这个阶段,你让大脑的智商再继续上升,其实边际效果已经下降了,不经济了。同理,今天的模型已经足够强了,我们如何在今天给模型构建一个大学,让他从一个标准的智商转变为无数跟业务耦合的最优解,从而实现从个体智能到群体智能的飞跃。这也完美符合了OpenAI的AGI的五条路的level 4和level 5。所以我们做这件事的原因其实是基础模型的延展。
许四清:那你觉得商业强化学习,最先在哪些场景上可以实现突破呢?
张帆:我觉得首先取决于我们怎么定义这件事。我们今天把它定义为是一个劳动力市场的事,而不是一个软件市场。劳动力市场大概是一个50万亿美金的市场,比软件市场大50倍。在这个市场中,我们的切入有两个选择标准,一个是今天的市场规模,今天有哪些工种所占的市场份额是最高的,肯定是我们优先选择的。第二个就是哪些工种,今天是可以完全在数字空间里解决的,也会是我们优先选择的对象。
许四清:你曾经提出整个AI行业存在供给热需求冷的状况,企业也会被这种状况带入这个焦虑驱动的采购陷阱,你觉得你能改变这个采购陷阱吗?
张帆:这件事儿是一个很明确的观察,我们发现今天其实是一个供给跟需求极度错配的市场。具体来说,今天所有的人,包括一级二级市场,针对于供给侧几乎是无条件投入。大家会要更强的芯片,更大的集群和更强的基模,capex也从24年的2000亿美金提升到了25年的4000亿美金,明年可能就万亿以上。另一方面,模型的成本逐步下降,芯片的性能逐步提升,未来三年我们可能会比现在多1000倍的token的产量,但大家从来没有怀疑过它能不能被消耗掉。大家都认为,只要算力足够便宜就一定能被消耗掉,我觉得这个其实是不一定。
那么我们再看需求侧,MIT之前有一个分享讲到今天大概只有5%的PUC是真实落地并且带来了数百万美金的收益。这个跟我们过去两年在整个市场上看到的情况是高度近似的,今天大模型落地是极其单调和重复的,无非就是chatbot、知识库、合同审核,打标签等,其实根本就没有切入到核心业务,有点像具身领域大家都在翻跟头,但是没有真正进流水线的逻辑。
许四清:这个非常有意思。所以你看到了大家在大炼钢铁一般炼模型和芯片,但你没有看到大家在需求侧把这些练好的模型和芯片用到极致,你就是想解决这个问题是吧?
张帆:对,我想解决这个问题。我觉得AI其实更多对标的是电力,你会发现电力是通过影响物理世界的方式在影响人类的生产生活,比如说是电梯让整个城市从平面变成了立体,改变了我们所有人的居住方式,房地产业,城镇化,地铁交通一切问题,而不是电力本身。所以今天AI也需要嵌入物理世界,这就是为什么我们觉得TOB很重要。
但是如果要嵌到物理世界,最大的问题就是在于:一个是效果如何直观观测,一个是成本如何下降。原来我们所有AI界的人,大家都在做一件事,叫做为知识建模。无论是垂类还是通用,我们都是把人类世界所有知识压缩到一起放进去,然后压缩成一个模型。这种方式确实有一定的通用性,但是我们任然认为将来会出现无数个专业模型,这就意味着我们不能再靠人标了。今天对于模型的调优策略是极度局限的,就是做SFT、prompt优化、workflow,我不认为这能走到一个真正的终局。所以我们觉得必须要找到一个大一统的方式,用一个标准的手段解决一切垂类环境跟模型的最优匹配。
寄语2026
孙洋:2026年,我觉得会是非常争议的一年。这个争议点在于AI产品上可能会出现的百花齐放,以及大家认为26年可能会有很大的bubble。
张玉峰:希望两边的学术、技术、产业都能够快速发展,尤其是这个两地之间的交流、合作、协同能够越来越顺。
张帆:我觉得26年会是一个AI真正进入物理世界的元年,也是一个商业强化学习落地的元年。25年更多的价值体现在了供给侧的财报,比如英伟达,但我期望26年,我们能看到AI可以给二级市场AI带来了明显的业务价值的提升。
戴若犁:我们是服务具身智能这个行业的,所以我个人的期待其实很朴素:一方面希望马斯克身体健康,继续把人形机器人这条路线往前推;另一方面希望这一波具身智能创业公司都能走得稳、走得远,希望我的客户们都越来越好。
Kay Feng:首先26年还是希望AI行业更好,更多的客户的产品走过PMF的阶段,到达go to market的阶段,希望大家的产品能够在全球更多地区扎根。
许四清:我对2026年的期望是,具身智能的落地前景能从此变得更加光明。目前具身智能面对的探索环境与大语言模型截然不同,受限于数据匮乏,行业只能在“小脑”层面进行探索。我希望2026年大家能将探索重心转向“大脑”层面,为具身智能的突破奠定基础。(本文首发于钛媒体APP,由钛媒体编辑陶天宇整理)
特别声明:以上内容仅代表作者本人的观点或立场,不代表Hehson财经头条的观点或立场。如因作品内容、版权或其他问题需要与Hehson财经头条联系的,请于上述内容发布后的30天内进行。