街坊秀 街坊秀

当前位置: 首页 » 街坊资讯 »

面向无人系统的具身社会感知智能

(来源:科创中国)

自主智能无人系统在动态复杂、多主体耦合、信息不完备且社会约束强的真实开放环境中运行时,面临合规性建模不足、社会风险感知受限、协同冲突突出及异常响应滞后等关键挑战。本文提出一种具身社会感知智能框架,并引入代理式人工智能(Agentic AI)作为顶层决策与控制机制,实现多层级、自主化的认知决策,为实现可信赖、可解释、可持续的自主智能系统提供新的技术路径。

在俄乌冲突这一智能化对抗的试验场上,多种新技术与新装备不断涌现并投入使用,无人系统与人工智能的深度融合不仅凸显了现代对抗的高科技特征,也在重塑传统对抗场格局。与此同时,人工智能在信息与认知领域的作用同样突出。这种由多源信息汇聚、经智能算法解析并快速转化为行动方案的方式,不仅限于国际对抗冲突,也为民用领域提供启示。

无论是在对抗环境中提升透明度,还是在灾害救援中加快响应速度,都表明一个共同趋势:对物理环境的实时感知、对社会因素的动态反馈以及基于智能算法的自主决策正在逐步融合。将具身感知、社会信息获取与智能体决策机制有机结合,不仅是应对复杂现实场景的必然选择,也将成为推动自主智能无人系统走向可靠、可控和工程化应用的关键路径。

1、从具身感知到具身社会感知智能

从具身感知到具身社会感知智能的转变,不仅拓展了感知能力,也是实现更高级别智能的关键。

1.1 具身感知

具身感知是自主智能无人系统实现环境理解和任务执行的核心基础,涵盖了对自身状态、外部环境以及人机交互的全面感知(图1)。

其一,本体感知使系统能够实时感知自身的位置、姿态和受力状态。

其二,交互感知赋予系统皮肤,通过柔性电子皮肤的分布式节点,系统能够同时感知压力、剪切力与温湿度。

其三,外界感知是无人系统连接环境的主要通道。

其四,内部感知聚焦于系统的自身状态。

其五,意图感知扩展了具身感知的社会性边界。

5类感知共同支撑了智能无人系统在复杂环境中的稳健运行,它们不仅使机器具备自知能力,也让其能够感知环境和识别健康状态,甚至初步具备理解人类意图的潜力。然而,这些感知大多仍停留在物理和个体层面,难以触及社会语境与群体协同的复杂性。

1 5类感知常见传感器

单纯具身感知的4大局限:

1)任务起始和优先级判断混乱,缺乏对紧急重要的正确判别;

2)合规性不足,难以将法规、礼仪与临时管制转化为可计算的约束条件;

3)社会风险感知不足,群体拥挤、情绪波动与伦理敏感点常在感知缺失下爆发;

4)突发响应滞后,系统只能被动等待物理信号,而无法基于社会先兆提前调整。

1.2 社会雷达

1.2.1 社会雷达的起源

社会雷达的概念并非凭空产生,而是历史经验、学理积淀与现实事件相互作用的结果。早在中国古代,《诗经》中的风、雅、颂体系与相传的采诗制度相联系。与当今依托社交媒体与网络动态追踪群体态势的社会雷达在原理上相通,可视为其思想雏形。

传播学者Schramm20世纪80年代借用雷达这一比喻,首次提出社会雷达一词,用以形象说明社会系统如何通过采集、识别与反馈信息,为社会雷达提供了理论框架。

2011年,阿拉伯之春成为社会雷达走入公众视野的重要契机。进入大数据与人工智能时代,社会雷达逐渐演变为一种面向公共治理和网络安全的智能服务平台。由此,社会雷达完成了从采风式的经验性探索,到社会态势感知的理论化设想,再到智能平台的工程化实现的发展过程,逐步成长为理解社会动态与群体行为的重要工具。

1.2.2 社会雷达的发展

早期工作主要停留在社会科学和传播学领域,强调其类似物理雷达的功能。如今,研究开始聚焦于如何将社交媒体、在线论坛和新闻报道中的多源信息转化为可计算的社会态势图。近年来,社会雷达的研究进一步扩展到网络安全、交通、城市治理和智能车辆等领域。最新研究将多普勒效应引入社会雷达,提出社会多普勒雷达的概念,用以刻画社会情绪和群体行为的动态变化速率与方向。图2展示了物理雷达信号处理流程与社会雷达信息感知阶段之间的对应关系。

2 雷达与社会雷

1.2.3 社会雷达的优势和局限性

它能够在社交媒体、在线新闻和舆论场域中高效捕捉社会信号,实时识别突发事件与公众态势的阶段性变化,体现出显著的时效性与敏捷性。社会雷达可在跨地域的虚拟空间中实现大范围感知,具备广覆盖与跨域联动的优势。更为关键的是,为理解合规要求、社会情绪与潜在风险提供语义层面的支撑。然而,该范式亦存在固有局限:

其数据源噪声大、虚假与夸张信息频发,易诱发信谣传谣;资源调度与行动优先级可能失衡;如何将抽象社会信号可靠地映射为无人系统可执行的约束与目标,仍属跨学科的难题。

由此可见,具身感知与社会雷达构成物理可见社会可预的互补范式:前者确保无人系统看得清,后者使其听得懂。两者结合,方能支撑从场景理解到决策执行的端到端闭环。但融合并非简单相加,现实中至少面临3类核心挑战:

其一,跨模态语义对齐,仍缺乏统一而可验证的建模框架;

其二,多源数据的时效性与可信度评估,亟需建立面上任务的置信度与溯源机制;

其三,物理代价与社会优先级的权衡。

1.3 Agentic AI:主体性与群体自治

1.3.1 Agentic AI的内涵与机制

代理式人工智能(Agentic AI)的核心不再是孤立任务的执行,而是围绕从目标到行动的端到端闭环。其通过目标生成、任务分解、工具调用、记忆与反思,以及编排与治理5大机制的协同,能够在复杂、多步骤且需多方协作的场景中展现稳健的自治能力。

为进一步界定其本质,对比了生成式 AIgenerative AI)、AI代理(AI agent)、生成式代理(generative agent)与代理型AIagentic AI)的关键特征(表1)。

生成式AIAI代理、生成式代理与代理型AI的特征对比

1.3.2 Agentic AI的发展和应用

近年来,Agentic AI正逐步展现出作为多角色自治与编排系统的独特优势,能够在复杂、跨域与多步骤任务中实现高水平的自主性与可控性。

在科研领域,Agentic AI与无人机系统的深度融合催生了“Agentic UAV”新方向。总体而言,Agentic AI的应用呈现3大方向:

其一,无人系统智能化,包括无人机群协同、低空经济调度与自主对抗规划;

其二,工业与物流优化,涵盖仓储调度、生产线优化与供应链动态管理;

其三,跨域决策支持,通过记忆、反思与多源验证机制推动系统从能做走向做得对

上述进展亦为具身感知与社会雷达融合中的关键难题提供了新路径。据此,提出具身社会感知框架,以Agentic AI为中枢,将物理感知与社会感知深度耦合,构建面向无人系统的感知、认知、决策闭环。该框架既满足城市治理中的实时合规需求,又能支撑应急救援的快速响应与资源优化调度,并在群体协同与复杂联演任务体现更高的稳定性与协调性。

2、具身社会感知智能的基本框架

随着无人系统逐步深入人类社会,单纯依赖物理层面的感知与控制已难以支撑复杂多变的人机、群体交互。为此,在明确具身感知、社会雷达与Agentic AI3者内在关系的基础上,提出具身社会感知智能框架(图3)。3者协同构建由元控制层、感知层、推理层、执行层与反馈层组成的动态闭环,旨在赋予无人系统在复杂人机共融环境中的高级自主决策与社会适应能力。

具身社会感知智能框架由5个层级构成,5个层级自上而下联动,使无人系统在复杂环境中既能看得见、听得懂,又能做得对、持续学

3 具身社会感知智能框架

3、具身社会感知系统的基本流程

我们提出的具身社会感知智能框架,其核心逻辑在于引入基于Agentic AI的元控制层,将社会雷达与具身感知整合进统一决策闭环,使无人系统逐步成为具备物理实证与社会适应能力的具身社会智能体

该框架的整体工作流程由元控制层的顶层设计与驱动启动。其元控制层采用Agentic AI技术,将单一系统或系统集群塑造为具备自治性的智能体。该过程体现出自顶向下的策略制定与自底向上的闭环校正相结合的机制,使系统在任务推进中实现动态监督、协同与优化,确保目标可达与路径可审计。

感知层作为闭环的起点,接收来自系统内外海量且异构的原始信息流,涵盖5大感知维度。面对庞杂多模态数据,感知层采用以特征空间特征对齐为核心的多模态融合范式,并非简单叠加而是分阶段处理。由此产生的结构化、语义丰富的感知融合结果,既提供对物理世界的精确刻画,也包含对社会情境的初步理解,为后续推理层的情景化推断与约束构建提供高质量、高信息密度的决策依据。

接收感知层的融合表征后,推理层启动其核心的认知与决策过程,旨在基于当前信息生成满足物理规律与社会规范的行动意图。该层以思维链与检索增强生成为基础架构,由社会工具约束、物理空间理解和社会空间理解3模块协同作用,3者并行迭代、相互制约。在可解释推理框架的支撑下,推理层形成逐级可审计的推理流程与可复核的知识溯源,最终给出物理社会空间综合理解结果,为下游执行层提供可操作、可验证且具有边界意识的行动指南。

推理层输出的决策意图被输入至执行层,用以指导具体行为执行。执行层的核心任务是将这类高阶、抽象的意图经由动作解码器与控制栈转译为可操作的物理动作和与人机、机机交互行为,其流程包含单智能体执行与多智能体协同2个层面。当系统由多个无人单元构成时,元控制层通过治理与编排将若干独立的单智能体执行上升为多智能体协同。因此,执行层的输出是一系列精确的执行信号,直接驱动系统的电机、扬声器、显示屏等硬件单元,将智能决策最终外化为在物理与社会世界中的实际影响。

为了实现系统的持续学习与进化,反馈层闭合了整个工作流程的环路。反馈层内部由反馈机制与更新机制构成。通过反馈、提炼、更新的闭环迭代,无人系统得以在每次任务后持续吸收经验、修正误差并适应环境漂移,使其具身社会感知智能实现性能提升,进而在复杂真实场景中表现出更高的效率、稳健性与社会协同度。

4、结论

围绕具身社会感知智能这一新概念,系统梳理了具身感知、社会雷达与Agentic AI的发展脉络与现实需求,指出单一物理感知或单一社会感知在复杂开放环境中均难以支撑自主无人系统的可靠运行。在此基础上,构建了以Agentic AI为中枢、涵盖元控制、感知、推理、执行与反馈5个层级的具身社会感知智能框架,并给出了从信息采集、多模态融合到决策生成与自适应更新的完整流程。

在复杂开放环境中,社会信号的建模与噪声抑制仍较为初步,具身感知与社会雷达的融合机制在跨场景迁移、长期稳定性和极端情境下的鲁棒性方面尚需系统验证;合规性建模目前更多依赖规则与专家知识,如何在保证安全前提下引入自适应学习与在线更新机制,也是未来需要重点解决的难题。此外,Agentic AI的多智能体协同在安全边界、责任划分与人机协同治理方面,仍需进一步引入法律、伦理与政策层面的系统研究。

本文作者:范丽丽、史光宇、陈恺舸、李创、曾昌贤、邓方

作者简介:范丽丽,北京理工大学人工智能学院,助理教授,研究方向为智能无人系统感知。

文章来源:范丽丽, 史光宇, 陈恺舸, . 面向无人系统的具身社会感知智能:流程与框架[J]. 科技导报, 2025, 43(20): 3747.

特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。

未经允许不得转载: 街坊秀 » 面向无人系统的具身社会感知智能