摘要: 控制是航天器在空间环境下自主完成复杂任务的关键技术. 首先梳理了中国空间控制技术过去50多年来的发展成果, 总结划分为航天器姿态控制、姿态轨道控制、“感知−决策−执行”自主控制三个方面, 并在综述了各方面主要进展的基础上, 围绕超大结构航天器姿态轨道控制、轨道空间博弈控制、网络化航天器集群控制、地外探测智能无人系统控制、跨域航天器自主控制、在轨建造与维护控制6个技术方向, 提出面临的挑战和需要重点关注的基础性问题, 为空间控制技术未来的发展提供借鉴和参考.
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c220792 我国自1970年4月24日第一颗人造地球卫星东方红一号成功入轨以来, 形成了遥感、通信广播、气象、科学探测与技术实验、地球资源和导航定位等6大卫星系列[1], 实现了空间技术从近地卫星到载人航天、深空探测的跨越式发展. 航天活动深刻改变了人类对宇宙的认知, 成为促进国民经济发展、提升国家综合实力、推动人类社会进步的强大力量.
空间控制技术是空间技术的一个关键组成部分, 是完成各类复杂航天活动、服务空间应用和空间科学、拓展宇宙探索边界的使能技术, 涉及近地卫星、载人航天器 (载人飞船、空间站等)、深空探测器等各类航天器在执行飞行或探测任务过程中的姿态与轨道控制、在轨及地外星表的操作控制等, 其技术水平很大程度上决定了航天器的能力和水平, 是各国争相发展的重要技术领域. 空间控制同时作为自动控制的重要组成部分, 为推动自动控制领域的理论发展和技术进步提供了重要动力.
过去半个多世纪以来, 随着航天任务的持续推进和自动化、人工智能等领域科学技术的发展, 中国空间控制技术不断取得突破与创新, 有效支撑了我国450多颗人造地球卫星的入轨及在轨飞行、9次载人飞行、空间站建设、6次月球探测以及首次火星探测等任务的成功实施.
本文首先梳理了我国空间控制技术的发展成果, 将其划分为航天器姿态控制、姿态轨道控制和“感知−决策−执行”自主控制三个方面, 并分别介绍了各个方面的主要进展情况; 在此基础上, 围绕我国正在和即将部署实施的重大工程, 并结合世界航天的前沿动向, 面向空间智能自主控制技术的发展需求, 探讨提出了未来需要重点关注的技术方向和基础性问题, 为未来空间控制的基础研究和技术发展提供借鉴和参考.
我国空间控制技术的发展, 与航天活动由近及远、由单一到多样、由简单到复杂的发展过程相辅相成, 呈现出从卫星姿态与轨道控制、到载人航天交会与返回控制、再到深空探测自主控制的发展过程. 在不断发展的空间任务需求牵引下, 空间控制技术的内涵不断丰富, 从最基本的航天器姿态控制, 逐步发展为复杂度更高的六自由度姿态轨道控制, 以及功能更加综合、自主性更强的“感知−决策−执行”闭环控制, 控制系统的功能不断拓展, 精稳敏捷性能、对环境不确定性的适应能力、自主应对复杂任务的能力不断提升. 本节围绕航天器姿态控制、姿态轨道控制、“感知−决策−执行”自主控制三个方面(其包含关系韦恩图如图1所示), 介绍我国空间控制技术的主要进展, 重点关注在轨应用的相关技术. *
航天器姿态控制用来保持或改变航天器的运行姿态, 是完成在轨既定任务的基本前提. 例如, 通信卫星的天线指向地球上的某一区域、侦察卫星的载荷相机镜头对准地面、遥感卫星的动中成像任务等. 目前, 我国累计入轨的人造地球卫星已超过450颗, 覆盖了遥感、通信、气象、资源、导航、科学等主要领域, 遥感卫星载荷的空间分辨率达到亚米级, 且具备1:10000大比例尺地理测绘的能力, 为国民经济发展和国防建设做出了突出贡献. 为适应不断发展的空间应用和空间科学对高品质姿态控制的需求, 卫星姿态控制经历了从早期的自旋稳定到三轴稳定的发展过程, 控制系统的指向精度、稳定度和机动性能不断提升: 卫星姿态确定精度由0.1∘0.1∘提升到角秒级量级, 三轴姿态稳定度优于4×10−5∘4×10−5∘/s, 对地指向精度优于0.003∘0.003∘, 姿态机动能力优于10∘10∘/s. 部分指标优于日本ALOS (Advanced land observation satellite)、美国WorldView-4等先进遥感卫星 (其中, ALOS卫星的指向精度0.0075∘0.0075∘, 姿态稳定度2.0×10−5∘/52.0×10−5∘/5s[2], 机动能力60∘/15960∘/159s[3]; WorldView-4卫星的指向精度0.0046∘0.0046∘, 姿态稳定度2.8×10−6∘2.8×10−6∘/s, 机动能力56∘/2556∘/25s[4]), 达世界先进水平. 与此同时, 载荷及整星的复杂度不断提升, 航天器结构由中心刚体向带有大型太阳帆板、数据传输天线等挠性附件的“中心刚体++挠性附件”结构、以及大柔性组合体发展, 呈现出大型化、低刚度和挠性化的特点和趋势
1.1.1 航天器自旋稳定姿态控制
我国首颗人造地球卫星东方红一号采用了单自旋稳定的开环控制方式[1], 自旋转速为120 r/min. 通过旋转产生动量矩使得自旋轴在惯性空间具有定轴性, 这种方式简单可靠, 成为早期绝大多数航天器采用的姿态稳定控制方式. 在此基础上, 东方红二号试验通信卫星及实用通信广播卫星、风云二号气象卫星等均采用了双轴自旋稳定控制[5-8], 实现了卫星本体自旋稳定和天线机械消旋对地定向稳定控制. 其中, 天线消旋系统根据星体自旋周期内姿态敏感器的测量信号, 驱动载荷平台产生与卫星本体自旋方向相反、大小相等的相对运动. 从卫星入轨的星体起旋、主动章动控制、姿态机动、星体转速调整到地球同步轨道的定点捕获和天线消旋对地定向等任务, 风云二号气象卫星采用了主动章动控制、姿态−章动联合控制、消旋控制及动平衡调整等技术, 最终实现了同步轨道工作运行时星体98 r/min的额定转速维持与天线0.4∘0.4∘的对地指向精度要求[8]. 双自旋稳定控制技术在保证了星体自旋稳定的同时, 又满足了对地通信要求, 但自旋或双自旋卫星结构形式 (大都为短粗体) 制约了卫星有效载荷比和整星能源供给, 其在轨运行方式也制约了姿态确定精度和控制性能, 特别是自旋角动量与频繁快速的姿态调整需求无法相适应, 故在应用卫星领域自旋稳定控制技术逐渐被三轴稳定控制技术所取代.1.1.2 航天器精稳敏捷姿态控制 到了上世纪80年代末, 随着载荷精度要求的提高, 以及敏感器、执行机构、星载计算机等技术的发展, 卫星姿态控制逐渐转向三轴稳定控制 (此前1975年发射的我国首颗返回式卫星已验证了三轴喷气对地稳定控制技术), 包括风云一号气象卫星的零动量/偏置动量三轴姿态稳定控制[9]、东方红四号卫星的V+LV+L型轮控稳定控制等. 进入21世纪以来, 航天器的功能和性能要求不断提升, 姿态控制系统的测量精度、控制精度和姿态稳定度的要求不断提升; 而且, 航天器通常需要携带大面积太阳帆板、单/多自由度转动的数据传输天线等挠性运动部件. 这些大型挠性附件的振动, 以及推力器喷气、太阳帆板驱动机构等大惯量部件扰动, 成为制约航天器姿态控制性能提升的主要因素.
围绕高精度姿态测量的需求, 我国星载敏感器 (如: 惯性测量单元、星敏感器等) 的精度性能相比研制初期实现了1~2个数量级的跨代提升, 其中星敏感器的测量精度从几十角秒提升到亚角秒量级. 与此同时, 为消除高精度敏感器的安装及地面标校误差, 除了采用与载荷共基准的结构设计外, 还发展出基于敏感器在轨测量数据的基准标校方法[10], 可实现星敏感器基准的标校残差小于0.2''; 提出的两层滤波算法[11]可同时对卫星姿态、陀螺安装偏差、刻度因子误差等进行准确估计. 此外, 我国高精度立体测绘卫星中还引入了载荷与星敏感器/星相机的相对基准测量系统, 实现了对载荷在轨结构变形所引起基准变化的有效测量与补偿. 复杂挠性航天器的高精高稳姿态控制方面, 自抗扰控制 (Active disturbance rejection control, ADRC)[12-13]、基于干扰观测器的精细抗干扰控制[14-15]等方法, 为挠性振动、大惯量部件运动等产生的复杂多源干扰的估计和有效抑制提供了有益的解决思路[16-18]. 例如, 文献[16]讨论了帆板驱动影响下的卫星姿态高精高稳控制问题, 采用自抗扰控制器估计补偿由帆板驱动和系统不确定性引起的干扰, 并设计步进电机自适应电流补偿驱动器克服驱动机构摩擦力矩和谐波力矩的影响, 实现了对复杂扰动的有效抑制. 此外, 面向在轨应用的实际工程任务要求, 发展出了一系列高精高稳姿态控制方法. 针对喷气、部件运动等产生的快时变强扰动, 提出了基于零空间自适应规划的姿态与动量自主协同控制方法[19], 实现了角动量卸载、动量轮组构型切换、东西位置保持等情况下的高精度姿态控制和观测业务的连续运行, 卫星指向精度由0.03∘0.03∘提升到0.003∘0.003∘, 稳定度优于5×10−4∘5×10−4∘/s[20]. 对于一类带有以固定周期旋转大型载荷的扰动抑制问题, 文献[21]设计了一种干扰力矩参数未知情况下的闭环稳定自适应控制算法; 针对带有多自由度运动数据传输天线的高精度指向控制问题, 发展出了兼顾天线指向与星体姿态指向的复合控制方法, 利用所提出的基于模型参数开环与估计闭环的双层补偿控制策略, 大幅提升了对星体姿态扰动的抑制效果, 实现了卫星姿态长期稳定度优于5×10−5∘/s(3σ)5×10−5∘/s(3�) [22]. 为保证天线指向运动全过程角速度的平滑性, 基于预测−校正思想提出了具有全局平滑性的指向控制方法[23-24], 解决了天线起始末端角速度非零的运动控制问题. 针对传统太阳帆板步进电机驱动的步进不平稳性造成的扰振问题, 还提出了基于永磁同步电机直接驱动的高刚度高稳定度主动控制方案, 实现了较高的相位裕度及高稳定性, 显著改善了动态性能[25].
随着姿态控制精度、稳定度和机动能力等指标不断提高, 传统卫星平台单级控制回路设计在解决宽频多点多源扰动耦合问题时面临瓶颈. 例如, 詹姆斯⋅⋅韦伯太空望远镜 (James Webb space telescope, JWST) 的指向精度达0.3'' ~ 0.45'' 短期姿态稳定度达6.2 ~ 6.7 mas[26], 机动能力90∘/900s90∘/900s. 星上高速旋转执行机构颤振、帆板/天线驱动机构挠性振动、大挠性载荷在姿态机动过程中的振动等扰动频率范围0 ~ 300 Hz, 且扰动会在卫星平台与载荷结构传播路径上形成复杂时变的叠加和混合; 传统单级控制回路设计将航天器整体作为被控对象, 控制直接作用于各类复杂挠性模态的航天器本体上. 受敏感器/执行机构时延及帆板挠性模态的影响, 控制器设计往往无法兼顾高带宽和高稳定裕度, 难以同时满足大范围机动和高稳定度指向的要求. 对此, 在前期众多航天器振动控制研究 (如, 文献[27-29]) 的基础上, 发展出航天器多级协同稳定/复合控制方法 (如, 文献[30]), 核心是通过在载荷与平台间引入二级控制将姿态控制系统扩维, 提升系统内部扰动的可控可观性, 进而消除复杂干扰的影响, 实现姿态控制系统性能的数量级提升. 我国基于磁悬浮技术的双超平台卫星 (羲和号太阳观测卫星)[30]、基于主动指向超静技术的三超平台卫星 (北京三号敏捷遥感卫星)等均采用了上述多级协同复合控制技术, 并形成了包括基于空间解耦的单输入单输出线性控制[31-33]、磁浮平台的主从协同及干扰补偿[34-35]、基于主动指向超静平台的隔振与指向综合控制[36-37]等一系列方法. 针对敏捷机动与精稳性能相互制约的问题, 提出了多级协同规划与敏捷机动控制、自适应变刚度变阻尼全频段扰动抑制, 解决了机动诱发指向波动、机动中刚度阻尼自主适配等难题, 并在北京三号卫星上进行了在轨验证, 实现了高动态反向推扫等复杂敏捷动中成像, 创造了单次成像最高幅宽等多项纪录, 已在高分辨率遥感、天文观测等领域展开应用.
对于具备快速、灵活目标探测能力的敏捷航天器 (Agile spacecraft)[38], 需要在较短时间内实现姿态大角度快速机动, 要求其执行机构具备大力矩输出、大角动量和快速响应等特点. 以控制力矩陀螺 (Control moment gyroscope, CMG) 为代表的执行机构逐渐取代了动量轮, 在敏捷航天器中得到广泛应用 (常以4 ~ 6台CMG组合的方式提供三轴力矩输出). CMG固有的内部摩擦、高频扰动特性等非线性不确定性会直接影响输出力矩的精度, 而且在某些低速框架角组合下还会陷入奇异状态, 导致CMG群不再具有三轴力矩输出能力, 进而引发姿态失稳、转速过快情况下的CMG失效等风险[39]. 因此, 需要解决CMG操纵律设计、奇异规避等问题. 文献[40]通过将CMG群安装角作为控制变量, 设计了可变构型的控制力矩陀螺操纵方法; 文献[41-43]提出了动态螺旋搜索矢量调节、奇异规避动态分配等方法, 实现了CMG框架角速度去饱和的快速奇异规避, 在轨取得较好的应用效果. 除此之外, 围绕姿态机动范围大、稳定时间短等约束下的机动轨迹规划问题, 已发展出最短路径[44]、SS型路径[45]、多项式路径[46]等多种形式, 其核心是如何在敏感器和执行机构受限条件下, 有效减少姿态快速机动过程中挠性附件产生的振动影响. 针对机动过程的高精度高稳定度控制问题, 除处理姿态动力学和运动学强耦合非线性外, 基于递阶饱和PIDPID控制器[47], 消除了积分项在姿态误差较大时带来的不利影响; 通过在滑模控制器的前后端引入滤波器[48], 有效降低了系统抖振; 针对姿态的动态调整需求, 利用冲量等效原理提升了姿态机动过程的稳定度[49].1.1.3 大型组合体航天器姿态控制 以空间站为代表的大型组合体, 其大质量 (百吨级)、大惯量、大环境干扰、低频挠性的特点, 以及需要综合调度多个舱段的执行机构实现组合体控制的方式给姿态控制带来了新的挑战[50-51]. 我国“TT字形”三舱组合体构型的空间站建设过程中, 强自适应变构型柔性组合体控制等技术有利支撑了多达50余种构型变化下的空间站在轨安全运行. 我国空间站的特殊结构使其惯量高出常规航天器4∼54∼5个数量级, 环境干扰力矩达到0.1∼10.1∼1N·m量级, 普通航天器采用的喷气或磁力矩器的角动量卸载方式难以适用. 对此, 发展出了空间站大环境干扰下的系统姿态/角动量一体化控制方法[52-55], 基本原理是采用内模原理辨识空间环境力矩, 且在利用重力梯度力矩进行角动量卸载的同时, 将姿态控制在标称姿态附近. 文献[52]提出了力矩平衡姿态控制方法, 实现了单舱入轨后惯性系下的姿态/角动量一体化控制; 文献[53]则给出了轨道系内的姿态控制与角动量管理控制方法. 此外, 机械臂进行在轨舱段组装时, 组合体的基频低至0.01 Hz量级, 对此, 提出了基于高阶结构滤波器的极低频超大型组合体控制设计方法, 实现了机械臂在轨组装或空间站转位过程中的稳定控制[55].
另外, 空间碎片清除、燃料补加、在轨维修等任务中, 服务航天器与目标航天器完成捕获连接后构成的组合体的稳定控制问题, 也受到学术界的广泛关注(例如, 文献[56-61]). 针对捕获后组合体航天器的质量特性、推力器构型突变等问题, 发展出了改进的状态依赖Riccati方程 (Sate-dependent Riccati equation, SDRE) 最优控制[57]、基于自适应动态逆控制的姿态接管控制[58]、基于超螺旋干扰观测器的有限时间姿态控制[59]等方法, 可实现目标动力学大范围不确定情况下组合体航天器的姿态稳定控制. 文献[60]研究了捕获过程中碰撞扰动对组合体姿态的影响, 提出了基于反作用轮重构的双积分滑模控制方法, 通过控制反作用轮来吸收撞击产生的角动量, 进而实现组合航天器的稳定控制. 目前, 组合体航天器姿态稳定控制技术尚处于理论探索和地面实验研究阶段, 在轨实际应用还非常初步.1.1.4 航天器稳健控制 除了高精度高稳定度、高敏捷机动控制外, 航天器在轨长期、连续、稳定运行对控制系统提出了强鲁棒/稳健控制要求, 需要系统具备故障诊断以及欠配置控制能力 (也即: 当执行机构出现故障、系统处于欠配置状态时, 系统仍具备一定的控制能力)[62, 39]. 欠驱动控制是欠配置控制的重要方向, 在欠驱动航天器的可控性与可镇定性分析、欠驱动航天器的姿态控制等方面均开展了相关研究. 文献[63]考虑单轴、双轴独立喷气控制的情况, 给出了航天器完整姿态动力学方程全局可控的充要条件; 文献[64]则探讨了欠驱动航天器的可镇定性问题, 指出: 对于只有两个控制输入的刚体航天器, 由于不满足Brockett必要条件, 其动力学方程不能由连续状态回馈渐近镇定. 针对欠驱动航天器的喷气控制, 实现了基于滑模控制的速率阻尼[65], 以及基于“喷气消旋+飞轮机动”分段控制[66]的姿态稳定. 针对欠驱动航天器的角动量交换装置控制, 基于(ω,z)(�,�)参数描述的航天器姿态, 实现了仅带两个反作用轮的全局、渐近自旋稳定控制[67], 基于多变量优化的思想构造的3台单框架CMG欠配置操纵律, 已成功在轨应用[68], 这是世界上首次仅使用3台CMG完成的姿态机动控制. 除此之外, 提出的2台CMG与磁力矩器的深度欠配置控制方法[69], 可进一步提升欠驱动航天器的控制能力.
区别于仅关注绕质心转动的姿态控制, 航天器姿态轨道控制是同时调整质心位置/速度和绕质心旋转角度/角速度的六自由度运动控制, 还涉及用于生成满足任务要求的航天器飞行轨迹的制导律. 航天器再入返回、空间交会对接、多航天器编队飞行、以及在轨维护与操作等任务都会涉及航天器姿态轨道耦合控制. 例如, 航天器再入返回飞行需要同时满足动压、过载、热流等过程约束和着陆点精度等的终端状态约束, 以保证进入过程航天器结构和防热安全, 实现预定区域内的安全精准着陆. 为此, 除需要事先进行轨道设计和实际飞行中通过轨道控制保证外, 大气飞行中还需要在线调整航天器的倾侧角或者联合调整倾侧角和攻角, 控制航天器落点并满足过程中动压、过载、热流等约束[70]. 又如, 追踪航天器与目标航天器的交会对接/安全接近与捕获、多航天器的编队飞行等任务都涉及航天器之间的相对运动控制, 要求服务星与目标星/多个航天器之间的相对位置和姿态同时满足指定的约束和性能指标. 因此, 需要解决满足过程、终端、执行能力等复杂约束的制导律设计, 以及不确定非线性系统的姿态轨道耦合高精度控制等关键问题.
在此过程中, 上世纪80年代孕育发展出的特征建模理论[71-72], 其抓住系统的本质要素建立低阶等效特征模型、进而简化复杂高阶对象控制器设计的思想, 为处理复杂高阶不确定非线性系统的控制问题提供了有效手段. 基于该理论框架发展出的全系数自适应控制[73-74]、黄金分割相平面自适应控制[75-76]等方法, 成功应用于飞船和月球轨道返回再入、交会对接等重大任务, 对控制理论的发展做出了重要贡献.1.2.1 再入返回自适应制导控制
我国连续成功实践了神舟系列载人飞船的近地轨道返回再入控制任务, 和嫦娥五号再入返回飞行试验器 (CE-5T1)、嫦娥五号探测器返回器的月地转移轨道再入返回控制任务, 实现了以第一宇宙速度和第二宇宙速度再入返回[77], 突破了跳跃式再入返回控制技术[78], 并且完成了从标准弹道自适应制导方法到自适应预测制导方法的更新换代. 2014年以来, 自适应预测制导方法先后高精度完成了CE-5T1、嫦娥五号探测器返回器以接近第二宇宙速度的跳跃式再入返回, 新一代载入飞船试验船8000 km大椭圆轨道的高速再入返回[79], 以及空间站建设阶段神舟十二号 ~ 十四号载入飞船安全再入返回等重大工程任务, 开伞点控制精度达到世界领先水平.
再入返回制导控制的难点突出表现在如何应对气动参数的不确定性、飞行器质量特性偏差以及大气密度的较大摄动下的精确能量阻尼, 从而满足终端控制精度以及过程中过载、热流等约束. 对此, 国内外学者在再入飞行的参数辨识、制导回路的自适应调节、轨迹在线快速规划等方面均提出了新的解决思路, 以提升轨迹规划和跟踪控制方法的适应性和鲁棒性.
预测校正制导方法不依赖标称轨迹, 而是根据终端状态误差获得制导指令的校正量, 并结合动压、过载等过程约束和倾侧角、攻角的执行能力约束优化求解得到实际的制导指令, 可实现对飞行轨迹在一个较大范围内的调整[70, 80], 相比跟踪标称轨迹制导方法具有更强的自适应性和鲁棒性, 受到广泛关注. 例如, 文献[81]探讨了小升阻比航天器进入制导中倾侧角剖面的参数化方式; 学者们还从提升算法效率、引入对参数不确定性的辨识来提升预测精度等不同角度, 发展出轨迹规划与闭环制导相结合的数值预测校正[82]、基于高斯伪谱方法的最优预测校正制导[83]、基于嵌套式积分算法的航程快速预报[84]、伪四自由度的预测校正制导[85]等多种方法. 但算法本身的收敛性和可靠性成为了限制其在工程上应用的重要因素.
此外, 基于特征建模与自适应控制的理论框架, 围绕“预测误差与制导增量之间的比值”这一核心要素, 发展出了基于一阶特征模型的自适应预测校正制导方法[74, 86-87]. 其核心是引入预测误差与制导增量的比值作为控制增益, 通过建立控制增益 (输入) 和预测误差 (输出) 之间的一阶特征模型, 并结合增量式制导方式, 将制导问题转化为控制问题; 同时关注到控制增益随制导过程时间大范围变化的时变特性, 通过引入基于升阻比估计的动态增益变换, 大幅减小非标称情况下系统动态增益的变化范围, 并结合自适应反馈控制, 保证了特征模型的参数辨识及制导算法的收敛性. 该方法解决了进入段制导的建模难题, 避免了基于迭代的数值预测校正制导方法计算量大、收敛性无法保证的问题[70]. 实际飞行验证表明, 该方法具备对小升阻比飞行器、高超声速滑翔飞行器等的精确制导和控制能力.1.2.2 空间交会与接近停靠控制
空间交会对接是两个航天器在轨道上按预定的位置、速度和时间会合 (交会), 然后经姿态对准、靠拢直至在结构上连接成一体 (对接) 的全部飞行动作过程[88-89]. 自2011年11月神舟八号载人飞船与天宫一号目标飞行器首次交会对接任务[90]圆满完成以来, 我国已实施了17次近地轨道的空间交会对接任务和1次月球交会对接任务, 经历了自动、手动、到多方位全自主交会对接控制的发展历程, 交会对接过程历时由2 ~ 3天缩短到约6.5小时甚至2小时, 极大提高了飞行性能.
空间交会与接近停靠是完成诸如在轨组建、在轨服务、天体采样返回、载人空间探测等复杂空间任务的关键步骤, 从飞行任务上大体分为远距离导引阶段和接近停靠阶段两个阶段. 远距离导引阶段的主要任务是将追踪航天器从入轨初始轨道导引到近距离自主控制段所要求的预定轨道, 包括调整两航天器的相位差、缩短相对距离以及消除两航天器轨道面外偏差等. 空间交会2 ~ 3天策略中, 远程导引阶段主要靠地面多次注入变轨脉冲, 每次变轨后测定轨时间长, 完成远程导引需要20多圈, 给航天员和地面飞行控制都造成了较大压力, 对远程自主快速导引的需求迫切. 追踪航天器和目标航天器初始相位0∘∼360∘0∘∼360∘不确定, 轨道转移时间受限, 控制变量多, 燃料消耗受限、轨迹安全性等约束条件多, 远程导引终端精度要求高, 是典型的星载计算能力约束下的最优化轨迹控制问题. 近年来, 远程自主快速导引成为研究热点[91-93]. 文献[91]建立了5圈快速交会对接的调相变轨方案, 并采用四脉冲修正特殊点变轨算法进行求解, 可应对10∘10∘左右的初始相位角不确定性. 文献[89, 92]提出了基于多变量协调的全相位自适应动态规划方法、燃料最优制导脉冲求解方法, 解决了在轨自主计算变轨脉冲解的存在及唯一性难题. 标称情况下, 只需要2.5圈就可以完成远程导引自主交会, 已广泛应用于空间站工程的货运飞船[93]、载人飞船和实验舱等.
相对导航方面, 由差分卫星导航设备、微波雷达、激光雷达、光学成像敏感器等多种体制测量敏感器构成的导航系统, 可接力实现从数百公里直至对接范围内相对平动、相对转动等状态参数的自主确定. 其中, 交会对接光学成像敏感器作为百米以内相对位置和相对姿态的主要测量手段, 已实现从初代采用主动发光的合作目标到改进后采用被动的合作目标、再到融合激光点云技术的多代升级[94-97], 极大提升了敏感器抗杂散光的能力和可靠性. 利用敏感器的观测信息, 结合动力学/运动学模型, 工程中普遍采用卡尔曼 (Kalman) 滤波获得相对状态参数的估计值. 无迹卡尔曼滤波 (Unscented Kalman filter, UKF) 等确定性采样滤波以及利用蒙特卡洛 (Monte Carlo) 数值积分方法的粒子滤波 (Particle filter, PF) 方法等, 在处理非高斯噪声、显著模型偏差问题方面具有优势, 已用于空间交会对接导航算法设计. 文献[98]提出了基于UKF的交会对接相对导航算法, 并给出了稳定性分析. 文献[99]通过对过程噪声方差阵的在线辨识, 提出了一种自适应确定性采样滤波方法, 提高了对噪声不确定性的适应能力. 文献[100]提出了一种改进的高斯粒子滤波方法, 能够在多种测量噪声情况下实现高精度空间交会相对导航, 同时有效降低计算复杂度. 此外, 利用深度学习从空间目标的点云和图像测量数据中提取目标特征, 进而获得相对位姿估计 (如, 文献[101-102]), 也是当前备受关注的研究方向, 在轨应用仍面临数据处理效率、姿态解算实时性和鲁棒性等问题.
空间接近停靠阶段的主要难点是帆板挠性振动大、系统延迟大、姿态和轨道控制耦合、羽流干扰严重情况下的交会对接六自由度精准控制. 对此, 文献[103]基于视线位置信息的平行接近法, 对于横向和纵向同时协调控制, 提出一种多变量互相耦合的非线性滑动模态视线制导控制方法, 并对同时协调控制进行了存在性和稳定性分析; 文献[76]以基于特征模型的智能自适应控制为理论指导, 按照黄金分割自适应控制理论计算相平面参数, 依据相对距离对控制参数进行修正, 提出了基于特征模型的相平面自适应控制方法; 该方法具有控制精度高、燃料消耗小、鲁棒适应性好等优点, 应用于寻的段、接近段姿态控制, 以及最后平移靠拢段六自由度控制, 实现了载人飞船、货运飞船等在轨任务的全天时多方位精准对接. 此外, 文献[104]针对航天器姿态相平面控制系统稳定性分析问题, 证明了闭环控制系统存在特定的稳态区域, 并给出该稳态区域的计算公式. 近年来, 对合作及非合作故障航天器的在轨修理和回收、碎片清除、燃料补给等在轨服务, 以及地外星表取样返回等任务, 对空间交会与接近停靠控制技术提出了新的应用需求. 文献[105]研究了受控的追踪航天器和失控慢速翻滚的目标航天器的末段交会对接控制问题, 提出了基于特征模型的相对位置跟踪控制和姿态同步控制方法. 文献[106]讨论了火星采样返回任务火星轨道交会自主导航和制导技术, 针对光学自主导航敏感器更新频率远低于滤波解算频率的问题, 设计了一种连续观测量构造算法, 提高了导航精度.1.2.3 多航天器/星座编队控制 2012年以来, 我国先后开展了多次卫星编队构型保持技术在轨试验. 在绕飞半径5km5km的两星编队飞行试验中, 绕飞维持控制修正了绕飞构型的畸变, 使漂移速度偏差的绝对值降到mm/smm/s量级[107-108]; 此后开展的编队保持试验中, 两星间隔0.8∼2km0.8∼2km飞行了上百天, 验证了前−后编队构型的保持控制技术. 卫星编队构型保持的难点突出表现在需要获取高精度的编队构型参数, 其中两星的相对漂移速度是最关键的参数. 提出的周期平均漂移速度的估计算法[109], 实现了对漂移速度的准确估计; 基于相对轨道根数的控制方法[110], 实现了对不同编队构型的保持. 值得说明的是, 当前差分全球导航卫星系统 (Differential global navigation satellite system, DGNSS) 的位置精度能达到cm量级, 速度精度能达到mm/s量级. 经过转换到相对半长轴为几米的量级, 因此可将编队飞行的半长轴控制在几米的范围内, 故而几圈甚至十几圈才需要进行一次保持控制喷气, 很好地满足了长期编队构型保持的应用需求. 尽管通过对相对漂移速度的高精度估计, 可以有效减少编队构型保持的燃料需求, 但长期来看, 编队构型保持仍然以消耗较多的推进剂为代价. 对此, 近年来还出现了多种无需推进剂的编队控制方法的探索研究 (包括: 利用大气阻力差[111-113]、电磁力[114]、磁通钉效应[115]等), 展现出良好的应用前景. 另外, 围绕多星编队飞行协同控制的理论和应用研究 (例如, 主从式、行为方式及虚拟结构方式的协同控制[116-117], 基于一致性算法的分布式协同控制[118-119]等), 可为未来多星编队飞行的分布式自主控制提供基础.
此外, 我国还发展了以时差定位型三星星座系统、环境与灾害监测预报小卫星星座、北斗导航卫星星座、云海卫星星座为代表的星座系统, 其轨道控制需在考虑空间环境的基础上增加星间相对关系约束. 目前工程上应用较多的是“控制盒子”方法, 通过绝对轨道控制使星座内的所有卫星保持在控制盒子里. 铱星星座、全球定位系统 (Global positioning system, GPS) 导航星座均采用了这种控制策略. 云海卫星星座采用了基于虚拟卫星的相对轨道控制策略, 以相对于虚拟相位中心的偏差作为控制变量, 实现星座整体相对稳定, 同时兼顾了燃料消耗和轨控周期两方面的要求.
国内外学者还开展了星座构型保持控制的理论方法研究. 在绝对站位星座构型保持控制方面, 文献[120]利用线性规划方法精简轨道控制变量, 提出了满足星座覆盖要求的单星控制允差; 文献[121]以星座轨道面交点碰撞安全为约束, 提出了全球导航星座构型维持的“死区”指标; 文献[122]在分析了Walker-δ�星座中各卫星位置偏差对在轨任务的影响, 提出了以满足星座覆盖性能为目标的星座构型绝对站位保持策略. 相对站位星座构型保持方面, 文献[123]通过构建导航卫星相对平均轨道高度的轨道偏差, 获得轨道控制量; 文献[124]研究了星座构型摄动补偿方法. 文献[125]分析了全球星座构型发散的原因, 并据此给出了绝对站位和相对站位星座构型控制方法对控制量需求的对比分析, 可为设计全球星座轨道和制定运控策略提供参考依据.
进入21世纪, 我国的航天活动开始向更深更远更广阔的太空延伸, 为人类探索宇宙奥秘、寻找长久发展贡献中国力量. 2007年10月至2020年12月, 我国先后实施了6次月球探测任务, 成功实现了对月球的环绕、着陆巡视和取样返回探测. 2021年5月15日, 我国首次火星探测任务天问一号探测器[126]成功着陆于火星乌托邦平原南部预选区; 随后, 祝融号火星车开始执行火星表面巡视探测任务.
深空探测任务本身的高度复杂性、地外环境的未知不确定性、以及地面测控时延大导致的高自主性要求等, 对控制系统的智能处理能力、自主应对不确定环境和复杂任务的能力需求大幅提升, 推动航天器由传统的制导、导航与控制 (Guidance, navigation and control, GNC) 系统向“感知−决策−执行” (Perception-decision-action, PDA) 闭环的自主控制系统[127]发展. 例如, 地外探测器的自主避障软着陆过程, 需要充分考虑环境因素的影响, 通过对着陆区地形的测量和障碍物/危险的识别判断 (感知)、自主选择安全着陆点并规划飞行轨迹 (决策)、并基于导航信息进行轨迹跟踪控制和姿态保持控制 (执行), 当前时刻的动作又会影响环境及下一时刻的感知判断结果, 故而构成闭环反馈回路, 不断修正实现安全区域的软着陆. 又如, 巡视器在执行地外星表探测任务时, 同样需要对周围环境地形进行测量并识别危险 (及感兴趣的探测目标), 分析地形的可通行性, 并据此规划安全行驶路径, 通过位姿确定和运动控制行驶到期望目标点.
与传统的GNC系统相比, 航天器PDA闭环控制系统的内涵更加丰富. 系统以深度融合的信息物理系统 (Cyber-physical systems, CPS) 为基础, 将空间环境及任务目标作为被控对象纳入闭环控制系统, 感知不仅包含航天器自身/相对运动参数确定, 还包括航天器与环境目标组成任务场景以及交互过程的理解与认知; 决策则根据任务、环境和自身状态生成优化目标和约束条件, 基于感知结果自主选择最佳方案; 执行在姿态轨道控制和操作控制的基础上, 更强调与环境目标交互作用过程中系统行为的稳定控制. 航天器PDA闭环控制面向的是动态多变、复杂不确定的空间任务, 面临系统建模、反馈机制设计、赋能学习、系统行为可信评价等基础性问题. 这些问题在此前的研究工作中已有涉及 (如, 文献[127-129]等), 本文发展展望部分也会结合未来的空间任务做进一步探讨. 这里, 重点介绍“感知−决策−执行”闭环控制框架下的相关技术进展.1.3.1 地外自主避障软着陆控制 从嫦娥三号月球探测器的首次地外软着陆全自主控制, 到嫦娥四号月球背面崎岖地形的自主避障与软着陆控制, 再到嫦娥五号带有复杂晃动动力学特性的高精度软着陆控制, 我国月球软着陆控制技术逐步走向成熟. 而天问一号火星探测器的成功着陆, 又使得该技术从无大气天体扩展到有大气天体, 从单纯的动力软着陆发展为包含大气进入、降落伞减速和动力下降着陆 (Entry, descent and landing, EDL) 复杂完整过程的全自主控制.
地外天体软着陆过程时间短且任务复杂 (如: 月球着陆器要在10多分钟内完成大推力动力减速、姿态调整、着陆点选取、悬停避障等动作, 火星探测器则要在7分钟内完成气动减速、抛大底、安全着陆点选择等10多个动作), 自主性要求高; 而且, 下降着陆过程地外大气、引力、地形等环境特性不确定性强, 自主避障检测及着陆点选取的准确度要求高; 再加上燃料消耗、液体晃动、大气扰动、开伞振荡等因素使着陆器动力学特性变化复杂, 对控制系统的鲁棒性要求苛刻. 地外自主软着陆需要解决着陆区危险地形快速识别、高动态动力下降过程高容错导航与惯性基准快速重构、不确定大干扰高动态系统在线规划自主制导、液体晃动强适用稳定控制等关键问题.
首先, 采用惯性导航作为核心以保证导航系统的自主性, 同时为保证导航精度, 在探测器飞行过程中利用旋转来增强可观性, 实现了对包括安装、零偏、刻度系数在内的陀螺误差的在轨全系数标定[11], 大幅降低了惯性器件误差对导航精度的影响; 另外, 还采用多子样圆锥效应补偿算法, 抑制了在着陆过程高动态振动环境下的惯导发散速度. 以此为基础, 针对火星着陆器动力学角速度变化连续的特点, 提出了一种递归多子样大动态惯性导航方法, 通过对角速度进行多项式拟合, 再利用该多项式完成旋转效应补偿, 进一步提高了大动态下的惯导姿态解算精度[130]. 惯性导航是一种绝对导航方式, 难以直接满足对着陆器相对天体表面运动状态的测算需求. 对此, 利用着陆雷达的相对距离和速度测量信息对惯性导航系统进行修正, 最终形成以惯导为基准、辅助多波束测距和测速修正的容错导航方案[131-132]. 针对不同数量波束会影响导航滤波效果的问题, 提出了基于波束数量监测的自适应阈值调整方法, 具备对多个测距、测速信息源进行故障诊断和波束优化选取的能力, 提高了整个导航系统的精度和可靠性[133]. 此外, 针对火星着陆过程存在的开伞过程喘振等特殊问题, 提出了利用着陆雷达完成导航基准重构[134]和引力修正的方法[135], 进一步提高了未知环境下着陆导航系统的性能.
在避障方面, 针对下降过程天体表面情况逐渐清晰的特点, 在嫦娥三号着陆器上首次提出并实现了融合光学图像和三维激光的接力避障方法, 在较远距离利用光学图像视线进行粗障碍识别, 近距离通过激光三维数字高程模型 (Digital elevation model, DEM) 数据实现精障碍识别, 完成了地外天体自主避障着陆[136], 并在嫦娥四号上进一步发展完善[137]. 相比月球, 火星着陆的避障过程则更为复杂, 除了规避地形风险以外, 还需要规避分离的伞与背罩, 为此着陆器在线实施了伞−背罩和地形障碍的一体化自主规避策略[138]. 其次, 着陆过程制导面临着初始入口散布大、下降过程不确定性因素多和任务约束多等诸多挑战. 月球着陆仅依靠发动机完成, 为了适应初始轨道、着陆器质量、发动机推力等参数不确定性的影响, 满足到达预定落区的要求, 提出了软着陆多约束自适应动力显式制导方法, 能够实现自主的飞行轨迹参数在线优化和目标着陆点调整[136, 139]. 而火星着陆则更为复杂, 包含了气动减速、降落伞下降、抛伞、规避机动、避障着陆等飞行过程. 为了满足这些需求, 提出了大气进入自适应规划与制导、多约束一体化自适应规划与控制策略[140], 实现了火星复杂飞行环境下的开伞状态优化控制、避障及背罩规避的协调一致控制, 显著提高了软着陆的安全性与着陆精度.
此外, 针对月球着陆过程制导存在目标姿态变化大、干扰力矩大且变化快, 以及着陆器角速度受限的特点, 提出了分区四元数姿态控制方法, 能够根据姿态误差实现角速度跟踪控制和姿态保持控制的切换, 实现了姿态的快速机动和高精度控制. 为了抑制下降过程姿态和平动机动引起的液体晃动, 采用双观测器技术估计晃动干扰力矩的瞬时值和平均值, 并根据干扰变化情况对控制器进行重构, 大幅增强了控制系统对着陆过程大幅液体晃动的抗干扰能力[141]. 在此基础上, 针对火星下降过程中制导对飞行器轴线的指向优先级要求往往高于绕轴线转动的特点, 提出了推力指向与滚动姿态解耦与分区姿态规划算法, 实现了动力减速过程推力方向的快速跟踪控制和轨迹的高效高精度控制. 针对动力减速过程中存在的快时变大干扰力矩、着陆平台惯量小导致的控制系统时延影响过大等问题, 提出了基于干扰力矩快速辨识和实时前馈补偿的姿态控制算法, 实现了快速时变大干扰下的鲁棒快速跟踪控制, 提高了触火的速度和姿态控制精度[142].1.3.2 地外起飞上升控制 嫦娥五号作为我国首个地外天体采样返回任务, 上升器完成了以着陆器为平台的月面起飞上升、进入目标环月轨道, 并与轨道器交会对接的飞行过程. 由于起飞点位置不确定, 需要完成起飞前的自主定位和对准. 为此, 提出了一种恒星与重力测量相结合的月表自主定位技术[143]和基于星光测量的对准技术, 并发展为具备完整的定位、测姿和导航功能的惯性++天文自主导航系统[144].
受实际着陆地形的影响, 地外天体起飞平台是倾斜的, 相对目标飞行方向任意; 且地外天体起飞窗口比较多, 探测器需要具备多圈次、多窗口、任意射向起飞的能力; 再加上天−地之间信息传输速率和传输量的限制, 起飞上升过程的制导律需要具有灵活适应性. 为此, 嫦娥五号在着陆显式制导的基础上, 在起飞前通过预报各关键飞行阶段参数, 自主完成对上升各阶段切换控制参数的规划; 在发动机点火后, 通过在线监测和估计发动机推力、比冲等状态, 自适应调整制导参数[144], 提高了系统对起飞重量、发动机推力等不确定性的适应能力. 此外, 提出了上升过程中主发动机和姿控发动机的自动组合策略[145], 以及入轨偏差条件下的智能自主应急抬轨策略规划、调度和执行方案[144], 进一步提高上升入轨的安全性.
对于起飞上升过程的姿态控制, 为了克服起飞姿态倾斜, 需要在起飞时快速将上升器姿态调垂直; 而在上升转弯完成后, 需要精确和稳定的实现对制导目标姿态的跟踪, 且面临推进剂消耗大, 上升器的质量、惯量变化大带来的不确定性. 对此, 采用分段变系数控制器设计来保证实现不同飞行阶段、不同质量特性下的控制品质要求.1.3.3 地外巡视探测控制 随着玉兔号/玉兔二号月球车、祝融号火星车地外天体表面巡视探测任务的成功实施, 自主定位与障碍识别、自主避障路径规划、协调运动控制技术[146-148]作为其自主应对地外严苛环境和复杂地形的关键技术得到了发展与应用.
地外天体表面没有全球导航卫星系统 (Global navigation satellite system, GNSS) 等直接定位信号, 须依靠惯导、里程计及视觉相机等车载敏感器进行自主定位. 工程上常用的是地图匹配方法, 通过将探测器在线获得的地图与事先装载的天体地图底图进行特征匹配, 判断探测器与位置已知特征地物之间的相对距离, 获得绝对位置信息, 其定位精度主要取决于地图底图的分辨率和位置精度. 此外, 还发展出了基于天文/惯导的自主定位方法, 利用地外星表测量的恒星矢量和当地重力矢量联合估计得到姿态和绝对位置信息. 该方法在嫦娥五号首次使用, 不足是对矢量测量精度敏感, 在月球表面1角秒的矢量误差会产生约10 m的位置误差, 在火星表面约为17 m. 相对定位方面, 玉兔号采用了基于全运动学的轮速里程计 (Wheel odometry, WO) 方法[149], 相对定位精度优于6 %. 针对车轮滑移和滑转影响WO定位精度的问题, 还开展了滑移和滑转的在线估计方法研究[150-153], 但尚未实际应用. 近年来, 随着计算机视觉技术的发展, 视觉里程计 (Visual odometry, VO) 逐渐成为相对定位的主流技术. VO通过图像前后帧的同名点匹配, 获得相对姿态和位置变化, 在已知初始位姿的情况下, 更新得到当前时刻的位置和姿态. VO计算复杂度高, 但能够有效克服滑移/滑转带来的WO定位误差, 已在好奇号、祝融号等火星车上成功应用. 但长距离行驶时, 相对定位误差会持续累计, 可考虑实时相对定位和绝对位置修正相结合的导航方法.
障碍自主识别方面, 地外星表形貌原始多变, 光照条件恶劣, 且受重量、功耗和算力等资源约束, 巡视器上难以配备大功耗激光雷达等敏感器. 因此, 如何利用有限资源实现复杂光照和地形下障碍的准确识别, 是需解决的关键问题. 双目立体视觉 (Binocular stereo vision, BSV) 是一种轻质低耗的感知识别技术, 通过计算左右图像对应点的位置偏差可获得地形的稠密三维几何信息. 该方法对地形纹理和光照条件敏感, 对于弱/无纹理或存在干扰光 (光照过亮或过暗) 的情况下, BSV会因无法匹配或误匹配导致障碍的误识别或漏识别. 对此, 玉兔号系列月球车采用了相机和激光点阵器的联合障碍识别方法[154-155], 激光点阵器在相机视场内投射18个激光点, 利用相机图像识别这些激光点并获得地形几何信息, 并据此识别障碍, 首次实现了地外星表阴影区的安全移动探测.
自主避障路径规划基于感知得到的稠密地形信息, 结合巡视器的通行能力进行可通行性建模, 并综合考虑巡视器的运动能力约束(如, 转弯曲率等), 给出从当前位置到目标位置的安全路径[149]. 玉兔号月球车首先根据地形坡度、高度和粗糙度给出通行适宜度的量化评价, 建立局部适宜度地图; 然后结合移动效率和安全性对地图上的每条备选路径 (由事先设置的具有一定曲率的弧径组成) 进行综合打分, 输出得分最高路径对应的转弯曲率, 作为运动控制的跟踪弧径. 祝融号火星车在此基础上增加了对全局适宜度地图的地形评估算法, 采用全局和局部融合的方法进行适宜度地图构建, 将每次规划路径的距离从0.5 m提升到1 m[148], 大幅提升了火星车的探测效率.
协调运动控制根据规划路径或地面运动要求、结合巡视器当前位置和姿态信息生成期望线速度和偏航角速度, 并通过逆运动学分解得到转向轮的期望转角和驱动轮的期望转速, 通过对期望转角和转速的跟踪控制, 实现各轮协调运动, 同时会修正由于地形变化、滑移、侧滑等因素导致的巡视器对设定运动轨迹的偏离, 实现对期望轨迹的跟踪.
我国正在实施和即将实施地外行星探测、月球科研站、载人登月、在轨服务与维护、大规模星座计划等重大工程任务, 给空间控制技术的智能自主化发展提出了新的需求. 与此同时, 世界航天进入新的发展阶段, 太空探索呈现出新的发展态势. 卫星由传统单星向“一星多用、多星组网、多网协同”的体系化、智能化转变, 呈现出高性能卫星和微小型化卫星的两极发展趋势; 太空安全形势日趋严峻, 空间战略资源竞争愈发激烈, 军民融合发展特征显著, 对太空资产的安全防护能力和在轨维护能力需求迫切; 深空探测有序推进, 探测目标集中在月球、火星和小天体等, 同时兼顾太阳系的其他天体, 任务类型更加复杂, 并向着载人探测的方向发展, 对探测器的智能自主化发展需求不断提升. 本节结合这些需求, 探讨后续需要重点关注的技术方向和基础性问题.
随着对地监测、天文观测等任务对信息获取能力需求的提升, 具有超大结构的柔性航天器已成为世界航天未来发展的需要. 例如, 高轨通信卫星带有需要在轨展开的大型天线、帆板、桁架结构, 尺寸达几十米甚至上百米; 美国国防高级研究计划局 (Defense Advanced Research Projects Agency, DARPA) 的薄膜衍射望远镜(Membrane optic imager real-time exploitation, MOIRE) 计划, 载荷的薄膜主镜直径达10 m ~ 20 m, 主镜与成像敏感器之间的距离达到50 m ~ 100 m. 此外, 为解决能源危机, 我国已开始部署空间太阳能电站, 计划于2028年发射首颗技术试验卫星, 在2035年和2050年前分别建设MW级空间太阳能电站试验系统和GW级商业空间太阳能电站[156]. 空间太阳能电站配置有超大尺度的可展开主桁架结构 (长达数百米甚至上千米), 支撑多个模块化的薄膜太阳电池阵(面积达几千平方米), 并与直径达数百米甚至上千米的微波发射天线建立导电连接[157].
这种百米甚至千米量级的超大型柔性组合体航天器, 不再是传统的本体加挠性帆板、再加载荷的形式, 而是载荷尺寸远大于本体, 或是载荷与本体间采用大尺寸桁架机构连接, 呈现“刚体−挠性−刚体−挠性−挠性”等刚挠混合形式, 具有“全局运动叠加全局挠性模态、再叠加局部挠性模态”的拓扑动力学特性, 传统的热耦合形变效应不可忽略. 航天器上每一点均是刚性姿态运动与挠性变形的复合叠加, 传统“中心刚体++挠性附件”的集中式控制难以适用, 需要发展超大结构刚挠混合航天器的分布式控制技术, 解决超大型刚挠混合航天器的动力学建模、大型挠性附件分布式振动测量、超大结构柔性航天器的分布式振动抑制及闭环系统的性能分析等基础性问题.
近年来, 在轨航天器近距离交汇和碎片碰撞危机事件频发, 对在轨太空资产和航天员安全带来极大挑战. 例如, 2021年3月, “一网-0178” (OneWeb-0178) 卫星为规避与“星链-1546” (Starlink-1546) 的碰撞风险, 采取了主动规避碰撞措施[158]; 2021年7月1日和10月21日, 出于安全考虑, 我国空间站组合体分别对向其主动接近的“星链-1095” (Starlink-1095) 卫星和“星链-2305” (Starlink-2305) 卫星实施了紧急避碰控制[129]. 面对太空环境安全风险激增给航天器在轨安全稳定运行带来的严峻挑战, 世界主要航天国家将太空感知和自主防御能力建设视为未来一段时期的发展重点 (如, 欧空局 (European Space Agent, ESA) 已着手发展航天器自主防撞系统[159]).
空间碎片/失效卫星碰撞、敌意卫星干扰等各类轨道威胁目标, 通常具有“快小暗弱”等特点, 其行为特征不明显且动态不确定性强. 如何在不影响自身既定业务的前提下, 及时发现并有效地应对各类轨道威胁, 是确保航天器在轨安全运行迫切需要解决的问题. 对此, 需要发展面向博弈对抗等强不确定场景的航天器智能自主控制技术, 使其能够在星上资源严重受限的情况下自主感知威胁、自主制定博弈策略并完成大范围机动规避动作. 因此, 在“感知−决策−执行”闭环控制的框架下, 需要进一步研究可实现资源自组织优化调配的航天器智能自主控制系统架构与模型、面向物理运动体的学习赋能机制及系统行为的可信评价等基础性问题, 突破轨道威胁目标的多体制测量与融合感知、多约束下非完全信息博弈决策与规避控制等关键技术.
网络化航天器集群作为分布式卫星系统体系中的一种新模式, 是服务未来空间立体监测、小行星探测等众多空间应用的重要发展方向. 例如, 下一代卫星系统更倾向于采用由异构卫星组成的动态网络化结构, 以满足对重访时间、以更高分辨率覆盖大面积或最小化数据访问延迟等的要求[160]; 面向未来小行星带探测任务, 美国国家航空航天局 (National Aeronautics and Space Administration, NASA) 提出了自主纳米蜂群 (Autonomous nano-technology swarm, ANTS) 计划, 通过开展群体智能和分布式计算等的研究与应用, 提供资源、分工等的自我配置能力, 以及分布式系统的自我优化、自我保护和自我修复等能力[161-162].
集群系统由大规模具有有限甚至单一功能的独立个体组成, 通过网络化通信系统实现个体之间/个体与环境之间的局部交互作用, 并通过群体自组织和智能涌现, 构成群体的整体性复杂行为能力, 具备复杂多任务的强适应性、在轨自修复和强生存能力. 其分布式网络架构、局部信息交互机制、资源的自组织配置、以及个体之间结构和功能的差异性等给航天器集群控制带来挑战. 对此, 需要深入研究航天器集群控制系统的体系架构、大范围空域下的信息获取与协同感知、多约束条件下的分布式协同规划、时变拓扑网络集群系统的分布式协同控制、集群行为的自组织涌现机制等基础性问题.
未来的月球科研站、地外行星探测等任务要求地外探测无人系统具备高精度定点超软着陆、高效能自主协同探测等技术能力. 例如, 我国已正式立项的探月工程四期, 计划2030年前在月球南极建设国际月球科研站的基本型, 其对着陆点的精度要求至少提升了一个数量级; 而且, 在未来的国际月球科研站上, 将是多个巡视器、着陆器和飞跃器在月球表面连续协调地工作, 通过多无人系统的分工协作开展月球资源的开采开发和原位科学研究. NASA-ESA公布的火星样本取回计划 (Mars Sample-return Mission, MSR)[163], 也是通过着陆器、巡视器、小型直升机等的协作, 完成火星样本的收集、转移和返回地球. 一方面, 为实现更高的着陆精度和更轻巧的触月控制, 需要发展基于月表地形图像、月基/天基信标源等的高精度导航, 强终端约束下的在线规划自主制导, 基于推力矢量的姿轨耦合高精度控制, 基于并联变推力发动机的平动转动协同控制[140]等技术. 另一方面, 为解决地外星表环境严苛未知、先验知识欠缺、资源严重受限、通信条件恶劣等现实约束, 导致的危险识别难、移动速度慢、作业精度低等瓶颈问题, 需要突破复杂未知无约束环境的多传感器协同感知、面向未知环境−自身行为关系的场景理解、复杂地外星表多任务多约束高安全性自主规划、多无人系统的智能协同操作控制、资源受限条件下的轻量化计算、无人系统智能水平评测等关键技术; 进一步通过积累经验、持续学习并生成知识, 提升无人系统的自主智能水平, 实现对动态环境和变化任务的主动适应, 从根本上提升地外探测效能.
未来更深远更复杂的深空探测活动等将持续拓展航天器的轨道空间和任务能力 (例如, ESA计划2023年发射的木星冰月探测器 (Jupiter icy moons explorer, JUICE) 将执行对木星及其3颗卫星 (木卫二Europa、木卫四Callisto、木卫三Ganymede) 的探测任务), 无疑对具备跨大空域、宽速域飞行能力、长时间在轨运行的跨域航天器提出了发展需求. 跨域航天器控制系统需要具备对不同环境特性轨道空间、不同速度下及其动力学特性等的强鲁棒适应性, 以及对可变执行机构 (甚至可变外形)、变化任务等的强自主适应性, 进而实现在环境、速度、机构、任务等组合变化下的稳定飞行. 系统往往呈现出复杂的时变特性和大范围不确定性, 还可能呈现出时间/事件混合驱动的混杂动态特性. 因此, 需要解决环境/任务变化下资源的自组织协调、不同约束条件组合和不同终端控制需求下的制导策略生成、有限计算资源情况下的可靠非线性规划/优化求解、域自适应的切换控制策略、跨域航天器系统的动力学建模和闭环性能分析等问题.
面向空间设施的在轨组装建造, 以及寿命末期或故障航天器的故障修复、燃料加注、辅助离轨等在轨维护任务, 服务航天器需要在复杂空间环境下, 利用具有一体化空间感知与执行的部件与载荷等, 与处于非合作慢旋等运动状态、且具有多种构型的目标航天器建立稳定连接, 并完成诸如拆除、剪切、切割、加注等工序复杂的多类操作任务, 多任务适应性要求高、精细化程度要求高. 例如, 我国已将“在轨服务与维护系统”列为国家科技重大专项; NASA计划2024年进行在轨演示的OSAM-1 (On-orbit servicing, assembly and manufacturing) 项目, 可为通用客户卫星进行在轨燃料补加, 整个过程包括更换末端工具、捕捉与重定位目标卫星、切割包覆膜、切断绞索、拧开盖子、加注枪抵近插入、燃料加注等多个精细操作任务. 在轨建造与维护控制面临非合作目标特性未知、空间环境存在多源干扰、操作环境非结构化、接触过程动力学复杂多变、作业精准度及安全柔顺性要求高等多方面的挑战. 对此, 需要突破多模态感知信息融合与利用、高效的多任务样本采集与利用、可学习的任务表示与关系、虚拟−真实策略迁移、多体系统的复合协调控制、人机交互混合智能操控等关键技术[164], 实现对非结构化不确定环境和复杂多任务适应能力更强、同时兼具精准柔顺作业能力的操作控制.
空间控制技术是提升太空探索能力和太空控制能力的驱动器和倍增器, 也是科技创新的重要领域. 过去半个多世纪, 在不断发展的空间任务需求牵引下, 以及自动化、人工智能等学科发展的推动下, 我国空间控制技术实现了从近地卫星到载人航天、深空探测的跨越式发展, 在航天器姿态控制、姿态轨道控制、“感知−决策−执行”自主控制三个方面均取得了重要突破. 本文在综述了中国空间控制技术主要进展的基础上, 结合我国未来的空间任务和世界航天发展前沿, 提出了需要重点关注的6个技术方向和基础性问题, 助推未来航天器智能自主控制技术的创新发展. 当前, 各学科交叉融合加快, 新兴学科不断涌现, 为我国空间控制技术的发展创造了重要机遇. 随着自动化、新一代人工智能等技术的不断突破, 以及信息科学、数理科学、生物科学、材料科学等领域的持续创新, 必将有力推动航天器控制系统新一轮的创新发展和能力升级, 为解决空间环境未知、任务多变、系统不确定等显著特征下的自主控制问题提供有效方案, 持续推动空间控制技术向智能化、轻量化、通用化等的方向发展, 更好地应对未来动态多变、复杂不确定的空间任务.
Review on Intelligent Autonomous Control for Spacecraft Confronting Orbital Threats YUAN Li et al., Acta Automatica Sinica, 2022