本论文旨在通过让非机器学习专业人士也能使用高级建模能力,实现时间序列智能的民主化。我们通过三项互补性研究达成这一目标:构建基础模型、深化模型理解、并解决实际应用中的挑战。 首先,我们提出MOMENT——首个开源时间序列基础模型系列,能够在极少量监督下,对跨领域数据完成多种任务。这些模型可扩展至长序列多元上下文处理,并整合多模态数据,从而应用于传统方法难以应对的复杂现实场景。
其次,我们通过研究模型的组合推理能力、表征结构和编码概念,揭示其内部学习机制。这些发现既深化了对模型的理解,也直接提升了其性能。 接着,我们针对部署挑战开发了新方法,包括:从分布式无标注数据中学习、评估标签质量、以及在标注数据稀缺时选择鲁棒模型。最后,我们探索如何利用大型语言模型(LLM)智能体,结合本论文开发的开源工具,自动化时间序列智能工程流程。
我们在临床场景中验证了这些方法的实用性——该领域既富含时间序列数据,模型应用又能产生重大影响。研究表明:专用基础模型与支持其落地应用的实用工具相结合,能显著推进时间序列智能发展,最终产出具有社会价值的解决方案。