The widespread adoption of wearable sensors has the potential to provide massive and heterogeneous time series data, driving the use of Artificial Intelligence in human sensing applications. However, data collection remains limited due to stringent ethical regulations, privacy concerns, and other constraints, hindering progress in the field. Synthetic data generation, particularly through Generative Adversarial Networks and Diffusion Models, has emerged as a promising solution to mitigate both data scarcity and privacy issues. However, these models are often limited to narrow operational scenarios, such as short-term and unimodal signal patterns. To address this gap, we present a systematic evaluation of state-of-the-art generative models for time series data, explicitly assessing their performance in challenging scenarios such as stress and emotion recognition. Our study examines the extent to which these models can jointly handle multi-modality, capture long-range dependencies, and support conditional generation-core requirements for real-world wearable sensor data generation. To enable a fair and rigorous comparison, we also introduce an evaluation framework that evaluates both the intrinsic fidelity of the generated data and their utility in downstream predictive tasks. Our findings reveal critical limitations in the existing approaches, particularly in maintaining cross-modal consistency, preserving temporal coherence, and ensuring robust performance in train-on-synthetic, test-on-real, and data augmentation scenarios. Finally, we present our future research directions to enhance synthetic time series generation and improve the applicability of generative models in the wearable computing domain.


翻译:可穿戴传感器的广泛采用有望提供海量且异构的时间序列数据,推动人工智能在人体感知应用中的发展。然而,由于严格的伦理法规、隐私问题及其他限制,数据收集仍面临诸多制约,阻碍了该领域的进展。合成数据生成,特别是通过生成对抗网络和扩散模型,已成为缓解数据稀缺性和隐私问题的有效途径。但这些模型通常局限于狭窄的操作场景,例如短期和单模态信号模式。为弥补这一不足,我们对时间序列数据的最新生成模型进行了系统性评估,重点考察其在压力与情绪识别等复杂场景中的表现。本研究探讨了这些模型在联合处理多模态性、捕获长程依赖关系以及支持条件生成(现实世界可穿戴传感器数据生成的核心需求)方面的能力。为实现公平且严谨的比较,我们引入了一个评估框架,该框架同时评估生成数据的内在保真度及其在下游预测任务中的实用性。研究结果揭示了现有方法的关键局限,特别是在保持跨模态一致性、维护时序连贯性以及确保在‘合成数据训练-真实数据测试’和数据增强场景中的鲁棒性能方面。最后,我们提出了未来的研究方向,以增强时间序列的合成生成能力,并提升生成模型在可穿戴计算领域的适用性。

0
下载
关闭预览

相关内容

文本、视觉与语音生成的自动化评估方法综述
专知会员服务
19+阅读 · 6月15日
图数据管理与图机器学习:协同效应与机会
专知会员服务
15+阅读 · 2月5日
面向 AIoT 的协同智能综述
专知会员服务
27+阅读 · 2024年11月16日
工业机器视觉中的生成式人工智能综述
专知会员服务
50+阅读 · 2024年9月1日
【AI与医学】多模态机器学习精准医疗健康
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
VIP会员
相关VIP内容
文本、视觉与语音生成的自动化评估方法综述
专知会员服务
19+阅读 · 6月15日
图数据管理与图机器学习:协同效应与机会
专知会员服务
15+阅读 · 2月5日
面向 AIoT 的协同智能综述
专知会员服务
27+阅读 · 2024年11月16日
工业机器视觉中的生成式人工智能综述
专知会员服务
50+阅读 · 2024年9月1日
相关基金
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
Top
微信扫码咨询专知VIP会员