Mobility analysis, or understanding and modeling of people's mobility patterns in terms of when, where, and how people move from one place to another, is fundamentally important as such information is the basis for large-scale investment decisions on the nation's multi-modal transportation infrastructure. Recent rise of using passively generated mobile data from mobile devices have raised questions on using such data for capturing the mobility patterns of a population because: 1) there is a great variety of different kinds of mobile data and their respective properties are unknown; and 2) data pre-processing and analysis methods are often not explicitly reported. The high stakes involved with mobility analysis and issues associated with the passively generated mobile data call for mobility analysis (including data, methods and results) to be accessible to all, interoperable across different computing systems, reproducible and reusable by others. In this study, a container system named Mobility Analysis Workflow (MAW) that integrates data, methods and results, is developed. Built upon the containerization technology, MAW allows its users to easily create, configure, modify, execute and share their methods and results in the form of Docker containers. Tools for operationalizing MAW are also developed and made publicly available on GitHub. One use case of MAW is the comparative analysis for the impacts of different pre-processing and mobility analysis methods on inferred mobility patterns. This study finds that different pre-processing and analysis methods do have impacts on the resulting mobility patterns. The creation of MAW and a better understanding of the relationship between data, methods and resulting mobility patterns as facilitated by MAW represent an important first step toward promoting reproducibility and reusability in mobility analysis with passively-generated data.
翻译:流动分析,或对人员流动模式的理解和建模,从何时、何地以及人们如何从一个地方向另一个地方流动到另一个地方,具有根本重要性,因为此类信息是该国多式运输基础设施大规模投资决策的基础,最近使用移动设备产生的被动产生的移动数据增多,使人们对使用此类数据以掌握人口流动模式产生疑问,因为:(1) 存在各种不同的移动数据及其各自特性未知;(2) 数据预处理和分析方法往往没有明确报告; 流动分析所涉及的高利害关系以及与被动生成的流动数据要求流动模式分析(包括数据、方法和结果)有关的问题,要求所有人都可以使用,在不同计算系统中互操作,可复制和可供他人使用; 在这项研究中,开发了一个名为流动分析流程的集装箱系统,整合数据、方法和结果; 在集装箱化技术的基础上,MAW的用户可以轻松地创建、配置、修改、执行和分享其方法和结果; 在Dovker 集装箱中,流动模式(包括数据、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法分析、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、方法、