Understanding passengers' path choice behavior in urban rail systems is a prerequisite for effective operations and planning. This paper attempts bridging the gap by proposing a probabilistic approach to infer passengers' path choice behavior in urban rail systems using a large-scale smart card data. The model uses latent classes and panel effects to capture passengers' implicit behavior heterogeneity and longitudinal correlations, key research gaps in big data driven behavior studies. We formulate the probability of each individual's arrival time at a destination based on their path choice behavior, and estimate corresponding path choice model parameters as a maximum likelihood estimation problem. The original likelihood function is intractable due to the exponential computation complexity. We derive a tractable likelihood function and propose a numerical integral approach to efficiently estimate the model. Also, we propose a method to calculate the t-statistic of the estimated choice parameters based on the numerically estimated Hessian matrix and Cramer-Rao bound (the lower bound on the coefficient variance). Case studies using synthetic data validate the model performance and its robustness against parameter initialization and input errors, and highlight the importance of incorporating crowding impact in path choice estimation. Applications using actual data from the Mass Transit Railway, Hong Kong reveal two latent groups of passengers: time-sensitive (TS) and comfort-aware (CA). TS passengers are those who are more likely to choose paths with short travel times. Most of them are regular commuters with high travel frequency and less schedule flexibility. CA passengers care more about the travel comfort experience and choose paths with less walking and waiting times. The proposed approach is data-driven and general to accommodate other discrete choice structures.
翻译:了解城市铁路系统乘客选择路径的行为是有效操作和规划的先决条件。 本文试图缩小差距, 提出一种概率方法, 以大规模智能卡数据来推断城市铁路系统乘客选择路径的行为。 模型使用潜伏阶级和小组效应来捕捉乘客的隐含行为差异和纵向相关性, 大数据驱动行为研究中的关键研究差距。 我们根据个人选择路径的行为来计算个人到达目的地的概率, 并估计相应的路径选择模型参数作为最大可能性估计问题。 最初的可能性功能因指数计算复杂而难以控制。 我们得出一个可移动的可能性功能, 并提出一个数字综合方法, 以高效估算模型。 此外, 我们提出一种方法, 来计算根据数字估计的海珊矩阵和Cramer-Rao行为研究中隐含的估算选择参数( 系数差异的制约较低 ) 。 我们用合成数据来验证模型的性能及其相对于参数初始和输入错误的稳健性。 原始概率功能功能功能由于指数的计算复杂性计算而难以控制。 我们得出一个可移动的可能性的概率功能, 并提议一个数字集选择一个数字集选择模型选择模型,,, 并用固定的频率, 固定旅行 旅行, 与机程中可能, 旅行 选择 选择, 最,, 最 最 最 和最 旅行 的 的 旅行 旅行 最 最 的 旅行 和最 的 的 的 的 的 的,,, 最 最 最 旅行 最 最 的 的 的 的 和最 最 的 的 最 的 的 的 最 的 的 最 的 的 最 最 的 的 的 的 的 最 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 最 的 的 的 最 最 的 的 的 的 的 的 最 的 的 的 的 的 的 的 的 最 最 最 最 最 最 最 的 的 最 最 最 最 最 最 最