We propose an online debiased lasso (ODL) method for statistical inference in high-dimensional linear models with streaming data. The proposed ODL consists of an efficient computational algorithm for streaming data and approximately normal estimators for the regression coefficients. Its implementation only requires the availability of the current data batch in the data stream and sufficient statistics of the historical data at each stage of the analysis. A dynamic procedure is developed to select and update the tuning parameters upon the arrival of each new data batch so that we can adjust the amount of regularization adaptively along the data stream. The asymptotic normality of the ODL estimator is established under the conditions similar to those in an offline setting and mild conditions on the size of data batches in the stream, which provides theoretical justification for the proposed online statistical inference procedure. We conduct extensive numerical experiments to evaluate the performance of ODL. These experiments demonstrate the effectiveness of our algorithm and support the theoretical results. An air quality dataset and an index fund dataset from Hong Kong Stock Exchange are analyzed to illustrate the application of the proposed method.


翻译:我们建议采用在线去偏差的Lasso(ODL)方法,在具有流数据的高维线性模型中进行统计推断,拟议的ODL包括数据流的高效计算算法和回归系数的大致正常估计值,其实施仅需要提供数据流中的当前数据批量和在分析的每个阶段对历史数据进行充分统计。我们开发了一个动态程序,以便在每批新数据到达时选择和更新调试参数,以便我们能够在数据流中根据适应性调整正规化的数量。ODL估计值的无症状正常性是在类似于离线设置和关于流中数据批量的温和条件的条件下建立的,为拟议的在线统计推理程序提供了理论依据。我们进行了广泛的数字实验,以评价ODL的性能。这些实验证明了我们的算法的有效性并支持理论结果。我们从香港股票交易所得到的空气质量数据集和指数基金数据集进行了分析,以说明拟议方法的应用情况。

0
下载
关闭预览

相关内容

【干货书】统计学习导论,431页pdf讲解数据科学知识
专知会员服务
77+阅读 · 2021年6月7日
专知会员服务
50+阅读 · 2020年12月14日
专知会员服务
52+阅读 · 2020年9月7日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
77+阅读 · 2020年7月26日
【MIT】反偏差对比学习,Debiased Contrastive Learning
专知会员服务
90+阅读 · 2020年7月4日
知识图谱推理,50页ppt,Salesforce首席科学家Richard Socher
专知会员服务
105+阅读 · 2020年6月10日
【经典书】统计学习导论,434页pdf,斯坦福大学
专知会员服务
233+阅读 · 2020年4月29日
【实用书】流数据处理,Streaming Data,219页pdf
专知会员服务
76+阅读 · 2020年4月24日
LibRec 精选:AutoML for Contextual Bandits
LibRec智能推荐
7+阅读 · 2019年9月19日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
已删除
将门创投
7+阅读 · 2018年10月12日
Arxiv
0+阅读 · 2021年10月15日
Adaptively Robust Geographically Weighted Regression
Arxiv
0+阅读 · 2021年10月14日
Arxiv
3+阅读 · 2016年2月24日
VIP会员
相关VIP内容
【干货书】统计学习导论,431页pdf讲解数据科学知识
专知会员服务
77+阅读 · 2021年6月7日
专知会员服务
50+阅读 · 2020年12月14日
专知会员服务
52+阅读 · 2020年9月7日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
77+阅读 · 2020年7月26日
【MIT】反偏差对比学习,Debiased Contrastive Learning
专知会员服务
90+阅读 · 2020年7月4日
知识图谱推理,50页ppt,Salesforce首席科学家Richard Socher
专知会员服务
105+阅读 · 2020年6月10日
【经典书】统计学习导论,434页pdf,斯坦福大学
专知会员服务
233+阅读 · 2020年4月29日
【实用书】流数据处理,Streaming Data,219页pdf
专知会员服务
76+阅读 · 2020年4月24日
Top
微信扫码咨询专知VIP会员