精选|2018年9月R新包推荐

2018 年 10 月 24 日 R语言中文社区

作者:Joseph Rickert

翻译:黄小伟,先后从事游戏、社交及金融数据研究及应用,目前就职杭州有赞

9月份,共有126个R新包收录于CRAN(8月份收录R新包160个),增幅连续下降,当然,这是R包经历过数量上快速增长后的正常变化。本期选摘了其中40个R新包,针对其主要功能做简单介绍,便于大家学习。包含八个类别:数据、金融、机器学习、科学、统计学、时间序列、工具和可视化,其中工具类R包将做重点介绍.

一. 数据

1. trigpoints : 提供British National Grid(OSGB36)坐标参考系统中历史GB标志点(帮助地图制作者和徒步旅行者的固定测量点)的完整数据集.

2. UKgrid : 提供自2011年以来英国国家电网需求数据(高压电力传输网络).


二. 金融

1. jubilee : 实现了Jubilee-Tectonic长期预测模型,用于预测美国股市的未来回报、国债收益率和黄金价格. ---量化同学可重点关注

2. portsort : 支持通过条件或无条件排序,将资产分类为最多三个因子的投资组合.

三. 机器学习

1. crfsuite : 针对CRFsuite进行封装,允许用户拟合条件随机场模型。重点是自然语言处理、有命名实体识别、文本分块、词性标注、意图识别和分类模型.

2. ELMSO : 实现Paulson, Luo和James(2018) 中描述的算法,该算法在一组在线广告机会中进行预算分配的实现.

3. embed : 提供使用简单的广义线性模型、非线性模型将因子预测变量转换为一个或多个数值表示的函数.

4. newsmap : 实施地理文件分类的半监督模型,同时包含英语、德语、西班牙语、日语和俄语的种子词典.

5. splinetree : 提供使用样条投影方法构建回归树、随机森林的功能.

6. stylest : 提供评价演讲者(作者)风格的独特性的功能.

四. 科学

1. conStruct : 提供一种将遗传数据映射为离散层组合的方法,在每个离散层内,相关性可能随地理距离不断衰减.

2. episcan : 提供一些有效的机制来扫描全基因组相互作用研究(GWIS)中的上位性,并支持病例对照状态(二元结果)和定量表型(连续结果)研究.

五.统计

1. ahpsurvey : 实现层次分析过程,一个由Saaty(1987)引入的通用多准则决策工具,它允许决策者权衡属性并评估呈现给属性的备选方案.

2. empirical : 实现经验单变量概率密度函数(连续函数)和经验累积分布函数(阶梯函数或连续函数).

3. basisMCMCplots : 提供用于检查来自NIMBLE软件包接口的单链、多链后验MCMC样本的功能.

4. MetaStan : 提供使用Stan进行贝叶斯元分析的函数,包括二项式 - 正态分层模型、使用弱信息先验的异质性参数、治疗效果参数等选项.

5. Opt4PL : 提供获取和评估3、4和5种参数逻辑回归模型的各种最佳设计的功能.

6. rmatalog : 实现了metalog分布,这是一种现代的、高度灵活的、数据驱动的分布.

7. rwavelet : 提供执行小波分析(正交和平移不变变换)的功能,同时进行数据压缩、去噪声.

8. samplingBigData : 提供对大数据集进行采样的方法,包括在多维空间中进行空间平衡采样.

9. survivalAnalysis : 实现高级接口封装以支持生存分析,包括Kaplan-Meier分析、对数秩检验、Cox回归.

10. ungroup : 提供实现惩罚复合链路模型的功能,有效地估计粗略分箱数据的平滑分布.

六. 时间序列

1. bayesdfa : 使用Stan实现贝叶斯动态因子分析,这是一种多变量时间序列的降维工具.

2. tbrf : 提供基于日期和时间窗口的滚动统计函数,而不是n-滞后观察.


七. 工具

1. atable : 提供创建临床试验报告、描述性统计和假设测试的功能,同时支持使用LaTeXWord将结果排列在表中.

2. av : 实现与FFmpeg AV库的绑定,以便在R中处理音频和视频.

3. binb : 为RMarkdown中基于PDF的演示幻灯片提供一系列LaTeX样式.

4. broom.mixed : 将通过R中各种混合模型包拟合的对象转换为整洁的数据框格式.

5. codified : 允许作者使用元数据增加临床数据,以创建传统出版物、报告中使用的输出.

6. duawrangler : 允许对受保护元素的原始数据文件创建可共享数据集的功能.

7. ipc : 提供用于在R进程之间传递消息的工具,其中Shiny示例显示了如何执行有用的任务.

8. piggyback : 针对git的50MB提交限制,允许更大(最多2 GB)的数据文件附加到各个GitHub版本的存储库中. 

9. pysd2r : 使用reticulate包实现pysd的交互接口,提供大量的pysd函数,并且支持以Vensimmdlxmile格式读取文件.

10. radix : 提供基于Radix阅读器友好排版,可视化的灵活布局选项以及对脚注和引文的完全支持来格式化Web的科学和技术文章的功能.

11. rbtc : 实现比特币的RPC-JSON API,并为区块链的地址创建和内容分析提供实用程序功能.

12. salty : 允许用户获取真实或模拟数据,并将其与常见的错误相结合,例如伪OCR错误、Unicode问题、带有荒谬标点符号的数字字段、错误日期等.

八. 可视化

1. customLayout : 提供了graphics::layout()的扩展版本,允许用户通过组合更简单的布局为多个元素创建复杂的绘图区域.

2. echarts4r : 允许用户通过利用Echarts 、JavaScript库创建交互式图表,它包括33种图表类型、动画等内容.

3. ggparliament : 支持对议会的可视化,将选举结果可视化为建筑布局中的点. 

4. ggTimeSeries : 提供其他时间序列可视化,如日历热图、Steam Graph流图等.

说明:限于个人水平,错误之处难免,烦请批评指正,共同交流~


登录查看更多
0

相关内容

【DeepMind推荐】居家学习的人工智能干货资源大全集
专知会员服务
107+阅读 · 2020年6月27日
【干货书】用于概率、统计和机器学习的Python,288页pdf
专知会员服务
287+阅读 · 2020年6月3日
【教程推荐】中科大刘淇教授-数据挖掘基础,刘 淇
专知会员服务
80+阅读 · 2020年3月4日
2019必读的十大深度强化学习论文
专知会员服务
57+阅读 · 2020年1月16日
【NeurIPS2019报告推荐】公平与表示学习—UIUC Sanmi Koyejo教授
【论文推荐】文本分析应用的NLP特征推荐
专知会员服务
33+阅读 · 2019年12月8日
【机器学习课程】Google机器学习速成课程
专知会员服务
164+阅读 · 2019年12月2日
Nature 一周论文导读 | 2019 年 2 月 14 日
科研圈
7+阅读 · 2019年2月24日
2018年中国供应链金融行业研究报告
艾瑞咨询
7+阅读 · 2018年11月20日
6月Python热文Top10,精选自1000篇文章
AI100
3+阅读 · 2018年6月15日
PRL导读-2018年120卷15期
中科院物理所
4+阅读 · 2018年4月23日
推荐|网易云音乐分析之推荐算法
人人都是产品经理
10+阅读 · 2018年2月26日
基于机器学习方法的POI品类推荐算法
全球人工智能
3+阅读 · 2017年11月22日
推荐|一份不错的机器学习笔记!
全球人工智能
22+阅读 · 2017年11月20日
推荐|2017年最受数据科学欢迎的Top15个Python库!
全球人工智能
8+阅读 · 2017年10月28日
【推荐】(TensorFlow)RNN入门
机器学习研究会
9+阅读 · 2017年10月10日
Arxiv
19+阅读 · 2018年5月17日
VIP会员
相关VIP内容
相关资讯
Nature 一周论文导读 | 2019 年 2 月 14 日
科研圈
7+阅读 · 2019年2月24日
2018年中国供应链金融行业研究报告
艾瑞咨询
7+阅读 · 2018年11月20日
6月Python热文Top10,精选自1000篇文章
AI100
3+阅读 · 2018年6月15日
PRL导读-2018年120卷15期
中科院物理所
4+阅读 · 2018年4月23日
推荐|网易云音乐分析之推荐算法
人人都是产品经理
10+阅读 · 2018年2月26日
基于机器学习方法的POI品类推荐算法
全球人工智能
3+阅读 · 2017年11月22日
推荐|一份不错的机器学习笔记!
全球人工智能
22+阅读 · 2017年11月20日
推荐|2017年最受数据科学欢迎的Top15个Python库!
全球人工智能
8+阅读 · 2017年10月28日
【推荐】(TensorFlow)RNN入门
机器学习研究会
9+阅读 · 2017年10月10日
Top
微信扫码咨询专知VIP会员