精选 | 2018年4月R新包推荐

2018 年 5 月 25 日 R语言中文社区


作者:Joseph Rickert

翻译:黄小伟,先后从事游戏、社交及金融数据研究及应用,目前就职网易杭州


2018年4月份,共有约212个R新包收录于CRAN,本文选摘了其中40个R包加以功能简述,有需要的爱好者可以自行下载帮助文档并安装R包进行使用。本文主要包括以下几个类别:计算方法、数据、数据科学、机器学习、音乐、科学、统计、时间序列、工具和可视化等.

一. 计算方法

1. diffeqr : 支持对微分方程计算工具的调用接口(DifferentialEquations.jl),提供了针对常微分方程(ODE)、随机微分方程(SDE)、时滞微分方程(DDE)、微分代数方程(DAE)等方程的高性能方法.

2. SimRepeat : 提供模拟统计方程的相关系统的功能,其中该方程可具有多种变量类型.

二. 数据

1. echor : 提供美国环境保护局(EPA)环境合规历史在线(ECHO) 数据的访问接口.

2. essurvey : 支持从欧洲社会调查(European Social Survey)下载所需数据.

3. malariaAtlas : 支持从疟疾地图集项目(Malaria Atlas Project)服务器下载公共可用数据,并对其进行可视化分析.访问地址:https://map.ox.ac.uk/

4. salesforcer : 提供 Salesforce平台的访问接口.

三. 数据科学

1. mleap : 为MLeap提供了一个sparklyr扩展,这是一个开放源码库,可以导出Apache Spark管道.

2. rdfp : 提供谷歌DFP DoubleClick for Publishers)的访问接口.

访问地址:https://developers.google.com/doubleclick-publishers/

3. workflowr : 提供了支持可重复性操作和团队协作的数据科学实施框架.

四. 机器学习

1. aws.translate : 支持将一种语言的文本输入转换成另一种语言的文本输出(AWS Translate).

2. CBDA : 实现一个集合预测器(“超级学习者”),使用基于过滤和全面感知的方法对大数据进行分类.

3. featurefinder : 通过使用rpart分类和回归树对模型残差进行详细分析,实现了一种用于查找模型特征的方法.

4. iilassso : 用可独立解释的Lasso实现用于拟合线性、逻辑回归模型的高效算法.

5. live : 通过了解关键因素,实施解释复杂机器学习模型的方法,

详见 Ribeiro et al. (2016) and Staniak and Biecek (2018).

6. mlrCPO : 提供了一套工具集,使得mlr(机器学习框架)更为丰富,可兼容多种预处理操作符(CPOS).

7. varrank : 提供用于执行变量排序和特征选择的计算工具箱.

五. 音乐

1. tabr : 支持通过R代码利用乐谱软件(LilyPond)创建吉他谱的功能,可根据标记语言生成高品质的乐谱.

六. 科学

1. DrInsight : 使用基于连接性测绘的药物重复利用工具,能够反向查询疾病表型或者查询与所查询药物具有类似功能的药物.

七. 统计

1. cultevo : 提供测量信号系统组成的工具:信息论测量(2016)、距离矩阵相关性的Mantel检验(1983)等.

2. indirect : 提供使用独立的条件均值先验值的贝叶斯广义线性模型的函数.

3. konfound : 实现了反映灵敏度分析最新进展的方法,包括计算稳健性指数的函数.

4. mgc : 实现多等级图关联(MGC),在2017年由Shen等人开发.

5. netregR : 提供将网络响应(有向和无向)回归到可能为演员、关系或网络值等感兴趣的协变量,并提供计算系数方差估计值的函数.

6. RNGforGPD : 提供生成遵循广义泊松分布的单变量和多变量数据的函数.

7. SmartEDA : 提供自动描述数据结构和关系的功能,以便于探索性数据分析.

8. stratifyR : 采用Khan等人的方法对单变量人群实施分层抽样设计.

9. WeMix : 提供运行混合效果模型的功能,其中包括每个级别的权重。遵循Rabe-Hesketh等人所提出的方法(2006),利用自适应正交的方法进行模型训练.

八. 时间序列

1. anomalize : 实现一个“整洁”工作流程,用于检测时间序列数据中的异常情况,支持分解时间序列、检测异常和将多个时间序列的正常数据与异常数据进行分离等功能.

2. LPWC : 提供函数-基于加权相关和引入滞后,进行时间序列的距离度量.

九. 工具

1. table1 : 提供用于创建用于描述性统计的HTML表格的功能.

2. foolbox : 提供一个操作函数的框架,并使用元编程来翻译.

3. graphframes : 提供了sparklyr包的扩展,提供了基于DataFrame的接口来处理图形.

4. komaletter : 提供用于书写字母的多功能R Markdown模板.

5. pkgnet : 使用图论的工具来分析R包中的函数与其导入的包之间的依赖关系,并量化它们的复杂性等.

6. promises : 提供了在R中进行异步编程的基本抽象.

十. 可视化

1. ERSA : 提供函数对回归计算的结果进行展示,同时该功能可以集成到shiny中进行可视化显示.

2. ggplotify : 提供了将绘图函数调用转换为grobggplot的方法,使用户可以对齐由基本图形、网格、点阵和vcd函数生成的绘图.

3. ggstatsplot : 对ggplot2进行扩展,生成带有统计试验结果的可视化图形.

4. panelView : 提供使用二分法处理可视化面板数据的功能.

5. prepplot : 提供一个单独的函数,用于创建基础绘图区域,可以轻松制作自定义图形.

说明:限于个人水平,错误在所难免,欢迎批评指正、交流!

登录查看更多
0

相关内容

专知会员服务
82+阅读 · 2020年5月16日
【课程推荐】普林斯顿陈丹琦COS 484: 自然语言处理课程
专知会员服务
82+阅读 · 2019年12月11日
【干货】大数据入门指南:Hadoop、Hive、Spark、 Storm等
专知会员服务
95+阅读 · 2019年12月4日
Keras作者François Chollet推荐的开源图像搜索引擎项目Sis
专知会员服务
29+阅读 · 2019年10月17日
【电子书推荐】Data Science with Python and Dask
专知会员服务
43+阅读 · 2019年6月1日
Github六个知识图谱实战项目推荐
专知
382+阅读 · 2019年6月2日
2018-Github最热门机器学习开源项目Top10分享
深度学习与NLP
8+阅读 · 2019年1月22日
10月机器学习开源项目Top10
机器学习算法与Python学习
3+阅读 · 2018年10月30日
一份超全的PyTorch资源列表(Github 2.2K星)
黑龙江大学自然语言处理实验室
25+阅读 · 2018年10月26日
6月Python热文Top10,精选自1000篇文章
AI100
3+阅读 · 2018年6月15日
PRL导读-2018年120卷15期
中科院物理所
4+阅读 · 2018年4月23日
推荐 | 机器学习开源项目 Top 10
深度学习世界
4+阅读 · 2018年3月22日
推荐|Python库中Top10 的AI项目(星级3k+),赶紧收藏!
全球人工智能
10+阅读 · 2018年1月16日
推荐|Google最热门31款开源项目资源
全球人工智能
4+阅读 · 2017年11月24日
Generating Fact Checking Explanations
Arxiv
9+阅读 · 2020年4月13日
Rapid Customization for Event Extraction
Arxiv
7+阅读 · 2018年9月20日
VIP会员
相关VIP内容
相关资讯
Github六个知识图谱实战项目推荐
专知
382+阅读 · 2019年6月2日
2018-Github最热门机器学习开源项目Top10分享
深度学习与NLP
8+阅读 · 2019年1月22日
10月机器学习开源项目Top10
机器学习算法与Python学习
3+阅读 · 2018年10月30日
一份超全的PyTorch资源列表(Github 2.2K星)
黑龙江大学自然语言处理实验室
25+阅读 · 2018年10月26日
6月Python热文Top10,精选自1000篇文章
AI100
3+阅读 · 2018年6月15日
PRL导读-2018年120卷15期
中科院物理所
4+阅读 · 2018年4月23日
推荐 | 机器学习开源项目 Top 10
深度学习世界
4+阅读 · 2018年3月22日
推荐|Python库中Top10 的AI项目(星级3k+),赶紧收藏!
全球人工智能
10+阅读 · 2018年1月16日
推荐|Google最热门31款开源项目资源
全球人工智能
4+阅读 · 2017年11月24日
Top
微信扫码咨询专知VIP会员