作者:Joseph Rickert
翻译:黄小伟,先后从事游戏、社交及金融数据研究及应用,目前就职杭州有赞,欢迎有兴趣的同学加入有赞分析团队
在过去28个月,每月平均有181个R新包收录于CRAN,增速惊人!下图为自2016年至今,R新包的收录数量趋势。
11月份,171个R新包收录于CRAN,以下是选摘的40个R新包,包括9个类别:计算方法、数据、金融、机器学习、市场分析、科学、统计学、工具和可视化.
1. mixsqp: 提供基于序列二次规划(SQP)的优化算法(Kim et al. 2012),用于有限混合模型( 成分密度已知 )中混合比例的最大似然估计.
2. polylabelr: 对C ++库polylabel进行封装,提供了一个有效的例程来查找多边形不可访问的近似极点.
3. Riembase: 实现了多种算法来估计基本统计量,包括用于多值数据的Frechet均值和几何中值.
4. SolveRationalMatrixEquation: 提供找到对称正定解X的函数,比如X = Q + L(X inv)L ^ T,计算对称正定矩阵Q和非奇异矩阵L.
1. metsyn: 提供Meteo France Synop数据的API访问接口.
2. neonUtilities: 提供国家生态观测站( NEON )的API接口.
3. phenocamapi: 支持用户从PhenoCam获取物候时间序列和站点元数据.
4. rdbnomics: 支持通过DBnomics API接口进行数亿数据序列的访问.
5. restez: 允许用户下载GenBank的大部分内容并生成基于SQL的本地数据库.
1. crseEventStudy: 实施Dutta等人( 2018 )长期事件研究中异常回报的标准化测试,以提高Kothari / Warner( 2007 )所述测试的功效和稳健性.
2. psymonitor: 提供Phillips,Shi和Yu( 2015 )所提出的实时监控策略.
四. 机器学习
1. pivmet: 为了解决贝叶斯混合模型中的标签切换问题,提供了一组关键算法来重新标记MCMC链,同时提供函数初始化经典k均值算法的中心,以便获得更好的聚类解决方案.
2. RDFTensor: 实现适用于稀疏、二进制和三模式RDF张量的因子分解技术.
3. rfviz: 提供交互式数据可视化和探索工具包,该工具包实现了Breiman和Cutler最初基于Java的随机森林可视化工具.
4. rJST: 提供联合情绪主题模型相关的函数,如Lin和He( 2009 )和Lin等人( 2012 )所述.
1. Marketmatching: 支持用户利用时间序列匹配找到最佳的控制市场,并分析干预的影响.
1. EpiSignalDetection: 借助欧洲联盟/欧洲经济区或国家一级的传染病监测数据,提供监测传染病暴发的相关工具.
2. memnet: 提供一系列网络科学工具,以促进对人类(语义)记忆的研究。包括从语言流利性数据推断网络的几种方法、网络增长模型、随机游走过程、分析和可视化网络的工具.
3. phylocomr: 提供Phylocom接口,它是一个用于分析系统发育群落结构和特征进化的库.
4. plinkQC: 提供相关工具,促进遗传关联研究的基因型质量控制,如Anderson等( 2010 )所述.
七. 统计学
1. BivRec: 实现了一组非参数和半参数方法来分析交替循环事件数据.
2. cusum: 提供了以伪信号概率为中心构造和评价CUSUM图和RA-CUSUM图的函数.
3. dabestr: 提供了使用自助法和估计图进行显著性测试的替代方法,参见Ho et al ( 2018 ).
4. deckgl: 提供deck.gl的接口,这是一个基于WebGL的开源JavaScript框架,用于对大型数据集进行可视化探索性数据分析,并支持来自mapbox的底图.
5. LindleyPowerSeries: 提供计算Lindley Power Series分布的概率密度函数、累积分布函数、危险率函数、分位数函数等功能.
6. modi: 实现将样本设计考虑在内的算法来检测多元异常值.
7. MPTmultiverse: 提供函数进行潜在模型的选择和验证.
8. pterrace: 提供相关绘图函数,用于拓扑数据分析的摘要图形,有助于确定重要拓扑特征的数量.
9. randcorr: 通过Pourahmadi和Wang( 2015 )所提出的算法,通过使用Cholesky分解和超球坐标表示相关矩阵来生成随机p x p相关矩阵.
10. SMFilter: 为Stiefel流形上的状态空间模型提供滤波算法,同时为Stiefel流形上的均匀矢量Langevin-Bingham和矩阵Langevin-Bingham分布提供相应的采样算法.
八. 工具
1. IRkernel: 为Jupyter Notebook实现了一个本地R内核.
2. lobstr: 提供一组工具,可用于检查和理解受str( )启发的R数据结构.
3. parsnip: 实现一个通用接口,允许用户指定模型,而不必记住不同函数或计算引擎中的不同参数名称.
4. pkgsearch: 允许用户通过METACRAN搜索服务器,检索目标R包.
5. stevedore: 提供Docker API接口.
6. vctrs: 定义原型和大小的新概念,用于提供一致且良好的类型强制和大小回收工具.
7. vtree: 提供绘制变量树图的功能,该图显示由分类变量值定义的数据框分层子集信息.
8. zipR: 在R中实现了zip( )函数.
1. countcolors: 提供计算图像中颜色的相关函数,以及将目标像素更改为不同颜色图像的掩码版本.
2. coveffectsplot: 提供森林图可视化协变量的效果,用户可以通过自命令行或交互式Shiny应用来实现.
说明:限于个人水平,错误之处难免,烦请批评指正,共同交流~