作者:Joseph Rickert
翻译:黄小伟,10年资深数据矿工。目前就职杭州有赞数据分析团队,欢迎加入!
2019年3月份,233个R新包收录于CRAN(2月份收录151个,环比增加54.3%),累计收录14087个R包!此次整理了十个类别,分别为计算方法、数据、机器学习、医学、科学、Shiny、统计学、时间序列、工具和可视化。以下是R新包的功能简介:
一. 计算方法
1.DistributionOptimization: 支持借助GA包的遗传算法来拟合高斯混合模型.
2.latte: 实现与Latte、4ti2的连接,用于计算阵点和凸多面体内部的积分、4ti2用于线性空间上的代数/几何和组合问题.
3.nlrx: 提供在R中设置、运行和分析NetLogo模型的工具.
4.nvctr: 利用地球椭球面模型实现N矢量法,用于计算地理位置.
二. 数据
1.EHRtemporalVariability: 针对不同数据时间批次之间的差异进行投影和可视化,描述电子健康记录随时间的变化特征,并通过数据时间热图、信息几何时间(IGT)图和shiny进行探索分析.
2.kayadata: 为 Kaya identity variables(可雅恒等变量)(人口、国内生产总值、主要能源消耗和能源相关的二氧化碳排放)提供数据,并包括用于探索和绘制特定国家或地区燃料组合的相关函数.
3.newsanchor: 提供 News API,支持快速获取新闻数据进行分析.
4.raustats: 提供从澳大利亚统计局和澳大利亚储备银行网站下载澳大利亚经济统计数据的接口.
三. 机器学习
1.akmedoids : 提出一组用于长期轨迹进行纵向聚类的R函数,并根据Caliński-Harabasz准则( Caliński and Harabasz (1974) )确定最优解.
2.shapper: 提供了Python shap的封装,为影响机器学习模型中的特定观察变量提供 SHapley Additive exPlanations (SHAP) (Shapley加性解释).
3.sparkxgb: 实现一个sparklyr扩展,为Apache Spark上的XGBoost提供调用接口.
4.xgb2sql: 通过将经过训练的模型对象转换为SQL查询,可以对R中构建的XGBoost模型进行数据库内评分.
四. 医学
1.ctrdata: 提供查询、检索和分析两个公共注册中心(欧盟临床试验注册中心、clinical trials.gov)临床试验协议和结果相关信息的功能.
2.pubtatordb: 提供下载PubTator(国家生物技术信息中心)注释的功能,然后创建和查询本地版本的数据库.
3.tacmagic: 提供便于分析正电子发射断层(PET)扫描时间活动曲线(TAC)数据的功能.
五. 科学
1.bulletcp: 提供通过贝叶斯变点检测方法自动检测凹槽位置的功能,用于法医弹头匹配算法的数据预处理步骤.
2.earthtide: 使用Hartmann和Wenzel(1994)或Kudryavtsev(20040潮汐目录计算H.G. Wenzel编造的Fortran ETERNA 3.4程序,用于地球合成潮汐的计算.
3.steps: 提供跨时空模拟人口动态的函数.
六. Shiny
1.periscope: 实现一个面向企业、可扩展和用户界面标准化的Shiny框架.
2.reactlog: 通过构建应用在任意点响应状态的有向依赖关系图,提供对shiny程序响应过程黑盒的可视化洞察.
3.shinyhttr: 修改httr包中的函数:progress(),让它从shinyWidgets包中将输出发送到函数:progressBar().
七. 统计学
1.CoopGame: 为具有可转移效用的合作博弈理论提供了一套全面的工具,使用户能够创建特殊的合作博弈家族,如破产博弈、成本分担博弈和加权投票博弈.
2.discfrail: 提供用于为分组的时间 - 事件数据拟合Cox比例风险模型的功能.
3.fastglm: 提供使用RcppEigen有效拟合广义线性模型的函数.
4.hettx: 通过由Ding,Feller和Miratrix(2016)以及Ding,Feller和Miratrix(2018)开发的方法,用于测试和观察治疗效果是否存在无法解释的变化,以及表征治疗中解释和原因不明变异的程度.
5.mcmcabn: 实现用于有向无环图(DAG)的MCMC采样器.
6.networkABC: 实现了一种新的多级近似贝叶斯计算(ABC)算法,用于解译网络数据和评估网络参与者之间推断链接的强度.
7.retrodesign: 根据Gelman和Tuerlinckx(2000年)和Gelman&Carlin(2014年)的建议,提供了处理类型S(符号)和类型M(幅度)错误的工具,使用闭合形式的方案来解决S/M类型错误概率问题.
8.senssobol: 使用Saltelli等人提出的估算器,用户可以计算、引导和绘制三阶Sobol指数.
八. 时间序列
1.DTSg: 提供一个类,用于处理基于data.table的时间序列数据和具有引用语义的R6.
2.RJDemetra: 实现jdemetra+的访问接口,JDemetra +是欧洲统计系统(ESS)和欧洲中央银行系统成员正式推荐的季节性调整软件.
3.runstats: 提供快速计算时间序列样本统计数据的方法,包括:平均值、标准差、相关性、协方差等.
九. 工具
1.aweek: 支持将日期转换为任意周定义.
2.credentials: 提供用于管理ssh和git凭据的工具.
3.cyphr: 通过 sodium和OpenSSL的轻量级支持来实现一个封装,支持进行加密数据分析.
4.encryptr: 通过强RSA加密,提供对数据帧或tibble列进行加密的功能.
5.lenses: 提供用于创建和使用透镜以简化数据操作的工具.
6.yum: 支持从一个或多个文件中提取yaml片段中的信息,还可以选择在data.tree中构造信息.
十.可视化
1.ggasym: 借助ggplot2,提供非对称矩阵绘图的功能.
2.predict3d: 通过ggplot2和rgl为多个回归模型提供二维和三维的绘图功能.
说明:限于个人水平,错误之处难免,烦请批评指正,共同交流~