Compositional data, which is data consisting of fractions or probabilities, is common in many fields including ecology, economics, physical science and political science. If these data would otherwise be normally distributed, their spread can be conveniently represented by a multivariate normal distribution truncated to the non-negative space under a unit simplex. Here this distribution is called the simplex-truncated multivariate normal distribution. For calculations on truncated distributions, it is often useful to obtain rapid estimates of their integral, mean and covariance; these quantities characterising the truncated distribution will generally possess different values to the corresponding non-truncated distribution. In this paper, three different approaches that can estimate the integral, mean and covariance of any simplex-truncated multivariate normal distribution are described and compared. These three approaches are (1) naive rejection sampling, (2) a method described by Gessner et al. that unifies subset simulation and the Holmes-Diaconis-Ross algorithm with an analytical version of elliptical slice sampling, and (3) a semi-analytical method that expresses the integral, mean and covariance in terms of integrals of hyperrectangularly-truncated multivariate normal distributions, the latter of which are readily computed in modern mathematical and statistical packages. Strong agreement is demonstrated between all three approaches, but the most computationally efficient approach depends strongly both on implementation details and the dimension of the simplex-truncated multivariate normal distribution. For computations in low-dimensional distributions, the semi-analytical method is fast and thus should be considered. As the dimension increases, the Gessner et al. method becomes the only practically efficient approach of the methods tested here.
翻译:由分数或概率构成的数据, 在许多领域, 包括生态、 经济学、 物理科学和政治科学, 是常见的, 包括分数或概率的数据, 在许多领域, 包括生态、 经济学、 物理科学和政治科学 。 如果这些数据通常会分布, 它们的分布可以方便地由单位简单x 下向非负空间递减的多变量正常分布法来表示。 这里的分布称为简单x- 调序多变量正常分布法。 对于计算脱轨分布法的计算, 通常需要快速估计其整体、 平均和共变法的分布法; 曲流分布法的特性通常与相应的非曲线分布法有不同的值。 在本文件中, 三种不同的方法可以估计任何简单x 调序的多变量正常分布法的集成、 平均值的平均值和数值的计算法的计算法 。 在此处, 所展示的统计法中, 最正态的快速和正态的计算法是 。 以正态计算法 。 以正态方式显示的正态计算法 。 。, 以正态计算法 。 的 以 以 直态 直态 直方 的 直方 的 直方 基 法 法 表示 的 的 的 的 以 以 直方 的 直方 直方 直方 直方 直方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 法 法 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 法 方 方 法 法 方 法 法 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 方 法 方 方 法 法