过去的决策是如何做出的,其驱动力、战略和理由是什么?关于组织应该如何从过去的经验中学习以帮助在未来做出更好的决策,这句老话是正确的。目前的第一阶段研究着眼于美国防部(DOD)如何灌输机构企业记忆。具体来说,该研究对如何开发一个透明的决策选项登记册(DOR)综合智能数据库系统进行测试并提出建议,其中DOR有助于捕捉国防部(DOD)内部项目的所有历史决策(假设、数据输入、约束、限制、竞争目标和决策规则)。这个DOR中的信息将与元语义搜索和数据科学分析引擎兼容。DOR用于对未来的决策方案进行建模,以便在不确定的情况下做出决策,同时依靠过去的最佳实践,使高级领导层能够做出可辩护的、实用的决策。目前第一阶段的研究使用程式化的数据和例子来说明推荐的方法。
这项研究采用先进的定量建模方法(随机模拟、投资组合优化),加上人工智能(AI)和机器学习(ML)算法(数据搜刮、文本挖掘、情感分析)和企业风险管理(ERM)程序,实施行业最佳决策分析。DOR将部分基于使用风险登记册的ERM方法,其中不同的风险元素被细分为不同的GOPAD组,或目标(军事能力、成本节约、新技术、未来武器能力、公共安全、政府优先事项、指挥偏好,等等。 )、组织(空军、陆军、海军、海军陆战队)、计划(采购、商业现货、联合产业、混合等)、活动(库存、替换、新开发、研究和开发等)和领域(空中、海上、网络等)类别。
多个相互竞争的利益相关者(例如,国防部长办公室、海军作战部长办公室、美国国会和平民)有其特定的目标(例如,能力、效率、成本效益、竞争力和杀伤力,以及替代方案和权衡)、约束(例如,时间、预算、进度和人力)和基于任务的领域需求(例如,平衡网络安全、网络反恐、反潜战、反-飞机战或导弹防御)。
这项研究采取了多学科的方法,来自先进分析、人工智能、计算机科学、决策分析、国防采购、经济学、工程和物理学、金融学、期权理论、项目和计划管理、随机建模的模拟、应用数学和统计学的方法被应用。最终的目标是为决策者提供可操作的情报和对未来决策选项或灵活的真实选项的可见性,以及导致某些可比较决策的假设。
推荐的方法包括使用监督和无监督的AI/ML情感文本分析、AI/ML自然语言文本处理以及AI/ML逻辑分类和支持向量机(SVM)算法,再加上更传统的高级分析和数据科学方法,如蒙特卡洛模拟、随机组合优化和项目选择、使用财务和经济指标的资本预算,以及PROMETHEE和ELECTRE等词汇学排名方法。
介绍了案例应用、代码片段和模拟的DOR,并以典型的数据来说明其能力。目前的研究成果将为下一阶段的多年研究提供基础,将建立原型,实际数据可以通过规定的分析引擎运行。
这项拟议研究的目的是生成一个透明的决策选项登记册(DOR)综合智能数据库系统,该系统有助于捕捉所有未来的历史决策,包括其假设、数据输入、约束、限制、竞争目标和国防部(DOD)的决策规则。该DOR中的信息将与元语义搜索和数据科学分析引擎兼容。DOR用于对未来的决策选项进行建模,以实施和实现在不确定的情况下做出决策,同时依靠过去的最佳实践,并允许高级领导层做出可辩护的和实用的决策。
DOR是基于私营企业的企业风险管理(ERM)实践,通常会列出过去、现在和未来拟议项目的风险和经验教训。建立一个决策历史的文件数据库是至关重要的。如果没有曲线,就没有学习曲线,而没有任何数据或信息就不可能有曲线。有了目前这项研究中推荐的DOR和相关方法,我们可以通过观察新项目的特点,以历史数据为参考,计算出新项目的成功和失败的概率,从而预测结果。当然,有必要对成功与失败进行操作和定义。仅仅因为一个项目低于预算,按时完成,几乎不需要返工,达到了所有要求的规格和技术发布水平,这是否意味着它是成功的?我们还可以用什么其他的指标来确定明确的成功或明确的失败,以及在这两者之间的所有其他层次呢?我们需要确定可用的数据以及差距,以使我们有一个坚实的决策选项登记册。我们在操作上定义的成功和失败的一些统计学上的重要预测因素是什么?另一个问题是减轻风险和战略灵活性。
这项研究将展示业界最佳的决策分析和企业风险管理(ERM)程序。DOR将部分基于使用风险登记册的ERM方法,其中不同的风险元素被细分为不同的GOPAD组,或目标(军事能力、成本节约、新技术、未来武器能力、公共安全、政府优先事项、指挥偏好,等等。 )、组织(空军、陆军、海军、海军陆战队)、计划(采购、商业现成的、联合产业、混合等)、活动(库存、替换、新开发、研究和开发等)和领域(空中、海上、网络等)类别。
多个相互竞争的利益相关者(如国防部长办公室、海军作战部长办公室、美国国会和平民)有其特定的目标(如能力、效率、成本效益、竞争力和杀伤力,以及替代方案和权衡)、限制(如。时间、预算、时间表和人力),以及基于任务的领域要求(例如,平衡网络安全、网络反恐、反潜战、防空战或导弹防御中的数字化转型需求)。当需要考虑新的决定时,这些因素是至关重要的。一个保存机构知识和记忆的DOR数据库将有助于这种努力,并为决策注入信任。
这项研究将采取多学科的方法,我们将应用先进的分析方法、人工智能、计算机科学、决策分析、国防采购、经济学、工程和物理学、金融、期权理论、项目和项目管理、随机建模的模拟、应用数学和统计学。最终的目标是为决策者提供可操作的情报,以及对未来决策选项或灵活的真实选项的可见性,并提供导致某些可比决策的假设。
在法律纠纷中,法院在决定案件的结果时使用先例。先例的使用已经有200多年的历史,通常是为了上诉或推翻以前的判决。然而,基于先例的决策是工业界和政府还没有完全接受的东西。由于人力资本的波动和外流,以及雇员离开或被重新分配到其他地方时机构知识的流失,包括国防部在内的各组织往往记忆短暂。目前的研究旨在包括对基于先例的决策技术现状的相关研究是如何进行的,什么可能被认为是技术现状,以及其目前的局限性是什么。
该研究应用了多种新颖的方法,以提高其在生成一个强大的、可搜索的DOR数据库方面的成功率。建议将包括关键参数、假设、输入数据、保存的模型和计算、做出的决定、领导的输入和重写、约束和限制、最终目标和其他相关信息,然后可以使用机器学习的情感分析,加上刮削算法和自定义词汇集的文本挖掘来挖掘。该系统的用户将能够把基于先例的洞察力应用于他们当前和未来的项目。此外,在可能的情况下,预测值将由随着时间推移捕获的实际值来补充。这允许对以前的项目进行事后分析,并提供一路走来的经验教训。掌握关键决策的历史将有助于高级领导层做出更可信和可辩护的决定,这可能最终导致国防部的法律和法规变化。
拟议的方法将允许收集可应用于各种领域的数据,包括但不限于综合风险管理®方法,其中可以运行蒙特卡洛模拟、随机组合优化等随机分析,以及高级数据分析方法、人工智能和数据科学方法。随着时间的推移,可以应用回溯分析来更新DOR,使其更接近国防部的需求。该系统应该能够收集不同类型的经济数据(总生命周期成本、总拥有成本、采购成本、成本递延、以及进度和风险成本);后勤数据(例如。固有可用性、有效可用性、任务可靠性、操作可靠性、平均停机时间、平均维护时间、后勤延迟时间、实现可用性、操作可用性、任务可用性、实战能力、创造性和新颖技术的李克特水平以及其他指标);定性的主题专家估计(战略价值、对社会的价值、指挥部优先事项、法律和监管影响得分等);以及市场可比性,以操作国防部利益的各种要素。在适当的时间间隔内,可以采用非线性判别分析、神经网络、分布式拟合、有限因变量、路径依赖的偏最小二乘法等反拟合分析,以找出导致一个项目或采购中某些决策成功或失败的关键成功因素。
目前的研究是重要的,因为它将在国防部的决策过程中创造一个重大的差异。国防部一直在为决策分析、资本预算和投资组合优化寻找更好的、理论上合理的、定量上严格的分析方法。具体的兴趣在于如何识别和量化每个项目对军队的价值,并优化选择正确的项目、系统和能力组合,使一些军事价值(战略、作战或经济)最大化,同时受到预算、成本、进度和风险限制。这项研究应用了私营部门和行业的最佳实践,再加上先进的分析方法和模型,以帮助创建这些方法来做到这一点。然而,国防部的独特性要求我们做更多的工作,以确定对军队的价值概念,同时考虑竞争的利益相关者的需求。国防部在其投资回报中需要有可辩护的、量化的、强有力的军事价值概念,以做出最佳的资金决策,如在哪里投资、投资多少、投资多长时间。在国防部的非经济环境中进行替代方案分析和平衡成本效益权衡时,这些决策选择(战略顺序复合实际选择、最佳时机选择、增长选择和其他选择,以扩大、收缩和放弃)是至关重要的。国防部将提供历史上保存下来的关于假设的各种替代性未来、模拟的替代方案以及为什么做出某些决定的见解。
人工神经网络(NN)是一个数据驱动的、无分布的非参数方法系列,可用于非线性模式识别、预测建模和预测。神经网络经常被用来指代生物神经元的组合网络电路。该术语的现代用法通常也指 "人工神经网络",包括在软件环境中重新创建的人工神经元,或节点。这种人工网络试图模仿人类大脑中的神经元或神经元节点的思维方式,识别模式,以及在我们的情况下,识别模式来预测时间序列数据。NN方法可用于行为良好的时间序列以及混乱的物理系统。当用于大数据(BD)并与机器学习(ML)方法结合使用时,它可以被视为半监督的人工智能(AI)系统的一个交叉点。NN仍然被认为是半监督的,因为神经网络需要一个多层次的训练过程作为激活函数的一部分。例如,一旦系统中的激活被触发,神经节点的权重和交互式卷积就可以自主地运行。在多层神经元节点中,第一个节点层的结果将成为后续节点层的输入。
本文提议增加一个内部优化过程,以迭代运行的方式不断训练节点,使其最小化一系列的误差测量,如标准化的误差平方和,同时平衡和约束Akaike信息准则、Bayes准则和Hannan-Quinn准则。此外,这里的建议是在组合中加入组合模糊逻辑方法,以产生尽可能好的预测。模糊逻辑一词来自模糊集合理论,用于处理近似而非精确的推理。相对于脆性逻辑,二元集有二元逻辑,模糊逻辑变量可能有一个真值,范围在0和1之间,不受经典命题逻辑的两个真值的限制。这种模糊加权模式与组合方法一起使用,可以得到时间序列的预测结果。
Augur(2016)对数据科学的历史做了一个很好的总结。根据他的研究,"数据科学 "一词最早出现在1974年,当时Peter Naur发表了题为 "计算机方法简明调查 "的文章,并将其定义为:"处理数据的科学,一旦它们被建立起来,而数据与它们所代表的关系被委托给其他领域和科学。" 这个词花了一段时间才流行起来,直到2010年才完全融入白话。数据科学家 "一词通常归功于2008年Facebook和LinkedIn的Jeff Hammerbacher和D. J. Patil。在2011年和2012年之间,"数据科学家 "的职位列表增加了15,000%,重点是与大数据的工作。到2016年,数据科学开始在人工智能领域根深蒂固,特别是在机器学习和深度学习的子领域。