We present Antler, which exploits the affinity between all pairs of tasks in a multitask inference system to construct a compact graph representation of the task set and finds an optimal order of execution of the tasks such that the end-to-end time and energy cost of inference is reduced while the accuracy remains similar to the state-of-the-art. The design of Antler is based on two observations: first, tasks running on the same platform shows affinity, which is leveraged to find a compact graph representation of the tasks that helps avoid unnecessary computations of overlapping subtasks in the task set; and second, tasks that run on the same system may have dependencies, which is leveraged to find an optimal ordering of the tasks that helps avoid unnecessary computations of the dependent tasks or the remaining portion of a task. We implement two systems: a 16-bit TI MSP430FR5994-based custom-designed ultra-low-power system, and a 32-bit ARM Cortex M4/M7-based off-the-shelf STM32H747 board. We conduct both dataset-driven experiments as well as real-world deployments with these systems. We observe that Antler's execution time and energy consumption are the lowest compared to all baseline systems and by leveraging the similarity of tasks and by reusing the intermediate results from previous task, Antler reduces the inference time by 2.3X -- 4.6X and saves 56\% -- 78\% energy, when compared to the state-of-the-art.
翻译:我们展示了安特勒, 它利用多任务推理系统中所有任务对等任务之间的亲近性, 来构建任务集的缩略图表示, 并找到执行任务的最佳顺序, 以便降低最后到最后的推理时间和能源成本, 而准确性却与最新工艺相似。 安特勒的设计基于两个观察: 首先, 在同一平台上运行的任务显示了一种亲近性, 从而找到一个用于帮助避免对任务集重叠子任务进行不必要计算的任务的缩略图 ; 其次, 在同一系统中运行的任务可能具有一种执行任务的最佳顺序, 以便找到一个有助于避免不必要地计算依赖性任务或任务剩余部分的任务的最佳顺序 。 我们实施两个系统: 16比 TI MSP430 FR5994 以定制的超低功率系统, 以及 32比 ARM Cortex M4/M7 以中间值表示任务, 避免不必要地计算任务中重叠的子任务 ; 第二, 在同一系统中运行的任务可能具有依赖性, 并且当我们用最低的能源定位 和最低的 基线化 任务 将能源定位系统 进行比重的实验时, 我们用所有的系统 和时间驱动的系统 都通过实际的系统 和时间 将 将 进行 将 和 将 进行实时的 和时间定位的 进行实时的 进行实时的 和时间轴 的 和 将 进行 进行 的 的 的 将 和 的 的 的 将 和 将 进行 和 进行 的 的 进行 和 的 的 的 的 的 的 的 和 的 的 的 和 的 的 的 和 和 和 的 的 的 以 进行 的 的 的 和 进行 进行 进行 进行 进行 进行 进行 进行 进行 进行 进行 进行 进行 进行 和 和 和 的 和 和 的 进行 的 进行 进行 进行 进行 进行 的 的 和 和 的 的 的 和 和 和 的 进行 进行 进行 进行 进行 进行 进行 进行 的 和 的 进行</s>