We extend recent 256 SSE vector work to 512 AVX giving a four fold speedup. We use MAGPIE (Machine Automated General Performance Improvement via Evolution of software) to speedup a C++ linear genetic programming interpreter. Local search is provided with three alternative hand optimised codes, revision history and the Intel 512 bit AVX512VL documentation as C++ XML. Magpie is applied to the new Single Instruction Multiple Data (SIMD) parallel interpreter for Peter Nordin's linear genetic programming GPengine. Linux mprotect sandboxes whilst performance is given by perf instruction count. In both cases, in a matter of hours local search reliably sped up 114 or 310 lines of manually written parallel SIMD code for the Intel Advanced Vector Extensions (AVX) by 2 percent.


翻译:我们将近期基于256位SSE向量的研究扩展至512位AVX,实现了四倍加速。利用MAGPIE(通过软件进化的机器自动化通用性能改进)技术,对C++线性遗传编程解释器进行加速。局部搜索基于三种替代性手动优化代码、版本历史记录以及以C++ XML格式呈现的Intel 512位AVX512VL技术文档。将Magpie应用于Peter Nordin线性遗传编程GPengine的新型单指令多数据(SIMD)并行解释器。通过Linux mprotect实现沙箱隔离,性能数据由perf指令计数提供。在两种实验场景中,局部搜索均在数小时内可靠地将手动编写的Intel高级向量扩展(AVX)并行SIMD代码(114行或310行)提速2%。

0
下载
关闭预览

相关内容

《用于代码弱点识别的 LLVM 中间表示》CMU
专知会员服务
14+阅读 · 2022年12月12日
ICLR'21 | GNN联邦学习的新基准
图与推荐
12+阅读 · 2021年11月15日
基于PyTorch/TorchText的自然语言处理库
专知
28+阅读 · 2019年4月22日
动手写机器学习算法:异常检测 Anomaly Detection
七月在线实验室
11+阅读 · 2017年12月8日
国家自然科学基金
2+阅读 · 2016年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关资讯
ICLR'21 | GNN联邦学习的新基准
图与推荐
12+阅读 · 2021年11月15日
基于PyTorch/TorchText的自然语言处理库
专知
28+阅读 · 2019年4月22日
动手写机器学习算法:异常检测 Anomaly Detection
七月在线实验室
11+阅读 · 2017年12月8日
相关基金
国家自然科学基金
2+阅读 · 2016年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员