改进并行C++ Intel AVX-512 SIMD线性遗传编程解释器 (Improving a Parallel C++ Intel AVX-512 SIMD Linear Genetic Programming Interpreter) - 专知论文

会员服务 ·

0

并行 · 英特尔 (Intel) · 编程 · 局部搜索 · 代码 ·

Improving a Parallel C++ Intel AVX-512 SIMD Linear Genetic Programming Interpreter

翻译：改进并行C++ Intel AVX-512 SIMD线性遗传编程解释器

William B. Langdon

We extend recent 256 SSE vector work to 512 AVX giving a four fold speedup. We use MAGPIE (Machine Automated General Performance Improvement via Evolution of software) to speedup a C++ linear genetic programming interpreter. Local search is provided with three alternative hand optimised codes, revision history and the Intel 512 bit AVX512VL documentation as C++ XML. Magpie is applied to the new Single Instruction Multiple Data (SIMD) parallel interpreter for Peter Nordin's linear genetic programming GPengine. Linux mprotect sandboxes whilst performance is given by perf instruction count. In both cases, in a matter of hours local search reliably sped up 114 or 310 lines of manually written parallel SIMD code for the Intel Advanced Vector Extensions (AVX) by 2 percent.

翻译：我们将近期基于256位SSE向量的研究扩展至512位AVX，实现了四倍加速。利用MAGPIE（通过软件进化的机器自动化通用性能改进）技术，对C++线性遗传编程解释器进行加速。局部搜索基于三种替代性手动优化代码、版本历史记录以及以C++ XML格式呈现的Intel 512位AVX512VL技术文档。将Magpie应用于Peter Nordin线性遗传编程GPengine的新型单指令多数据（SIMD）并行解释器。通过Linux mprotect实现沙箱隔离，性能数据由perf指令计数提供。在两种实验场景中，局部搜索均在数小时内可靠地将手动编写的Intel高级向量扩展（AVX）并行SIMD代码（114行或310行）提速2%。

0

相关内容

《用于代码弱点识别的 LLVM 中间表示》CMU

《用于代码弱点识别的 LLVM 中间表示》CMU

专知会员服务

14+阅读 · 2022年12月12日

ICCV'21 Oral｜拒绝调参，显著提点！检测分割任务的新损失函数RS Loss开源

专知会员服务

16+阅读 · 2021年8月11日

tf_geometric — 基于TensorFlow的友好高效的图神经网络（GNN）库

tf_geometric — 基于TensorFlow的友好高效的图神经网络（GNN）库

专知会员服务

26+阅读 · 2021年8月9日

语义相似性算法演化论文，29页pdf，Evolution of Semantic Similarity - A Survey

语义相似性算法演化论文，29页pdf，Evolution of Semantic Similarity - A Survey

专知会员服务

44+阅读 · 2020年4月30日

微软发布DialoGPT预训练语言模型，论文与代码 Large-Scale Generative Pre-training for Conversational Response Generation

微软发布DialoGPT预训练语言模型，论文与代码 Large-Scale Generative Pre-training for Conversational Response Generation

专知会员服务

28+阅读 · 2019年11月8日

ICLR'21 | GNN联邦学习的新基准

ICLR'21 | GNN联邦学习的新基准

图与推荐

12+阅读 · 2021年11月15日

字节跳动李航提出AMBERT！超越BERT！多粒度token预训练语言模型

字节跳动李航提出AMBERT！超越BERT！多粒度token预训练语言模型

专知

18+阅读 · 2020年8月31日

基于PyTorch/TorchText的自然语言处理库

基于PyTorch/TorchText的自然语言处理库

专知

28+阅读 · 2019年4月22日

Facebook开源MUSE：多语言无监督和监督词向量库

Facebook开源MUSE：多语言无监督和监督词向量库

论智

20+阅读 · 2017年12月23日

动手写机器学习算法：异常检测 Anomaly Detection

动手写机器学习算法：异常检测 Anomaly Detection

七月在线实验室

11+阅读 · 2017年12月8日

基于图论方法的DNA序列编码研究

国家自然科学基金

2+阅读 · 2016年12月31日

基于DASH的交互式三维视频系统建模

国家自然科学基金

1+阅读 · 2015年12月31日

直接优化半周长线长的VLSI两阶段迭代布局算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

SDN数据平面中大规模流表的高性能查找方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

动态Gr？bner 基与GVW算法

国家自然科学基金

0+阅读 · 2014年12月31日

Scaling Text2SQL via LLM-efficient Schema Filtering with Functional Dependency Graph Rerankers

Arxiv

0+阅读 · 12月18日

DiffusionBrowser: Interactive Diffusion Previews via Multi-Branch Decoders

Arxiv

0+阅读 · 12月15日

DiffSeg30k: A Multi-Turn Diffusion Editing Benchmark for Localized AIGC Detection

Arxiv

0+阅读 · 11月26日

ShelfOcc: Native 3D Supervision beyond LiDAR for Vision-Based Occupancy Estimation

Arxiv

0+阅读 · 11月19日

Beyond Accuracy: Behavioral Dynamics of Agentic Multi-Hunk Repair

Arxiv

0+阅读 · 11月14日

VIP会员

文章信息

相关主题

英特尔 (Intel)

相关VIP内容

《用于代码弱点识别的 LLVM 中间表示》CMU

《用于代码弱点识别的 LLVM 中间表示》CMU

专知会员服务

14+阅读 · 2022年12月12日

ICCV'21 Oral｜拒绝调参，显著提点！检测分割任务的新损失函数RS Loss开源

专知会员服务

16+阅读 · 2021年8月11日

tf_geometric — 基于TensorFlow的友好高效的图神经网络（GNN）库

tf_geometric — 基于TensorFlow的友好高效的图神经网络（GNN）库

专知会员服务

26+阅读 · 2021年8月9日

语义相似性算法演化论文，29页pdf，Evolution of Semantic Similarity - A Survey

语义相似性算法演化论文，29页pdf，Evolution of Semantic Similarity - A Survey

专知会员服务

44+阅读 · 2020年4月30日

微软发布DialoGPT预训练语言模型，论文与代码 Large-Scale Generative Pre-training for Conversational Response Generation

微软发布DialoGPT预训练语言模型，论文与代码 Large-Scale Generative Pre-training for Conversational Response Generation

专知会员服务

28+阅读 · 2019年11月8日

热门VIP内容

开通专知VIP会员享更多权益服务

大模型推理时代的知识编辑

《利用人工智能对军事行动进行建模》

【MIT博士论文】加速科学发现的因果建模实践算法

机器人、无人机与实时影像：应对城市爆炸威胁的三大技术方案

相关资讯

ICLR'21 | GNN联邦学习的新基准

ICLR'21 | GNN联邦学习的新基准

图与推荐

12+阅读 · 2021年11月15日

字节跳动李航提出AMBERT！超越BERT！多粒度token预训练语言模型

字节跳动李航提出AMBERT！超越BERT！多粒度token预训练语言模型

专知

18+阅读 · 2020年8月31日

基于PyTorch/TorchText的自然语言处理库

基于PyTorch/TorchText的自然语言处理库

专知

28+阅读 · 2019年4月22日

Facebook开源MUSE：多语言无监督和监督词向量库

Facebook开源MUSE：多语言无监督和监督词向量库

论智

20+阅读 · 2017年12月23日

动手写机器学习算法：异常检测 Anomaly Detection

动手写机器学习算法：异常检测 Anomaly Detection

七月在线实验室

11+阅读 · 2017年12月8日

相关论文

Scaling Text2SQL via LLM-efficient Schema Filtering with Functional Dependency Graph Rerankers

Arxiv

0+阅读 · 12月18日

DiffusionBrowser: Interactive Diffusion Previews via Multi-Branch Decoders

Arxiv

0+阅读 · 12月15日

DiffSeg30k: A Multi-Turn Diffusion Editing Benchmark for Localized AIGC Detection

Arxiv

0+阅读 · 11月26日

ShelfOcc: Native 3D Supervision beyond LiDAR for Vision-Based Occupancy Estimation

Arxiv

0+阅读 · 11月19日

Beyond Accuracy: Behavioral Dynamics of Agentic Multi-Hunk Repair

Arxiv

0+阅读 · 11月14日

相关基金

基于图论方法的DNA序列编码研究

国家自然科学基金

2+阅读 · 2016年12月31日

基于DASH的交互式三维视频系统建模

国家自然科学基金

1+阅读 · 2015年12月31日

直接优化半周长线长的VLSI两阶段迭代布局算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

SDN数据平面中大规模流表的高性能查找方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

动态Gr？bner 基与GVW算法

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员