机器之心 & ArXiv Weekly Radiostation
本周重要论文包括 IJCAI 2022 三篇杰出论文,以及苹果将 2D GAN 转换成 3D 的新研究。
-
Completeness and Diversity in Depth-First Proof-Number Search with Applications to Retrosynthesis
-
QCDCL with Cube Learning or Pure Literal Elimination - What is best?
-
PLURALITYVETO: A Simple Voting Rule Achieving Optimal Metric Distortion
-
Sliced Recursive Transformer
-
Generative Multiplane Images: Making a 2D GAN 3D-Aware
-
Registration based Few-Shot Anomaly Detection
-
Automatic Quantization for Physics-Based Simulation
-
ArXiv Weekly Radiostation:NLP、CV、ML 更多精选论文(附音频)
论文 1:Completeness and Diversity in Depth-First Proof-Number Search with Applications to Retrosynthesis
-
-
论文地址:https://www.ijcai.org/proceedings/2022/0658.pdf
摘要:
该研究重新审视了 DFPN(Depth-First Proof-Number Search)算法,这是一种用于解决双人游戏的著名算法
。首先,该研究考虑了算法及其变体的完整性,即当存在获胜策略时,算法是否总能找到获胜策略。虽然已知标准版本不完整,但该研究表明与简单阈值控制算法的组合是完整的,从而解决了该领域的一个开放问题。
其次,该研究修改 DFPN 以计算一组不同的解决方案,而不仅仅是一个单一的解决方案。最后,该研究将化学中的这种新变体应用于新目标分子的合成计划(逆合成)。在这个领域中,需要多种解决方案的集合。该研究将文献中的其他修改应用于算法,并根据自然多样性度量表明它优于蒙特卡洛树搜索,这是针对同一问题的另一种著名算法。
论文 2:QCDCL with Cube Learning or Pure Literal Elimination - What is best?
-
-
论文地址:https://www.ijcai.org/proceedings/2022/0248.pdf
摘要:QCDCL(Quantified conflict-driven clause learning)是求解量化布尔公式的主要方法之一。
该研究形式化和研究了 QCDCL 的几个版本,包括立方体学习和 / 或纯字面消除,并通过证明复杂性技术正式比较了生成的求解模型
。结果表明,几乎所有的 QCDCL 模型在证明大小(以及求解器运行时间)方面都呈指数级无法比拟,这指向了如何实际实现 QCDCL 的不同正交方式。
论文 3:PLURALITYVETO: A Simple Voting Rule Achieving Optimal Metric Distortion
-
-
论文地址:https://arxiv.org/pdf/2206.07098.pdf
摘要:
在度量失真框架中,假设 n 个选民和 m 个候选人共同嵌入一个度量空间,这样选民对离自己越近的候选人的排名就越高。投票规则旨在选出与选民总距离最小的候选人,只给出排名,而不是实际距离。因此,在最坏的情况下,每个确定性规则都会选择一个候选者,其总距离至少是最优规则的三倍,即失真至少为 3。
该研究的主要成果是一个极其简单的投票规则,称为 PLURALITYVETO,它同样实现了 3 的最优失真
。每个候选人开始时的得分等于他的第一名投票数。之后分数通过 n 轮否决会下降,在这个过程中,当一个候选人的分数达到 0 时,他就会退出。选民逐个地降低他们在候选人中排名靠后的分数,最后一位候选人获胜。
论文 4:Sliced Recursive Transformer
-
-
论文地址:https://arxiv.org/pdf/2111.05297.pdf
摘要:
目前 vision transformer 在不同视觉任务上如分类、检测等都展示出了强大的性能,但是其巨大的参数量和计算量阻碍了该模型进一步在实际场景中的应用。基于这个考虑,本文重点研究如何在不增加额外参数量的前提下把模型的表达能力挖掘到极致,同时还要保证模型计算量在合理范围内,从而可以在一些存储容量小,计算能力弱的嵌入式设备上部署。
基于这个动机
,Zhiqiang Shen、邢波等研究者提出了一个 SReT 模型
,通过循环递归结构来强化每个 block 的特征表达能力,同时又提出使用多个局部 group self-attention 来近似 vanilla global self-attention,在显著降低计算量 FLOPs 的同时,模型没有精度的损失。
本文所提出的模型在参数量(Params)和计算量(FLOPs)方面相比其他模型都有明显的优势。
推荐:
ECCV 2022 | 在视觉 Transformer 上进行递归,不增参数,计算量还少。
论文 5:Generative Multiplane Images: Making a 2D GAN 3D-Aware
-
-
论文地址:https://arxiv.org/abs/2207.10642
摘要:
如何让一个已有的 2D GAN 变成 3D 级别?这是一个有趣且实用的问题。为了解决这个问题,
来自苹果和伊利诺伊大学厄巴纳 - 香槟分校的研究者试图尽可能少地修改经典 GAN,即 StyleGANv2
。该研究发现只有两个修改是绝对必要的:1)一个多平面图像样式生成器分支,它产生一组以深度为条件的 alpha 图;2)一个以位姿为条件的鉴别器。
推荐:
仅做两项修改,苹果就让 StyleGANv2 获得了 3D 生成能力。
论文 6:Registration based Few-Shot Anomaly Detection
-
-
论文地址:https://arxiv.org/abs/2207.07361
摘要:
大多数现有的异常检测方法都专注于为每个异常检测任务训练一个专用模型。然而,在诸如缺陷检测之类的真实场景中,考虑到要处理数百种工业产品,为每种产品均收集大量训练集是不划算的。
上海交通大学 MediaBrain 团队和上海人工智能实验室智慧医疗团队等提出了一个基于配准的少样本异常检测框架
,通过学习多个异常检测任务之间共享的通用模型,无需进行模型参数调整,便可将其推广到新的异常检测任务。目前,这项研究已被 ECCV2022 接收为 Oral 论文,完整训练代码及模型已经开源。
推荐:
无需微调即可推广,上交大、上海人工智能实验室等提出基于配准的少样本异常检测框架。
论文 7:Automatic Quantization for Physics-Based Simulation
-
-
论文地址:https://arxiv.org/abs/2207.04658
摘要:
在今年的 SIGGRAPH 2022 会议上,来自
浙江大学、快手和美国犹他大学的研究人员联合发表了一篇题为《物理仿真的自动量化》的论文,提出了一种自动兼顾量化仿真精度和内存消耗的方法
。与全精度的物理仿真相比,能够在视觉效果不受明显影响的前提下,节省 50% 以上的内存占用,从而大幅度提高了量化仿真的易用性和生产力。
目前,相关的技术已成功落地,打开快手 APP,拍摄「别哭鸭」、「我要去潜水」和「火焰超能力」等魔法表情,即可体验到短视频行业内独家的移动端实时液体模拟特效技术。
应用该方法实现的基于欧拉网格实现的量化的烟雾仿真。
推荐:
节省 50% 内存占用,浙大、快手等提出量化仿真新方法,入选 SIGGRAPH 2022。
ArXiv Weekly Radiostation
机器之心联合由楚航、罗若天发起的ArXiv Weekly Radiostation,在 7 Papers 的基础上,精选本周更多重要论文,包括NLP、CV、ML领域各10篇精选,并提供音频形式的论文摘要简介,详情如下:
1. Equivariant and Invariant Grounding for Video Question Answering. (from Tat-Seng Chua)
2. RealTime QA: What's the Answer Right Now?. (from Dragomir Radev, Noah A. Smith)
3. Efficient Training of Language Models to Fill in the Middle. (from John Schulman)
4. WinoGAViL: Gamified Association Benchmark to Challenge Vision-and-Language Models. (from Yuval Elovici)
5. Knowledge-Grounded Conversational Data Augmentation with Generative Conversational Networks. (from Dilek Hakkani-Tur)
6. Measuring Causal Effects of Data Statistics on Language Model's `Factual' Predictions. (from Yoav Goldberg)
7. MLRIP: Pre-training a military language representation model with informative factual knowledge and professional knowledge base. (from Hui Li)
8. Anti-Overestimation Dialogue Policy Learning for Task-Completion Dialogue System. (from Marie-Francine Moens)
9. Two-Stage Fine-Tuning: A Novel Strategy for Learning Class-Imbalanced Data. (from Liang Zhao)
10. Chunk-aware Alignment and Lexical Constraint for Visual Entailment with Natural Language Explanations. (from Lin Ma)
1. DBQ-SSD: Dynamic Ball Query for Efficient 3D Object Detection. (from Jian Sun, Nanning Zheng)
2. AlignSDF: Pose-Aligned Signed Distance Fields for Hand-Object Reconstruction. (from Cordelia Schmid, Ivan Laptev)
3. Seeing 3D Objects in a Single Image via Self-Supervised Static-Dynamic Disentanglement. (from William T. Freeman, Fredo Durand, Joshua B. Tenenbaum)
4. Break and Make: Interactive Structural Understanding Using LEGO Bricks. (from Ali Farhadi, Dieter Fox)
5. On Higher Adversarial Susceptibility of Contrastive Self-Supervised Learning. (from Rohit Gupta, Mubarak Shah)
6. Learning Visual Representation from Modality-Shared Contrastive Language-Image Pre-training. (from Shih-Fu Chang)
7. Few-Shot Class-Incremental Learning via Entropy-Regularized Data-Free Replay. (from Huan Liu, Yang Wang)
8. Compositional Human-Scene Interaction Synthesis with Semantic Control. (from Yan Zhang)
9. Spatiotemporal Self-attention Modeling with Temporal Patch Shift for Action Recognition. (from Xian-Sheng Hua, Lei Zhang)
10. Learning Graph Neural Networks for Image Style Transfer. (from Dacheng Tao)
1. Spatial-Temporal Federated Learning for Lifelong Person Re-identification on Distributed Edges. (from Lei Zhang)
2. Online Continual Learning with Contrastive Vision Transformer. (from Dacheng Tao)
3. Tensor-based Multi-view Spectral Clustering via Shared Latent Space. (from Johan A.K. Suykens)
4. BigIssue: A Realistic Bug Localization Benchmark. (from Bo Pang)
5. ME-GAN: Learning Panoptic Electrocardio Representations for Multi-view ECG Synthesis Conditioned on Heart Diseases. (from Jian Wu)
6. Remote Medication Status Prediction for Individuals with Parkinson's Disease using Time-series Data from Smartphones. (from Jiebo Luo)
7. Regret Minimization and Convergence to Equilibria in General-sum Markov Games. (from Yishay Mansour)
8. Optimism in Face of a Context: Regret Guarantees for Stochastic Contextual MDP. (from Yishay Mansour)
9. Robust Knowledge Adaptation for Dynamic Graph Neural Networks. (from Hongyuan Zha)
10. Fairness and Randomness in Machine Learning: Statistical Independence and Relativization. (from Robert C. Williamson)
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:content@jiqizhixin.com