Spark论文 - 专知

会员服务 ·

Spark

Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架，Spark，拥有Hadoop MapReduce所具有的优点；但不同于MapReduce的是Job中间输出结果可以保存在内存中，从而不再需要读写HDFS，因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。

Riemannian-Geometric Fingerprints of Generative Models

Arxiv

0+阅读 · 10月28日

When Intelligence Fails: An Empirical Study on Why LLMs Struggle with Password Cracking

Arxiv

0+阅读 · 10月26日

Video-Thinker: Sparking "Thinking with Videos" via Reinforcement Learning

Arxiv

0+阅读 · 10月27日

AQORA: A Fast Learned Adaptive Query Optimizer with Stage-Level Feedback for Spark SQL

Arxiv

0+阅读 · 10月27日

Aircraft Collision Avoidance Systems: Technological Challenges and Solutions on the Path to Regulatory Acceptance

Arxiv

0+阅读 · 10月23日

Open-o3 Video: Grounded Video Reasoning with Explicit Spatio-Temporal Evidence

Arxiv

0+阅读 · 10月23日

Spark Transformer: Reactivating Sparsity in FFN and Attention

Arxiv

0+阅读 · 10月23日

Serverless GPU Architecture for Enterprise HR Analytics: A Production-Scale BDaaS Implementation

Arxiv

0+阅读 · 10月22日

Comparative analysis of large data processing in Apache Spark using Java, Python and Scala

Arxiv

0+阅读 · 10月21日

The Spark Effect: On Engineering Creative Diversity in Multi-Agent AI Systems

Arxiv

0+阅读 · 10月17日

Balancing Fairness and Performance in Multi-User Spark Workloads with Dynamic Scheduling (extended version)

Arxiv

0+阅读 · 10月17日

AQORA: A Learned Adaptive Query Optimizer for Spark SQL

Arxiv

0+阅读 · 10月12日

U-Turn: Enhancing Incorrectness Analysis by Reversing Direction

Arxiv

0+阅读 · 10月10日

Trajectory Prediction Meets Large Language Models: A Survey

Arxiv

0+阅读 · 10月7日

Reward Models are Metrics in a Trench Coat

Arxiv

0+阅读 · 10月3日

参考链接

父主题

大数据处理

数据批处理框架

子主题

微信扫码咨询专知VIP会员