成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
评估指标
关注
2
综合
百科
VIP
热门
动态
论文
精华
Step-DeepResearch Technical Report
Arxiv
0+阅读 · 12月29日
Ara-HOPE: Human-Centric Post-Editing Evaluation for Dialectal Arabic to Modern Standard Arabic Translation
Arxiv
0+阅读 · 12月25日
Detecting and Mitigating Insertion Hallucination in Video-to-Audio Generation
Arxiv
0+阅读 · 12月25日
Distributional Evaluation of Generative Models via Relative Density Ratio
Arxiv
0+阅读 · 12月26日
A Causal Lens for Evaluating Faithfulness Metrics
Arxiv
0+阅读 · 12月24日
Quantifying the Impact of Structured Output Format on Large Language Models through Causal Inference
Arxiv
0+阅读 · 12月19日
Step-DeepResearch Technical Report
Arxiv
0+阅读 · 12月23日
Normalized mutual information is a biased measure for classification and community detection
Arxiv
0+阅读 · 12月20日
Comprehensive Assessment of LiDAR Evaluation Metrics: A Comparative Study Using Simulated and Real Data
Arxiv
0+阅读 · 11月4日
Scalable Parameter-Light Spectral Method for Clustering Short Text Embeddings with a Cohesion-Based Evaluation Metric
Arxiv
0+阅读 · 11月25日
Scalable Parameter-Light Spectral Method for Clustering Short Text Embeddings with a Cohesion-Based Evaluation Metric
Arxiv
0+阅读 · 11月24日
Transport Novelty Distance: A Distributional Metric for Evaluating Material Generative Models
Arxiv
0+阅读 · 12月10日
Finetuning LLMs for Automatic Form Interaction on Web-Browser in Selenium Testing Framework
Arxiv
0+阅读 · 11月19日
Finetuning LLMs for Automatic Form Interaction on Web-Browser in Selenium Testing Framework
Arxiv
0+阅读 · 11月20日
SMILE: A Composite Lexical-Semantic Metric for Question-Answering Evaluation
Arxiv
0+阅读 · 11月21日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top