new

Get trending papers in your email inbox once a day!

Get trending papers in your email inbox!

Daily Papers

byAK and the research community

Apr 6

Submitted by

iieycx

Self-Distilled RLVR

·
10 authors

Submitted by

play0718

A Simple Baseline for Streaming Video Understanding

lmms-lab

Submitted by

phillipinseoul

Token Warping Helps MLLMs Look from Nearby Viewpoints

·
6 authors

Submitted by

taesiri

Agentic-MME: What Agentic Capability Really Brings to Multimodal Intelligence?

·
15 authors

Submitted by

nick11roberts

Test-Time Scaling Makes Overtraining Compute-Optimal

Uwmadison

University of Wisconsin-Madison

Submitted by

sikarwarank

Communicating about Space: Language-Mediated Spatial Integration Across Partial Views

Submitted by

xxiaoyali

GrandCode: Achieving Grandmaster Level in Competitive Programming via Agentic Reinforcement Learning

deepreinforce-ai

Submitted by

taesiri

InCoder-32B-Thinking: Industrial Code World Model for Thinking

·
25 authors

Submitted by

kingofspace0wzz

AgentSocialBench: Evaluating Privacy Risks in Human-Centered Agentic Social Networks

CarnegieMellonU

Carnegie Mellon University

Submitted by

puar-playground

Swift-SVD: Theoretical Optimality Meets Practical Efficiency in Low-Rank LLM Compression

Tele-AI

Submitted by

taesiri

AgentHazard: A Benchmark for Evaluating Harmful Behavior in Computer-Use Agents

·
9 authors

Submitted by

Lancelot53

VLMs Need Words: Vision Language Models Ignore Visual Detail In Favor of Semantic Anchors

·
7 authors

Submitted by

taesiri

Xpertbench: Expert Level Tasks with Rubrics-Based Evaluation

·
31 authors

Submitted by

domiso

Salt: Self-Consistent Distribution Matching with Cache-Aware Training for Fast Video Generation

·
9 authors

Submitted by

taesiri

CoME-VL: Scaling Complementary Multi-Encoder Vision-Language Learning

·
7 authors

Submitted by

Jeff-Wang

DriveDreamer-Policy: A Geometry-Grounded World-Action Model for Unified Generation and Planning

GigaAI-Research

GigaAI-Research

Submitted by

Zhanguang

Do World Action Models Generalize Better than VLAs? A Robustness Study

·
14 authors