new

Get trending papers in your email inbox once a day!

Get trending papers in your email inbox!

Daily Papers

byAK and the research community

Apr 17

Submitted by

taesiri

HY-World 2.0: A Multi-Modal World Model for Reconstructing, Generating, and Simulating 3D Worlds

·
45 authors

Submitted by

Hao605

RAD-2: Scaling Reinforcement Learning in a Generator-Discriminator Framework

Huazhong University of Science and Technology

Submitted by

taesiri

DR^{3}-Eval: Towards Realistic and Reproducible Deep Research Evaluation

·
19 authors

Submitted by

njuhzx

How to Fine-Tune a Reasoning Model? A Teacher-Student Cooperation Framework to Synthesize Student-Consistent SFT Data

·
9 authors

Submitted by

NoamIssachar

GlobalSplat: Efficient Feed-Forward 3D Gaussian Splatting via Global Scene Tokens

The Hebrew University of Jerusalem

3

Submitted by

P-YI

ASGuard: Activation-Scaling Guard to Mitigate Targeted Jailbreaking Attack

Korea University

Submitted by

Violin-Y

HiVLA: A Visual-Grounded-Centric Hierarchical Embodied Manipulation System

·
11 authors

Submitted by

taesiri

Dive into Claude Code: The Design Space of Today's and Future AI Agent Systems

·
4 authors

Submitted by

Kaichengalex

UniDoc-RL: Coarse-to-Fine Visual RAG with Hierarchical Actions and Dense Rewards

DeepGlint-AI

Submitted by

HaoyiSun

Switch-KD: Visual-Switch Knowledge Distillation for Vision-Language Models

LiAuto-Foundation-Model

LiAuto Foundation Model

Submitted by

taesiri

LeapAlign: Post-Training Flow Matching Models at Any Generation Step by Building Two-Step Trajectories

ByteDance-Seed

Submitted by

Sta8is

Representations Before Pixels: Semantics-Guided Hierarchical Video Prediction

·
3 authors

Submitted by

AdinaY

TRACER: Trace-Based Adaptive Cost-Efficient Routing for LLM Classification

DeepRecall

Submitted by

jiuntian

OneHOI: Unifying Human-Object Interaction Generation and Editing

NanyangTechnologicalUniversity

Nanyang Technological University

Submitted by

jw-sohn

RadAgent: A tool-using AI agent for stepwise interpretation of chest computed tomography

ethz

Submitted by

Bowen232

LongAct: Harnessing Intrinsic Activation Patterns for Long-Context Reinforcement Learning

·
7 authors

Submitted by

taesiri

MM-WebAgent: A Hierarchical Multimodal Web Agent for Webpage Generation

MicrosoftResearch

Microsoft Research

Submitted by

ryanxhr

Reinforcement Learning via Value Gradient Flow

·
4 authors

Submitted by

SophiaSirko

Boosting Visual Instruction Tuning with Self-Supervised Guidance

valeocorg

Submitted by

ChuangtaoChen-TUM

KV Packet: Recomputation-Free Context-Independent KV Caching for LLMs

TUM

Technical University of Munich

Submitted by

Iamvarun369

SuperLocalMemory V3.3: The Living Brain -- Biologically-Inspired Forgetting, Cognitive Quantization, and Multi-Channel Retrieval for Zero-LLM Agent Memory Systems

Submitted by

leopoldmaillard

Beyond Prompts: Unconditional 3D Inversion for Out-of-Distribution Shapes

·
4 authors

Submitted by

dukesun99

Don't Retrieve, Navigate: Distilling Enterprise Knowledge into Navigable Agent Skills for QA and RAG

·
3 authors

Submitted by

yunhuijang

Towards Autonomous Mechanistic Reasoning in Virtual Cells

kaist-ai

Submitted by

FengTing

Cross-Tokenizer LLM Distillation through a Byte-Level Interface

·
5 authors

Submitted by

MohammadAbuAyyash

Three-Phase Transformer

BrainsBuild

Submitted by

Akira-k

C2: Scalable Rubric-Augmented Reward Modeling from Binary Preferences

·
2 authors

Submitted by

natnitaract

Model Capability Dominates: Inference-Time Optimization Lessons from AIMO 3

·
1 authors

Submitted by

quandao10

An Optimal Transport-driven Approach for Cultivating Latent Space in Online Incremental Learning

·
9 authors