reading - samrat's thought space

Interesting research papers I have read (and my notes):

HERMES: Human-to-Robot Embodied Learning from Multi-Source Motion Data for Mobile Dexterous Manipulation 10-17-2025
ResMimic: From General Motion Tracking to Humanoid Whole-body Loco-Manipulation via Residual Learning 10-14-2025
DeepMimic: Example-Guided Deep Reinforcement Learning of Physics-Based Character Skills 10-13-2025
From Pixels to Predicates: Learning Symbolic World Models via Pretrained Vision-Language Models 10-03-2025
PDP: Physics-Based Character Animation via Diffusion Policy 09-30-2025
Open X-Embodiment: Robotic Learning Datasets and RT-X Models 09-07-2025
$\pi_0$: A Vision-Language-Action Flow Model for General Robot Control 08-28-2025
The Intentional Unintentional Agent: Learning to Solve Many Continuous Control Tasks Simultaneously 06-29-2025
Reinforcement Learning with Unsupervised Auxiliary Tasks 06-13-2025
Universal Value Function Approximators 06-12-2025
Progressive Neural Networks 06-09-2025
Variational Option Discovery Algorithms 06-05-2025
Diversity is All You Need: Learning Skills without a Reward Function 06-04-2025
Variational Intrinsic Control 06-02-2025
Exploration by Random Network Distillation 06-01-2025
Curiosity-driven Exploration by Self-supervised Prediction 05-31-2025
EX2: Exploration with Exemplar Models for Deep Reinforcement Learning 05-30-2025
#Exploration: A Study of Count-Based Exploration for Deep Reinforcement Learning 05-29-2025
Count-Based Exploration with Neural Density Models 05-28-2025
Recurrent World Models Facilitate Policy Evolution 05-26-2025
Unifying Count-Based Exploration and Intrinsic Motivation 05-23-2025
VIME: Variational Information Maximizing Exploration 05-22-2025
Evolution Strategies as a Scalable Alternative to Reinforcement Learning 05-22-2025
Interpolated Policy Gradient: Merging On-Policy and Off-Policy Gradient Estimation for Deep Reinforcement Learning 05-21-2025
The Reactor: A fast and sample-efficient Actor-Critic agent for Reinforcement Learning 05-20-2025
Combining Policy Gradient and Q-learning 05-18-2025
Trust-PCL: An Off-Policy Trust Region Method for Continuous Control 05-15-2025
Decision Transformer: Reinforcement Learning via Sequence Modeling 05-12-2025
Bridging the Gap Between Value and Policy Based Reinforcement Learning05-11-2025
Action-dependent Control Variates for Policy Optimization via Stein’s Identity05-10-2025
Q-Prop: Sample-Efficient Policy Gradient with An Off-Policy Critic 05-08-2025
Implicit Quantile Networks for Distributional Reinforcement Learning05-07-2025
Distributional Reinforcement Learning with Quantile Regression05-05-2025
A Distributional Perspective on Reinforcement Learning04-27-2025
Addressing Function Approximation Error in Actor-Critic Methods04-26-2025
Continuous Control with Deep Reinforcement Learning04-26-2025
Deterministic Policy Gradient Algorithms04-24-2025
Soft Actor-Critic: Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor 04-23-2025
Sample Efficient Actor-Critic with Experience Replay04-20-2025
Scalable trust-region method for deep reinforcement learning using Kronecker-factored approximation04-18-2025
Proximal Policy Optimization Algorithms04-17-2025
Emergence of Locomotion Behaviours in Rich Environments04-17-2025
High-Dimensional Continuous Control Using Generalized Advantage Estimation04-15-2025
Trust Region Policy Optimization04-07-2025
Asynchronous Methods for Deep Reinforcement Learning04-06-2025
Rainbow - Combining Improvements in Deep Reinforcement Learning04-05-2025
Prioritized Experience Replay04-04-2025
Deep Reinforcement Learning with Double Q-learning04-03-2025
Dueling Network Architectures for Deep Reinforcement Learning04-01-2025
Deep Recurrent Q-Learning for Partially Observable MDPs04-01-2025
Playing Atari With Deep Reinforcement Learning11-04-2024
Extensibility, Safety, and Performance in the SPIN Operating System09-05-2024
On Micro-Kernel Construction08-31-2024
Exokernel - An Operating System Architecture for Application-Level Resource Management08-31-2024