Academic Projects Links About 🚇

Research

Page 1 - Showing 11 of 11 posts View all posts by years →

Jun 21, 2026

Paper Reading: Agent Inference 1

整理最近 Agent Inference 领域的好文

1 min read zh
- paper reading
- agent inference
Jun 2, 2026

Paper Reading 0

为了不被时代的潮流所淹没，为了追寻内心的知识殿堂，记录一些跟随时代的论文学习

4 min read zh
May 24, 2026

RL学习笔记（6）: 时序差分学习

时序差分学习（Temporal Difference Learning）

7 min read zh
- reinforcement learning
May 21, 2026

RL学习笔记（5）: 蒙特卡洛方法

蒙特卡洛方法（Monte Carlo Methods）

22 min read zh
- reinforcement learning
May 17, 2026

RL学习笔记（4）: 动态规划

动态规划（Dynamic Programming）

19 min read zh
- reinforcement learning
May 16, 2026

Paper Reading: Agent Memory 2

整理 Agent Memory 领域关于个性化记忆的工作

3 min read zh
- paper reading
- agent memory
May 14, 2026

RL学习笔记（3）: 马尔可夫决策过程

马尔可夫决策过程（MDP）

11 min read zh
- reinforcement learning
May 11, 2026

RL学习笔记（2）: 多臂赌博机

多臂赌博机问题（ϵ-贪心、UCB、汤普森采样……）

10 min read zh
- reinforcement learning
May 7, 2026

RL学习笔记（1）: 强化学习简介

强化学习简介

18 min read zh
- reinforcement learning
May 5, 2026

Paper Reading: Agent Memory 1

整理最近 Agent Memory 领域的好文

1 min read zh
- paper reading
- agent memory
May 4, 2026

Paper Reading: World Model 1

探索 World Model 的研究本质

3 min read zh
- paper reading
- world model