摘 要:在现代工业自动化领域,机器人执行复杂装配任务的能力至关重要。尽管强化学习为机器人策略学习提供了一种有效途径,但在装配任务的策略训练初始阶段存在采样效率低和样本质量差的问题,导致算法收敛速度慢,容(试读)...