Scheduling/Paper
-
[RL] Toward optimal assembly line order sequencing with reinforcement learning a case study(2020)Scheduling/Paper 2021. 4. 19. 09:49
논문/사례 제목 출간년도 저자 Toward optimal assembly line order sequencing with reinforcement learning a case study 2020 Saad Shafiq 외 3명 요약 강화학습을 이용하여 assembly line의 minimum output을 보장하는 order sequence를 찾는 방법 사용 방법론 실험결과
-
[RL] Value-based algorithm VS Policy-based algorithmScheduling/Paper 2021. 4. 19. 09:46
Topic Value-based algorithm과 policy-base algorithm 비교 Description -Value-based Goal : maximize state-value function(expected return for each state s_t) → action value function을 maximize 하는 policy P(s_t |a_t)를 도출하여 Goal 달성 → action이 Q-function을 최대로 하는 a_t^∗로 deterministic로 결정 → ε-greedy을 이용하여 탐색 영역 확대 ex) SARSA, Q-learning, DQN - -Policy-based Goal : 처음부터 episode 종료시까지 주어지는 reward의 총합의 기댓값을 최대화 →..
-
[RL] Actor-critic deep reinforcement learning for solving job shop scheduling problems(2020)Scheduling/Paper 2021. 4. 19. 09:30
논문/사례 제목 출간년도 저자 Actor-critic deep reinforcement learning for solving job shop scheduling problems 2020 Chien-liang Liu, Chuan-chin Change, Chun-jan Tseng 요약 Job shop scheduling problem(JSSP)에 deep reinforcement learning(DRL) 방법론을 적용하여 dispatching rule보다 성능적 우위, optimal model보다 시간적 우위를 도출함. 사용 방법론 -Actor-Critic algorithm Critic network : 현재의 policy를 평가하는 역할 -> action을 해보고 그 action의 value functio..
-
[RL] Simulation study on reward function of reinforcement learning in gantry work cell scheduling(2018)Scheduling/Paper 2021. 4. 19. 09:22
논문/사례 제목 출간년도 저자 Simulation study on reward function of reinforcement learning in gantry work cell scheduling 2018 Xinyan Ou, Qing Chang, Nilanjan Chakraborty 사용 방법론 -System Description, Gantry system modeling, R/L algorithm 논문1과 동일 -Reward function 1. Prioritize end-of-line output -> impose a punishing reward once last machine is waiting for a gantry during two consecutive decision point. -> 최종..
-
[RL] Gantry Work Cell Scheduling through Reinforcement Learning with knowledge-guided Reward Setting(2018)Scheduling/Paper 2021. 4. 19. 09:19
논문/사례 제목 출간년도 저자 Gantry Work Cell Scheduling through Reinforcement Learning with knowledge-guided Reward Setting 2018 Xinyan Ou, Qing Chang, Jorge Arinez, Zing Zou 사용 방법론 -System Description m개의 machine, m-1개의 buffer, n개의 gantry Machine의 생산속도 차이에 의해 병목현상 발생 Real disruption event : machine 고장으로 인한 생산 delay Virtual disruption event : 병목현상으로 인한 생산 delay -Gantry System Modeling Gantry system을 state에..
-
[GNN] A graph neural network assisted monte carlo tree search approach to traveling salesman problem(2020)Scheduling/Paper 2021. 4. 19. 09:11
[GNN] A grap neural network assisted monted carlo tree search approach to traveling salesman problem(2020) 요약 : GNN을 이용하여 tsp graph의 사전확률을 구하고 이를 monte carlo tree search에 적용한 결과 다른 learning-based algorithm보다 좋은 성능을 내었다. 1. Introduction Deep convolutional neural netowrks(CNN)과 Monte Carlo Tree Search(MCTS)의 조합은 그 유명한 AlphaGo를 탄생시킨 알고리즘이다. 그러나 바둑에 적용된 알고리즘을 TSP에 그대로 적용하는 것은 부적절하다. 그 이유는 다음과 같다. 첫째..