차이

문서의 선택한 두 판 사이의 차이를 보여줍니다.

차이 보기로 링크

양쪽 이전 판 이전 판
다음 판
이전 판
activity:public:2020:meerkat [2020/09/24 14:24:13] – [1. 개요] kkirukactivity:public:2020:meerkat [2021/06/09 13:09:41] (현재) – 글 주제과 관련없는 위키 문법 관련 문단 삭제 david
줄 47: 줄 47:
 이 정보를 받은 **serial_node**에서 아두이노를 제어하여 차량을 움직이게 합니다. 이 정보를 받은 **serial_node**에서 아두이노를 제어하여 차량을 움직이게 합니다.
  
-{{:activity:member:2020:sum.png?1000}}+ 
 +{{https://img.kasimov.synology.me/reference/meerkat/sum.png?1000}}
 ====2.2. 아두이노==== ====2.2. 아두이노====
  
줄 71: 줄 72:
 뎁스의 x,y,theta정보와 IMU의 ax,ax,theta_dot 정보를 사용하여 x,y,yaw,x_dot,y_dot,theta_dot을 추정하는 시스템 식은 아래와 같습니다.\\ 뎁스의 x,y,theta정보와 IMU의 ax,ax,theta_dot 정보를 사용하여 x,y,yaw,x_dot,y_dot,theta_dot을 추정하는 시스템 식은 아래와 같습니다.\\
 process update\\ process update\\
-{{:activity:member:2020:f.png?800}}\\+{{https://img.kasimov.synology.me/reference/meerkat/f.png?800}}\\
 measurement update\\ measurement update\\
-{{:activity:member:2020:h.png?500}}\\+{{https://img.kasimov.synology.me/reference/meerkat/h.png?500}}\\
  
 칼만 필터의 식은 다음과 같습니다.\\ 칼만 필터의 식은 다음과 같습니다.\\
-{{:activity:member:2020:kf.jpg?700}}\\+{{https://img.kasimov.synology.me/reference/meerkat/kf.jpg?700}}\\
  
 이를 활용하여 매 스탭마다 칼만 필터를 업데이트 해가며 자세를 추정하였습니다.\\ 이를 활용하여 매 스탭마다 칼만 필터를 업데이트 해가며 자세를 추정하였습니다.\\
줄 94: 줄 95:
  
 **NN** 아키텍쳐는 다음과 같습니다.\\ **NN** 아키텍쳐는 다음과 같습니다.\\
-{{:activity:member:2020:nn.png?500}}\\+{{https://img.kasimov.synology.me/reference/meerkat/nn.jpg?500}}\\
  
 **Action**은 총 5개로 Steering Wheel이 각각 60,75,90,105,120일 때 입니다.\\ **Action**은 총 5개로 Steering Wheel이 각각 60,75,90,105,120일 때 입니다.\\
줄 106: 줄 107:
  
 노이즈가 없을 때 돌려본 강화학습의 결과는 다음과 같습니다. \\ 노이즈가 없을 때 돌려본 강화학습의 결과는 다음과 같습니다. \\
-{{:activity:member:2020:clean_res.png?1000}}\\+{{https://img.kasimov.synology.me/reference/meerkat/clean_res.png?1000}}\\
  
 왼쪽은 평균 성공률, 오른쪽은 평균 보상. 평균 보상이 높을수록 현재 행동이 최적 행동에 가깝도록 설계하였습니다.\\    왼쪽은 평균 성공률, 오른쪽은 평균 보상. 평균 보상이 높을수록 현재 행동이 최적 행동에 가깝도록 설계하였습니다.\\   
줄 114: 줄 115:
 action을 3가지로 줄이고 현실에 맞게 time step을 늘렸기 때문에 평균 보상은 많이 줄어들었지만 나쁘지 않은 성공률을 보였습니다.\\ action을 3가지로 줄이고 현실에 맞게 time step을 늘렸기 때문에 평균 보상은 많이 줄어들었지만 나쁘지 않은 성공률을 보였습니다.\\
  
-{{:activity:member:2020:figure_1.png?1000}}\\+{{https://img.kasimov.synology.me/reference/meerkat/noisy_res.png?1000}}\\
  
 마지막에 강화학습 학습한 코드롤 실 로봇에 돌려봤어야 했으나 건강의 문제 + 시간의 문제로 인하여 포기했습니다ㅜㅜ 마지막에 강화학습 학습한 코드롤 실 로봇에 돌려봤어야 했으나 건강의 문제 + 시간의 문제로 인하여 포기했습니다ㅜㅜ
줄 124: 줄 125:
 하지만, 좌표 정보로 잘 움직인다면, 우리는 **모방학습**을 시도해 볼 수 있을 거 같습니다. 전에 학습해 놓은 Depth 정보로 Policy(Q_value)를 만들고 RGB 값을 Input으로 하는 새로운 뉴럴 네트워크의 policy (Q_value)를 단순한 지도학습으로 학습하는 방법이나, 역강화학습, 혹은 다른 모방학습 알고리즘을 활용한다면, 안전하게 현실에서 학습 할 수 있을 것입니다. \\ 하지만, 좌표 정보로 잘 움직인다면, 우리는 **모방학습**을 시도해 볼 수 있을 거 같습니다. 전에 학습해 놓은 Depth 정보로 Policy(Q_value)를 만들고 RGB 값을 Input으로 하는 새로운 뉴럴 네트워크의 policy (Q_value)를 단순한 지도학습으로 학습하는 방법이나, 역강화학습, 혹은 다른 모방학습 알고리즘을 활용한다면, 안전하게 현실에서 학습 할 수 있을 것입니다. \\
 **단순 지도 학습** 위 **GAIL 역강화학습** 아래 \\ **단순 지도 학습** 위 **GAIL 역강화학습** 아래 \\
-{{:activity:member:2020:future.png?700}}\\+{{https://img.kasimov.synology.me/reference/meerkat/future.png?700}}\\ 
  
 =====3. 로봇팔 개발일지===== =====3. 로봇팔 개발일지=====
줄 144: 줄 146:
 ====3.5. 향후 과제==== ====3.5. 향후 과제====
  
- 
-=====0. 기초문법===== 
- 
-====0.1. 순서 없는 목록==== 
-  * 순서 
-  * 없는 
-  * 목록 
- 
-====0.2. 순서 있는 목록==== 
-  - 순서 
-  - 있는 
-  - 목록 
- 
-====0.3. 코드 블럭==== 
-''<code>내용</code>''을 사용! 
- 
-====0.4. 링크만들기==== 
-<code>[[URL|링크제목]]</code> 
-ex) 
-<code>[[https://kasimov.korea.ac.kr|KAsimov Homepage]]</code> 
-[[https://kasimov.korea.ac.kr|KAsimov Homepage]] 
- 
-====0.5. YouTube 임베드==== 
-편집기 위 버튼 중에 맨 마지막 슬레이트 모양 버튼 ''동영상 공유 사이트에서 동영상 넣기''으로 삽입\\ 
-ex) 
-{{youtube>iUXAHc-ABoY?medium}} 
- 
-====0.6. 가로줄==== 
-<code>----</code> 
-이러면 아래 가로 줄이 생김 
----- 
- 
-====0.7. 글자 서식==== 
-<code> **굵게** //기울이기// __밑줄__ ''짧은 코드'' <del>취소선</del> </code> 
-**굵게** //기울이기// __밑줄__ ''짧은 코드'' <del>취소선</del> 
- 
-====0.8. 글자 박스==== 
-<code> 
-<alert type="종류" icon="아이콘">내용</alert> 
-</code> 
-이건 직접 만들지 말고 편집기 버튼들 중 보라색 배경 흰색 B버튼 눌러서 ''alert''선택한 후 설정 수정할것 
-아이콘 사용 안할거면 빈칸, 사용할거면 [[wiki:iconlist|Icon List]]참조해서 ''glyphicon (해당이름)'' 집어넣어주면 됨 
-사용 예시는 3. 주의사항 참조 
- 
-====0.9. 표==== 
-<code> 
-^ 1열      ^ 2열      ^ 3열      ^ 
-| 1열1행   | 2열1행   | 3열1행   | 
-| 1열2행   | 행 span (마지막 ''|'' 2개있는거 주의!) || 
-| 1열3행   | 2열3행   | 3열3행   | 
-</code> 
-^ 1열      ^ 2열      ^ 3열      ^ 
-| 1열1행   | 2열1행   | 3열1행   | 
-| 1열2행   | 행 span (마지막 ''|'' 2개있는거 주의!) || 
-| 1열3행   | 2열3행   | 3열3행   | 
- 
-====0.10. 기타==== 
-[[wiki:syntax|Formatting Syntax]] 참조(영어임) 
- 
-====0.11. 주의사항==== 
-<alert type="warning" icon="glyphicon   
-glyphicon-warning-sign">저장 전 꼭 [미리보기] 버튼 눌러 오타, 문법오류 등 확인하고 저장!</alert> 
-아주 민감한 정보 잘못 넣었다가 저장하면 <color #ed1c24>**영구박제(되돌리려면 위키 다 엎어야 함)**</color>되므로 주의! 
  • activity/public/2020/meerkat.1600925053.txt.gz
  • 마지막으로 수정됨: 5년 전
  • 저자 kkiruk