Journal of Korea Robotics Society
[ ARTICLE ]
Journal of Korea Robotics Society - Vol. 12, No. 3, pp.339-349
ISSN: 1975-6291 (Print) 2287-3961 (Online)
Print publication date Aug 2017
Received 4 Apr 2017 Revised 26 Jun 2017 Accepted 28 Jul 2017
DOI: https://doi.org/10.7746/jkros.2017.12.3.339

다중 에이전트 모바일 로봇 대형제어를 위한 유한시간 슬라이딩 모드 제어기 설계

박동주1 ; 문정환2 ; 한성익
Finite-Time Sliding Mode Controller Design for Formation Control of Multi-Agent Mobile Robots
Dong-Ju Park1 ; Jeong-Whan Moon2 ; Seong-Ik Han
1Electronic Engineering, Pusan National University djpark@pusan.ac.kr
2Electronic Engineering, Pusan National University jeongwhan1696@pusan.ac.kr

Corresponding author: Mechanical Engineering, Pusan National University, Jangjeon-Dong, Geumjeong-Gu, Busan, Korea ( snikhan@gmail.com)

© Korea Robotics Society. All rights reserved.

Abstract

In this paper, we present a finite-time sliding mode control (FSMC) with an integral finitetime sliding surface for applying the concept of graph theory to a distributed wheeled mobile robot (WMR) system. The kinematic and dynamic property of the WMR system are considered simultaneously to design a finite-time sliding mode controller. Next, consensus and formation control laws for distributed WMR systems are derived by using the graph theory. The kinematic and dynamic controllers are applied simultaneously to compensate the dynamic effect of the WMR system. Compared to the conventional sliding mode control (SMC), fast convergence is assured and the finite-time performance index is derived using extended Lyapunov function with adaptive law to describe the uncertainty. Numerical simulation results of formation control for WMR systems shows the efficacy of the proposed controller.

Keywords:

Distributed Multi-agent System Mobile Robot, Kinetic/Dynamic Control, Formation Control, Finite-time Sliding Mode Control

1. 서 론

최근 다중 에이전트 시스템에 대한 관심이 증가되고 있다. 그것은 단일 에이전트가 수행할 수 없는 센싱이나 구동을 수행할 수 있으며 미지의 환경에 대한 유연성, 적응성, 강인성이 크기 때문이다. 다중 에이전트의 주된 응용분야는 공중, 수중, 지상의 자율 주행체, 통신 네트 워크, 그리고 센서 네트워크이다. 다중 에이전트 시스템 은 분포 네트워크 제어시스템에 대한 그래프 이론[1]을 이용하여 제어하며 크게 일치제어(consensus control), 대형제어(formation control), 봉쇄제어(containment control) 로 분류된다. 일치제어는 모든 에이전트들이 같은 정보 상태가 되도록 만드는 것이며 대형제어는 각 에이전트 들이 특정한 기하학적인 대형 패턴을 만들어 유지하는 것을 의미하고 봉쇄제어는 선도 에이전트들이 형성하는 이동 구역 내에 추종 에이전트들이 항상 머물도록 강제 로 유도하는 것을 의미한다. 분포(distributed) 에이전트 시스템에서 대부분 선도(leader)에이전트 및 추종(follower) 에이전트가 존재하나 추종 에이전트만이 있는 경우도 있다. 선도 에이전트는 스스로 명령을 만들어 이동하며 추종 에이전트에 대해 이동 명령을 전달한다.

다중 에이전트에 대한 제어기법으로서 슬라이딩 모드 제어(sliding mode control: SMC) 기법[2,3]이 적용되었고 빠른 수렴 특성을 위한 터미널(terminal) 슬라이딩 모드 제어 기법이(TSMC)[4,5] 연구되었다. 그리고 Lagrangian 다중 에이전트 비선형 동적시스템에 대해 백스태핑 (backstepping) 제어[6,7] , 백스태핑-슬라이딩모드 제어[8], dynamic surface 제어[9,10]가 연구되었다. 슬라이딩 모드 제어는 미지의 외란에 대한 강인성을 보장하는 장점이 있으나 수렴속도가 커지는 단점이 있어 터미널 슬라이 딩 모드제어가 개발되어 빠른 수렴속도를 보장할 수 있 게 되었다. 백스테핑 제어는 복잡한 비선형성을 지닌 다 중 에이전트 제어를 위해 도입되었고 dynamic surface 제어는 백스테핑 제어기 설계 단계에서 발생하는 미분 항의 복잡성에 의한 제어기 차수 증가를 피하기 위해 연구되었다. 다중 에이전트에서 가장 많이 응용되는 것 은 지상 주행 WMR 분야이다. 그런데 대부분의 WMR에 대한 다중 에이전트 적용은 WMR이 소형이어서 관성 특성을 무시한 기하학적(kinematic) 특성만을 고려한 제 어기를 설계하여 적용하였다[10-14]. 그래서 WMR에 대해 속도 명령을 발생시켜 각 WMR의 위치를 제어하였다. 그러나 각종 센서 장착과 부하가 걸리면 WMR의 동역학 을 고려한 토크제어를 사용해야 한다. 다중 로봇 머니퓰 레이터에 대한 분포 에이전트 제어를 연구하였으나[6] WMR에 대한 기구학과 동력학을 동시에 고려한 연구는 거의 없었다.

기존의 다중 WMR 에이전트 제어시스템의 경우 기구 학만을 고려하였으나 본 연구에서는 기구학특성과 동역 학 특성을 동시에 고려하여 통합된 모델을 유도하고 기 구학과 동특성을 동시에 고려하는 적분형 유한시간 (finite-time) 슬라이딩 모드 제어기를 설계하였으며 모델 불확실성에 대한 적응규칙을 유도하였다. 유한시간 리 아프노츠(Lyapunov) 안정도 이론을 이용하여 적응규칙 을 고려한 유한 수렴시간 지표를 유도한다. 최종적으로 1개의 선도 WMR과 4개의 추종 WMR에 대한 대형 형성 제어를 시뮬레이션을 통해 구현하여 제안한 제어기의 성능을 검증한다.


2. 다중 WMR 에이전트에 대한 graph 이론

먼저 n개의 추종 WMR과 1개의 선도WMR로 팀이 구 성된것으로 가정한다. [1]에서그래프이론은 다중WMR 시스템의 coordination 문제를 다루었다. 방향성 그래프 (directed graph) G 는 유한 node집합 V={0,1,2,,n}과 에지(edge) ε V× V 로 구성된 ( V, ε) 쌍이다. 에지(i, j) 는 WMR j는 WMR i로부터 정보를 얻는 그래프 집합이 다. 방향성트리는 모든 노드(node)는 부모가 없으며 다 른 모든 노트에 대해 방향성 경로(path)를 갖는 root라고 부르는 한 개의 노드를 제외하고 정확히 한 개의 부모 노드를 갖는 방향성 그래프이다. 그래프 G=( V, ε)는 방향성 확장트리(directed spanning tree)가 ( V, ε)의 부 분 그래프이면 방향성 확당트리이다. 방향성 그래프 G=( V, ε)( V, ε)가 모든 다른 노드에 대해 최소한 1 개의 방향성 경로를 갖는다면 방향성 확장트리를 갖는 다. a=[aij]Rn+1×n+1(j,i) ε 이면 양의 가중치 aij 로 구성되며(j,i) ε 이면 aij = 0 이다. 보통 aij 는 1로 가 정한다. D=diag{ d0, d1,, dn}Rn+1×n+1 di=j=0naij,i=0,,n,dij=0,ij 로 구성된 degree 행렬이다. Laplacian 행렬 L=[lij]Rn+1×n+1 은 다음과 같이 정의된다.

lij=j=1,jin+1aij,lij=aij,ij(1) 

식 (1)에서 L= D aRn+1×n+1 이다.


3. 다중 WMR 에이전트 모델링 및 분포 유한시간 슬라이딩 모드 제어기 설계

3.1. 다중 에이전트 WMR의 통합된 기구학 및 동적 모델

Fig. 1i 번째 WMR은 양쪽 면에 구동 바퀴가 있고 전면 P점에 dummy 바퀴가 부착되어 있다. 기하학식은 식 (2)와 같이 주어진다. Table 2는 각 용어에 대한 설명 을 나타낸다.T1

Fig. 1

Nonholonomic differentially driven WMR

Nomenclature

RMS tracking error

q˙i=[r˙xir˙yiθ˙i]=[cos θi0sin θi001][viωi]=Ji(θi)Vi,(2) 

여기서 Ji(θi)=[cos θisinθi0001]T 는 WMR 좌표의 속도 Vi=[vi  ωi]T 에서 Cartesian 좌표의 속도 q˙i=[r˙xi  r˙yi  θ˙i]T 로 변환시켜 주는 Jacobian 행렬이다.

Nonholonomic 구속 조건은 다음과 같다.M3

AiT(qi)q˙i=0,(3) 

여기서 AiT(qi)=[sin θi  cos θi  0]T. Nonholonomic 구속을 갖는 동적 방정식 Lagrange-Euler 방정식을 이용하여 구 하면 다음과 같이 주어진다.

Mi(qi)q¨i+τdi=BiτiAiT(qi)λi,(4) 

여기서, τdiR3×1 는 외란, λiR 는 Lagrange multiplier, τi=[τr  τl]T 는 바퀴를 구동하는 토크이고 Mi(qi)R3×3Bi(qi)R3×2 는 다음과 같이 주어진다.

Mi(qi)=[mi000mi000Ii],Bi(qi)=1ri[cos θicos θisin θisin θiRiRi].

JiT(qi)AiT(qi)=0 이므로 JiT(qi) 를 식 (4)에 곱하고 외란 을 무시하면 다음을 얻는다.

[v˙iω˙i]=1ri[1mi1miRiIiRiIi][τriτli].(5) 

Fig. 1에 주어진 WMR의 heading 위치는 다음과 같다.

[hxihyi]=[rxiryi]+Li[cos θisin θi].(6) 

식 (6)을 2번 미분하면

[h¨xih¨yi]=[cos θiLi sin θisin θiLi cos θi][v˙iω˙i]+[sin θiωiviLicos θiωi2cos θiωiviLi sin θiωi2].(7) 

식 (5)를 식 (7)에 대입하고 정리하면

[h¨xih¨yi]=[T11T12T21T22][τriτli]+[dxidyi,](8) 

또는M9

h¨i=Tiτi+di,(9) 

여기서 Ti=1ri[cos θimiLiRisin θiIicos θimi+LiRisin θiIisin θimi+LiRi​ cos θiIisin θimiLiRi cos θiIi],

di=[dxidyi]T,[dxidyi]=[sin θiωiviLi cosθiωi2cos θiωiviLi sinθiωi2].

i번째 추종 WMR과 선도 WMR의 상태공간 모델은 다음과 같이 표현된다.

x˙i1=xi2,x1iR2x˙i2=Tiui+di,xi2R2,i=1,,n,(10) 

x˙l1=xi2,xl1R2x˙i2=Tlul+dl,xl2R2,(11) 

여기서 xi1=hi,xi2=h˙i,ui=τi=[τri  τli]T,xl=[xlx  xly]T,ul=[ulx  uly]T, Tldl 는 추종 WMR과 동일한 구조를 갖 는다. 식 (10)에서 di 는 조건 , |di|<δi<,i=1,,n 으로 가 정하며 δi 는 미지의 상수이다. 일치제어 알고리즘에 의해 위치 오차함수와 속도오차함수는 다음과 같이 주어진다.

Eci=j=1naij(x1ixij)+bi(x1ix1l),(12) 

E˙ci=j=1naij(x2ix2j)+bi(x2ixl2),(13) 

여기서, bii번째 추종WMR과 선도 WMR사이의 가중 치이다. 그리고 Ec=[Ec1,,Ecn]TR2n, Eci=[ecxi  ecyi]T, ecxi=i=1naij(hxihxj)+bi(hxihxl), ecyi=j=1naij(hyihyj)+bi(hyihyl), E˙c=[E˙c1,,E˙cn]TR2n, X1=[x11T,,xn1T]TR2n, X2=[x12T,,xn2T]TR2n, Xl=[xl1T,,XlnT]TR2n 로 정의하면 식 (12), (13)은 다음과 같은 간결한 형태로 표현된다.M15

Ec=(( L¯+ B¯) I2)X1( B¯ 1n I2)Xl,(14) 

E˙c=(( L¯+ B¯) I2)X2( B¯ 1n I2)X˙l,(15) 

여기서

a¯=[0a21a1na210a2nan1an20]Rn×n, D¯=[ d10000 d200000 dn]Rn×n, B¯=[b10000b200000bn].

정리 1[1]. directed graph G=( V, ε) 에 대해 Laplacian 행렬 L 은 한 개의 0인 고유값을 가지며 열린 우반평면 에서 0이 아닌 모든 고유값들이 존재한다.

정리 2[1,4]. 식 (10), (11)에 주어진 선도-추종 WMR시 스템을 고려하자. 만일 directed graph G=( V, ε)가 directed spanning tree를 갖고 Ec = 02n 이면M16

X1=( 1n I2)Xl,(16) 

이 성립한다.

증명: 식 (14)에서 Ec = 02n 이면

(( L¯+ B¯) I2)X1=( B¯ 1n I2)Xl.(17) 

¯ 의 행의 합은 0이므로 [( L 1n)× I2]= 02n 이고 식 (17) 의 우변은 ( B¯ 1n I2)Xl=[( L¯+ B¯) 1n I2],Xl=[( L¯+ B¯) I2]X1 이 된다. b=[b1,,bn]T 를 정의하고 행렬을 확장하 면 Mn×n+1=[ L¯+ B¯  b] 이 되고 확장된 Laplacian 행렬 은 다음과 같이 표현된다.M18

L= D a=[01×n+1 L¯+ B¯b]=[01×n+1 Mn×n+1]Rn+1×n+1.(18) 

만일 L 이 directed spanning tree를 갖고 Rank( L)=n 이면 Rank( Mn×n+1)=n 이다. ( L¯ 1n) I2=0 이므로

bTI2=( B¯ 1n)I2=(( L¯+ B¯) 1n)I2.(19) 

이것은( L¯+ β¯) 의 역행렬이 존재함을 의미하고 식 (19)는 다음과 같이 다시 표현된다.M20

[( L¯+ B¯) I2]X1=[( L¯+ B¯) I2]( 1n I2)Xl.(20) 

그러므로 다음을 얻을 수 있다.M21

X1=( 1n I2)Xl.(21) 

이것은 Ec = 02n 일 때 추종 WMR의 모든 위치와 방향 이 선도 WMR의 위치와 방향에 대해 일치 제어가 성취 됨을 의미한다.

이러한 일치제어에 대한 결과를 대형제어에 대해 적 용하면 오차함수는 다음과 같이 표현된다.M22

Ef=[( D¯ a¯) I2]X1+( B¯ I2)X1( B¯ I2) 1nXl+[( D¯ a¯) I2]Λf+( B¯ I2)Λf( B¯ I2) 1nΛl=[( L¯+ B¯) I2](X1+Λf)( B¯ 1n I2)(X1+Λf).(22) 

여기서 Ef=[Ef1,,Efn]T,Λf=[Λ1,,Λ2n]TR2n. 대형 제어에서 방향 graph G=( υ, ε)Ef= 02n,( L¯ 1n) I2= 02n 이면M23

[( L¯+ B¯) I2](X1+Λf)=( B¯ 1n I2)(X1+Λf)=[( L¯+ B¯) I2]( 1n I2)(Xl+Λl)(23) 

이 성립하고 일치제어와 마찬가지로M24

X1=( 1n I2)Xl(Λf 1n I2Λl),(24) 

을 얻을 수 있다.

3.2. 다중 에이전트 WMR에 대한 유한시간 슬라이딩 모드 제어기 설계

식 (8)에서 다음을 가정한다.

j=1naij(didj)+bidi<j=1naij(δi+δi)+biδi=(2 di+bi)δi,(25) 

여기서 ρi=(2 di+bi)δi>0 로 정의한다. 다음과 같은 i번 째 WMR에 대해 적분형 유한시간 슬라이딩면 벡터 Sci=[scixsciy]T 을 정의한다.

Sci=E˙ci+c1isig(Eci)γ1+c2i0tsig(Eci)γ2dτ.(26) 

여기서 c1i=diag(c1ix,c1iy)>0,  c2i=diag(c2ix,  c2iy)>0,sig(Eci)γj=|Eci|γjsign(Eci),  j=1,2,  0<γj<1,  j=1,2 는 상수이다. 다음을 정의한다/

S˙ci=c3iScic4isig(Sci)γ4c5iSci|Sci|+κi.(27) 

여기서 cij=diag(cjix,cjiy)>0,j=3,4,5,0<γ4<0κi>0 는 상수이다. 식 (26)를 미분하고 식 (27)을 고려하면

S˙ci=E¨ci+c1iγ1|Eci|γ11E˙ci+c2isig(Eci)γ2=j=1n(aij+bi)Tiuij=1naijTjujbiui+j=1naij(didj)+bidi+c1iγ1|Eci|γ11E˙ci+c2isig(Eci)γ2=c3iScic4isig(Sci)γ4c5iSci|Sci|+κi.(28) 

식 (28)로부터 i번째 WMR에 대한 유한시간 슬라이딩 모드 제어기와 적응법칙은 다음과 같이 제안한다.

uci=(j=1n(aij+bi)Ti)1[c1iγ1|Eci|γ11E˙cic2isig(Eci)γ2c3iScic4isig(Sci)γ4c5iSci|Sci|+κiρ^i+j=1naijTjuj+biul],(29) 

ρ^˙i=ηi(SciT+ηiρ^i),(30) 

여기서 ηi > 0 와 ηi>0 는 상수이다.

3.3. 안정도 해석 및 유한시간 성능지표 유도

다음의 리아프노프 함수를 정의한다.

Vci=12SciTSci+12ηiρ˜iTρ˜i,(31) 

여기서 ρ˜i=ρiρ^i,ρ^iρi의 추정값. 식 (31)을 미분하면

V˙ci=SciTS˙ci+1ηiρ˜iTρ˜˙i=SciT(j=1n(aij+bi)Tiuij=1naijTjujbiul+j=1naij(didj)+bidi+c1iγ1|Eci|γ11(j=1naij(x2ix2j)++bi(x2ixl2))+c2isig(Eci)γ2)SciT(j=1n(aij+bi)Tiuij=1naijTjujbiul+ρ^i+c1iγ1|Eci|γ11(j=1naij(x2ix2j)+bi(x2ixl2))+c2isig(Eci)γ2)+ρ˜iT(SciT1ηiρ^˙i).(32) 

식 (29), (30)를 식 (32)에 대입하면

V˙ci=c3iSciTScic4iSciTsig(Sci)γ4cc5iSciTSci|Sci|+κi+κiρ^iρ˜iTc3iSci212κiρ˜i2+μiςiVci+μi.(33) 

여기서 μi=κiρi2/2,ςi=min(2c3i,κi/2)eςit 를 식 (33)에 곱하면 다음과 같이 표현된다.

ddt(Vcieςit)μieςit.(34) 

식 (34)를 [0, t]에서 적분하면M35

0Vci(Vci(0)μiςi)eςit+μiςiVci(0)+μiςi.(35) 

따라서 리아프노프 안정도 이론에 의해서 폐루프 시 스템의 모든 신호들은 반 전역적으로 균일하게 한정 (semi-globally uniformly bounded)하게 된다.

보조정리 1. 유한시간 안정도에 대한 정의[15]로부터 수 렴 유한시간 유도를 위한 확장된 리아프노프 확장 부등 식은 다음과 같이 표현된다.

V˙i(Si)Λ1iVi(Si)Λ2iViχ/2(Si),

여기서 Λi>0,i=1,2,  0<χ/2<1. 이 때 Vi(t) 는 평형점으 로 유한시간 tfi 안에 수렴한다.

tfi1Λ1i(1χ/2)lnΛ1iVi1χ/2(Si(0))+Λ2iΛ2i.

정리 2. 다중 WMR 시스템이 방향성 확장트리를 갖는 다고 가정한다. 제어입력 식 (29), 적응법칙 식 (30)과 함께 리아프노프 함수를 다음과 같이 정의한다.

Vc=i=1nVci.(36) 

식 (36)의 미분은 다음을 만족한다.M37M38

V˙cΛ1VcΛ2Vcχ/2,  ifρ=ρ^,(37) 

V˙cΛ1VcΛ2Vcχ/2+μ,  ifρρ^,(38) 

여기서 μ=max[μ1,,μn]. 그러면 선도-추종 WMR의 일 치제어에 대한 안정도가 보장되고 일치제어 목적은 유 한 시간 안에 달성된다.

증명:

  • i)  식 (33)에서 ρ=ρ^ 이면 다음을 얻을 수 있다.M39
    V˙cc3minVcc4minVcχ/2,(39) 

    여기서 c3min=min[c31,,c3n],  c4min=min[2χc41,,2χc4n],χ=γ4+1+1. 따라서 모든 초기 조건으로부터 유한 시간 내에 평형점 Sc = 0 에 도달한다. 보조정리 1로부터 Sc(t) (Ec (t)) 는 다음으로 주어지는 유한 시간 tfi 내에 0으로 수렴한다.M40
    tfi=1c3min(1χ/2)ln(c3minc4minVi1χ/2(Sci(0))+1),  i=1,,n,(40) 
  • ii)  만일 ˆ ρ ≠ ρ 이면, 리아프노프 함수는
M41

Vc=i=1nVci=i=1n(12SciTSci+12ηiρ˜iTρ˜i),(41) 

로 정의되고 성질 a1p+a2p=(a12)p/2+(a22)p/2+(a22)p/2(a12+a22)p/2 를 이용하면

V˙cic3iSci2c4iSciγ4+112κiρ˜i2+μic3iSci2c3iηiρ˜i2c4iSciχc4iηiχρ˜iχ12κiρ˜i2+c4iηiχρ˜iχ+c3iηiχρ˜i2+μi2c3i(12Sci2+12ηiρ˜i2)2χc4i(12Sci2+12ηiρ˜i2)χ/2+μi=Λ1iVciΛ2iVciχ/2+μi,(42) 

여기서 Λ1i=2c3i,  Λ2i=2χc4i,  μi=c4iηiχρ˜iχ+c3iηiρ˜i2+μi. 식 (42)는 다음과 같이 두가지 형태로 쓸 수 있다:

V˙ci(Λ1iμiVci)VciΛ2iVciχ/2,(43) 

V˙ciΛ1iVci(Λ2iμiVciχ/2)Vciχ/2.(44) 

식 (43), (44)에서 만일 Λ1iΛ2iΛ1i>μi/Vci,Λ2i>μi/Vciχ/2 가 되도록 선정하면 다음을 얻는다.M45M46

V˙ciΔ1iVciΛ2iVciχ/2,(45) 

V˙ciΛ1iVciΔ2iVciχ/2,(46) 

여기서 Δ1i=Λ1iμi/Vci>0,  Δ2i=Λ2iμi/Vciχ/2>0.

따라서 보조정리 1로부터 Sc(t) 는 유한 시간지표 tfi=min[tf1i,tf2i] 이내에 0으로 수렴한다. 이것은 또한 Ec 가 0으로 유한 시간 tfi=min[tf1i,tf2i] 내에 수렴함을 의미한다. 여기서

tf1i=1Δ1i(1χ/2)ln(Δ1iΛ2iVci1χ/2(0)+1),i=1,,n,tf2i=1Λ1i(1χ/2)ln(Λ1iΔ2iVci1χ/2(0)+1),i=1,,n.(47) 

식 (29)의 제어기를 다중 WMR 시스템에 확대 적용한 행렬형태로 표현하면 다음과 같다.

Uc=[((D¯+¯)T)I2]1[C1γ1{|((¯+¯)I2)X1((¯1n)I2)Xl)|γ11}{((¯+¯)I2)X2((¯1n)I2)Xl2)}C2|((¯+¯)I2)X1(¯1n)I2)Xl|γ2sign{((¯+¯)I2)X1(¯1nI2)Xl}{C3Sc+C4sig(Sc)γ4+C5Sc|Sc|+κ}I2(a¯I2)TUc+((B¯1n)I2)Ul],(48) 

여기서 Uc=[u1T,,unT]TR2n, T=diag(T1,,Tn), Cj=diag(cj1,,cjn), j=1,,5,Sc=[Sc1,,Scn]T.

식 (48)에서 다음을 얻을 수 있다.

[(( D¯+ B¯)T) I2]Uc( a¯ I2)TUc=[((L¯+ B¯)T) I2]Uc=[C1γ1{|((L¯+ B¯) I2)X1(( B¯ 1n) I2)Xl)|γ11{((L¯+ B¯) I2)X2(( B¯ 1n) I2)Xl2)}C2|((L¯+ B¯) I2)X1( B¯1n I2)Xl|γ2sign{((L¯+ B¯) I2)X1( B¯1n I2)Xl}{C3Sc+C4sig(Sc)γ4+C5Sc|Sc|+κ} I2+(( B¯1n) I2)Ul].(49) 

식 (49)에서 최종적으로 일치제어기는 다음과 같이 주 어진다.M50

Uc=[((¯+¯)T)I2]1[C1γ1{|((¯+¯)I2)X1((¯1n)I2)Xl)|γ11{((¯+¯)I2)X2((¯1n)I2)Xl2)}C2|((¯+¯)I2)X1(¯1nI2)Xl|γ2sign{((¯+¯)I2)X1(¯1nI2)Xl}{C3Sc+C4sig(Sc)γ4+C5Sc|Sc|+κ}I2+((¯1n)I2)Ul].(50) 

대형제어기는 유사하게 다음과 같이 얻을 수 있다.

Uf=[((¯+¯)T)I2]1[C1γ1{|((¯+¯)I2)X1+Λf)((¯1n)I2)Xl+Λl))|γ11{((¯+¯)I2)X2((¯1n)I2)Xl2)}C2|((¯+¯)I2)(X1+Λf)(¯1nI2)Xl|γ2sign{((¯+¯)I2)X1(¯1nI2)(Xl+Λl)}{C3Sc+C4sig(Sc)γ4+C5Sc|Sc|+κ}I2+((¯1n)I2)Ul].(51) 


4. 시뮬레이션 결과

제안한 제어시스템의 성능을 검증하기 위한 다중 WMR 시스템은 1대의 선도 WMR과 4대의 추종 WMR 로 구성되는 topology를 구성하였다. 각 WMR의 파라미 터는 다음과 같다: mi = 7.8kg, Ii = 0.164kgm2, Li = 0.2m, Ri = 0.145m, ri = 0.075m. 통신 topology는 다음과 같은 행렬로 표현된다.

a¯=[0111001001000000],L¯[3111011001100000],b=[0011],  L¯+B¯=[3111011001200001].

대형제어는 일치제어의 일반 형태이므로 본 연구에서 는 대형제어만 수행하기로 하고 선도 WMR의 주어진 위치에 대해 원하는 각 추종 WMR의 대형패턴은 다음과 같이 선정하였다: ef1x=(x11+1x212)+(x11+1x313)+(x11+1x412),ef2x=(x21+2x313),ef3x=(x31+3x212)+(x31+3xlx),ef4x=(x41+2xl),ef1y=(y11+0.5y21+0.5)+(y11+0.5y310.5)+(y11+0.5y411.5)ef2y=(y210.5y310.5),ef3y=(y310.5y21+0.5)+(y31+0.5xly),efyx=(y4+1.5xly). 각 추종 WMR의 초기 위치는 [0, 0.5], [0,1.2], [0,-1.5], [0, -0.5] (m)로 주어진다. 초기 위치가 [0,0]인 선도 WMR에서 발생하는 대형 위치 명령 은 xlx=0.5t(m),xly=0.25t(m) 이다. 제어기 게인 파라미터 는 다음과 같이 선정하였다: c1i=5,c2i=1,c3ix=2,c3iy=1,c4ix=0.5,c4iy=0.25, c5ix=2,c5iy=2,γi=0.51,ηi=1,ηi=0.01,κi=0.01 for i=1,,4. 제어기 게인 선정 시 c3i,c4i,γi 는 위상평면에서 임의의 초기위치에서 슬라이 딩면으로의 수렴성능에 관여하고 c5i 는 외란에 대한 강 인성에 관여하며 κi는 스위칭 성능을 결정한다. κi가 0 인 경우 스위칭함수는 sign 함수가 되어 채터링이 심해 지고, 반대로 κi가 커지면 스위칭 성능이 떨어진다. 추가 적으로 제어기 성능 비교를 위해 기존의 슬라이딩 모드 제어기를 설계하였다. 이 경우 슬라이딩면은 식 (25)에 서 적분항을 삭제하고 식 (51)의 제어기에서 γi = 1 로 선 정하면 Table 2에 제시 설계할 수 있다. 대형제어 시뮬레 이션 결과는 Fig. 2에 제시되어 있다. Fig. 2(a)는 선도 WMR의 움직임에 대해 일정한 패턴을 형성하면서 각 추종 WMR들이 이동한 경로를 보여주고 있다. 선도 WMR의 x, y 방향 명령에 대한 추종 오차는 Fig. 2(b)-(e) 에 제시되어 있으며 제안한 FSMC가 기존의 SMC 시스 템보다 오버슈트가 크게 감소하고 빠른 오차 수렴 성능 을 보여주고 있으며 되어 있듯이 전체 시간에 대한 제곱 근 평균오차(root mean square: RMS)도 상당히 감소하 고 있음을 알 수 있다.

Fig. 2

Simulation results for the SMC and FSMC system. (a) The formation tracking output of the FSMC system. (b) Formation tracking error of x-direction of the SMC system. (c) Formation tracking error of x-direction of the FSMC system. (d) Formation tracking error of y-direction of the SMC system. (e) Formation tracking error of y-direction of the FSMC system. (f) Control input torque of x-direction of the FSMC system. (g) Control input torque of y-direction of the FSMC system.

제안한 기법을 실제 실험적으로 구현하기 위해서는 각 WMR의 정확한 위치정보를 필요로 한다. 실외의 경 우 GPS와 IMU 센서를 이용하지만 위치 인식 오차가 커질 수 있으며 실내의 경우 beacon를 이용하거나 비전 카메라를 천정에 장착하여 위치 인식을 하지만 장소가 한정된다. 따라서 무인자동차에 주행에 사용되는 ridar 센서를 적용하거나 또는 실내의 경우 kinect 카메라 센서 를 이용한 SLAM 기법을 통해 위치인식을 하는 연구가 지속적으로 필요하다.


5. 결 론

본 연구에서는 다중 WMR 에이전트에 대한 기구학 및 동역학 특성을 결합한 WMR 시스템에 대한 모델링을 수행하고 일치, 대형 제어 성능 향상을 위해 적분형 유한 시간 슬라이딩 면을 만들고 다중 WMR 시스템의 일치, 대형제어를 위한 제어기를 설계하였다. 불확실성에 대 한 적응규칙과 이를 고려한 유한 수렴 시간 지표를 확장 된 리아프노프 함수를 고려하여 유도하였다. 제안된 제 어기는 분포 네트워크 WMR 시스템의 일치, 대형제어성 능을 향상시킬 수 있음 1-선도, 4-추종 로봇시스템에 대 한 대형제어 시뮬레이션을 통해 검증하였다. 추후 이러 한 연구를 WMR 네트워크에 대한 실험을 통해 구현할 예정이다.

Acknowledgments

This work was supported by the National Research Foundation of Korea (NRF) grant funded by the Korea government (MSIP) (NRF-2015R1A2A 2A01004457).

References

  • Ren, W., Beard, R.W., Distributed consensus in multi-vehicle cooperative control, London, Springer-Verlag, (2008). [https://doi.org/10.1007/978-1-84800-015-5]
  • Defoort, M., Floquet, T., Kokosy, A., Perruquetti, W., Sliding-mode formation control for cooperative autonomous mobile robots, IEEE Trans. Ind. Electron, (2008), 55(11), p3944-3953. [https://doi.org/10.1109/tie.2008.2002717]
  • Mirkin, B., Gutman, P., Shtessel, Y., Asymptotic sliding mode control approach to adaptive distributedtracking problem for multi-agent nonlinear delayed systems, Int. J. Control, (2012), 86(11), p1671-1682. [https://doi.org/10.1080/00207179.2012.696703]
  • Khoo, S., Xie, L., Man, Z., Robust finite-time consensus tracking algorithm for multirobot systems, IEEE/ASME Trans. Mechatron, (2009), 14(2), p219-228. [https://doi.org/10.1109/TMECH.2009.2014057]
  • Zhang, Y., Yang, Y., Zhao, Y., Wen, G., Distributed finite-time tracking control for nonlinear multi-agent systems subject to external disturbances, Int. J. Control, (2013), 86(1), p29-40. [https://doi.org/10.1080/00207179.2012.717722]
  • Zhang, W., Wang, Z., Guo, Y., Backstepping-based synchronization of uncertain networked Lagrangian system, Int. J. Syst. Sci, (2014), 45(2), p145-158. [https://doi.org/10.1080/00207721.2012.669869]
  • Ghommam, J., Saad, M., Backstepping-based cooperative and adaptive tracking control design for a group of underactuated AUVs in horizontal plan, Int. J. Control, (2014), 87(5), p1076-1093. [https://doi.org/10.1080/00207179.2013.868605]
  • Zhao, D., Zou, T., Li, S., Zhu, Q., Adaptive backstepping sliding mode control for leader-follower multi-agent control, IET Control Theory Appl, (2012), 6(8), p1109-1117. [https://doi.org/10.1049/iet-cta.2011.0001]
  • Yoo, S.J., Distributed adaptive consensus tracking of a class of networked non-linear systems with parametricuncertainties, IET Control Theory Appl, (2013), 7(7), p1049-1057. [https://doi.org/10.1049/iet-cta.2012.0619]
  • Yoo, S.J., Distributed adaptive containment control of uncertain nonlinear multi-agent systems in strict-feedback form, Automatica, (2013), 49(7), p2145-2153. [https://doi.org/10.1016/j.automatica.2013.03.007]
  • Ren, W., Sorensen, N., Distributed coordination architecture for multi-robot formation control, Roboticand Auto. Systems, (2008), 56, p324-333. [https://doi.org/10.1016/j.robot.2007.08.005]
  • Dong, W., “Flocking of multiple mobile robots based on backstepping,” IEEE Trans, Systems, Man, and Cyber.-Part B: Cyber, (2011), 41(2), p414-424. [https://doi.org/10.1109/TSMCB.2010.2056917]
  • Peng, Z., Wen, G., Rahmani, A., Yu, Y., Distributed consensus-based formation control for multiplenonholonomic robots with a specified reference trajectory, Int. J. Syst. Sci, (2013), 46(8), p1447-1457. [https://doi.org/]
  • Sabattini, L., Chopra, N., Secchi, C., Decentralized connectivity maintenance for cooperative control of mobile robotic systems, Int. J. Robot. Res, (2013), 32(12), p1411-1423. [https://doi.org/10.1177/0278364913499085]
  • Yu, S., Yu, X., Shirinzadeh, B., Man, Z., Continuous finite-time control for robotic manipulators withterminal sliding mode, Automatica, (2005), 41, p1957-1964. [https://doi.org/10.1016/j.automatica.2005.07.001]
박 동 주

2016 인제대학교 전자지능로봇공학과 전공 학사 졸업

2016~현재 부산대학교 전기전자컴퓨터 공 학과 석사 과정

관심분야: 지능로봇제어, 딥 러닝, Microprocessor 응용

문 정 환

2016 창원대학교 메카트로닉스 제어계측공 학 전공 학사 졸업

2017~현재 부산대학교 전기전자컴퓨터 공 학과 석사 과정

관심분야: 지능로봇제어, 딥 러닝, Localization

한 성 익

1995 부산대학교 기계설계공학과 공학박사

1995~2009 순천제일대학교 교수

2010~2016 부산대학교 전자공학과

2017~현재 부산대학교 기계공학과

관심분야: 비선형제어, 다중로봇제어, 퍼지-뉴럴네트워크, 딥러닝 로 봇지능 제어

Fig. 1

Fig. 1
Nonholonomic differentially driven WMR

Fig. 2

Fig. 2
Simulation results for the SMC and FSMC system. (a) The formation tracking output of the FSMC system. (b) Formation tracking error of x-direction of the SMC system. (c) Formation tracking error of x-direction of the FSMC system. (d) Formation tracking error of y-direction of the SMC system. (e) Formation tracking error of y-direction of the FSMC system. (f) Control input torque of x-direction of the FSMC system. (g) Control input torque of y-direction of the FSMC system.

Table 1

Nomenclature

Symbol Meaning Symbol Meaning
G graph h heading position of WMR
V vertex Kronecker delta
E edge Sc sliding surface variable vector
a adjacency matrix M(q) inertia matrix
D degree matrix B(q) input matrix
L Laplacian matrix λ Lagrange multiplier
B gain matrix τ input torque vector
J (θ) Jacobian matrix τd disturbance vector

Table 2

RMS tracking error

SMC FSMC
x-direction 0.0026 m (100%) 0.0023 m (88%)
y-direction 0.0024 m (100%) 0.0017 m (74%)