모델 학습과 마음의 수렴: Loss Spike를 마주하는 법

인공지능을 만드는 엔지니어로서, 나는 모델의 파라미터 수만큼이나 많은 난관에 부딪히곤 한다. 그럴 때마다 내가 해법을 찾는 곳은 의외로 공학 교과서가 아닌 심리학이나 인문학의 영역이다. 복잡한 시스템이 문제를 해결하는 원리는 결국 하나로 통하기 마련이고, 특히 인간의 뇌를 모사한 언어모델은 인간의 마음이 겪는 증상과 놀라울 정도로 닮아 있기 때문이다.

1. Loss(손실)라는 이름의 간극

언어모델 학습은 본질적으로 ‘모방’의 과정이다. 모델이 기존에 학습한 데이터를 바탕으로 다음 문장을 ‘상상(예측)’해보고, 실제 데이터와 비교하여 그 차이를 계산한다. 이 차이를 우리는 ‘Loss(손실)’이라고 부른다. 학습은 이 손실을 점차 줄여 나가는 과정이다.

우리의 예측이 실제와 달랐을 때 발생하는 잠재적인 손해를 지칭하는 이 용어는, 우리가 삶에서 느끼는 ‘기대와 현실의 괴리’와 무척 닮아 있다. 아주 조금 다르다면 “아, 요만큼만 고치면 되겠구나” 하며 성장의 발판으로 삼지만, 감당할 수 없을 만큼 큰 차이를 마주하면 시스템은 비명을 지르기 시작하며, 더 이상 작동할 수 없게 된다.

2. Loss Spike와 마음의 패닉

언어 모델을 학습하다보면 가끔 학습 그래프가 천장을 뚫을 듯 솟구치는 ‘Loss Spike’가 발생한다. 한국어만 배운 모델에게 갑자기 영어를 쏟아붓는 것처럼, 기존의 분포와 완전히 동떨어진 자극이 들어올 때 모델은 갈피를 잡지 못하고 수렴이 아닌 발산을 해버린다.

이 상태가 지속되면 모델은 정교하게 쌓아온 지식마저 잊어버리는 ‘Catastrophic Forgetting(치명적 망각)’ 상태에 빠진다. ‘치명적’이라는 공학 교과서나 논문에서 찾아보기 힘든 이 강력한 감정적 단어는, 우리 인간이 극심한 불안과 우울 속에서 겪는 ‘패닉’과 동일한 메커니즘을 설명한다.

    • 사회 초년생의 낯선 이주
    • 언어가 통하지 않는 곳으로의 홀로 유학
    • 준비되지 않은 상태에서의 단절된 독박 육아

이런 상황들은 우리 인생의 ‘Loss Spike’이다. 이성적 판단은 마비되고, 과거의 경험은 무용지물이 되며, 그저 하루하루 임기응변으로 버티는 상태. 이것이 장기화되면 우리는 ‘우울’이라는 깊은 늪으로 빠져들게 된다.

3. 우리는 어떻게 수렴(Convergence)하는가

다행히 언어모델이나 사람이나, 기본적으로는 평온한 상태(낮은 Loss)로 수렴하도록 설계되어 있다. 일시적인 Spike는 시간이 지나면 다시 우하향 곡선을 그리며 안정화된다. 하지만 문제는 이 ‘비정상적 고통’이 지속될 때이다. 엔지니어로서 내가 Loss Spike에 대처하는 방식은 우리 삶에도 유효한 처방전이 될 수 있다고 생각한다.

첫째, 유해한 자극으로부터의 격리 학습 데이터에 비정상적인 ‘Outlier(이상치)’가 너무 많이 섞여 있다면 과감히 제거한다. 삶에서도 나를 망가뜨리는 환경이나 해석 불가능한 부정적 자극이 지속된다면, 잠시 그 유입을 차단하고 스스로를 보호하는 것이 우선 필요하다. 도저히 ‘악’이 아니면 설명할 수 없는 동료의 행동이나 지구 반대편의 끔찍한 뉴스들은 명백히 유해하다.

둘째, 학습률(Learning Rate) 조정과 루틴의 힘 모델의 변화 폭을 강제로 제한(Gradient Clipping)하듯, 삶의 조급함을 내려놓아야 한다. 우리 모두는 모두 도달하고자 하는 상태가 있다. 언어모델 학습에서 이는 최적점 ‘Optima’라고 한다. 여기 도달하기 위한 경주 속에서 “반드시 해내야 한다”는 압박에서 힘을 빼고, 변하지 않는 일상의 루틴을 지키며 심리적 안정감을 확보하는 것이 필요하다.

셋째, 가장 건강했던 ‘Checkpoint’로의 회귀 내가 가장 중요하게 생각하는 방법이다. 모델 학습이 완전히 망가졌을 때 언젠가는 다시 정상으로 돌아오겠지 하는 기대로 이를 고집스럽게 이어가는 대신, 가장 견고했던 이전의 상태(Checkpoint)로 되돌아가 다시 시작해야 한다. 사람도 마찬가지로, 최근의 성취나 노력이 아까울 수 있겠지만, 마음의 상실감이 높아지기 시작한 그 지점이 어디인지 복기하고 삶을 그곳으로 돌려놓아야 한다. 모델 학습에서 돌아가기에 너무 늦은 때란 없는 것처럼, 우리 인생도 다시 시작하기에 늦은 때란 결코 없기 때문이다.

언어모델을 학습하는 과정은 인간의 학습과 성장 과정과 놀랄만큼 닮아 있다. 그래서 인간의 성장이 아무 복잡한 매커니즘에 의해 이루어지는 것이 아닐 수 있다는 생각이 든다. 이를 관찰하는 과정에서 나는 오히려 나의 마음을 다스리고 성장하는 법을 배운다. 마음 속 Loss 그래프가 요동치고 있다면, 그것은 내 내면의 무엇이 잘못되어서가 아니라 잠시 감당하기 어려운 데이터를 마주했기 때문일지 모른다.

잠시 멈추고, 체크포인트를 확인하고 복기한다. 나는 언제든 다시 시작할 수 있고, 결국 다시 평온한 상태로 수렴할 수 있는 존재로 만들어졌다.

Long Live the office life

대출이 있다보니 돈이 나올 구석을 생각해본다. 문득 나도 회사를 오래 다녔다는 생각이 들어 사내 인트라넷의 퇴직금 계산 페이지를 들어가 보았다. 어느 덧 근속년수에 숫자 16이 찍힌다. 오랜 시간이다. 초등학고, 중학교, 고등학교, 대학교, 대학원을 모두 합친 시간 만큼이다. 채우기 위해 학교를 다녔고 쏟아내기 위해 또 그만큼 회사를 다녔다.

나는 꾸준히 오래하는 것을 잘했다. 초등학교부터 대학원까지 개근이라는 것은 나의 자부심이다. 조퇴는 몇 번 있었지만 결석은 없었다. 몇 차례 학교에 가지 못할 위기가 있었지만 여행, 시상식, 외부 행사 등을 포기하고서라도 꼬박꼬박 나갔다. 회사도 몇 년에 한번 도저히 근무할 수 없는 것처럼 아플때 휴가를 쓴 것 외에는 꾸역꾸역 출근했다. 친구들과 같이 시작한 영어 회화 학원도, 수영 강습도 늘 마지막까지 남아있는 것은 나였다. 40여명의 동기들로 시작한 직장 생활이지만, 아직까지 여기 남아 다니는 것은 한자리 수로 셈할 수 있다. 물론 다른 곳에서 다들 열심히 삶을 살고 있을 것이다.

회사 생활을 오래할 수 있는 것은 무엇이 비결이었을까? 20년, 30년 다닌 분들도 많으니 사실 이 정도야 어느 정도의 근면 성실함만 있으면 가능한건가? 아니면 내가 정말 대단한 사람이라 그런건가? 자리에 앉아 오분 정도 생각해보니 아래 두 가지가 가장 가장 큰 위기이자 비결이라면 비결인 것 같다.

‘추상화된 대상에 감정을 가지지 않기’

큰 목적을 위해 사람이 쌓아올린 조직은 반드시 추상화된 대상물을 만들어 내고 거기에 권위를 부여한다. 회사 내에는 팀, 랩, 부문 등이 존재하지만 실체는 없다. 소속원들에게 어떤 조치나 행동이 취해질때는 권위를 가진 주체 명의로 이루어진다. 친구 두 명이 닭싸움을 하더라도 본격적이 되면 심판이 필요하기 마련이다. 임원이 아닌 직장인은 보통 그 조치나 행동의 대상이 된다. 득이 될때는 잠시 기쁘고 말지만, 해가 될때 내 마음속에 생긴 분노, 좌절은 꽤 긴 시간 마음을 갉아 먹는다. 승진 누락이나 복지 축소, 업무 전환 등은 달가운 일이 아니다.

이럴 때 나는 절대로, 절대로 추상화된 대상물에 감정을 가지지 않는다. 어떻게 회사가 내게 이럴 수 있어라고 생각하지 않는다. 누가 나에게  회사를 사랑하냐고 물으면 이렇게 대답할 것이다. “어떻게 회사나 조직을 사랑할 수 있지요? 물론 회사를 다니는 사람들을 사랑할 순 있습니다.” 내게 있어서 회사는 애정의 대상이 아니다. 비슷하게 어떤 조직, 혹은 팀과의 갈등이 생긴다고 그 조직을 괴물로 여기거나 어떤 팀을 타도해야 할 악으로 여기지 않는다. 반면 그 조직의 최고 의사 결정권자를 미워하거나, 어떤 팀장의 인간성을 의심할 수 있다. 그게 훨씬 편하다. 싸울 수도 있고, 패배하고 인정할 수도 있다. 그가 보이지 않으면 감정도 사라진다.

간혹 회사 상사나 그 보다 더 높은 관리자에게 이런저런 불만 사항을 쏟아내는 직장인이 있다. 문제를 느낀다면 그 문제를 정확하게 이해할 수 있고 해결할 수 있으며, 그럴 책임이 있는 사람에게 가서 조치를 요구해야 한다. (물론 대안도 같이 들고 가야한다.) 해결할 수 없는 사람에게, 들어줄 수 없는 문제를, 감정의 발산을 통해 표현하는 것 만큼 최악이 없다. 최선을 다해 의견을 관철시키려고 노력하고 만약 안된다면 그 책임자의 능력과 자질, 의지를 의심해도 된다. 그것은 내 자유다. 하지만 그러기에 앞서 사람이 아닌 회사나 조직이 문제가 있다고 갈음해서 생각한다면 그건 나를 너무 힘들게 한다. 또 문제를 절대 해결할 수 없는 것으로 만든다.

결국 그 책임자가 조직이고 조직이 곧 책임자라고? 그럴 수 있다. 하지만 그런 동일시는 문제를 너무 어렵게 만든다. 조직이나 추상화된 개체를 움직이는 동력은 정보의 비대칭 때문에 쉽게 알기 어렵고, 무수히 많은 변수들의 결과이며, 단 하나의 솔루션을 만들어내기 어렵다.

‘메시지에서 감정을 읽어내지 않기’

회사는 다양한 커뮤니케이션 채널이 직원들 사이를 가로지른다. 회사 생활을 가끔 전쟁에 비유하는데, 이는 경쟁사, 경쟁 조직과의 싸움을 묘사하기도 하지만, 사내에서 이러한 커뮤니케이션을 오가는 총탄에 비유한 것이라고도 생각한다. 전화, 이메일이나 사내 게시판은 이미 전 세대의 수단이고, 위키 페이지, 슬랙 등 인스턴스 메시징, Teams 나 Zoom  같은 화상회의 솔루션들도 널리 쓰인다. 소프트웨어 개발 조직은  Jira와 같은 업무 관리 도구를 사용하기도 하며 여기에도 수 많은 메시징 기능이 결합되어 있다. 이들 모두는 키보드와 스크린을 매개로 한 의사소통이다. 최근에는 소통이 많아질 수록 역설적으로 조용해지고 키보드 소리만 가득한 사무실이 된다.

나는 정확한 의사소통을 위해서는 만나서, 얼굴을 맞대고 이야기 하는 것이 필요하다고 생각하지만 요즘 같이 유연 근로가 일상화된 시대에 업무의 속도를 따라가려면 꼭 그럴 수는 없다. 정보나 의견의 ‘즉시’ 확인이 필요할 때는 전화번호를 누르거나 슬랙 DM을 보낼 수 밖에 없다. 물론 이는 나의 조급함이지 이메일이나 슬랙 DM을 받은 상대방이 즉시 답장을 보낼 의무는 없다. 꼭 전화를 받을 필요도 없다. 그런 기대는 하지 않으며 직장인으로서의 능력 중 하나라고 생각하지만 개인적인 시간 관리는 각자가 더 효율적인 방안을 찾아야 한다.

중요한 두 번째 원칙은 간절히 기다려서 받은 이메일이나 슬랙 DM에서 사람의 감정을 읽어내지 않아야 한다는 것이다. 답장을 보내는 상대방의 모습을 상상하지 않으려고 한다. 잠시 그런 감정이 떠오를 때는 어떤 상상도 배재한체 무미건조하게 활자 읽기를 수행한다. ‘단답’은 무례함을 의미하지 않는다. ‘무미건조하고 사무적인 답변’은 나에 대한 무시를 의미하지 않는다. ‘빈정대는 것처럼 들리는 것’은 내 머리속의 시뮬레이션일 뿐이다. 그 결과에 따라 이어지는 내 감정들도 역시 근거 없는 상상이라고 생각한다. 그게 진실이든 아니든 상관없다. 100%의 커뮤니케이션을 위해 노력하되, 절대로 나의 상상을 덧붙이지 않는다. 상대방의 선의를 믿고 우리 모두는 직장에서 최선을 다한다 생각해야 한다. 우리 모두는 Code of Ethics를 준수한다.

만약 이 사고선에서 벗어나면 회사는 인간성(Humanity) 없는 공간으로 보일 것이다. 모두의 모두에 대한 투쟁이고 진짜 전쟁터가 된다. 예전 일련의 경영학 수업을 들으면서 느꼈다. 여기에 인간은 어디 있는가? 같은 공간을 두고 누구는 전쟁터로 묘사하지만, 나는 다양한 배려들로 채워진 공동체 공간으로 보고 싶다.

위에서 말한 두 가지 원칙의 공통점은 내 머리 속에서 일어나는 상상과 그에 따른 감정의 회오리에 빠지지 않도록 노력한다는 점이다. 풍차를 향해 돌격하는 돈키호테처럼 내 마음 속의 허상의 대상물을 향한 분노, 미움은 내가 건강한 마음을 가지고 살아가는데 아무런 도움을 주지 않았다. 나도 안다, 16년 동안 때로는 미련하거나 미숙할 정도로 순수하다는 평가를 받았다. 더 터프한 리더를 요구 받는 경우도 있다. 하지만 이는 나를 지키고 나를 목표하는 지향점으로 끌고가기 위한 전략이다. (나는 무엇보다도 내가 감정에 휩쓸리지 않는 더 좋은 사람이 되면, 자연스럽게 더 좋은 모든 역할을 맡을 수 있다고 확신한다.)

세상에 실제로 존재하는 사람, 갈등은 어떻게든 해결되거나 잠잠해지거나 흘러가지만, 내 상상 속의 실체도 없는 대상에 대한 감정은 없어지지 않고, 기회가 있을 때마다 어떤 가당치도 않은 유추와 회상에 의해 되살아난다. 내가 생각하기에 오랜 회사생활을 위한 가장 큰 장애물이 이것이다. 그리고 이것이 회사 생활에만 적용되진 않을 것이라는 생각이 들었다.