더 열심히 고치기 전에 무엇부터 고칠지를 묻는 사람

스탠퍼드의 한 교수가 자신의 책을 통째로 무료로 풀면서, 각 장을 일부러 한두 쪽으로 짧게 잘랐습니다. 이유가 흥미로웠습니다. 팀원에게 한 장씩 출력해서 돌려보라는 것이었습니다. 두꺼운 교과서로 묶어 책장에 꽂아두라는 게 아니라, 회의 들어가기 전 복도에서 1분에 읽고 바로 써먹으라는 설계였습니다. 그 교수가 앤드루 응(Andrew Ng), 전 세계 수백만 명에게 머신러닝을 가르친 사람입니다. 저는 이 책을 AI가 어떻게 똑똑해지는지 알고 싶어서 폈습니다. 그런데 책장을 덮을 때 손에 남은 건 알고리즘이 아니라, 제가 15년간 상담실에서 잘못 써온 시간에 대한 후회였습니다.

솔직히 말씀드리면 저는 오래 헷갈렸습니다. 학원이 안 풀릴 때 무엇부터 손대야 하는지요. 재등록이 떨어지면 상담 멘트를 바꿔야 하나, 교재를 갈아야 하나, 강사를 더 뽑아야 하나, 아니면 그냥 더 열심히 가르치면 되나. 선택지가 다섯 개쯤 떠오르면 결국 제일 손에 익은 것부터 잡았습니다. 그게 정답이라서가 아니라, 안 해보면 불안해서였습니다. 그렇게 한 달을 쓰고도 숫자가 안 움직이면, 다음 달엔 또 다른 걸 손댔습니다. 부지런했지만, 정확히 어디가 새는지는 끝까지 몰랐습니다.

『머신러닝 열망(Machine Learning Yearning)』이 다루는 건 놀랍게도 정확히 이 문제입니다. 앤드루 응은 첫 장에서 고양이 사진을 가려내는 어느 스타트업 이야기를 꺼냅니다. 정확도가 부족할 때 팀 앞에는 갈림길이 한가득입니다. 데이터를 더 모을까, 더 오래 학습시킬까, 신경망을 키울까 줄일까, 구조를 바꿀까. 그는 말합니다. 방향을 잘 고르면 업계 선두를 만들고, 잘못 고르면 몇 달을 통째로 버린다고. 여기서 이 책이 같은 분야의 다른 책들과 갈라집니다. 시중의 머신러닝 교과서가 대부분 "어떤 알고리즘이 더 똑똑한가"를 가르친다면, 이 책은 단 한 가지, **"한정된 시간에 무엇부터 손대야 하는가"**만 가릅니다. 똑똑해지는 법이 아니라, 헛수고를 줄이는 법을 적은 책입니다.

응이 그 자리에 닿은 계기가 책 곳곳에서 비칩니다. 그는 대학 강의가 알고리즘은 가르치면서 "어떤 실험부터 해야 시간을 안 버리나"는 거의 안 가르친다는 데서 출발했다고 밝힙니다. 똑똑한 사람들이 모인 팀이 엉뚱한 방향으로 반년을 쏟는 걸 곁에서 너무 많이 봤다는 겁니다. 그래서 그가 내놓은 도구 중 제가 가장 오래 붙들었던 건, 의외로 가장 단순한 것이었습니다.

오류 분석(error analysis)이라는 도구입니다. 응의 설명은 이렇습니다. 어느 팀원이 "개를 고양이로 잘못 보는 문제를 한 달 걸려 고치겠다"고 합니다. 응은 그 한 달을 쓰기 전에 딱 한 가지를 먼저 하라고 합니다. 틀린 사진 100장을 모아서, 그중 개 사진이 몇 장인지 직접 세어보라는 겁니다. 만약 5장이라면, 개 문제를 완벽히 고쳐도 전체 오류는 5퍼센트밖에 못 줍니다. 정확도가 90퍼센트에서 잘해야 90.5퍼센트가 됩니다. 한 달을 써서 0.5퍼센트입니다. 반대로 50장이라면 90퍼센트가 95퍼센트까지 열립니다. 그가 덧붙인 한 문장이 저를 찔렀습니다. "100장을 1분씩 봐도 두 시간이면 끝난다. 이 두 시간이 한 달 헛수고를 막는다."

저는 이 대목에서 책을 덮고 한참 천장을 봤습니다. 제가 상담실에서 단 한 번도 안 해본 일이었거든요. 재등록이 떨어지면 저는 곧장 "상담을 더 잘하자"로 갔습니다. 그런데 응의 방식대로라면, 먼저 지난달 그만둔 학생 명단을 펴고 사유를 한 줄씩 세어봤어야 합니다. 가짓수를 적어보는 겁니다. 진도가 안 맞아서 몇 명, 이사를 가서 몇 명, 친구 따라 옮겨서 몇 명, 형이 다니던 데로 합쳐서 몇 명. 만약 절반이 이사였다면, 제가 한 달 갈아엎은 상담 멘트는 아무것도 못 막습니다. 그건 제가 손댈 수 있는 천장 바깥의 일이었으니까요. 그동안 저는 셈을 안 한 채 제일 손에 익은 걸 고쳤고, 그게 안 들으면 제 노력이 부족했다고 자책했습니다.

여기서 원장님께 렌즈 하나를 바꿔드리고 싶습니다. 우리는 보통 개선을 "더 잘하는 것"이라고 생각합니다. 그런데 이 책의 눈으로 보면, 개선은 세어보는 것에서 시작합니다. 더 열심히가 아니라, 먼저 어디가 막혔는지를 숫자로 확인하는 일이지요. 그러면 노력이 천장에 부딪히는 헛일과, 천장을 실제로 올리는 일이 갈라집니다. 십수 년 현장에 있으면서 제가 본 진실 하나를 보태면, 가장 성실한 원장님일수록 이 셈을 건너뜁니다. 셈은 답답하고 노력은 시원하거든요. 그래서 부지런한 분들이 오히려 같은 자리에서 오래 헤맵니다.

응의 또 다른 도구 하나만 더 열어두겠습니다. 그는 "데이터를 더 모을까, 모델을 키울까"를 감으로 정하지 말라며, 그 결정을 두 개의 숫자로 가르는 법을 보여줍니다. 학원으로 옮기면 이렇습니다. 우리 반 아이들이 학원 안 모의고사는 잘 보는데 실제 수능에서 무너진다면, 그건 가르친 내용이 부족한 게 아니라 실전 적응이 안 된 겁니다. 반대로 학원 모의고사부터 형편없었다면 진단이 완전히 달라집니다. 같은 "성적이 안 나온다"도 두 숫자를 갈라보면 처방이 정반대로 나옵니다. 무엇을 더 가르칠지가 아니라, 무엇이 막혔는지를 먼저 진단하라는 것. 그 두 숫자의 이름과 계산법은 책에서 직접 확인하시는 게 좋겠습니다. 이 책이 가장 차분하게 공들이는 대목이거든요.

물론 이 책을 모든 원장님께 권하지는 않겠습니다. 분명히 이건 머신러닝 팀을 위해 쓰인 실무서입니다. 고양이 분류기, 음성 인식, 자율주행 같은 예시가 끝까지 이어지니, AI라는 단어에 거부감이 있으시면 비유를 건너 읽어야 하는 수고가 듭니다. 그리고 정직하게 밝히면, 저도 58개 장 전부를 문장 단위로 읽지는 못했습니다. 전략의 뼈대를 세우는 앞쪽 스물두 개 장과 맺음말을 정독했고, 중간의 세부 기법 장들은 주제만 확인했습니다. 그러니 이 글은 두꺼운 매뉴얼의 핵심 골격을 읽고 적은 메모에 가깝습니다. 다만 응이 각 장을 한두 쪽으로 자른 이유가, 다 읽지 않아도 한 장만으로 일하는 눈이 바뀌게 하려는 설계였음을 떠올리면, 이 미완의 독서가 그렇게 부끄럽지만은 않았습니다.

저는 이 책을 덮고 나서, "열심히"라는 단어를 다시 보게 됐습니다. 예전엔 안 풀리면 더 열심히가 답이라고 믿었습니다. 지금은 열심히 앞에 한 단계가 더 있다고 봅니다. 손대기 전에, 틀린 것 100개를 펴놓고 무엇이 몇 개인지 세어보는 두 시간. 똑똑한 답을 아는 사람과 같은 자리를 오래 맴도는 사람을 가르는 건 재능이 아니라 그 두 시간이었습니다. 그러니 이번 주에 학원에서 안 풀리는 일이 하나 있다면, 더 손대기 전에 종이 한 장을 꺼내 가짓수부터 세어보시길 권합니다. 어쩌면 한 달 헛수고를 두 시간으로 막을 수 있을지 모릅니다.

Machine Learning Yearning
Andrew Ng 저
deeplearning.ai · 2018

"고수와 하수를 가르는 건 얼마나 똑똑한 답을 아느냐가 아니라, 손대기 전에 어디가 막혔는지를 세어보느냐였습니다."

함께 읽으면 좋은 글

잘된다는 말과 보증된다는 말은 다릅니다

우리 학원 잘 굴러간다는 그 말이 가장 위험합니다

반 평균 82점이 같다고 두 반이 같은 게 아니었습니다