TinyML는 지속가능한가?
Shvetank Prakash(하버드대학교 John A. Paulson School of Engineering and Applied Sciences 박사과정 학생), Matthew Stewart(하버드대학교 박사후 연구원), Colby Banbury, Mark Mazumder (하버드대학교 John A. Paulson School of Engineering and Applied Sciences 박사과정 학생), Pete Warden(Useful Sensors사 CEO 겸 스탠포드대학교 박사과정 학생), Brian Plancher(컬럼비아대학교 Barnard 대학 전산학과 조교수), Vijay Janapa Reddi(하버드대학교 Engineering and Applied Science학과 부교수)
번역: 강성원(KAIST)
[옮긴이의 말] 이 글은 Communications of the ACM의 2023년 11월 호(Vol. 66 No. 11)에 실린 논문 “TinyML는 지속가능한가?”의 전반부를 우리말로 옮긴 것이다. 기계학습을 사용하는 인공지능 기술이 세상을 크게 바꾸고 있는 가운데 거대언어모델(LLM) 같은 기계학습 모델은 훈련비용이 작게는 100만달러에서 많게는 1억 달러가 소요될 정도로 많은 비용과 전력을 소모시키며 동시에 많은 이산화탄소를 발생시키고 있다. 이 논문은 하버드 대학교와 스탠포드 대학교의 박사과정 학생들이 중심이 되어 작성한 논문으로 최신 인공지능 기술의 혜택을 누리는 동시에 지구환경보존에 기여할 수 있는 기술로서 TinyML의 이용 현황과 잠재력을 소개한다. 이 논문은 TinyML을 활용한 MCU들이 대규모로 배포될 경우 이로 인해 새로운 환경 문제가 발생할 수 있지만, TinyML을 활용하여 기존의 환경 문제들을 해결하여 얻는 이점이 TinyML의 도입으로 인한 단점보다 더 클 것으로 기대한다. 다만 개별 MCU의 탄소 배출량은 적을지라도 전 세계에 배포될 MCU의 수는 적지 않기 때문에, 지속가능한 TinyML의 적용을 위한 노력이 필요하다고 말한다.
탄소 배출량과 지구 환경에 해로운 글로벌 폐기물이 지속적으로 늘어남에 따라, 환경에 심각한 우려가 제기되고 있고 지속가능한 미래에 대한 요구는 더 커지고 있다. 이에 대한 응답으로 유엔(UN)은 2030년 “지속가능한 개발을 위한 공동 프레임워크”를 만들었다. 이는 인류와 지구의 평화와 번영을 목표로 하고 있으며, 그 핵심으로 17개의 지속가능한 발전 목표(Sustainable Development Goals: SDG)들을 제시한다. SDG는 모든 국가가 환경적으로, 경제적으로, 사회적으로 더 지속가능한 미래를 만들기 위한 노력을 하도록 독려하는 행동요구이다.
극소형 기계학습(Tiny Machine Learning)을 뜻하는 TinyML은 마이크로컨트롤러(MCU) 장치 안에서 기계학습을 가능하게 한다. 따라서 특히 환경 지속가능성과 관련된 다양한 유엔의 지속가능한 발전 목표에 대한 해결책을 줄 수 있는 큰 잠재력을 갖고 있다. TinyML의 운영상의 이점으로 종종 지속가능성이 강조되고 있지만, 순 탄소 감소를 보장하기 위해서는 어플리케이션과 하드웨어의 전체 수명 주기를 고려해야 한다. 본 논문은 TinyML의 지속가능성 이점을 보여주는 몇몇 사례를 보이고, 생명주기 분석(Life Cycle Analysis)을 통해 MCU 및 시스템 수준에서 TinyML의 환경 영향을 검토하며, 지속가능한 TinyML을 위한 향후 연구 방향을 제시한다.
TinyML에서는 기계학습 알고리즘을 저비용, 저전력의 제한된 자원의 마이크로컨트롤러(MCU) 시스템에 배치한다. TinyML은 인공 신경망 모델을 플래시와 같은 메모리에 저장하고 기기 내 센서 데이터로부터 추론을 실행하여 그 결과를 출력한다. 보통 클라우드와의 통신을 통해 데이터를 전송한 뒤 외부에서 처리하는 기존의 사물인터넷(IoT) 접근 방식과 달리 이 방식은 장치 안에서의 지능적 센서데이터 분석을 수행한다. 중요한 점은 TinyML이 전통적인 기계학습 시스템에 필요한 계산 리소스의 양에 비해 극히 적은 양만을 사용함으로써 같은 목표를 달성한다는 것이다. 표 1은 TinyML과 (클라우드 및 모바일 시스템과 같은) 전통적인 BigML을 비교한다. 표 1은 TinyML이 계산, 메모리, 저장소, 전력, 비용 등에서 훨씬 적은 리소스를 필요로 한다는 것을 보여준다. MCU 장치의 이질성과 제한된 자원은 장치 내 훈련, 모델 업데이트 및 배포에 대한 새로운 도전을 제기하지만, 최근의 연구 및 Microcontrollers를 위한 TensorFlow Lite와 같은 기계학습 프레임워크의 개발로 TinyML을 이용하기는 한결 용이해졌다.
표 1. 클라우드와 모바일 기계학습 시스템과 TinyML의 비교. TinyML 시스템의 풋프린트(footprint)가 훨씬 작다.
플랫폼 | 속도 | 메모리 | 저장 용량 | 전력소모 | 가격 | 탄소 배출량 |
클라우드 | GHz | 10+GB | TBs-PBs | ~1 kW | $1000이상 | 수백 킬로그램 |
모바일 | GHz | Few GB | GBs | ~1 W | $100이상 | 수십 킬로그램 |
TinyML | MHz | KBs | 수 MB | ~1 mW | $10 | 수 킬로그램 |
MCU의 보편성, 저렴한 가격, 작은 전력 소모는 TinyML이 인터넷 연결이 없어도 동작한다는 특징과 결합되어, 규모에 상관없이 전 세계 어디서든 기계학습모델을 배포할 수 있도록 한다. 이러한 이유로, 대역폭, 지연, 에너지 소비, 신뢰성 및 개인 정보 보호와 관련된 우려도 있지만, 내장된 단말 디바이스에서 직접 기계학습을 실행하는 TinyML의 방식이 인기를 끌고 있다.
현재 전 세계에 2500억 개 이상의 MCU가 배치되어 있는데, MCU의 단위 가격이 0.50달러 미만으로 떨어질 것으로 예상된다. 그로 인해 향후 10년 동안 매년 400억 개의 MCU가 판매되어 이 수치는 더 커질 것이다. 따라서 TinyML은 점점 더 보편적인 기술이 될 것으로 예상된다. 그러나 TinyML를 탑재한 디바이스의 수명이 다하며 ‘쓰레기의 인터넷(Internet of Trash)’을 만들 위험이 있는지도 생각해 보아야 한다.
지속가능성을 높이는 TinyML의 적용들
MCU에서의 기계학습이 환경에 주는 영향을 공정하게 평가하기 위해 우리는 먼저 TinyML의 이점을 고려해 보았다. 일반적으로 TinyML은 소비자를 대상으로 한 키워드 감지, 이미지 분류 및 이상 감지와 같은 기능에 주로 이용되었다. 그러나 미래를 더 지속 가능하게 하는 데 이용될 수 있는 많은 다른 TinyML의 응용 프로그램도 있다. 지금부터 환경 관련 중요한 지속가능 발전 목표(SDGs)에 TinyML이 도움이 되는 새로운 응용 프로그램들을 조명한다.
TinyML는 전 세계적으로 농업의 지속가능성 향상, 야생 동물 보호 지원, 그리고 기후 변화와 그 영향과 싸우는데 적합하다.
기아 인구 제로와 건강과 복지 (SDG #2와 #3).
굶주림을 종식시키고, 식량 안보 및 영양 개선 달성하고, 지속가능한 농업 촉진, 그리고 모든 연령에서의 복지 증진을 통한 건강한 생활을 보장해야 한다.
기계학습 응용 프로그램은 데이터 기반 방법을 통해 농업 생산을 증가시킬 수 있다. 예를 들어, PlantVillage 프로젝트의 Nuru는 휴대전화 및 클라우드 기반 기계학습 앱으로, 식물 질병을 감지하는 데 있어 인간보다 정확하며 개별 농민의 수익을 55% 증가시키고 수확량을 146% 증가시키는 데 기여했다. 또한, 기계학습은 소량의 농약을 사용하는 정밀 농업을 가능케 하는 작은 드론과 같은 자율 장치에도 활용되었다. 이들 드론은 농약 사용을 기존의 블랭킷 스프레이의 0.1%로 줄일 수 있다. 또 다른 예로는, 연구자들이 돼지의 호흡 문제 발생을 감지하기 위해 동물 우리 위에 마이크로폰을 배치하여 표준 방법보다 12일 더 빨리 농부에게 경고하는 기침 감지 시스템을 개발했다.
TinyML는 이러한 시스템들이 주는 영향을 증가시킬 수 있는 잠재력을 가지고 있다. 첫째, 저전력 및 저연결성 운영을 통해 이와 많은 다른 응용 프로그램이 원격 지역에서 사용될 수 있도록 할 수 있다. 둘째, 이는 이러한 스마트 센서들의 확장 배치를 가능하게 하여 더 정확한 정보를 제공할 수 있다(예: 기침 감지 시스템의 경우 실시간으로 모든 개별 돼지에 대한 정보). 가장 중요한 것은 비용을 줄임으로써 이러한 기술에 대한 전 세계적인 접근성을 증가시킬 것이다. Sparrow와 Howard가 언급한 것처럼, 기기들이 “작은 농장에서도 사용 가능할 수 있게 충분히 저렴하게 제조되고 판매될 수” 있는 경우에만 전 세계적으로 수용될 것이다.
TinyML는 우리의 건강과 복지를 지원하는 데도 이용될 수 있다. 유엔의 지속가능 발전 목표(SDG) 보고서에 언급된 질병 중 하나는 말라리아로, 이 질병은 전세계에 엄청난 규모로 피해를 준다. 실제로 세계 인구의 거의 절반이 모기로 인해 사망한 역사도 있다. 열악한 자금 사정과 의료 설비로 인해 2019년에는 아프리카에서 모든 말라리아 발병과 사망의 94%가 발생했다. TinyML 개발 플랫폼인 Edge Impulse를 사용하여 날개 진동 소리 분류를 통해 치명적인 모기를 88.3%의 정확성으로 식별하는 시스템이 프로토타입으로 제작되었다. 이러한 시스템이 전 세계에 보급되면 큰 영향을 끼칠 수 있고, 이는 많은 사람들의 목숨을 구할 수 있는 TinyML의 잠재력을 보여주는 또 다른 예이다.
육지와 해저의 생명체(SDG #14와 #15).
육지와 수상 생태계를 보호, 회복, 보존하고 지속가능한 방식으로 이용할 수 있게 하며, 또한 숲과 해양 자원을 지속가능하게 관리하고 사막화와 생물다양성의 감소를 막아야 한다.
TinyML는 분산 센싱 네트워크에 의존하는 보전 노력의 효율성을 향상시킴으로써 지구의 생물 다양성을 보존하는 데 도움을 줄 수 있다. 아시아와 아프리카에서의 인간-코끼리 충돌을 해소하는 것이 그 한 예이다. RESOLVE의 Wild-Eyes 인공지능 카메라는 비디오 스트림 전체를 클라우드로 전송하는 대신 코끼리 감지의 알림만을 전송함으로써 리튬이온 배터리 하나로 1.5년 이상 작동한다. 최신 인공지능 기술은 또한 말라위의 리워드 국립 공원에서 밀렵을 방지하는 데 사용되었으며, 2019년 9월까지 30개월 동안 동물들이 밀렵 당하지 않았다. 이와 유사한 시스템이 붐비는 수로에서 고래와의 충돌을 방지하는 데 사용되고 있다. 예를 들어, Google은 Vancouver Bay의 선박에 경보를 울리기 위해 수중 마이크로폰인 하이드로폰에 TinyML 모델을 배치했다.
낮은 계산 요구 사항으로 인해, TinyML 응용 프로그램을 위한 재활용된 전자 장치뿐 아니라 (버려진 것으로부터 새것을 만드는 것을 뜻하는) 새활용(upcycling)된 전자 장치에 대한 기회도 존재한다. Rainforest Connection(RFCx)는 재활용된 스마트폰을 사용하여 장거리에서 산림 벌채를 정확하게 포착하기 위한 태양 전원 리스닝 장치를 개발하고 있다. 이와 유사한 기회는 MCU의 새활용에도 존재한다.
기후 행동(SDG #13)
기후 변화 및 그 영향에 대처하기 위해 긴급한 조치를 취해야 한다.
TinyML을 이용하면, 환경 모니터링 응용 프로그램으로 기후 변화와 그 영향에 대항할 수 있다. 예를 들어, 최근 Ribbit 네트워크는 분산 지능 센서를 통해 세계 최대의 온실 가스 배출 데이터셋을 크라우드소싱하는 노력을 시작했다. 이런 방법으로 값싸고 정확한 배출에 대한 지역 데이터를 얻을 수 있다. 이와 비슷하게, SmartForest 프로젝트에서는 원격 모니터링 시스템을 활용하여 나무의 성장 정보를 제공한다. 이로 인해 이제는 150~160 명의 직원이 정기적으로 현장에 나갈 필요가 없고, 대신 한번의 출장으로 센서를 설치하여 생태계에 미치는 영향을 크게 감소시키는 동시에 데이터 품질을 향상시켰다.
장기적으로 보면 TinyML은 차세대 소형 로봇에 새로운 능력을 부여하여 기후 변화가 지구에 미치는 충격을 줄이는 데 도움을 줄 수 있다. 예를 들어, 기후 변화는 꿀벌과 같은 꽃가루를 나르는 필수 수분자들의 수를 크게 감소시켜 전 세계적인 식량 공급을 위협한다(앞에서 언급한 SDG #2). TinyML를 이용하면 Robobee 와 같은 소형 로봇에 지능을 제공하여 인공 수분자로 이용할 수 있다. 그러나 소형 로봇의 학습 기술을 확보하기 위해서는 많은 개발과 도전이 필요하다.
마지막으로 건축 부문은 현재 큰 관심을 받고 있는 분야이다. 기존의 시스템들도 조명, 자동 창 셰이딩 그리고 사람이 있는 지를 탐지하는 점유 센서 및 조도 센서를 기반으로 하는 HVAC(Heating, Ventilation, and Air Conditioning)을 사용하여 건물 에너지 사용량을 20%~40% 줄이고 있다. 이러한 시스템들에 기계학습 기능을 추가하면 효율성이 더욱 향상될 것이다. 이렇게 효율성을 높이는 것이 중요한 이유는, 에너지 생산 및 주거용과 상업용 에너지 사용이 전 세계 온실 가스 배출의 큰 부분을 차지하기 때문이다.