TensorFlow입문::Coursera의 머신러닝 강좌 수료

 

1. 머신러닝과 인프라

저는 최근에 금융계열 시스템을 운용보수팀에서 약3년간 근무했습니다. 일본의 경우 금융계에서는 범용기를 쓰는 전형적인 온프레미스 환경이 아직 많습니다. 그 현장을 나와서 다음 현장을 찾으며 그동안 못했던 기술에 대한 공부를 집중적으로 하는 중이고, 요즘에 가장 핫한 클라우드에 대한 학습을 가장 먼저 목표로 했습니다. 퍼블릭 클라우드는 나온지 꽤 되었지만 그것이 모든 온프레미스를 대체하고 있냐면 하면 아직은 그렇지가 않다는 느낌입니다. 금융계 같은 대형시스템을 운용하는 곳에서는 온프레미스와 퍼블릭 클라우드를 조합한 하이브리드형으로 운용을 하기 시작하고 있고, 퍼블릭 클라우드로의 완전이행은 아직 시간이 더 걸릴 듯 싶습니다. 대형시스템이 그렇게 빨리 이행할수 있는건 아니니까요. 
어찌됐든, 클라우드를 공부해 가면 AI나 IoT에 필요한 대형로드워크용 아키택쳐에 대해 반드시 공부하게 됩니다. 그리고 현장면담에 나가보면 인프라인데도 머신러닝에 대한 이해가 있는 사람을 찾고 있다, 혹은 앞으로 찾을것이다 하는 이야기를 듣게 됩니다. 이러한 경험을 하면서 저는 이 두가지를 떨어뜨려 놓고 생각할 수 없는 것이라 판단하였습니다. 아직은 제가 인프라도 데이터 사이언스에 대한 이해가 많이 부족한 편이지만,  이 두가지의 공부를 같이 해나가는 것이 장래적으로 유효할 것으로 생각되었습니다.

2. TensorFlow

인프라는 퍼블릭 클라우드를 통해 공부하기로 하고 머신러닝에 대해서는 TensorFlow를 해야겠다 생각했습니다. 제가 처음 공부한 프로그래밍언어가 Python인것이 크게 작용했는데, Python을 하면 으레 데이터 사이언스와 만나게됩니다. 처음에는 Python으로 웹크롤링이나 웹파싱등을 하고싶었을 뿐이었는데 Python에 대한 자격증등을 찾는 과정에서 데이터분석에 대한 공부를 하게 되었습니다. 일본에서 Python 자격인증을 시행하고 있는 곳은 Pythonエンジニア育成推進協会 뿐입니다. 이 곳에서 Python 3 エンジニア認定基礎試験, Python 3 エンジニア認定データ分析試験 이 2개의 자격시험을 시행하고 있고 작년에 땄습니다. Python 3 エンジニア認定基礎試験은 Python의 기본문법을 묻는 시험이고, Python 3 エンジニア認定データ分析試験에서는 간단한 수학, Numpy, Pandas, Matplotlib, scikit-learn에 대한 지식을 물어보는데, 이 scikit-learn을 이해하는데 상당히 애를 먹었습니다. 하지만 덕분에 상기 시험을 통해 약간은 머신러닝에 대해서 접해볼 수 있었고 그 이해를 바탕으로 다음은 무얼할까 고민하던 중에 TensorFlow를 알게 되었습니다. 그러다가  클라우드 공부에 이리 치이고 저리 치이면서 좀처럼 시간을 낼 수 없었는데 이번에 SAA-C02를 합격하여 시간적 여유가 조금 생겨서 TensorFlow에 도전해보기로 하였습니다.

3. 입문강좌::Introduction to TensorFlow for Artificial Intelligence, Machine Learning, and Deep Learning(Laurence Moroney)

TensorFlow에 대한 입문강좌로서 Coursera의 Introduction to TensorFlow for Artificial Intelligence, Machine Learning, and Deep Learning(Laurence Moroney)를 추천하시는 분이 상당히 많았습니다.
4코스로 되어있는 강좌입니다.

-A new programming paradigm
-Introduction to Computer Vision
-Enhancing Vision with Convolutional Neural Networks
-Using Real-world Images

이 코스 하나하나가 영상강좌, google colaboratory를 사용한 실연, 개념에 대한 퀴즈, 코딩물 제출로 이루어져있습니다. 한 코스에 1주를 예상하고 디자인된 강의지만 학습분량이 그렇게 많은 것은 아닙니다. 저는 한 3일정도 걸려서 모두 다 들었습니다. 이미지처리를 중점으로 하고 있는 내용이며 기본적인 파이썬 문법은 숙지하셔야 듣기가 수월합니다. 영상강좌의 언어는 영어인데 아쉽게도 한국어 자막이 없습니다. Coursera에서 계정 파시면 5일간 무료로 들을 수 있습니다.(신용카드는 등록해야하는데, 5일안에 얼릉 강좌 듣고 정보 삭제 하면 됩니다.)
다 강의를 수강하시면, 수료증도 나오고 링크드인등에 공유할 수 있고, PDF로도 다운로드할 수 있습니다. 


실제로 수강한 내용이나 개념에 대한 정리는 따로 포스팅 해두었으니 아래의 링크에서 확인해주세요.  <오답정정하는블로그::TensorFlow 도전기 (with Coursera 1일차) >

Python 3 エンジニア認定データ分析試験은 이론공부가 많았는데 이런 강좌는 핸즈온으로 직접 눈으로 보면서 패러미터 조정해보면서 어떤 영향이 있는지 알아볼수 있었기 때문에 굉장히 재미 있었습니다.

다음. Tensorflow Developer Certification

텐서플로에 대한 관련자격증은 구글에서 시행 하고 있습니다. 자세한 내용은 공식홈페이지에서확인해 보세요.

<인증내용>
-ML 및 딥 러닝의 기본 원칙
-TensorFlow 2.x에서 ML 모델 개발하기
-심층신경망 및 컨볼루셔널 신경망을 사용하여 영상 인식, 객체 감지, 텍스트 인식 알고리즘 빌드
-컴퓨터가 정보를 '보는' 방식을 이해하고 손실과 정확도를 그래프로 표시하는 컨볼루션을 통해 이미지의 여정을 시각화하도록 다양한 모양과 크기의 실제 이미지 사용
-과적합(예: 증강 및 드롭아웃)을 방지하는 전략 살펴보기
-자연어 처리 문제 해결을 위해 TensorFlow로 신경망 적용

이 내용이 코세라의 강의에 전부 나오는 내용이고, 코세라 강의 내용 그대로 시험이 출제된다는 것이 이미 시험 수험하신 분들의 감상입니다. 오픈북이며 비용은 100불이인데 비용에 비하여 인증에 대한 신뢰도가 살짝 의심받는 지라 어떤 목적으로 인증을 취득할 것에 대한 정리가 필요할 수 있습니다. 시험시간은 5시간인데 시험자체보다는 Pycharm을 이용한 환경준비등이 더 힘들었다는 의견도 많았습니다. 어쨌든, 인증취득의 유효성은 개인의 필요성과 판단에 따라 선택하시면 될 듯하구요, TensorFlow의 입문을 생각할때 강좌의 활용등에 대해서는 강력 추천 드리는 바이니, 관심 있으신 분은 생각해 보시면 좋을 듯 싶습니다.