[서평] 만들면서 배우는 파이팅!딥러닝!

 #파이트치 #디플러닝 #일본책 #pytorch #DeepLearning #MachineLearning 이번에 리뷰할 책은 '만들면서 배우는 파이트치 딥러닝'이다. 이 책은 오타와 유가로 저자가 쓰고 박광수(아크몬드) 역자가 번역한 책이다.이 책은 9장의 챕터로 구성됐으며 가장 많은 지면을 할애한 것은 1장의 화상분류와 전이학습(VGG)이다.물론 맨 뒤에 index를 보고 원하는 것을 찾을 수도 있지만 잘 해석한다면 아마 1장부터 차례로 읽고 싶은 마음에서 목차를 뽑았을 것이다. 또 한 가지 아쉬운 점은 1장부터 차례로 실습을 하다 보면 첫 번째 예제는 실행되지 않는다는 점이다. 1장의 중간 이후를 읽어야 정상적으로 실행할 수 있는 방법을 알 수 있다. 그리고 아쉬운 점은 파이토치 1.1로 구성되어 있다. 물론 호환성이 있기 때문에 대부분 무리 없이 실행되지만 간혹 파이토치 1.6 이상의 상위 버전에서는 실행 결과가 다르기 때문에 다소 당황스럽다. 최근 나온 파이토치 책이 1.6 이상 버전으로 실행된 것에 비해 아쉬운 대목이다.이 책의 좋은 점은 일관성을 유지하는 코딩 표기법이나 가독성을 높이기 위한 코드 호환성을 통일감 있게 이끌어가며 기초를 읽은 사람이 응용으로 어려운 문제를 해결하고자 할 때 쓸 만한 전이 학습과 GAN과 자연어 처리 동영상 처리 등 다양한 분야를 다루려 했다는 점이다. 하지만 PC 자원의 여유 용량이 없거나 AWS 클라우드를 사용하지 않으면 실행이 오래 걸린다는 단점이 있다.첫 설치부터 AWS 사용법뿐 아니라 딥러닝의 다양한 활용까지 내용이 방대하기 때문에 책이 백과사전 느낌이라는 것이 또한 이 책의 장점이다.파이트치는 최근 버전에서 여러 라이브러리와 함께 사용할 수 있어 세부 내용을 모르고 구현하는 경우가 종종 있다. 이 책을 따라 같은 코드를 여러 번 코딩하다 보면 (이 책의 내용이 반복?) 학습 중심으로 작성) 낮은 수준에서 어떻게 구현해야 하는지를 알게 될 것이다.

★ 각 장의 개요

_1장: 이미지 분류와 전이 학습(VGG)된 VGG 모델을 활용하여 소량의 데이터로 딥러닝 모델을 구축할 수 있는 전이 학습과 파인 튜닝을 소개합니다. 또한 이 책에서는 AWS의 클라우드 GPU 머신을 사용하여 딥러닝을 설명합니다.

_ 2장. 물체인식(SSD) 물체감지는 딥러닝 응용방법 중에서도 특히 복잡한 기술입니다. SSD 모델을 활용하여 물체 감지의 흐름을 설명합니다.

_3장. 시멘틱 분할(PSPNet) 픽셀 수준에서 물체를 분류하는 '시멘틱 분할'을 학습하면서 딥러닝 모델 PSPNet을 설명합니다. 어떻게 픽셀 수준에서 물체를 분류할 수 있는지, 그리고 네트워크 구조, 순전파 함수, 손실 함수도 알아보겠습니다.

_4장. 자세추정(OpenPose) 자세추정은 이미지에 포함된 여러 인물을 탐지하여 인체의 각 부위의 위치를 식별하고 부위를 연결하는 선(링크)을 구하는 기술입니다. Open Pose가 어떻게 사람의 각 부위를 탐지하고 부위를 연결하는지를 구현하고 그 구조를 확인합니다. 모델의 네트워크 구조를 확인하는 방법으로서 텐서 보드 X 의 사용법을 설명합니다.

_5 장. GAN을 활용한 화상생성(DCGAN, Self-Attention GAN) Self-Attention은 자연언어처리(NLP)에 활용되는 Transformer와 BERT의 열쇠입니다만, 이해가 어렵기 때문에 우선은 화상에서 Self-Atention을 구현합니다.

_6장. GAN을 활용한 이상감지(AnoGAN, Efficient GAN) 이상 이미지 검출은 의료현장에서 질환 및 건강상태를 판별하거나 제조업에서 이상이 있는 부품을 검출하는 경우 등에 사용합니다. 이상화상이 정상화상보다 매우 적을 때는 AnoGAN을, 이상검지에 걸리는 시간을 해결하기 위해서는 EfficientGAN을 응용할 수 있습니다.

_7장. 자연어 처리를 활용한 감정 분석(Transformer) 텍스트 데이터를 다루는 자연어 처리를 확인하고 딥러닝 모델 Transformer를 활용하여 텍스트 데이터 내용을 긍정과 부정으로 감정합니다. word2vec과 fasttext를 활용하여 단어를 벡터로 수치화하고 단어에 Attention을 곱하여 추론결과를 시각화해 보겠습니다.

_8장 : 자연어 처리를 활용한 감정 분석(BERT) 감정 분석 모델을 구축, 학습하고 추론하여 맥락에 따라 단어 벡터가 어떻게 변화하는지를 알아보고 Self-Attention에서 시각화해 봅시다.

_9 장. 동영상 분류 (3DCNN, ECO) 이미지 분류와 동영상 분류의 차이에 주목하면서 어떻게 동영상을 딥러닝으로 다루며 구현하는지 설명합니다.

한빛미디어 <나는 리뷰어다> 활동을 위해 책을 제공받아 작성된 서평입니다.

이 블로그의 인기 게시물

●살빼는 약 부담 줄여줘 장라도 30대 다이어트법

정보(주가, 영업이익 등) 한글 및 컴퓨터 주식

잃어버린 30년! 1엔만 비싸도 손 벌벌…Since1990 갈라파고스 현상《30년간 월급이 제자리》헤이세이 일본의