웹툰 이미지에서 대사만 지워보자 #OCR #GCP #Python #OpenCV


업무중에 웹툰 이미지에 그려져있는 대사를 추출하고 해당 대사를 지우는 작업이 필요했다.

기본적인 아이디어는 다음과 같다. 다른 클라우드 서비스들도 비슷하지만 Google Vision API에서 지원하는 OCR API는 문자와 문자가 적혀있는 영역의 좌표를 함께 알려준다. 그래서 OCR을 통해서 얻은 글자의 영역(좌표)을 OpenCV를 이용해서 주변색으로 칠해버리면 된다는 생각이다.

구현하는 것은 어렵지 않았다. 그런데 결과는 좀 실망스러웠다. 말 풍선안에 있는 대사들은 어느정도 깔끔하게 지우는데 성공했지만 감탄사나 효과음을 글자로 적어 놓은 것들은 OCR로 찾아내지 못하거나 찾아내더라도 영역을 나타내는 좌표가 맞지 않고 배경이 단일 색이 아닌 경우도 있어서 주변색으로 채워넣는 것도 쉽지가 않았다.