SKT FLY AI 2기 [AI 비전과 챗봇을 활용한 아동심리분석 에이닷 확장 서비스] 프로젝트 구경하기
[대한상공회의소] 2023년 5월 22일 미래산업 인재 육성 컨퍼런스가 온라인으로 진행되었기에, 구경을 좀 했다.
여러 프로젝트 중에 가장 눈에 띄는 것은 HTS검사를 이미지로 찍어 심리검사의 기준이 되는 자연어로 분리해 심리검사를 하는 프로젝트였다.
주제, 기술스택 선정, 그리고 나의 견해
- 최신 트렌드
-
- 2023년, 오은영 선생님을 모르는 20대는 거의 없다고 생각한다. 그만큼 최근 계속 이슈가 되고 있고, 아이들의 인지 발달에 관심이 많아졌다는 점도 의미한다. 프로젝트 주제를 정할때, 누구나 할 수 있는 주제가 아닌 최신 트렌드를 반영하고 주제로 정하는것이 큰 용기이고 도전이라고 생각한다. 트렌드를 반영 할 수 있다는 능력 자체가 시장의 요구에 맞출 수 있다는 점이기도 하니깐.
- objectdetection과 nlp를 적극적으로 활용했다는 점도 굉장히 고평가한다. 위와도 연결되는 점인데, 기존의 모델들을 활용했다고 해도, 그 모델들을 가지고 새로운 서비스를 만든다는 것은 도전하기 어렵고, 예상치 못한 문제를 만날 가능성이 크다.
- 2023년, 오은영 선생님을 모르는 20대는 거의 없다고 생각한다. 그만큼 최근 계속 이슈가 되고 있고, 아이들의 인지 발달에 관심이 많아졌다는 점도 의미한다. 프로젝트 주제를 정할때, 누구나 할 수 있는 주제가 아닌 최신 트렌드를 반영하고 주제로 정하는것이 큰 용기이고 도전이라고 생각한다. 트렌드를 반영 할 수 있다는 능력 자체가 시장의 요구에 맞출 수 있다는 점이기도 하니깐.
- 보여주기 좋은 주제, 그리고 속이 꽉 차있는 개발 스택
-
- 프로젝트 주제 선정에 있어서, 특히 이러한 개발자 교육 프로그램의 프로젝트는, 얼마나 주어진 시간 안에 임팩트 있는 결과물을 보여줄 수 있냐에 따라 달려있다고 생각한다. 동시에 개발의 전문성도 빠뜨리면 안됀다. 수많은 있어보이는 프로젝트들도, 뚜껑을 따보면 말만 번지르르한 경우가 많은데, 이 프로젝트는 개발자들도 충분히 참신하다고 느낄 것이라 생각한다.
- 말만 번지르르한 프로젝트 이야기가 나와서 조금 더 이야기하자면, 필자는 개인적으로 UI가 깔끔한 디자인을 싫어한다. 특히 그것이 일반인이나 사업 투자자들을 위한 발표 프로젝트가 아닌, 개발자들끼리의 발표인 경우. 개발자들끼리의 프로젝트인 경우, 겉보기에는 번지르르하고 속은 별거 없으면.. UI할 시간에 더 알차게 하지.. 라는 생각이 든다. 물론 디자인 하나로도 세상이 바뀌는 경우는 많다. 거기에다 요즈음은 수많은 앱/웹/프로그램들이 넘쳐나다 보니 디자인 자체가 경쟁력이기도 하지.. 암암. 하지만 UI보다 커널을 자주 보는 개발자라 어쩔수 없는 점이 있나보다.
- 프로젝트 주제 선정에 있어서, 특히 이러한 개발자 교육 프로그램의 프로젝트는, 얼마나 주어진 시간 안에 임팩트 있는 결과물을 보여줄 수 있냐에 따라 달려있다고 생각한다. 동시에 개발의 전문성도 빠뜨리면 안됀다. 수많은 있어보이는 프로젝트들도, 뚜껑을 따보면 말만 번지르르한 경우가 많은데, 이 프로젝트는 개발자들도 충분히 참신하다고 느낄 것이라 생각한다.
- SKT AI의 KoGPT2 사용
-
- 프로젝트 자체가 SKT FLY에서 해서 그런지, SKT의 오픈소스 언어모델 KoGPT2를 사용했다. 요즈음 필자는 무언가 프로젝트를 하면, OpenAI에서 제공하는 API로 gpt3만 사용하는데 KoGPT2를 사용한 점이 좀 인상깊다. 근데 KoGPT-Trinity를 안쓰고 GPT2를..?
- 최근 필자는 메타에서 유출(이라 쓰고 공개라 읽는) LLaMA 언어 모델을 이리저리 뜯어보고 있다. 그 중 양자화로 경량화방식에 대해 배우고 있다. 공부와 동시에 느끼는 점은, 미래의 한글 언어 모델은 어떻게 될까..? 라는 점이다. 개인적으로는 한글 언어 모델에 있어서, 형태소 분석으로 모델을 만드는 시기는 지났다고 조심스럽게 생각한다. 한글을 이해해야지만 언어모델이 만들어지는건 아니니깐. 마지 중국어 방 논증처럼. 그렇기에 현재 HWP와 MS-Word 처럼. 한국어는 다른 길을 갈지도 궁금해진다.
- 프로젝트 자체가 SKT FLY에서 해서 그런지, SKT의 오픈소스 언어모델 KoGPT2를 사용했다. 요즈음 필자는 무언가 프로젝트를 하면, OpenAI에서 제공하는 API로 gpt3만 사용하는데 KoGPT2를 사용한 점이 좀 인상깊다. 근데 KoGPT-Trinity를 안쓰고 GPT2를..?
프로젝트 발표 관련
UI는 앱으로 구현했는데, 아이닷의 UI를 카피한것인지(아이닷의 서비스 연계를 목표로) 아니면 아이닷의 개발 환경인지는 모르겠다.
혹시라도 개발자가 직접 만들고, 유저가 추가 할 수 있는 환경이 되어있나 해서 에이닷을 설치해보았지만, 아쉽게도 UI만 카피한 듯 하다. 가입을 위해 3번 인증을 받는것은 덤.
Docker는 사용하지 않았지만, 보통 Docker+FastAPI+AWS/GCP을 사용하는 듯 하다. 아무래도 SKT FLY 프로그램 과정에 포함되어 있는 느낌?
아쉬운 점은
HTP 그림분석 자체가, 굴뚝, 창문의 개수, 집의 크기 등 도출되는 결과는 이미 정해져있는데 이걸 굳이 자연어 모델을 사용했어야 했나? 싶은 생각이 든다.
- 이미지 DataSet
이미지 Set은 Roboflow로 직접 그렸다고 한다.
600장
테이블에 앉아 저걸 그렸다고 생각하니 귀엽게 느껴진다
슬프게도 5월 26일 AIhub에 AI기반 아동 미술심리 진단을 위한 객체인식 그림 데이터가 올라왔다
- 감정 사전 점수화
채팅에서 감정을 점수화 하기 위해 감정 사전을 만들고, 감정 사전에 포함되는 단어가 있으면 긍정과 부정으로 나눠진다 했는데.. 음.. 요즈음 긍정 부정 AI도 있어서 그걸 활용해보았으면 어떨까 싶다.
총평
일단은 굉장히 아이디어가 좋다고 생각한다. 이미 기존의 비슷한 앱이 있는지는 잘 모르겠지만, 지금 나온 접근만으로도 가치가 있다고 생각한다. 조금 아쉬운 부분은 아동심리부분이 포함되어 있으므로, 인위적으로 데이터를 해석하지 않고 정확한 진단을 위해, 일정 거리에서 정확히 잰다던가, 예외가 많이 나올 가능성이 있는 챗봇을 뺀다던가. 무엇보다도 심리 상담에서 임의로 나눈 감정 점수화는 별로 좋지 않은 방법이라 생각한다.
그래도 SKT fly AI 특화 프로젝트중 최우수상을 받은 만큼, 주제도 명확하고 접근도 괜찮았다. 기사에는 비전공자가 많았다고 하던데, 전공자인 나도 같은 주제로 프로젝트를 한다면 3개월정도는 들어갈것이다.
음.. 3일 전에 데이터셋이 올라왔으니깐 한번 해볼까?