본 연구의 목적은 첫째, 소셜 빅데이터를 활용하여 청소년의 비만 검색과 관련한 문서를 수집하고 주제분석과 감성분석을 통하여 청소년의 비만에 대한 미래신호를 탐지하는 것, 둘째, 머신러닝 기술을 활용하여 청소년의 다이어트 성공, 실패 예측모형을 개발하는 것이다.
비만 관련 토픽은 온라인 채널에서 매일 매시간 수집하여 총 120만 7,531건의 온라인 문서(Text)를 분석대상으로 하였다. 수집된 문서 내에 ‘청소년, 학생, 소아, 아동, 어린이, 학령전기, 중학생, 초등학생, 학령기, 10대, 고등학생’의 키워드가 포함된 문서를 청소년 문서(11,963건)로 분류하여 연구대상으로 하였다. 소셜 빅데이터를 수집하기 위해서는 크롤러(Crowler)를 사용하였고, 비만 토픽은 모든 관련 문서를 수집하기 위해 ‘Obesity’, ‘Diet’ 를 사용하였다.
주요 연구결과는 다음과 같다. 첫째, 청소년 비만 관련 운동 요인에 대한 성공 감정은 식이요인 55.6%, 운동요인 52.4%였다. 둘째, 다이어트 주요 이슈에 대한 감성과 DoD 증가율을 분석한 결과 저지방식사, 저열량식사, 해조류섭취, 근력운동, 유제품 이슈의 경우 리스크의 관리가 주요한 대응 방안이 될 수 있다. 셋째, 다이어트 실패와 독립변수 간의 연관성 예측에서 ‘유산소, 저지방식사, 균형 잡힌 식사, 과일섭취’의 경우 다이어트 성공 확률이 2.17배 높은 것으로 나타났다. 연구결과를 바탕으로 비정형 빅데이터 분석을 위한 개선방안을 제시하였다.