본문 바로가기
생활

젤리 랩에서 텍스트 분석 하기 (태그 클라우드 등.)

by _BlankSpace 2019. 1. 21.

요즘은 빅데이터다 뭐다 해서 텍스트를 분석하는 능력이 중요시 되고 있습니다.

그래서 관련 공부를 하려 했지만, 귀차니즘으로 인해서 잠시 미루고 있는데..


최근, 우연히 태그 클라우드를 검색하다가, 텍스트 분석을 통해서 여러 가지 형태로 결과를 만들어 주는 사이트를 찾을 수 있었습니다.

이 회사는 NEWSJELLY라는 이름을 가지고, 데이터 시각화 기술을 제공하는 회사입니다.


먼저, 사이트 링크는 아래를 참고하세요.

http://newsjel.ly/


일단 이 포스팅은 회사를 소개하려는 것은 아니므로, 바로 텍스트 분석을 통해서 태그 클라우드를 만드는 방법을 정리하려고 합니다.


젤리랩 사이트를 들어가면 아래와 같은 화면을 볼 수 있습니다.

먼저, 텍스트를 분석할 것이므로, 아래처럼 데이터 분석을 누릅니다.



누르셨나요? 그러면 아래와 같은 화면이 표시됩니다.

텍스트를 분석하는 방식으로 형태소 분석기, 일/월/분기 변환, 기초 통계, 상관 분석, 회귀 분석 이라는 것들이 있습니다.


저는 기본적인 텍스트 분석을 할 것이므로, 형태소 분석기를 선택하겠습니다.

여러 형태로 텍스트를 분석하고자 하시는 분이라면 아래의 다른 분석도 이용해보시기 바랍니다.



형태소 분석기를 선택하였다면, 아래의 화면이 나옵니다.

이제, 입력 창에 본인이 분석하고자 하는 텍스트를 입력합니다.


제가 입력한 내용은 네이버의 한 글을 입력한 것입니다.

(그래서 일부러 모자이크화 하였으니, 양해 부탁 드립니다.)


입력이 완료되었으면, 아래 화살표 버튼을 눌러줍니다.

그러면 출력으로 단어빈도수를 나타냅니다.


이제 이 출력 내용을 Ctrl + a 로 전체 선택후에 Ctrl + c 로 복사를 합니다.


이제 복사한 내용을 데이터 시각화 해야겠죠?

저는 데이터 시각화의 방법 중 하나인 태그 클라우드를 생성하려고 합니다.


아래 화면에서 데이터 시각화를 눌러줍니다.



그러면, 아래 화면이 표시됩니다.

데이터 시각화의 방법태그 클라우드, 막대 차트, 선 차트, 영역 차트, 파이 차트, 산점도 등이 있습니다.

역시, 여러 가지로 표현해보고 싶은 분이라면 이용해보시면 될 것 같습니다.


저는 태그 클라우드 방식으로 표현할 것이므로 아래처럼 태그 클라우드를 선택하였습니다.



이제 마지막 단계입니다.

왼쪽의 입력 창에 아까 복사해두었던 내용을 Ctrl + v 를 이용하여 붙여넣기를 합니다.


그러면, 아래처럼 입력창에 단어와 빈도수가 입력되는 것을 확인할 수 있습니다.

이제, 화살표 버튼을 눌러줍니다.


그러면 오른쪽의 출력 창처럼 빈도수가 많은 단어일수록 글자의 크기가 큰 태그 클라우드를 확인할 수 있을 것입니다.



완성된 태그 클라우드를 png로 저장하면 아래처럼 사용도 가능합니다.

굉장히 간단하게 태그 클라우드를 만들 수 있지 않나요?


태그 클라우드가 필요하신 분이라면 한번 만들어 보시길 바랍니다.

방법이 간단하므로, 금방 따라하실 수 있으리라 생각합니다.



서로 이웃 추가는 항상 환영입니다. :)

댓글