이번 포스팅은 R 언어를 활용한 택시운전사 영화 분석 결과를 설명해드리겠습니다. 인물들의 등장 빈도수에 따른 비중과 대화, 행동 빈도수로 등장인물들의 중요도를 데이타 분석 관점에서 확인해 보겠습니다. 택시운전사는 2017년 개봉한 영화입니다. 1980년…
R 언어를 활용한 영화 말아톤 시나리오 분석 결과를 설명해드리겠습니다. 인물들의 등장 빈도수에 따른 비중과 대화, 행동 빈도수로 등장인물들의 중요도를 데이타 분석 관점에서 확인해 보겠습니다. 말아톤은 2005년 개봉한 영화입니다. 자폐증을 앓고…
오늘은 R 정규표현식 문자 분석하는 방법에 대해 알아보겠습니다. 문자 파싱은 여러 다양한 형태를 요구하기 때문에 정규식을 제대로 이해하고 사용할 줄 알아야 텍스트 마이닝에서 좋은 데이타를 얻을 수 있습니다. 쉼표 등…
문자열의 패턴을 간결하게 기술하는 방식을 정규표현식이라고 합니다. 특정 패턴의 텍스트 분석을 하기 위해서는 해당 표현을 이해하고 작성할 수 있어야 코드양과 비용과 시간을 줄일 수 있습니다. 이제 R 정규표현식에 대해 살펴보겠습니다….
이전 시간에 이어 R 언어를 활용하여 영화 시나리오 분석하는 프로젝트를 진행해보도록 하겠습니다. R로 영화 시나리오 씬구분하는 방법을 진행해보겠습니다. 로딩한 시나리오 샘플데이타를 씬 별로 분류해서 데이타를 생성하는 방법을 알아보겠습니다. 시나리오 로딩에…
R을 활용하여 영화 시나리오 분석하는 프로젝트를 진행해보도록 하겠습니다. 데이타 분석에 많이 활용하는 R 언어를 이용해보고자 합니다. 먼저 R 영화 시나리오 로딩을 진행해보겠습니다. 작업 디렉토리를 설정하고 대본의 형식을 간략히 살펴본 후…
R로 하는 감정 분석에 대해 알아보겠습니다. 감정분석할 텍스트를 로딩한 후 긍정과 부정을 분석하는 방법을 파이썬으로 구현해보도록 하겠습니다. https://github.com/park1200656/KnuSentiLex 1. 감정 사전 활용하기 문장의 감정 점수 구하기 2. 단어에 감정 점수…
워드프레스 웹페이지 구축하기 위해 많이 사용하는 호스팅 서비스 중에 블루호스와 아마존 라이트세일이 있습니다. 블루호스트 vs 라이트세일 장단점을 알아보고 사이트 규모와 성격에 맞는 호스팅 업체을 선택하면 됩니다. 블루호스트 vs 라이트세일 아마존…
두 텍스트를 비교 분석하기 위해 합치는 과정이 필요합니다. 각 텍스트를 불러와서 합친 후 여러가지 방법으로 텍스트를 비교하는 방법을 알아보도록 하겠습니다. 1. 단어 빈도 비교하기 2. 오즈비-상대적으로 중요한 R 단어 비교하기…
Spring boot war 배포 방법에 대해 알아보도록 하겠습니다. war 파일을 Tomcat에 배포하는 방법은 다음과 같습니다. WAR 배포 방법 이것은 War 파일을 Tomcat에 배포하는 가장 기본적인 방법입니다. 물론, 환경에 따라 추가…