문자열의 패턴을 간결하게 기술하는 방식을 정규표현식이라고 합니다. 특정 패턴의 텍스트 분석을 하기 위해서는 해당 표현을 이해하고 작성할 수 있어야 코드양과 비용과 시간을 줄일 수 있습니다. 이제 R 정규표현식에 대해 살펴보겠습니다….
이전 시간에 이어 R 언어를 활용하여 영화 시나리오 분석하는 프로젝트를 진행해보도록 하겠습니다. R로 영화 시나리오 씬구분하는 방법을 진행해보겠습니다. 로딩한 시나리오 샘플데이타를 씬 별로 분류해서 데이타를 생성하는 방법을 알아보겠습니다. 시나리오 로딩에…
R을 활용하여 영화 시나리오 분석하는 프로젝트를 진행해보도록 하겠습니다. 데이타 분석에 많이 활용하는 R 언어를 이용해보고자 합니다. 먼저 R 영화 시나리오 로딩을 진행해보겠습니다. 작업 디렉토리를 설정하고 대본의 형식을 간략히 살펴본 후…
R로 하는 감정 분석에 대해 알아보겠습니다. 감정분석할 텍스트를 로딩한 후 긍정과 부정을 분석하는 방법을 파이썬으로 구현해보도록 하겠습니다. https://github.com/park1200656/KnuSentiLex 1. 감정 사전 활용하기 문장의 감정 점수 구하기 2. 단어에 감정 점수…
워드프레스 웹페이지 구축하기 위해 많이 사용하는 호스팅 서비스 중에 블루호스와 아마존 라이트세일이 있습니다. 블루호스트 vs 라이트세일 장단점을 알아보고 사이트 규모와 성격에 맞는 호스팅 업체을 선택하면 됩니다. 블루호스트 vs 라이트세일 아마존…
두 텍스트를 비교 분석하기 위해 합치는 과정이 필요합니다. 각 텍스트를 불러와서 합친 후 여러가지 방법으로 텍스트를 비교하는 방법을 알아보도록 하겠습니다. 1. 단어 빈도 비교하기 2. 오즈비-상대적으로 중요한 R 단어 비교하기…
Spring boot war 배포 방법에 대해 알아보도록 하겠습니다. war 파일을 Tomcat에 배포하는 방법은 다음과 같습니다. WAR 배포 방법 이것은 War 파일을 Tomcat에 배포하는 가장 기본적인 방법입니다. 물론, 환경에 따라 추가…
R 형태소 분석기를 활용하여 단어의 빈도수를 확인하는 방법을 알아보도록 하겠습니다. 단어를 추출하고 명사로 분류하여 문장, 글에서 해당 명사가 어떤 비중을 차지하는지 빈도수를 계산해보겠습니다. 1. R 형태소 분석 2. 명사 빈도…
R 단어 빈도 분석에 대해 알아보도록 하겠습니다. R은 텍스트 마이닝에 대한 유용한 라이브러리를 제공합니다. 단어의 빈도수를 확인하여 문장내에서 어떤 비중을 차지하고 있는지 확인해보도록 하겠습니다. 1.텍스트 전처리 2. 토큰화하기 3. R…
카프카 프로듀서, 컨슈머 질문사항으로 많이 나오는 항목에 대한 답변 정리를 하겠습니다. 해당 내용을 바탕으로 실무에서 카프카가 어떻게 활용되고 있는지를 보다 명확히 알 수 있는 계기가 되었으면 합니다. 프로듀서 관련 →…