일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 파이썬
- 챗gpt
- chatGPT
- 판다스
- 랭체인
- 사이킷런
- konlpy
- HTML
- NLP
- Python
- programmablesearchengine
- deeplearning
- langchain
- 머신러닝
- 파이토치기본
- 파이썬웹개발
- fastapi #python웹개발
- pytorch
- 판다스 데이터정렬
- pandas
- sklearn
- python 정렬
- 파이토치
- fastapi #파이썬웹개발
- 딥러닝
- 자연어분석
- OpenAIAPI
- 비지도학습
- MachineLearning
- fastapi
- Today
- Total
목록konlpy (3)
Data Navigator

고양시 관광 관련 인스타그램 크롤링 자료 분석 결론 1. 인스타그램은 비공개 게시물이 많아 관련 키워드의 총 게시물 숫자에 비해서 수집이 가능한 게시물 수가 적었음. 2. 고양시 관련 여행 패턴과 자주 가는 관광지가 어디인지를 찾는 것이 목적이었으나 인스타그램이 주로 음식점, 카페 관련 게시물이 압도적으로 많은 관계로 목적에 맞는 결과가 도출되지 않음. 고양시 관광 관련 인스타그램 게시물에 언급된 단어 빈도 상위 100개의 그래프 추가 분석 과제 1. 딥러닝을 활용한 군집 분석과 단어 간의 상관관계 분석이 필요. (gensim, Word2Vec을 이용해 분석 예정) 2. 블로그와 페이스북 자료를 추가적으로 확보하여 함께 분석 하는 것이 필요. 분석환경 Mac OS Big Sur, python, panda..

기존의 호텔스 닷컴 사용자 리뷰 분석을 gensim 모듈의 Word2Vec을 사용하여 다시 분석해 보았다. Word2Vec는 단어를 벡터화 한 후 단어들 간에 상관도가 높은 것들을 모아서 추출할 수 있다. 1. 분석결과 1) 사용자 리뷰 전체를 벡터화해서 가장 빈도수가 높은 상위 10개 단어들을 넣고 연관 단어를 찾았으나 특이한 점은 발견 할 수 없었음. 2) 평점 8 이상을 good(만족), 7 이하를 bad(불만족)으로 구별하여 각각 다시 벡터화 3) good(만족) 그룹에서는 역시 특이한 점을 찾기 어려웠고 bad(불만족) 그룹에서 의미있는 자료가 나옴 4) bad(불만족) 그룹에서 눈에 띄었던 결과 검색어: 방음 ('옆방', 0.9461838006973267), ('층간', 0.9254038333..

NLP 호텔스닷컴 사용자 후기와 평점 분석 sklearn의 Naive Bayes Classification을 이용 1. 분석 목적 호텔스 닷컴에서 수집한 호텔에 대한 평점과 사용자 리뷰 간의 관계를 파악하고 리뷰 글을 분석해서 평점이 긍정적으로 나올지, 아닐지를 판별하는 예측 모델을 만든다. 2. 분석 대상 데이터 호텔스 닷컴에서 수집한 전국 8884개 호텔, 사용자 리뷰 89,942개 3. 분석 결과 1) 사용자 리뷰 키워드 분석 내용 전체적으로 객실, 친절, 조식, 직원 등의 빈도가 높았고 객실 상태, 직원의 친절한 응대, 조식 음식의 맛과 질이 호텔 사용자 만족도에 크게 영향을 끼침을 알 수 있었음. A. '만족'한 그룹의 사용자 리뷰에서 가장 높은 빈도수를 나타낸 단어는 [친절], [편안], [위..