728x90 반응형 from operator import itemgetter2 넷플릭스 영화 추천 알고리즘 파이썬 코드로 구현하기! 시청데이터로 예상 선호도 산출! 타이타닉, 쥬라기공원, 스타워즈를 본 나와 비슷한 유저는? 실제 넷플릭스 데이터 대회에 사용된 데이터의 일부를 JSON, 사전형(Dictionary)로 변환하고 재정렬해보며 비슷한 성향의 유저를 찾을 수 있다. 그리고 사람들에게 작품을 추천해주거나 A작품과 B작품이 얼마나 비슷한지 분석할 수 있는 코드를 한번 생성하는 실습을 진행해보자. - 회원별로 시청한 작품 정리하기 - 두 작품의 유사도 비교하기 - 예상 선호도 점수 구하기 - 사용자(User)가 시청한 영화들을 기반으로 선호할만한 영화 Top 10 추천받기 이전 게시물(JSON을 Dictionary로 변환할때 ~)을 공부하면서 기본적인 이론과 코드 원리를 공부하고 실습하면 더 쉽게 할 수 있을 것 같다. # 이전 게시물 2023.12.04 - [D.. Data Analyst/Project & Practice 2023. 12. 4. 더보기 ›› [파이썬 데이터분석] 가장 많이 사용하는 '영어 단어'는? 코드 구현! 약 1억 개의 영어 단어와 그 빈도수를 정리/구성된 British National Corpus(BCN) 단어 모음을 분석하고 그래프로 시각화해보자. 그리고나서 '이상한 나라의 엘리스' 동화책에 등장하는 단어와 BCN의 영어단어의 사용빈도 수를 비교해보자. BCN과 영어동화책에서 가장 많이 사용된 영어 단어는 무엇일까? → 'corpus.txt' 를 이용해서 가장 많이 사용된 영어 단어 분석 (하나의 텍스트파일 - BCN 자료) → 'alice/chapter1~5.txt' 를 이용하여 영어동화책에 사용된 영어 단어 분석 (여러 개의 텍스트파일 - 동화책) → 'matplotlib' 을 이용해 단어별 사용빈도를 보여주는 막대 그래프 작성 → 아래 주어진 단계를 통해 각각의 필요한 함수들을 생성하고, main.. Data Analyst/Project & Practice 2023. 11. 20. 더보기 ›› 반응형 이전 1 다음