데이터분석가로 살아남기 16

[모두를 위한 R 데이터 분석 입문] chap08 - 연습문제 풀이

중간 중간 귀찮아서 안푼 문제도 있어요.. 그냥 혼자 공부하면서 올리는거라 이상한 부분은 댓 남겨주시면 수정할게요.R에서 기본 제공하는 데이터셋이나 특정 데이터셋을 받아오거나 하는 문제가 아니라, 직접 하나하나 데이터값을 입력해서 프레임을 만들어줘야하는 문제는 시간 상 건너뛰었어요. 연습문제 1#01us 연습문제2#02ds =13] 연습문제3#03symbols(ds$Fertility, ds$Agriculture, circle=ds$Education, bg="green")text(ds$Fertility, ds$Agriculture, rownames(ds)) 연습문제4#04ds_tree 연습문제5#05ds_color 연습문제7#07library(ggplot2)ca..

[모두를 위한 R 데이터 분석 입문] chap06 - 연습문제 풀이

중간 중간 귀찮아서 안푼 문제도 있어요.. 그냥 혼자 공부하면서 올리는거라 이상한 부분은 댓 남겨주시면 수정할게요. 연습문제01#01cor(cars$speed, cars$dist)plot(cars$speed, cars$dist)res 연습문제02#02cor(pressure$temperature, pressure$pressure)plot(pressure$temperature, pressure$pressure)res 연습문제03#03ds 연습문제04#04plot(iris$Petal.Length, iris$Petal.Width, col = iris$Species, pch = 3) 연습문제07#07ds 연습문제10#10#(1)plot(trees$Girth, trees$Height)cor(t..

[모두를 위한 R 데이터 분석 입문] chap04 - 연습문제 풀이

문제 번호는 주석에 달아놨습니다. 틀린 부분은 댓글로 알려주시면 수정하겠습니다. 연습문제 01#(1)nums = 0cnt = 0for(i in 1:100){ if(i%%3==0){ nums 연습문제 02for(i in 1:6){ cat(strrep("*", i), "\n")} 연습문제 03i 연습문제 04score 60, 'Pass', 'Fail')print(result) 연습문제 05nums 0) { p 연습문제 06numlist 연습문제 07#(1), (2)apply(iris[,1:4], 1, sum)apply(iris[,1:4], 2, max) 연습문제 08apply(mtcars, 2, sum)apply(mtcars, 2, max)apply(mtcars, 2, sd) 연습문제 09lg..

[모두를 위한 R 데이터 분석 입문] chap03 - 연습문제 풀이

* 혼자 공부하면서 작성한 내용으로 틀린 부분은 댓글로 알려주시면 수정하겠습니다* 연습문제 02st = 5000)subset(st, Income >=4500, select= c("Population","Income", "Area"))sum(st$Income>=4500)subset(st, Area>=100000 & Frost=2.0])mean(st$Income[st$Illiteracy =2.0])subset(st, Life.Exp == max(st$Life.Exp))subset(st, Income > st["Pennsylvania", "Income"]) 연습문제 03name 연습문제 04class(airquality)head(airquality)subset(airquality, Temp == max(ai..

[LeetCode] 리트허브 폴더 수정하기, 백준허브처럼 상위 폴더 만들기

야심차게 리트허브를 설치하고 커밋을 했는데...이렇게 생성된다....내가 원한건코딩 연습 폴더 하위에 백준, 프로그래머스, 리트코드 이렇게 있고, 각 폴더마다 문제가 들어가는 형태를 원했는데...찾아보니까 나같은 문제를 겪으신 고수님들이 방법을 아주아주 친절하게 설명해주셨다.깃헙 잘 쓸 줄 모르는 나도 설치하였으니 다들 잘 따라하면 가능할듯!https://github.com/raphaelheinz/LeetHub-3.0 GitHub - raphaelheinz/LeetHub-3.0: Automatically push your LeetCode solutions to your GitHub repositoryAutomatically push your LeetCode solutions to your GitHub r..

[R] 패키지 다운로드 시 오류 SSL connect error, packages are not available for this version of R / 패키지 수동설치하기

R을 설치하고 install.package("tidyverse")를 했는데> install.packages("tidyverse")Warning: unable to access index for repository https://cran.yu.ac.kr/src/contrib: cannot open URL 'https://cran.yu.ac.kr/src/contrib/PACKAGES'Warning: unable to access index for repository https://cran.yu.ac.kr/bin/windows/contrib/4.4: cannot open URL 'https://cran.yu.ac.kr/bin/windows/contrib/4.4/PACKAGES'Warning message:..

[Python] parallel_apply() 함수 사용 시 pandas import 문제 해결 : NameError: not defined error

혼자 공부하면서 작성하는 글입니다. 더 효율적인 해결방법이 있거나 오류가 있다면 댓글 남겨주세요~! Parallel_apply() 사용 시 NameError 해결 1parallel 함수를 사용하며 worker 프로세스에서도 모듈을 정의해줘야 한다는 사실을 알았다.처음에 코드를 다음과 같이 작성했는데, NameError: re not defined가 떴다. 분명 처음에 import를 했는데.#에러코드def remove_one_char_words(text): cleaned_text = re.sub(r'\b[가-힣]\b', '', text) cleaned_text = re.sub(r'\s+', ' ', cleaned_text).strip() return cleaned_textdf['cl..

[논문 - 빅데이터] 빅데이터를 활용한 스마트 관광도시 사례 분석 연구: 제주특별자치도 관광객 데이터를 중심으로

개인적으로 읽으며 정리한 내용입니다. 자세한 내용은 원문에서 확인하세요! 🍺 논문 정보문준환, 김성현, 노희섭 and 구철모. (2019). 빅 데이터를 활용한 스마트 관광 도시 사례 분석 연구: 제주특별자치도 관광객 데이터를 중심으로. 경영정보학연구, 21(2), 1-27.https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART002472477 빅 데이터를 활용한 스마트 관광 도시 사례 분석 연구: 제주특별자치도 관광객 데이터를 중심으정보기술의 발전으로 스마트한 관광서비스가 가능해졌는데, 관광산업이 기존 산업 범위를 벗어나 다른 산업과 융합을 통해 새로운 비즈니스 모델이 ..

[스파크 완벽 가이드] 2장. 스파크 간단히 살펴보기(2)

※ 혼자 책보고 공부하면서 적는거라 틀린 부분 있으면 댓글로 알려주세요!YES24구매링크 - 별 의도는 없고 그냥 제가 예사에서 구매했어요... 스파크 완벽 가이드 - 예스24스파크 창시자가 알려주는 스파크 활용과 배포, 유지 보수의 모든 것 오픈소스 클러스터 컴퓨팅 프레임워크인 스파크의 창시자가 쓴 스파크에 대한 종합 안내서이다. 스파크 사용법부터 배포,www.yes24.com CHAP2. 스파크 간단히 살펴보기(2) - 종합예제데이터 다운로드는 여기서1. 스파크로 데이터 읽어오기spark.read: Spark의 DataFrameReader를 사용해 데이터를 읽을 준비.option("inferSchema", "true"): CSV 파일의 각 열에 대한 데이터 타입을 자동으로 추론하여 읽어옴.option..