목록전체 글 (35)
Alchemist
그래프 (Graph) : 데이터를 보기 쉽게 그림으로 표현한 것 그래프로 데이터를 표현하면 "추세" 와 "경향성" 이 드러나 특성을 더욱 쉽게 이해할 수 있다. (ggplot2 패키지는 그래프를 만들 때 가장 많이 사용하는 패키지이다. ggplot2를 이용해 그래프를 그려보도록 하겠다.) 산점도 - 변수 간 관계 표현 함수 : geom_point() 산점도 (Scater Plot) : 데이터를 x축과 y축에 점으로 표현한 그래프 산점도는 연속된 값으로 된 두 변수의 관계를 표현할 때 사용한다. #1. 배경 설정하기 data에 그래프를 그리는 데 사용할 데이터를 지정 aes에는 x축과 y축에 사용할 변수를 지정 ggplot(data = mpg,aes(x=displ , y=hwy)) #2. 그래프 추가하기 ..
http://kookbang.dema.mil.kr/newsWeb/20190524/4/BBSMSTR_000000010024/view.do 12월부터 해군 장교 지원하면 ‘AI(인공지능) 면접’ 학사사관후보생 선발부터 시범 도입 온라인 접속해 물음에 답하는 방식 지원자 행동·성향 파악해 질문 선별 내년까지는 당락 영향 없이 참고만 2022년 50%까지 배점 점차 확대 해군이 올해 후반기부터 인재 선발과정에 ‘인공지능(AI) 면접’을 새로 도입한다. 해군은 23일 “오는 12월 128기 학사사관후보생(OCS)을 시작으로 해군사관생도·학군사관후보생·부사관후보생 선발 과정에 AI 면접을 도입해 참고자료로 활용하겠다”고 밝혔다. 해군은 매년 해군사관 kookbang.dema.mil.kr 예전부터 인공지능을 이용해 ..
통계분석절차 분석 방법 선정 분석하고자 하는 목적에 따른 귀무가설과 대립가설 설정 분석도구(SPSS , R등) 검정통계량 실행 및 확인 유의수준 결정 : 0.1 , 0.05 , 0.01 유의확률 확인 유의확률과 유의수준 비교 귀무가설과 대립가설 선택 분석 결론 모집단 표본 관심이 대상이 되는 모든 개체의 관측값이나 측정값의 집합 모집단에서 실제로 추출한 관측값이나 측정값 모수 통계량 대상 모집단의 특성 표본에서 계산한 특성 표시 그리스 로마자 표시 알파벳 표시 μ x̄ σ s
이상치 (Outlier) : 정상 범주에서 크게 벗어난 값 -> 이상치가 포함되어 있으면 분석 결과가 왜곡되기 때문에 분석에 앞서 이상치를 제거해 주어야 한다. #1 이상치가 있는 데이터 만들기 sex의 범위 : 1~2 , score의 범위 : 1~5 인 변수로 구성된 데이터 생성. outlier % group_by(sex) %>% summarise(mean_score = mean(score)) 상자 그림(Boxplot)을 이용해 극단치 기준 정하기 1. mpg 데이터의 hwy 변수로 상자 그림을 만들어 보겠다. (mpg 데이터는 ggplot2 에 내장된 샘플데이터이다.) boxplot(mpg$hwy) 상자 그림은 값을 크기 순으로 나열해 4등분 했을 때 위치하는 값인 '사분위수'를 이용해 그려진다. 아..
https://news.naver.com/main/read.nhn?mode=LSD&mid=shm&sid1=105&oid=016&aid=0001538317 “인간가치 존중”…OECD, 만장일치로 ‘AI 원칙’ 권고안 첫 채택 - 국제기구 첫 AI 가이드라인 마련 [헤럴드경제=이정아 기자] 경제협력개발기구(OECD) 회원국 등 세계 42개 국가가 인공지능(AI) 개발이 인간가치를 존중하는 방식으로 이뤄져야 한다는 원칙이 담긴 권고안을 채택 news.naver.com 경제협력개발기구(OECD)가 인공지능(AI) 활용에 대한 국제적인 가이드라인을 만장일치로 공식 채택되었다고 한다. 가이드 라인의 주요 내용을 살펴보면 포용성과 지속가능성 인간가치와 공정성 투명성과 설명 가능성 책임성을 정핵 권고 사항으로 지정 연..
#1 결측치 정제 결측치(Missing Value) - 누락된 값, 비어 있는 값. 결측치가 있으면 함수가 적용되지 않거나 분석 결과가 외곡되는 문제가 발생한다. 때문에 결측치가 있는지 확인해 제거하는 정제 과정을 거친 후에 분석을 해야 한다. 1. 데이터 프레임 만들기 df
#1 데이터 전처리 '데이터 전처리(Data Preprocessing)' - 분석에 적합하게 데이터를 가공하는 작업 데이터의 일부를 추출하거나, 종류별로 나누거나, 여러 데이터를 합치는 등의 가공 작업을 말한다. dplyr 함수 기능 filter() 행 추출 select() 열(변수) 추출 arrange() 정렬 mutate() 변수 추가 summarise() 통계치 산출 group_by() 집단별로 나누기 left_join() 데이터 합치기(열) bind_rows() 데이터 합치기(행) library(dplyr) exam % 기호를 이용해 함수들을 나열하는 방식으로 코드를 작성한다. #2 조건에 맞는 데이터만 추출하기 dplyr 패키지의 filter()를 이용하면 원하는 데이터(일부)를 추출할 수 있다..
이번 내용에서는 데이터 파악, 데이터 수정에 관한 내용을 학습해보았다. 데이터를 파악할 때 사용하는 기본 함수들 head() - 데이터 앞부분 출력 (기본적으로 6개의 데이터 출력. 사용자가 임의의 값 지정 가능) tail() - 데이터 뒷부분 출력 (기본적으로 6개의 데이터 출력. 사용자가 임의의 값 지정 가능) View() - 뷰어 창에서 데이터 확인 dim() - 데이터 차원 출력 str() - 데이터 속성 출력 summary() - 데이터 총계량 출력 qplot() - 막대 그래프로 빈도 표현 table() - 빈도표로 데이터를 표현한다 잠시 후 실습 사진을 통해 'midwest' 라는 데이터를 파악하기 위해 위의 함수를 사용 했음을 알수 있다. ggplot2 패키지로 데이터 파악하기 mpg 데이..