BDA 빅데이터 분석 학회/ADsP 스터디 4

ADsP 자격증 스터디 4주차 (데이터의 이해)

스터디 날짜: 4월 16일스터디 범위: PART 1 데이터의 이해 (p.16~62)Chapter 1. 데이터의 이해Section 1. 데이터와 정보데이터1) 데이터의 정의데이터는 객관적인 사실로서 추론, 전망, 추정, 예측을 하기 위한 근거로서 사용되는 특성을 지님​2) 데이터 유형정성적 데이터: 언어, 문자 등의 형태로 저장, 형태가 일정하지 않은 비정형적 데이터 형태로 저장이 됨, 저장, 검색, 통계분석 작업에 시간과 비용이 많이 소요. ex) 트위터, 블로그와 같은 SNS 상에 올라와 있는 글, 날씨 예보, 뉴스기사, 설문조사 주관식 응답내용 등정량적 데이터: 수치, 기호, 도형 등으로 표현, 형태가 일정한 정형적 데이터, 데이터베이스 관리 시스템에 저장 및 검색, 분석하여 활용하기가 용이​2. 데..

ADsP 자격증 스터디 3주차 (데이터 분석 기획)

스터디 날짜: 4월 9일스터디 범위: PART 2 데이터 분석 기획(p65~p116)Chapter 1. 데이터 분석 기획의 이해Section 1. 분석 기획 방향성 도출분석 기획1) 분석 기획의 정의 및 특징실제 데이터를 분석하기 전에 수행할 과제의 정의 및 의도했던 결과가 도출될 수 있도록 관리할 수 있는 방안을 사전에 계획해당 영역에 대한 전문성 역량 및 통계학적 지식을 활용한 분석 역량, 분석 도구인 데이터 및 프로그래밍 기술 역량에 대한 균형잡힌 시각을 가지고 방향성 및 계획을 수립해야 함분석가에게 요구되는 역량: 통계학적 지식을 활용한 분석역량, IT 및 프로그래밍 기술, 분석 주제에 대한 도메인 전문성, 의사소통 능력, 프로젝트 관리, 리더십 역량​2) 분석 주제 유형최적화(Optimizati..

ADsP 자격증 스터디 2주차(정형 데이터 마이닝)

스터디 날짜: 4월 2일스터디 범위: PART 3 데이터 분석 - 정형 데이터 마이닝(p201~p244)Chapter 3. 정형 데이터 마이닝Section 1. 분류 분석데이터 마이닝 개요대용량 데이터로부터 의미있는 패턴, 관계, 규칙을 파악, 예측, 의사결정에 활용감춰진 지식, 규칙을 발견, 실제 비즈니스 의사결정 등에 활용목적 설정 -> 데이터 준비 -> 데이터 가공 -> 데이터 마이닝 기법 적용 -> 검증​2. 분류 분석1) 로지스틱 회귀 모형독립변수가 수치형 데이터, 종속변수가 범주형인 경우 적용되는 회귀 분석 모형일반적으로 종속변수가 두 가지 값만 가지는 경우에 적용R에서는 glm() 함수로 구성유의성 검정은 카이제곱 검정을 사용로지스틱 회귀 모델 원리: 독립변수를 x, 종속변수를 z로 표기, ..

ADsP 자격증 스터디 1주차(R기초와 데이터 마트, 통계분석)

스터디 날짜: 3월 26일스터디 범위: Part 3 R 기초와 데이터 마트(p117-146), 통계분석 (p147-200)Part 3. 데이터 분석Chapter 1. R기초와 데이터 마트​Section 1. R 프로그래밍 기초1. R의 자료 구조R에서 사용하는 데이터의 기본 타입: 숫자형, 문자형, 논리형자료구조는 변수에 의해서 메모리에 할당벡터, 행렬, 배열은 한 가지 타입의 데이터로만 이러우진 원소들만 저장, 데이터 프레임은 다양한 타입 저장 가능데이터 형에 따른 R구조: 스칼라, 팩터, 백터, 행렬, 데이터프레임, 배열, 리스트 / 데이터 프레임과 리스트는 복합 원소 저장 가능​- factor: 문자형 데이터가 저장된 벡터의 일종 (성별, 혈액형, 학점)- vector: 스칼라 원소들을 갖는 1차원..