머신러닝과 빅데이터 분석/기초 통계(Statics)2 기초 통계2 1. 확률통계 확률이론은 통계학의 기본 이론으로 추정과 검정이론의 기초 통계적 추론이 확률이론에 기초하고 있기 때문에 의미 있는 통계적 추론을 하기 위해서는 기본적인 확률이론에 대한 이해가 필요하다. 1-1. 확률과 확률변수 1) 확률 발생 가능한 모든 사건들의 집합 표본공간에서 표본공간의 부분집합인 특정 사건 A가 발생할 수 있는 비율을 나타내는 값으로, 0과 1사이의 값이며, 가능한 모든 사건의 확률의 합은 항상 1이다. 어떤 사건이 일어날 가능성을 수치로 나타낸 것 2) 조건부 확률 어떤 사건 A가 일어났을 때 사건 B가 발생할 확률을 뜻한다. 이는 두 사건이 동시에 일어날 확률P(A∩B)을 사건 A가 일어날 확률 P(A)로 나눈 것으로 조건부 확률에 있어서 사건 B가 발생할 확률이 사건 A의 확률.. 머신러닝과 빅데이터 분석/기초 통계(Statics) 2024. 3. 8. 기초 통계 1. 데이터의 이해 1-1. 데이터 데이터란 용어는 1646년 영국문헌에 처음 등장하였으며 라틴어인 dare(주다)의 분사형으로 ‘주어진것’이란 의미로 사용된다. 데이터는 추론과 추정의 근거를 이루는 사실을 나타낸다. 1) 데이터의 특성 존재적 특성 "있는 그대로의 사실"을 나타냄 당위적 특성 "추론, 예측, 전망, 추정"을 위한 정보의 근거 2) 데이터의 유형 - 형태의 따른 분류 정성적 데이터 언어나 문자등과 같이 수치적으로 표현되지않은 데이터 (선호도, 만족도) 정량적 데이터 수치,도형,기호 등 연산이 가능하도록 수치화된데이터 (온도, 풍량, 주가) - 구조에 따른 분류 정형 데이터 정형화된 틀이 있고 연산이 가능(정량적 데이터) 비정형 데이터 정형화된 틀이 없고 연산이 불가능(정성적 데이터) 반정.. 머신러닝과 빅데이터 분석/기초 통계(Statics) 2024. 3. 7. 이전 1 다음 728x90