본문 바로가기

NumPy2

[데이터 분석] numpy (1) ◆ Numpy 기초 스터디 - numpy = numerical python / 파이썬 데이터 과학의 핵심 라이브러리 - import numpy as np ◆ Numpy Basic Concept python의 데이터를 담는 기본적인 컨테이너는 list(리스트) 입니다. python은 동적 타이핑(dynamic typing)을 지원하기 때문에, 각각 서로 다른 데이터의 형식을 담는 리스트를 생성 할 수 있습니다. 파이썬은 이처럼 유연한 타입을 허용하기 때문에, 리스트의 각 항목에 타입의 정보 등을 가지고 있어야 하며, 이는 때때로 고정 타입 배열 형식에 비해서 비효율적으로 보일 수 있습니다. 리스트는 굉장히 유연한 것이 장점이지만, 때때로 비효율적일 수 있습니다. 그런 리스트와 달리, 효율적으로 고정 타입 .. 2021. 3. 6.
[Pandas] 누락 데이터 처리 201217 Python Study Pandas의 Input으로 주기 위한 데이터는 깨끗하거나 형태가 단일한 경우가 극히 드물다. 이런 경우, 누락데이터를 처리해주어야한다. None, Nan(Not a Number) 등이 누락된 데이터를 말한다. 누락된 데이터의 특성을 한번 살펴보자 1+np.nan의 값은 nan으로 나오고 None값은 연산을 할경우 오류가 발생한다. 이를 볼때, None값을 가지는 배열에서 연산을 할 경우 오류를 발생할 것임을 알 수 있다. ■ NaN의 특성 1+ np.nan = nan 0 * np.nan = nan NaN이 포함된 객체의 모든 연산은 NaN으로 값을 출력하므로 기억해두면 좋다 ■Null값 연산 - isnull() / notnull() / dropna() / fillna.. 2021. 3. 1.