집돌이 공대남 IT

[Python]파이썬으로 데이터 분석 및 시각화하기: pandas, numpy, matplotlib, seaborn 활용법-numpy,matplotlib,seaborn 본문

IT/파이썬

[Python]파이썬으로 데이터 분석 및 시각화하기: pandas, numpy, matplotlib, seaborn 활용법-numpy,matplotlib,seaborn

집공이 2023. 3. 4. 23:52

안녕하십니까 집공이입니다.

 

오늘은 저번 시간에 이어 나머지 라이브러리에 대해서 실습을 해보려 합니다.

 

혹시 저번 포스팅을 못 보셨다면 차례차례로 진행하시길 추천 드립니다.

 

 

 

[Python]파이썬으로 데이터 분석 및 시각화하기: pandas, numpy, matplotlib, seaborn 활용법-pandas편

안녕하십니까 집공이입니다. 저번 포스팅에서 라이브러리에 대해서 개념적인 부분들을 배웠습니다. [Python]파이썬을 활용한 데이터 분석 라이브러리: pandas, numpy, matplotlib, seaborn 안녕하십니까 집

gongdeanam-it.tistory.com

 

 

저번 시간에 pandas를 1번으로 했으니 바로 2번으로 진행하겠습니다.

 

2. numpy

numpy를 활용한 간단한 실습을 진행해보겠습니다.

 

우선 numpy를 설치해주세요. 아래의 명령어를 터미널(cmd)에 입력해주세요.

 

pip install numpy

 

설치가 완료되었다면, 다음과 같은 예제 코드를 실행해보세요.

import numpy as np

# 1차원 배열 생성
arr1 = np.array([1, 2, 3])
print("1차원 배열 출력:")
print(arr1)

# 2차원 배열 생성
arr2 = np.array([[1, 2, 3], [4, 5, 6]])
print("2차원 배열 출력:")
print(arr2)

# 3차원 배열 생성
arr3 = np.array([[[1, 2], [3, 4]], [[5, 6], [7, 8]]])
print("3차원 배열 출력:")
print(arr3)

# 배열의 형태 출력
print("배열의 형태 출력:")
print(arr1.shape, arr2.shape, arr3.shape)

# 배열의 크기 출력
print("배열의 크기 출력:")
print(arr1.size, arr2.size, arr3.size)

# 배열의 데이터 타입 출력
print("배열의 데이터 타입 출력:")
print(arr1.dtype, arr2.dtype, arr3.dtype)

# 배열 연산
arr4 = np.array([[1, 2], [3, 4]])
arr5 = np.array([[5, 6], [7, 8]])

print("배열 연산:")
print(arr4 + arr5)
print(arr4 - arr5)
print(arr4 * arr5)
print(arr4 / arr5)
print(np.dot(arr4, arr5))

 

위 코드는 numpy를 이용하여 1차원, 2차원, 3차원 배열을 생성하고, 배열의 형태, 크기, 데이터 타입 등을 출력하는 예제입니다. 마지막으로 배열 간의 연산을 수행하는 코드도 포함되어 있습니다.

실행해보시고 numpy의 기본적인 사용법을 익혀보세요!

 

3. matplotlib

matplotlib 실습 예제를 살펴보면서 그래프를 그려보도록 하겠습니다.

아래는 예제 코드입니다. 이 예제 코드는 numpy를 사용하여 데이터를 생성하고, matplotlib를 사용하여 데이터를 시각화하는 간단한 예제입니다.

import numpy as np
import matplotlib.pyplot as plt

# 데이터 생성
x = np.linspace(0, 10, 100)
y = np.sin(x)

# 그래프 그리기
plt.plot(x, y)
plt.show()

위 코드를 실행하면, x축은 0부터 10까지 100개의 값을 생성하고, y축은 sin 함수를 이용하여 생성한 값입니다. 그리고 plt.plot(x, y)를 사용하여 그래프를 그리고, plt.show()를 사용하여 그래프를 화면에 출력합니다.

이제 이 코드를 실행해보세요. 그래프가 잘 그려지는지 확인해보세요.

 

4. seaborn

seaborn은 matplotlib을 기반으로 한 데이터 시각화 라이브러리로, matplotlib보다 간편하게 그래프를 그릴 수 있습니다.

 

seaborn을 활용하여 다양한 시각화 기법을 적용할 수 있습니다.

 

seaborn을 실습해보기 위해서는 먼저 seaborn 라이브러리를 설치해야 합니다. 아래의 명령어를 통해 설치할 수 있습니다.

 

!pip install seaborn

 

seaborn을 활용하여 데이터를 시각화할 때는 데이터프레임을 활용합니다.

 

다음은 seaborn을 사용하여 데이터프레임에서 변수들 간의 관계를 살펴볼 수 있는 산점도를 그리는 예시입니다.

import seaborn as sns
import pandas as pd

df = pd.read_csv('data.csv')  # 데이터프레임 불러오기
sns.scatterplot(x='age', y='income', data=df)  # 산점도 그리기

위의 코드는 데이터프레임에서 'age'와 'income' 변수 간의 관계를 살펴보는 산점도를 그리는 코드입니다.

 

이외에도 seaborn을 사용하여 히스토그램, 박스 플롯, 히트맵 등 다양한 시각화 기법을 적용할 수 있습니다.

 

오늘은 이렇게 파이썬의 라이브러리들을 배워봤습니다. 어디서 어떤 데이터에 써야할 지 생각해보면서 실습하시면 더욱더

좋습니다.

 

감사합니다.