ํ๋ค์ค
-
๋น ๋ฐ์ดํฐ๋ถ์๊ธฐ์ฌ ์ค๊ธฐ corr() ํจ์์ numeric_only ์ต์
corr() ํจ์์ numeric_only ์ต์ ๋ค์ด๊ฐ๋ฉฐํ๋ค์ค(Pandas) 2.0.0 ๋ฒ์ ๋ถํฐ corr ํจ์์ numeric_only ์ต์ ์ ๊ธฐ๋ณธ๊ฐ์ด False๋ก ๋ณ๊ฒฝ๋์๋ค.์ด์ ๋ํ ๋ด์ฉ์ ์ ๋ฆฌํด๋ณธ๋ค. ์ค๋ช ํ๋ค์ค(Pandas) 2.0.0 ๋ฒ์ ๋ถํฐ corr ํจ์์ numeric_only ์ต์ ์ ๊ธฐ๋ณธ๊ฐ์ด False๋ก ๋ณ๊ฒฝ๋์๋ค.์ด์ ๋ฒ์ ์๋ ๊ธฐ๋ณธ๊ฐ์ด True๋ก ์ค์ ๋์ด ์์ด์, ์ด ์ต์ ์ ๋ฐ๋ก ๋ฃ์ด์ฃผ์ง ์์๋ ๋์๋ค.๋ฐ๋ผ์ ํ๋ค์ค 2.0.0 ์ด์ ๋ฒ์ ์ด ์ ์ฉ๋ ๋น ๋ฐ์ดํฐ๋ถ์๊ธฐ์ฌ ์ค๊ธฐ ์ํ 9ํ์ฐจ๋ถํฐ corr ํจ์๋ฅผ ์ฌ์ฉํ ๊ฒฝ์ฐ, numeric_only=True ์ต์ ์ ๋ฐ๋์ ์ง์ ํด์ค์ผ ํ๋ค.import pandas as pddf = pd.read_csv("data/Titani..
0 2024.11.25 -
Python loc, iloc ์ฐจ์ด์ ๋น๊ต (Pandas)
loc, iloc ์ฐจ์ด์ ๋น๊ต (Pandas)๋ค์ด๊ฐ๋ฉฐํ๋ค์ค(Pandas)์ loc๊ณผ iloc ํจ์์ ์ฐจ์ด์ ์ ์ ๋ฆฌํด๋ณธ๋ค.๋ ํจ์๋ ํ๋ค์ค์ ๋ฐ์ดํฐํ๋ ์(DataFrame) ๊ฐ์ฒด์์ ์ฌ์ฉํ ์ ์๋ค. loc ํจ์๊ฐ๋ ๋ผ๋ฒจ ๊ธฐ๋ฐ(Label-based) ์ธ๋ฑ์ฑ ๋ฐฉ์ํ๊ณผ ์ด์ ์ด๋ฆ ๋๋ ๋ผ๋ฒจ์ ๊ธฐ์ค์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ์ ํํ๋ค.์ฌ๋ผ์ด์ฑ์ ํ ๋, ๋๊ฐ๋ ํฌํจ๋๋ค. ([a, b]) ์ฌ์ฉ ์์ ์ฝ๋import pandas as pddata = { 'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}df = pd.DataFrame(data, index=['row1', 'row2', 'row3'])""" ์ถ๋ ฅ ๊ฒฐ๊ณผ A B Crow1 1 4 7row..
0 2024.11.22 -
๋น ๋ฐ์ดํฐ๋ถ์๊ธฐ์ฌ ์ค๊ธฐ ํ๋ค์ค(pandas) ์ถ๋ ฅ ๊ธธ์ด ์ ํ ํด์ ํ๊ธฐ
ํ๋ค์ค(pandas) ์ถ๋ ฅ ๊ธธ์ด ์ ํ ํด์ ํ๊ธฐ๋ค์ด๊ฐ๋ฉฐํ๋ค์ค(pandas)์ ์ถ๋ ฅ ๊ธธ์ด ์ ํ์ ํด์ ํ๋ ๋ฐฉ๋ฒ์ ์ ๋ฆฌํด๋ณธ๋ค.๊ธด ๋ด์ฉ์ ๋ฐ์ดํฐ๋ฅผ ํ์ธํ ๊ฒฝ์ฐ ์ค๊ฐ์ ...์ผ๋ก ์๋ต๋์ด ์์ด์ ๋ถํธํ๋ฐ, ์ด ์ค์ ์ ํด์ฃผ๋ฉด ์ ์ฒด ๋ด์ฉ์ด ๋ณด์ด๊ฒ ๋๋ค. ๋ฐฉ๋ฒ๋ค์๊ณผ ๊ฐ์ด pd.set_option()์ ์ด์ฉํ์ฌ ์ต๋ ์ถ๋ ฅ ํ๊ณผ ์ด์ ๊ฐ์๋ฅผ ์์จ ์ ์๋ค.import pandas as pd# ํ๊ณผ ์ด์ ์ต๋ ์ถ๋ ฅ ์ ํ ํด์ ํ๊ธฐpd.set_option('display.max_rows', None) pd.set_option('display.max_columns', None) ์ฐธ๊ณ ์ฌ์ดํธ pandas.set_option โ pandas 2.2.3 documentationdisplay.[large_repr, max_c..
0 2024.10.27 -
Python ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ ํ ๋ ๊ฒฐ์ธก๊ฐ ์ ๊ฑฐ ๋ฐฉ๋ฒ (Pandas)
๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ ํ ๋ ๊ฒฐ์ธก๊ฐ ์ ๊ฑฐ ๋ฐฉ๋ฒ (Pandas)๋ค์ด๊ฐ๋ฉฐ๋ฐ์ดํฐ๋ฅผ ์ ์ฒ๋ฆฌํ ๋ ํ๋ค์ค(Pandas)๋ฅผ ์ด์ฉํ์ฌ ๊ฒฐ์ธก๊ฐ์ ์ ๊ฑฐํ๋ ๋ฐฉ๋ฒ์ ์ ๋ฆฌํด๋ณธ๋ค. ๋ฐฉ๋ฒ๋ณดํต ๋ค์๊ณผ ๊ฐ์ด df.dropna()๋ฅผ ์ด์ฉํ ์๋ ์์ผ๋, ๋ฐ์ดํฐ์ ๊ณต๋ฐฑ(' ')์ด ์์ ๊ฒฝ์ฐ ์ ๊ฑฐํ์ง ๋ชปํ๋ค๋ ๋จ์ ์ด ์๋ค.df['column'] = df['column'].dropna() ๊ทธ๋์ ๋ค์๊ณผ ๊ฐ์ด pd.to_numeric()์ ๋จผ์ ์จ์ ๊ณต๋ฐฑ(' '), NaN ๋ฑ ๊ฒฐ์ธก๊ฐ์ ์ ๋ถ NaN์ผ๋ก ๋ฐ๊ฟ์ค ํ, dropna()๋ฅผ ์ ์ฉ์์ผ์ฃผ๋ฉด ๋ชจ๋ ๊ฒฐ์ธก์น๋ค์ ์ ๊ฑฐํ ์ ์๋ค.df['column'] = pd.to_numeric(df['column']) # ๊ณต๋ฐฑ, NaN ๋ฑ ๋ชจ๋ ๊ฒฐ์ธก์น๋ค์ NaN์ผ๋ก ๋ฐ๊พธ๊ธฐdf['colu..
1 2024.06.21