ํ๋ค์ค
-
- [๋น ๋ฐ์ดํฐ๋ถ์๊ธฐ์ฌ ์ค๊ธฐ] corr() ํจ์์ numeric_only ์ต์
corr() ํจ์์ numeric_only ์ต์ ๋ค์ด๊ฐ๋ฉฐํ๋ค์ค(Pandas) 2.0.0 ๋ฒ์ ๋ถํฐ @corr@ ํจ์์ @numeric_only@ ์ต์ ์ ๊ธฐ๋ณธ๊ฐ์ด @False@๋ก ๋ณ๊ฒฝ๋์๋ค.์ด์ ๋ํ ๋ด์ฉ์ ์ ๋ฆฌํด๋ณธ๋ค. ์ค๋ช ํ๋ค์ค(Pandas) 2.0.0 ๋ฒ์ ๋ถํฐ @corr@ ํจ์์ @numeric_only@ ์ต์ ์ ๊ธฐ๋ณธ๊ฐ์ด @False@๋ก ๋ณ๊ฒฝ๋์๋ค.์ด์ ๋ฒ์ ์๋ ๊ธฐ๋ณธ๊ฐ์ด @True@๋ก ์ค์ ๋์ด ์์ด์, ์ด ์ต์ ์ ๋ฐ๋ก ๋ฃ์ด์ฃผ์ง ์์๋ ๋์๋ค.๋ฐ๋ผ์ ํ๋ค์ค 2.0.0 ์ด์ ๋ฒ์ ์ด ์ ์ฉ๋ ๋น ๋ฐ์ดํฐ๋ถ์๊ธฐ์ฌ ์ค๊ธฐ ์ํ 9ํ์ฐจ๋ถํฐ @corr@ ํจ์๋ฅผ ์ฌ์ฉํ ๊ฒฝ์ฐ, @numeric_only=True@ ์ต์ ์ ๋ฐ๋์ ์ง์ ํด์ค์ผ ํ๋ค.import pandas as pddf = pd.read_csv("data/Titani..
2024.11.25 -
- [Python] loc, iloc ์ฐจ์ด์ ๋น๊ต (Pandas)
loc, iloc ์ฐจ์ด์ ๋น๊ต (Pandas)๋ค์ด๊ฐ๋ฉฐํ๋ค์ค(Pandas)์ @loc@๊ณผ @iloc@ ํจ์์ ์ฐจ์ด์ ์ ์ ๋ฆฌํด๋ณธ๋ค.๋ ํจ์๋ ํ๋ค์ค์ ๋ฐ์ดํฐํ๋ ์(DataFrame) ๊ฐ์ฒด์์ ์ฌ์ฉํ ์ ์๋ค. loc ํจ์๊ฐ๋ ๋ผ๋ฒจ ๊ธฐ๋ฐ(Label-based) ์ธ๋ฑ์ฑ ๋ฐฉ์ํ๊ณผ ์ด์ ์ด๋ฆ ๋๋ ๋ผ๋ฒจ์ ๊ธฐ์ค์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ์ ํํ๋ค.์ฌ๋ผ์ด์ฑ์ ํ ๋, ๋๊ฐ๋ ํฌํจ๋๋ค. (@[a, b]@) ์ฌ์ฉ ์์ ์ฝ๋import pandas as pddata = { 'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}df = pd.DataFrame(data, index=['row1', 'row2', 'row3'])""" ์ถ๋ ฅ ๊ฒฐ๊ณผ A B Crow1 1 4 7row..
2024.11.22 -
- [๋น ๋ฐ์ดํฐ๋ถ์๊ธฐ์ฌ ์ค๊ธฐ] ํ๋ค์ค(pandas) ์ถ๋ ฅ ๊ธธ์ด ์ ํ ํด์ ํ๊ธฐ
ํ๋ค์ค(pandas) ์ถ๋ ฅ ๊ธธ์ด ์ ํ ํด์ ํ๊ธฐ๋ค์ด๊ฐ๋ฉฐํ๋ค์ค(@pandas@)์ ์ถ๋ ฅ ๊ธธ์ด ์ ํ์ ํด์ ํ๋ ๋ฐฉ๋ฒ์ ์ ๋ฆฌํด๋ณธ๋ค.๊ธด ๋ด์ฉ์ ๋ฐ์ดํฐ๋ฅผ ํ์ธํ ๊ฒฝ์ฐ ์ค๊ฐ์ @...@์ผ๋ก ์๋ต๋์ด ์์ด์ ๋ถํธํ๋ฐ, ์ด ์ค์ ์ ํด์ฃผ๋ฉด ์ ์ฒด ๋ด์ฉ์ด ๋ณด์ด๊ฒ ๋๋ค. ๋ฐฉ๋ฒ๋ค์๊ณผ ๊ฐ์ด @pd.set_option()@์ ์ด์ฉํ์ฌ ์ต๋ ์ถ๋ ฅ ํ๊ณผ ์ด์ ๊ฐ์๋ฅผ ์์จ ์ ์๋ค.import pandas as pd# ํ๊ณผ ์ด์ ์ต๋ ์ถ๋ ฅ ์ ํ ํด์ ํ๊ธฐpd.set_option('display.max_rows', None) pd.set_option('display.max_columns', None) ์ฐธ๊ณ ์ฌ์ดํธ pandas.set_option — pandas 2.2.3 documentationdisplay.[large_repr, max_c..
2024.10.27 -
- [Python] ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ ํ ๋ ๊ฒฐ์ธก๊ฐ ์ ๊ฑฐ ๋ฐฉ๋ฒ (Pandas)
๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ ํ ๋ ๊ฒฐ์ธก๊ฐ ์ ๊ฑฐ ๋ฐฉ๋ฒ (Pandas)๋ค์ด๊ฐ๋ฉฐ๋ฐ์ดํฐ๋ฅผ ์ ์ฒ๋ฆฌํ ๋ ํ๋ค์ค(Pandas)๋ฅผ ์ด์ฉํ์ฌ ๊ฒฐ์ธก๊ฐ์ ์ ๊ฑฐํ๋ ๋ฐฉ๋ฒ์ ์ ๋ฆฌํด๋ณธ๋ค. ๋ฐฉ๋ฒ๋ณดํต ๋ค์๊ณผ ๊ฐ์ด @df.dropna()@๋ฅผ ์ด์ฉํ ์๋ ์์ผ๋, ๋ฐ์ดํฐ์ ๊ณต๋ฐฑ(@' '@)์ด ์์ ๊ฒฝ์ฐ ์ ๊ฑฐํ์ง ๋ชปํ๋ค๋ ๋จ์ ์ด ์๋ค.df['column'] = df['column'].dropna() ๊ทธ๋์ ๋ค์๊ณผ ๊ฐ์ด @pd.to_numeric()@์ ๋จผ์ ์จ์ ๊ณต๋ฐฑ(@' '@), @NaN@ ๋ฑ ๊ฒฐ์ธก๊ฐ์ ์ ๋ถ @NaN@์ผ๋ก ๋ฐ๊ฟ์ค ํ, @dropna()@๋ฅผ ์ ์ฉ์์ผ์ฃผ๋ฉด ๋ชจ๋ ๊ฒฐ์ธก์น๋ค์ ์ ๊ฑฐํ ์ ์๋ค.df['column'] = pd.to_numeric(df['column']) # ๊ณต๋ฐฑ, NaN ๋ฑ ๋ชจ๋ ๊ฒฐ์ธก์น๋ค์ NaN์ผ๋ก ๋ฐ๊พธ๊ธฐdf['colu..
1 2024.06.21