Pandas ์ฌ์ฉ๋ฒ - ํ์ผ ์ ์ฅ ๋ฐ ์ด๊ธฐ [๊ธฐ๋ณธ]
pandas๋ฅผ ํ์ฉํ๋ฉด ๊ฐ๋จํ๊ฒ ํ์ผ์ ์ด๊ณ ์ ์ฅํ ์ ์๋ค. ์ด์ ์ ํ์ฉํ๋ DataFrame์ ํ์ฉํ์.
data = {
'์ด๋ฆ' : ['์ฑ์น์', '์ ๋๋ง', '์กํ์ญ', '์ํ์
', '๊ฐ๋ฐฑํธ', '๋ณ๋๊ท', 'ํฉํ์ฐ', '์ค๋ํ'],
'ํ๊ต' : ['๋ถ์ฐ๊ณ ', '๋ถ์ฐ๊ณ ', '๋ถ์ฐ๊ณ ', '๋ถ์ฐ๊ณ ', '๋ถ์ฐ๊ณ ', '๋ฅ๋จ๊ณ ', '๋ฅ๋จ๊ณ ', '๋ฅ๋จ๊ณ '],
'ํค' : [197, 184, 168, 187, 188, 202, 188, 190],
'๊ตญ์ด' : [90, 40, 80, 40, 15, 80, 55, 100],
'์์ด' : [85, 35, 75, 60, 20, 100, 65, 85],
'์ํ' : [100, 50, 70, 70, 10, 95, 45, 90],
'๊ณผํ' : [95, 55, 80, 75, 35, 85, 40, 95],
'์ฌํ' : [85, 25, 75, 80, 10, 80, 35, 95],
'SWํน๊ธฐ' : ['Python', 'Java', 'Javascript', '', '', 'C', 'PYTHON', 'C#']
}
df = pd.DataFrame(data,index =['1๋ฒ','2๋ฒ','3๋ฒ','4๋ฒ','5๋ฒ','6๋ฒ','7๋ฒ','8๋ฒ'])
df.index.name = '์ง์๋ฒํธ'
Pandas์์๋ csv, hdf, SQL, excel, json ๋ฑ ๊ต์ฅํ ๋ง์ ํ์์ผ๋ก ํ์ผ์ ์ ์ฅํ ์ ์๋ค. ์ฌ์ฉ๋ฐฉ๋ฒ์ ๋ชจ๋ ๋น์ทํ๋ ๋ช๊ฐ์ง๋ง ์์๋ณด์.
ํ์ผ ์ ์ฅ
#csvํ์ผ๋ก ์ ์ฅ
df.to_csv('score.csv',encoding='utf-8-sig')#์ธ์ฝ๋ฉ ํด์ฃผ๋ฉด ํ๊ธ์ด ์๊นจ์ง
#csvํ์ผ์ธ๋ฐ, index(์ง์๋ฒํธ)๋ฅผ ๋นผ๊ณ ํ์ผ ์ ์ฅ
df.to_csv('score.csv',encoding='utf-8-sig',index=False)
์์ ๊ฐ์ด to_csv('ํ์ผ ์ด๋ฆ', ...)์ ํ์ฉํ๋ฉด ์์ฑํ DataFrame์ csvํ์ผ๋ก ๋ด๋ณด๋ผ ์ ์๊ณ , index์ ํฌํจ์ฌ๋ถ๊น์ง ์ค์ ํ ์ ์๋ค.
๋น์ทํ ๋ฐฉ๋ฒ์ผ๋ก ๋ค๋ฅธ ํ์ฅ์๋ก ํ์ผ์ ์ ์ฅํ๊ณ ์ถ๋ค๋ฉด to_[___]๋ฅผ ์ฌ์ฉํ ์ ์๋ค.
##ํ
์คํธ(.txt)ํ์ผ๋ก ์ ์ฅ
df.to_csv('score.txt',sep='\t') #tab์ผ๋ก ๊ตฌ๋ถ๋ ํ
์คํธ ํ์ผ
#์์
ํ์ผ๋ก ์ ์ฅ
df.to_excel('score.xlsx')
ํ์ผ ์ด๊ธฐ
๋ํ ์ ์ฅ๋ ํ์ผ์ ๊ฐ์ ธ์์ ์ด ์ ์๋ค.
'to_ํ์ฅ์' ๋์ ์ด๋ฒ์๋ 'read_ํ์ฅ์'๋ฅผ ์ฌ์ฉํ๋ฉด ๋๋ค.
#csvํ์ผ ์ด๊ธฐ
df=pd.read_csv('score.csv')
df
๋ ๋ฐ์ดํฐ ํ์ผ๋ค์ ์ด์ด๋ณด๋ฉด, ๊ฐ๋ ์ธ๋ฐ์๋ ์ธ๋ฑ์ค๋ค์ด ์๋จ์ ๋ฐฐ์น๋ ๊ฒฝ์ฐ๊ฐ ์๋ค. ์ด๋ฐ ๊ฒฝ์ฐ์๋ ์ต์ ์ ์ฌ์ฉํ์ฌ ์ธ๋ฐ ์๋ ํ์ ์ญ์ ํ๊ณ ํ์ผ์ ๋ถ๋ฌ ์ฌ ์ ์๋ค. ์์ df์ columns๋ '์ด๋ฆ', 'ํ๊ต'๋ฑ์ ์ ๋ณด๊ฐ ๋ค์ด๊ฐ ์์ง๋ง skiprows ์ต์ ์ ์ฌ์ฉํ๋ฉด ์ด๋ฅผ ๊ฑด๋๋ฐ๊ณ ๋ถ๋ฌ์ฌ ์ ์๋ค.
#1
df = pd.read_csv('score.csv',skiprows=1) #์ง์ ๋ ๊ฐฏ์ ๋งํผ์ row๋ฅผ ๊ฑด๋๋
df
#2
df = pd.read_csv('score.csv',skiprows=[1,3,5])
df
#3
df = pd.read_csv('score.csv',nrows=4) #์ง์ ๋ ๊ฐฏ์ ๋งํผ์ row๋ง ๊ฐ์ ธ์ด
df
์๊น์ ๋ค๋ฅด๊ฒ df์ columns์ ์ฑ์น์, ๋ถ์ฐ๊ณ ๋ฑ์ ์ ๋ณด๊ฐ ๋ค์ด๊ฐ ๊ฒ์ ํ์ธํ ์ ์๋ค.
๋๋ฒ์งธ ๋ฐฉ๋ฒ์ฒ๋ผ skiprows์ ์ ๋ ฅ์ ๋ฐฐ์ดํํ๋ก ์ ๋ ฅํ๋ฉด ์ ์ธํ๊ณ ์ถ์ ํ์ ์ง์ ์ ํํด์ ๋นผ๊ณ , ํ์ผ์ ๋ถ๋ฌ์ฌ ์๋ ์๋ค.
์ธ๋ฒ์งธ ๋ฐฉ๋ฒ์ ์ง์ ๋ ๊ฐฏ์๋งํผ๋ง ํ์ ๊ฐ์ ธ์ค๋ ๊ฒ์ด๋ค. nrows ์ต์ ์ ํ์ฉํ์ฌ ์ํ๋ ๊ฐฏ์๋งํผ์ ํ๋ง ๊ฐ์ ธ์ฌ ์ ์๋ค.