Sainmhínítear parsáil sonraí mar bhailiúchán agus próiseáil uathoibríoch faisnéise, a úsáidtear go minic i gcás comhad CSV. Anseo ciallaíonn parsáil comhaid CSV a slisniú i sraitheanna, i gcolúin agus i luachanna. Agus é sin á dhéanamh, is féidir anailís a dhéanamh ar na sonraí, a scagadh, agus a bhaint le haghaidh tuilleadh oibre gan stró. San Airteagal seo míneoimid conas Python a úsáid chun comhaid CSV a léamh. Ina theannta sin, taispeánfaimid conas sonraí a pharsáil ó chomhad CSV i Python.
Is formáid chomhaid é CSV, nó (Comma Separated Values) a shábhálann sonraí ar bhealach a bhfuil luachanna scartha ag camóga agus athruithe nua líne. Mar gheall air seo, is féidir formáid CSV a úsáid i gcomhthéacsanna éagsúla, mar shampla sonraí a chruthú nó a mhodhnú in Excel.
Is é an príomh -neart amháin de chomhaid CSV an éascaíocht a bhaineann le rochtain a fháil ar fhaisnéis agus a roinnt. Ceadaíonn a uathúlacht an comhad a oscailt agus a phróiseáil beag beann ar na bogearraí atá á n -úsáid. Fágann sé seo go bhfuil sé áisiúil sonraí den sórt sin a onnmhairiú i bhfoirm scarbhileog nó bunachar sonraí.
Anois, lig dúinn a thaispeáint conas CSV a oscailt agus a léamh i Python sa bhloc seo a leanas.
Tá leabharlann CSV tógtha ag Python atá in ann sonraí a léamh agus a scríobh gan stró. Ní gá leabharlanna seachtracha a shuiteáil, rud a fhágann go bhfuil anailís á déanamh ar ábhar agus ar chomhaid a oscailt.
Taispeánann na codanna seo a leanas de chód conas comhad сv a oscailt agus a phriontáil ar a dtugtar university_records i Python. Baineann sé úsáid as an modh léite chun an comhad a oscailt, agus ansin léann sé an comhad CSV, ar deireadh, priontálann sé na sonraí le lúb.
import csv
with open('university_records.csv', 'r') as csv_file:
reader = csv.reader(csv_file)
for row in reader:
print(row)
Chun na críche seo, bainfimid úsáid as an modúl CSV chun sonraí a scríobh. Tá modhanna úsáideacha ann chun cabhrú leat faisnéis a scríobh sa mhodúl CSV:
Tá modhanna an mhodúil léirithe go cuimsitheach sa chód thíos:
import csv
row = ['David', 'MCE', '3', '7.8']
row1 = ['Monika', 'PIE', '3', '9.1']
row2 = ['Raymond', 'ECE', '2', '8.5']
with open('university_records.csv', 'a') as csv_file:
writer = csv.writer(csv_file)
writer.writerow(row)
writer.writerow(row1)
writer.writerow(row2)
Tá sé ríthábhachtach inniu úsáid a bhaint as Python chun comhaid CSV a pharsáil: ó scarbhileoga le haghaidh airgeadais go bunachair shonraí ollmhóra le haghaidh foghlama meaisín. Uaireanta is pian é obair leis na comhaid sin, go háirithe nuair a bhíonn níos mó gnéithe de dhíth ort ná an méid a sholáthraíonn Python as an mbosca. I gcásanna den sórt sin, is féidir le leabharlann Pandas teacht chun cinn.
Léirítear an cumas iomlán chun sonraí a scríobh le DataFrame thíos. Tá DataFrame ar cheann de na príomhstruchtúir sonraí i leabharlann Pandas agus úsáidtear é chun oibriú le sonraí táblaí.
import pandas as pd
data = {"Name": ["David", "Monika", "Raymond"],
"Age": [30, 25, 40],
"City": ["Kyiv", "Lviv", "Odesa"]
}
df = pd.DataFrame(data)
file_path = "data.csv"
df.to_csv(file_path, index=False, encoding="utf-8")
I gcás Python, meastar go bhfuil leabharlann Pandas ar cheann de na cinn is éifeachtaí chun CSV a pharsáil agus anseo na cúiseanna go bhfuil sé chomh cumhachtach agus áisiúil:
Taispeánann na gnéithe seo gur fearr an leabharlann chun comhaid CSV a anailísiú go tapa mar go bhfuil uirlisí eile teoranta i gcomparáid. Ag an am céanna, tá sé in ann méideanna móra sonraí a phróiseáil, rud a fhágann go bhfuil sé thar a bheith úsáideach i saol na faisnéise.
Sula bhfuil tú in ann an doiciméad CSV a úsáid, is é an chéad chéim é a uaslódáil.
import pandas as pd
df = pd.read_csv("data.csv")
Agus tú ag déileáil le tacair shonraí fhairsinge, tá uirlisí PANDAS oiriúnach le húsáid. Déanaimis iniúchadh ar conas is féidir le script Python comhad CSV a pharsáil.
df.head() # Taispeánann an chéad 5 shraith
df.tail(10) # Taispeánann sé na 10 sraith dheireanacha
df.info() # Aschuir liosta de cholúin, cineálacha sonraí, agus líon na luachanna líonta
Chun colúin amháin nó ilcholún a roghnú, cuir i gcrích:
df["Name"] # Faigh an colún "Name"
df[["Name", "Age"]] # Sliocht amháin "Name" agus "Age"
Anois déanaimis súil ar conas sraitheanna áirithe a chur isteach, a mhodhnú agus a bhaint.
Rae nua a chur isteach:
# Luchtaigh an comhad CSV
df = pd.read_csv(file_path)
# Cuir sraith nua leis
new_row = pd.DataFrame([{"Name": "Denys", "Age": 35, "City": "Kharkiv"}]) df = pd.concat([df, new_row], ignore_index=True)
# Spáráil
df.to_csv(file_path, index=False, encoding="utf-8")
Rae áirithe a mhodhnú:
df = pd.read_csv(file_path)
# Athraigh aois Ivan
df.loc[df["Name"] == "Ivan", "Age"] = 26
df.to_csv(file_path, index=False, encoding="utf-8")
As a chéile a bhaint:
df = pd.read_csv(file_path)
# Bain an tsraith áit a bhfuil ainm == "Mykhailo"
df = df[df["Name"] != "Mykhailo"]
df.to_csv(file_path, index=False, encoding="utf-8")
Chun achoimre a dhéanamh, san alt seo léiríomar conas comhad CSV a oscailt agus a léamh i Python. Ach nuair a éilíonn úsáideoir níos mó cruinnis agus uirlisí ateangaireachta cumhachtach, oibríonn Pandas go foirfe. Próisis athchleachtacha a uathoibriú, a cheadaíonn do chomhaid ollmhóra a láimhseáil agus am a shábháil, tá an leabharlann seo an -éifeachtach. Dá bhrí sin, is féidir a thabhairt i gcrích go soláthraíonn an leabharlann chaighdeánach CSV na riachtanais i gcás bunfheidhmeanna, agus go ndéantar Pandas chun déileáil le sonraí faisnéise fairsinge.
Tuairimí: 0