Conas comhaid CSV a pharsáil i Python

Tuairimí: 0

Sainmhínítear parsáil sonraí mar bhailiúchán agus próiseáil uathoibríoch faisnéise, a úsáidtear go minic i gcás comhad CSV. Anseo ciallaíonn parsáil comhaid CSV a slisniú i sraitheanna, i gcolúin agus i luachanna. Agus é sin á dhéanamh, is féidir anailís a dhéanamh ar na sonraí, a scagadh, agus a bhaint le haghaidh tuilleadh oibre gan stró. San Airteagal seo míneoimid conas Python a úsáid chun comhaid CSV a léamh. Ina theannta sin, taispeánfaimid conas sonraí a pharsáil ó chomhad CSV i Python.

Cad is comhad CSV ann?

Is formáid chomhaid é CSV, nó (Comma Separated Values) a shábhálann sonraí ar bhealach a bhfuil luachanna scartha ag camóga agus athruithe nua líne. Mar gheall air seo, is féidir formáid CSV a úsáid i gcomhthéacsanna éagsúla, mar shampla sonraí a chruthú nó a mhodhnú in Excel.

Is é an príomh -neart amháin de chomhaid CSV an éascaíocht a bhaineann le rochtain a fháil ar fhaisnéis agus a roinnt. Ceadaíonn a uathúlacht an comhad a oscailt agus a phróiseáil beag beann ar na bogearraí atá á n -úsáid. Fágann sé seo go bhfuil sé áisiúil sonraí den sórt sin a onnmhairiú i bhfoirm scarbhileog nó bunachar sonraí.

Anois, lig dúinn a thaispeáint conas CSV a oscailt agus a léamh i Python sa bhloc seo a leanas.

Comhaid CSV a pharsáil le Python

Tá leabharlann CSV tógtha ag Python atá in ann sonraí a léamh agus a scríobh gan stró. Ní gá leabharlanna seachtracha a shuiteáil, rud a fhágann go bhfuil anailís á déanamh ar ábhar agus ar chomhaid a oscailt.

Taispeánann na codanna seo a leanas de chód conas comhad сv a oscailt agus a phriontáil ar a dtugtar university_records i Python. Baineann sé úsáid as an modh léite chun an comhad a oscailt, agus ansin léann sé an comhad CSV, ar deireadh, priontálann sé na sonraí le lúb.


import csv

with open('university_records.csv', 'r') as csv_file:
    reader = csv.reader(csv_file)

    for row in reader:
        print(row)

Comhaid CSV a scríobh le Python

Chun na críche seo, bainfimid úsáid as an modúl CSV chun sonraí a scríobh. Tá modhanna úsáideacha ann chun cabhrú leat faisnéis a scríobh sa mhodúl CSV:

  • .writer() – feidhmíonn sé mar uirlis cruthaithe comhad;
  • .writerow() – stórálann sé sonraí i ndiaidh a chéile.

Tá modhanna an mhodúil léirithe go cuimsitheach sa chód thíos:


import csv

row = ['David', 'MCE', '3', '7.8']

row1 = ['Monika', 'PIE', '3', '9.1']

row2 = ['Raymond', 'ECE', '2', '8.5']

with open('university_records.csv', 'a') as csv_file:
    writer = csv.writer(csv_file)

    writer.writerow(row)

    writer.writerow(row1)

    writer.writerow(row2)

CSV a pharsáil le Leabharlann Pandas

Tá sé ríthábhachtach inniu úsáid a bhaint as Python chun comhaid CSV a pharsáil: ó scarbhileoga le haghaidh airgeadais go bunachair shonraí ollmhóra le haghaidh foghlama meaisín. Uaireanta is pian é obair leis na comhaid sin, go háirithe nuair a bhíonn níos mó gnéithe de dhíth ort ná an méid a sholáthraíonn Python as an mbosca. I gcásanna den sórt sin, is féidir le leabharlann Pandas teacht chun cinn.

Léirítear an cumas iomlán chun sonraí a scríobh le DataFrame thíos. Tá DataFrame ar cheann de na príomhstruchtúir sonraí i leabharlann Pandas agus úsáidtear é chun oibriú le sonraí táblaí.


import pandas as pd

data = {"Name": ["David", "Monika", "Raymond"], 
        "Age": [30, 25, 40], 
        "City": ["Kyiv", "Lviv", "Odesa"]
} 

df = pd.DataFrame(data) 

file_path = "data.csv" 
df.to_csv(file_path, index=False, encoding="utf-8")



Príomhghnéithe Leabharlann Pandas

I gcás Python, meastar go bhfuil leabharlann Pandas ar cheann de na cinn is éifeachtaí chun CSV a pharsáil agus anseo na cúiseanna go bhfuil sé chomh cumhachtach agus áisiúil:

  1. Uaslódáil comhad simplí. If a dataset comes from multiple origins and has inconsistency in its formatting, then Pandas proving it’s supreme is magical as it parses the file automatically eliminating manual effort.
  2. Scalability. Nuair a fhéachann na leabharlanna caighdeánacha Python le comhaid mhóra CSV a pharsáil, is iondúil go mbíonn siad ag titim go leor ach le pandas, déantar an leas iomlán a bhaint as mar go ndéantar é a dhéanamh go maith le comhaid níos mó. Chomh maith leis sin, cuireann ilroinnt an uaslódála comhaid cosc ​​ar ró -ualach cuimhne a chosc.
  3. Ag déileáil le próisis éagsúla. Tá luachanna atá ar iarraidh, formáidí míchearta agus dúblálaí le fáil go príomha i gcomhaid CSV. Dea -rud, cruthaíonn pandas go fóill go bhfuil draíocht le huirlisí tógtha ar nós sonraí atá ar iarraidh agus athsholáthar cineálacha, glanadh carachtar, agus athstruchtúrú faisnéise le haghaidh anailíse ardleibhéil.

Taispeánann na gnéithe seo gur fearr an leabharlann chun comhaid CSV a anailísiú go tapa mar go bhfuil uirlisí eile teoranta i gcomparáid. Ag an am céanna, tá sé in ann méideanna móra sonraí a phróiseáil, rud a fhágann go bhfuil sé thar a bheith úsáideach i saol na faisnéise.

Ag léamh comhaid CSV le pandas

Sula bhfuil tú in ann an doiciméad CSV a úsáid, is é an chéad chéim é a uaslódáil.


import pandas as pd

df = pd.read_csv("data.csv")

Agus tú ag déileáil le tacair shonraí fhairsinge, tá uirlisí PANDAS oiriúnach le húsáid. Déanaimis iniúchadh ar conas is féidir le script Python comhad CSV a pharsáil.


df.head() # Taispeánann an chéad 5 shraith
df.tail(10) # Taispeánann sé na 10 sraith dheireanacha
df.info() # Aschuir liosta de cholúin, cineálacha sonraí, agus líon na luachanna líonta

Chun colúin amháin nó ilcholún a roghnú, cuir i gcrích:


df["Name"] # Faigh an colún "Name"


df[["Name", "Age"]] # Sliocht amháin "Name" agus "Age"

Comhaid CSV a scríobh le pandas

Anois déanaimis súil ar conas sraitheanna áirithe a chur isteach, a mhodhnú agus a bhaint.

Rae nua a chur isteach:


# Luchtaigh an comhad CSV
df = pd.read_csv(file_path) 

# Cuir sraith nua leis
new_row = pd.DataFrame([{"Name": "Denys", "Age": 35, "City": "Kharkiv"}]) df = pd.concat([df, new_row], ignore_index=True) 


# Spáráil
df.to_csv(file_path, index=False, encoding="utf-8")

Rae áirithe a mhodhnú:


df = pd.read_csv(file_path) 

# Athraigh aois Ivan
df.loc[df["Name"] == "Ivan", "Age"] = 26 

df.to_csv(file_path, index=False, encoding="utf-8")

As a chéile a bhaint:


df = pd.read_csv(file_path) 

# Bain an tsraith áit a bhfuil ainm == "Mykhailo" 
df = df[df["Name"] != "Mykhailo"] 

df.to_csv(file_path, index=False, encoding="utf-8")

Deireadh

Chun achoimre a dhéanamh, san alt seo léiríomar conas comhad CSV a oscailt agus a léamh i Python. Ach nuair a éilíonn úsáideoir níos mó cruinnis agus uirlisí ateangaireachta cumhachtach, oibríonn Pandas go foirfe. Próisis athchleachtacha a uathoibriú, a cheadaíonn do chomhaid ollmhóra a láimhseáil agus am a shábháil, tá an leabharlann seo an -éifeachtach. Dá bhrí sin, is féidir a thabhairt i gcrích go soláthraíonn an leabharlann chaighdeánach CSV na riachtanais i gcás bunfheidhmeanna, agus go ndéantar Pandas chun déileáil le sonraí faisnéise fairsinge.

Tuairimí:

0 tuairimí