Faisnéis a íocann ag rátaí urghnácha sa lá atá inniu ann, agus stóráiltear go leor comhad ar Google Docs. Mar sin, go deimhin, is bealach iontach é scríobadh sonraí Google Docs chun go leor ama agus iarrachta a shábháil.
San Airteagal seo, scrúdóimid na modhanna a chuidíonn leis an bpróiseas a uathoibriú. Bainfimid úsáid as Python chun Google Docs a scríobadh agus chun comhaid den sórt sin a shábháil i bhformáid JSON ar formáid stórála sonraí coitianta é.
Is féidir aisghabháil uathoibrithe sonraí atá stóráilte ar dhoiciméid phoiblí a úsáid ar chúiseanna éagsúla. Cabhraíonn sé le bailiú na faisnéise a uathoibriú gan aon idirghabháil láimhe. Tá sé seo an -úsáideach do:
Tá sé úsáideach freisin go bhfuil Google Docs le Python, úsáideach freisin chun anailís a dhéanamh ar ábhar na gcomhad sin. Fágann sé seo gur acmhainn iontach í an tseirbhís seo chun faisnéis chruinn agus dhomhain a fháil a phróiseáiltear níos déanaí ag baint úsáide as tuairiscí nó córais oiliúna meaisín-fhoghlama.
Chun scríobadh sonraí Google Docs a chomhlíonadh go héifeachtach, ní mór duit na huirlisí cuí i Python a roghnú don tasc seo. Seo a leanas cuid de na leabharlanna:
Braitheann roghnú idir na huirlisí seo ar cé acu an bhfuil do sprioc ag léamh comhad nó más mian leat idirghníomhaíochtaí ardleibhéil a dhéanamh ag baint úsáide as glao API ar shonraí struchtúrtha.
Anois, ba mhaith liom go ndéanfaimis scrúdú ar conas dul ar aghaidh leis an timpeallacht oibre a bhunú agus a dhéanamh leis na próisis atá imlínithe.
Cinntigh go bhfuil python suiteáilte agat. Ar Aghaidh:
python -m venv myenv
myenv\Scripts\activate
source myenv/bin/activate
pip install requests beautifulsoup4 google-api-python-client gspread google-auth
Oscail an comhad lena mbaineann. Ba chóir an doiciméad a údarú go poiblí. Lean na céimeanna thíos:
Gan seo, seolfaidh do scripteanna earráidí rochtana ar ais.
Chomh luath agus a fhoilsítear doiciméad, glacann a URL an fhormáid seo a leanas:
https://docs.google.com/document/d/1AbCdEfGhIjKlMnOpQrStUvWxYz/view
1AbCdEfGhIjKlMnOpQrStUvWxYz – is é seo an chaoi a ndéanfaidh tú rochtain ar an doiciméad ag baint úsáide as scríobadh API nó HTML.
Seo dhá phríomh -chur chuige chun faisnéis a bhaint as docs den sórt sin:
Is leor HTML do chásanna nach bhfuil chomh casta sin, ach tá gá le APIs i gceann níos casta.
Nuair a fhoilsítear comhad mar leathanach gréasáin, is féidir a HTML a aisghabháil agus ansin é a pharsáil chun an fhaisnéis ábhartha a fháil:
import requests
from bs4 import BeautifulSoup
url = 'https://docs.google.com/document/d/YOUR_ID/pub'
response = requests.get(url)
if response.status_code == 200:
soup = BeautifulSoup(response.text, 'html.parser')
# Bain gach téacs as an leathanach
text = soup.get_text()
print(text)
else:
print(f'Access error: {response.status_code}')
Seo an algartam oibre:
Má tá níos mó beachtais ag teastáil ar an bhfaisnéis a theastaíonn, is é an bealach is oiriúnaí ná trí láimhseálaithe agus doiciméid arna n -eisiúint ag an gCuideachta, agus mar sin ag baint úsáide as Google Docs API.
Céimeanna a thionscnamh:
Tá an chuma air seo:
from google.oauth2 import service_account
from googleapiclient.discovery import build
# Cosán chuig do chuntas seirbhíse JSON Comhad JSON
SERVICE_ACCOUNT_FILE = 'path/to/your/service_account.json'
# Do ID Doiciméad
DOCUMENT_ID = 'YOUR_ID'
# Cumraíocht rochtana
credentials = service_account.Credentials.from_service_account_file(
SERVICE_ACCOUNT_FILE,
scopes=['https://www.googleapis.com/ga/auth/documents.readonly']
)
service = build('docs', 'v1', credentials=credentials)
# Ábhar an doiciméid a aisghabháil
document = service.documents().get(documentId=DOCUMENT_ID).execute()
# Priontáil teideal an doiciméid
print('Document title: {}'.format(document.get('title')))
Nuair a fhaigheann tú sonraí, is gá é a stóráil go héifeachtach ionas gur féidir é a aisghabháil níos déanaí.
Sábháil le JSON:
import json
# Ag glacadh leis go bhfuil `data` athraitheach agat le hábhar eastósctha
with open('output.json', 'w', encoding='utf-8') as f:
json.dump(data, f, ensure_ascii=False, indent=4)
Ina dhiaidh sin, is féidir leat na sonraí a anailísiú nó a athrú de réir do riachtanais.
Bheadh sé níos fearr nuashonruithe uathoibríocha a leagan síos ná do script a fhorghníomhú féin.
Anseo thíos tá sampla de script uathoibrithe:
import time
def main():
# Do chód chun sonraí a bhaint agus a shábháil
print("Data harvesting...")
# Rith gach 6 uair an chloig
while True:
main()
time.sleep(6 * 60 * 60)
Cé go bhféadfadh sé a bheith simplí agus scríobadh sonraí Google Docs, áirítear le dúshláin shonracha:
Last agus is cinnte gurb é an eitic an ceann is tábhachtaí:
D'fhéachamar go domhain isteach i scríobadh sonraí Google Docs ag baint úsáide as Python. Deimhneoidh leibhéal castachta do thionscadail an roghnaíonn tú scríobadh HTML nó an Google Docs API. Agus tú ag déileáil le doiciméid phoiblí, is fearr a bheith cúramach agus machnamh a dhéanamh ar na hiarmhairtí dlíthiúla a bhaineann le scríobadh gréasáin.
Soláthraíonn scríobadh den sórt sin féidearthachtaí móra ar nós taighde a dhéanamh, monatóireacht a dhéanamh ar athruithe, agus seirbhísí speisialaithe a fhorbairt. Leis an eolas seo, is féidir leat an t -uathoibriú poiblí Google Docs a uathoibriú gan uaim ag baint úsáide as Python agus uathoibriú na dtascanna athfhillteacha a shruthlíniú.
Tuairimí: 0