Conas Uirlis 'Ngram Viewer' a Úsáid i Leabhair Google

Is é Ngram, ar a dtugtar freisin go coitianta gur anailís staitistiúil é an N-gram ar théacs nó ábhar cainte, chun teacht ar (roinnt) de chineál áirithe sa téacs. D'fhéadfadh sé a bheith i ngach cineál rudaí, mar phonemes, réimírí, frásaí nó litreacha. Cé go bhfuil an N-gram beagán dÚsachtach lasmuigh den taighdeoir, úsáidtear é i réimsí éagsúla, agus tá go leor impleachtaí aige do dhaoine a dhéanann cláir ríomhaire a thuigeann agus a fhreagairt le teanga labhartha nádúrtha. Ba é sin, i dtús báire, suim Google sa smaoineamh.

I gcás Google Books Ngram Viewer, tagann an téacs atá le hanailís ón méid mór leabhar Tá scanadh déanta ag Google ó leabharlanna poiblí chun inneall cuardaigh Google Books a phobaláil. Maidir le Leabhair Google Ngram Viewer, tagraíonn siad don téacs atá tú ag cuardach mar "corpus." Roinntear an corparánach sa Ngram Viewer de réir teanga, cé gur féidir leat Béarla na Breataine agus na Meiriceánach a anailísiú nó iad a chnapáil le chéile. Críochnaíonn sé go bhfuil sé thar a bheith suimiúil é a scoráil ó úsáid na mBriotáine agus na Meiriceánach de théarmaí agus féach go n-athraíonn na cairteacha.

Conas a oibríonn Ngram

  1. Téigh chuig Google Books Ngram Viewer ag books.google.com/ngrams.
  2. Tá na hábhair cás-íogair, murab ionann agus cuardaigh Google Web, mar sin bí cinnte go mbainfidh tú leas as ainmneacha cuí.
  3. Scríobh aon fhrása nó frásaí ar mhaith leat a anailísiú. Bí cinnte gach frása a dhíscríobh le coma. Molann Google, "Albert Einstein, Sherlock Holmes, Frankenstein" chun tú a thosú.
  4. Ar aghaidh, clóscríobh i raon dáta. Is é 1800 a 2000 an réamhshocrú, ach tá leabhair níos déanaí (is é 2011 an ceann is déanaí a liostaítear ar dhoiciméadú Google, ach d'fhéadfadh sé gur athraigh sé sin).
  5. Roghnaigh corpas. Is féidir leat téacsanna teanga iasachta nó Béarla a chuardach, agus i dteannta na roghanna caighdeánacha, is féidir go dtabharfaidh tú faoi deara rudaí cosúil le "Béarla (2009) nó Béarla Mheiriceá (2009)" ag bun an leathanaigh. Is corra níos sine iad sin go bhfuil Google suas chun dáta ó shin, ach d'fhéadfadh go mbeadh cúis éigin agat chun comparáidí a dhéanamh i gcoinne sean-thacar sonraí. Is féidir leis an chuid is mó d'úsáideoirí neamhaird a dhéanamh orthu agus díriú orthu ar an gcorra is déanaí.
  6. Socraigh do leibhéal glactha. Tagraíonn smúdáil ar cé chomh réidh agus atá an graf ag an deireadh. Ba é an t-ionadaíocht is cruinne ná leibhéal súgartha de 0, ach d'fhéadfadh sé a bheith deacair é a léamh. Tá an réamhshocraithe leagtha síos 3. I bhformhór na gcásanna, ní gá duit é seo a choigeartú.
  1. Brúigh an cnaipe Cuardaigh go leor de na leabhair . (Is féidir leat dul isteach díreach ag an bpróiseas cuardaigh.)

Cad atá Ngram Léirithe?

Leagfaidh Google Books Ngram Viewer graf as a léiríonn úsáid frása áirithe i leabhair tríd an am. Má chuir tú níos mó ná aon fhocal nó abairt amháin, feicfidh tú línte códaithe dath chun na téarmaí cuardaigh éagsúla a chodarsnacht. Tá sé seo cosúil go leor le Google Trends , ach clúdaíonn an cuardach tréimhse níos faide.

Seo sampla fíor-saoil. Bhí a fhios againn mar gheall ar bhréagáin fínéagar le déanaí. Luaitear iad i Laura Ingalls Wilder's Little House ar an tsraith Prairie , ach ní chuala muid an rud sin. Úsáid muid cuardach Gréasáin Google ar dtús chun níos mó a fhoghlaim faoi bhréagáin fínéagar. Ar ndóigh, measann siad go bhfuil siad mar chuid de ealaín Mheiriceá Theas agus déantar iad ó fhínéagar. Éistfidh siad siar go dtí amanna nach raibh rochtain ag gach duine ar tháirgí úra i gcónaí ar feadh na bliana. An é sin an scéal iomlán?

Chuireamar cuardach ar Google Ngram Viewer, agus tá roinnt léargas ar an bpíosa sa luaths agus sa déanach sna 1800idí, go leor de na luadh sna 1940í, agus tá méadú tagtha ar líon na méaduithe le blianta beaga anuas (b'fhéidir cuid mhaith de na smaointe). Bhuel, tá roinnt fadhb leis na sonraí ag leibhéal smúdála de 3. Tá plé ar na luadh sna 1800í. Ar ndóigh, ní raibh líon comhionann léargas ar phíosa amháin ar leith gach bliain ar feadh cúig bliana? Is é an méid atá ar siúl ná mar gheall nach bhfuil a lán de na leabhair a foilsíodh le linn na tréimhse sin, agus toisc go bhfuil ár gcuid sonraí leagtha amach go réidh, déanann sé an pictiúr a shaobhadh. Is dócha go raibh leabhar amháin ann a luaitear píosa fínéagar, agus fuair sé ach meán chun spike a sheachaint. Trí shúrúchán a shocrú go 0, is féidir linn a fheiceáil go bhfuil sé seo go díreach. Ionaid an Spike ar 1869, agus tá Spike eile ann i 1897 agus 1900.

An raibh aon duine ag plé le fínéagar an chuid eile den am? Is dócha gur labhair siad faoi na bataí sin. B'fhéidir go mbeadh oidis dócha ag snámh ar fud an áit. Níor scríobh siad ach iad i leabhair ach is teorainn de na cuardaigh Ngram sin.

Cuardach Casta Ngram

Cuimhnigh conas a dúirt muid go bhféadfadh Ngrams gach cineál cuardach téacs difriúil a bheith ann? Ceadaíonn Google duit drillín a dhéanamh go leor le Ngram Viewer chomh maith. Más mian leat iasc a chuardach, cuirfear an briathar in ionad an t-ainmfhocail ar iasc, is féidir leat é a dhéanamh trí úsáid a bhaint as clibeanna. Sa chás seo, ba mhaith leat cuardach a dhéanamh ar "fish_VERB"

Soláthraíonn Google liosta iomlán d'orduithe is féidir leat úsáid a bhaint as agus doiciméid chun cinn eile ar a láithreán gréasáin.