Wikiprojekti:Oodi/14. helmikuuta 2019

Wikipediasta
Siirry navigaatioon Siirry hakuun

Oodi-wikiprojektissa on tarkoitus pitää wikitapaamisia Helsingin keskustakirjasto Oodissa. Päämääränä tapaamisilla on opintopiirin tapaan esitellä Wikipediaan liittyviä projekteja ja tekniikoita. Samalla se toimii paikkana, johon aloittelevatkin wikipedistit voivat tulla muokkaamaan avointa tietosanakirjaa yhdessä muiden kanssa.

Kolmannen tapaamiskerran päämääränä on käydä läpi sitä miten luettelomuodossa olevia sisältöjä saadaan tallennettua OpenRefine 3 -työkalulla Wikidataan. Tapaamispaikkana on Oodin 2. kerroksen ryhmätila 5 kl 19.00-22.00.

Ohjeita

Valmistauduthan jo etukäteen

[muokkaa | muokkaa wikitekstiä]
  1. Katso, että olet luonut Wikipedian käyttäjätunnuksen
  2. Lataa ja asenna OpenRefine 3.1 - http://openrefine.org/download.html

Mitä käymme läpi?

[muokkaa | muokkaa wikitekstiä]
  • Taulukkomuotoisen datan tuominen OpenRefineen eri muodoissa. Voit ottaa mukaan tai etsiä verkosta sopivan datasetin. Katso, että datasettisi kohteet sopivat Wikidataan merkittävyydeltään ja että datasetissä on korkeintaan muutamakymmentä riviä. Sopiva datasetti on sellainen, jonka rivi on tai voisi olla Wikipedia-artikkeli.
  • Wikidatan tekijänoikeuden lisensointimalli on CC0. Tekijänoikeuslain mukaisesti datasetistä voi kopioida vähäpätöisen otoksen ilman tekijänoikeuden rajoituksia. Jos haluat siirtää kokonaisen datasetin, sen on oltava tekijänoikeuksista vapaata, joko Public Domain tai CC0.
  • Miten dataa siivotaan? Datasetissäsi sama nimi voi olla esimerkiksi kirjoitettu usealla eri tavalla. Ehkä etu- ja sukunimi tarvitsee laittaa eri järjestykseen tai tiedot on sullottu yhteen kenttään. OpenRefinessa on erilaisia työkaluja, joilla dataa työstetään yhä yhdenmukaisemmaksi ja valmiimmaksi vietäväksi Wikidataan.
  • Osa tiedoista voi olla jo ennestään Wikidatassa ja osalle voi olla ristiriitaista tietoa. Merkittävä osa työstä kohdistuu yhteneväisten kohteiden tunnistamiseen ja yhdistämiseen. Tätä kutsutaan rekonsilioinniksi. Rekonsilioinnissa auttaa, jos datasettisi kohteilla on auktoriteettitunnus, kuten ISBN, VIAF-tunnus, YSO-tunnus tai vastaava.
  • Kaikille lisättäville tiedoille on muistettava luoda korkealaatuiset lähdeviitteet. Viite voi olla Wikidataan talletettu kohde (julkaisu, tietokanta tms.) tai verkosta löytyvä resurssi (julkaisu, verkkosivu, tietokanta tms.). Varmista, että sinulla on nämä tiedot.
  • Kun tiedot on yhdenmukaistettu, muotoiltu ja olemassaolevat kohteet on tunnistettu, tiedot voi viedä Wikidataan.

OpenRefine video walkthrough

[muokkaa | muokkaa wikitekstiä]
osa 1 - Tietojen lataus OpenRefineen CSV-tiedostosta. Ladattujen tietojen linkitys Wikidatakohteisiin.
Osa 2 - Ladattuje tietojen siivous OpenRefine -työkalussa.
Osa 3 - Siivottujen tietojen vienti OpenRefinestä Wikidataan.

OpenRefine esimerkki

[muokkaa | muokkaa wikitekstiä]
Wikidata Henkilön nimi Familyname First name 1 First name 2
Q4115189 Ilmo Hassinen Hassinen Ilmo Ensio
Second Wikidata sandbox Gunnar Myllylä Myllylä Johan Gunnar
Third sandbox Kalevi Lönnqvist Lönnqvist Jouko Kalevi

Ensimmäinen esimerkki

[muokkaa | muokkaa wikitekstiä]

Ohjeessa muokataan Wikidatan hiekkalaatikkoa johon voi tehdä kokeilumuokkauksia.

  1. Asenna OpenRefine 3
  2. Kopioi ylläoleva taulukko leikepöydälle
  3. Avaa OpenRefine 3
  4. Valitse Clipboard
  5. Liitä teksti leikepöydältä Paste data from clipboard here -laatikkoon
  6. Klikkaa Next
  7. Vaihda project name kenttään projektiksi "Esimerkki"
  8. Klikkaa Create project'

  9. Start reconciling
    Valitse otsikosta Wikidata Reconcile -> Start reconciling
  10. Valitse Serviceksi Wikidata (en)
  11. Valitse kenttään Reconcile each cell to an entity of one of these types arvo Wikipedian
  12. Klikkaa Start reconciling

  13. Valitse otsikosta Familyname Reconcile -> Start reconciling
  14. Valitse Wikidata (en)
  15. Valitse kenttään Reconcile each cell to an entity of one of these types arvo family name
  16. Klikkaa Start reconciling
  17. Klikkaan niille joille ei löytynyt tulosta Choose new match

  18. Valitse otsikosta First name 1 Reconcile -> Start reconciling
  19. Valitse Wikidata (en)
  20. Valitse kenttään Reconcile each cell to an entity of one of these types arvo male given name
  21. Klikkaa Start reconciling
  22. Valitse niille joille löytyi monta tulosta oikea klikkaamalla oikeaa riviä (klikkaamalla tekstiä saa lisätietoa boksin)

  23. Wikidata schema -valikko
    Klikkaa otsikkoriviltä Extensions: Wikidata -> Edit Wikidata schema
  24. Klikkaa Add item
  25. Raahaa otsikko Wikidata kohtaan type item or drag reconciled column here
  26. Klikkaa Add term
  27. Valitse ensimmäiseen terms-kentän sarakkeeseen Description
  28. Kirjoita toiseen terms-kentän sarakkeeseen fi ja valitse Suomi avautuvasta valikosta
  29. Kirjoita kolmanteen sarakkeeseen "Esimerkki"

  30. Klikkaa Add statement
  31. Kirjoita ensimmäiseen kenttään Family name (ja valitse se aukeavasta valikosta)
  32. Raahaa toiseen kenttään Family name

  33. Klikkaa Add statement
  34. Kirjoita ensimmäiseen kenttään Given name (ja valitse se aukeavasta valikosta)
  35. Raahaa toiseen kenttään First name 1

  36. Ylärivillä olevasta Issues -välilehdestä näkee varoitukset ja virheilmoitukset. Tässä tapauksessa siinä pitäisi olla 6 varoitusta siitä, että lähteitä ei ole merkittynä lisätyille tiedoille.
  37. Ylärivillä olevasta Preview -välilehdestä näkee mitä OpenRefine olisi kirjoittamassa Wikidataan

  38. Kirjoittaaksesi muutokset Wikidataan
    1. valitse Extensions: Wikidata -valikosta ensin Manage Wikidata account ja aseta tiedot millä tunnuksella muokkaukset tehdään.
    2. valitse Extensions: Wikidata -valikosta Upload edits to Wikidata (ohjeessa muokataan Wikidatan hiekkalaatikkoa)