Tekstitiedosto

Wikipediasta
Siirry navigaatioon Siirry hakuun

Tekstitiedosto on tiedosto, joka sisältää muotoilematonta tekstiä. Teksti on muotoiltu riveinä, joita erottaa rivinvaihtomerkki.

Perusmuodossaan tekstitiedostot on tarkoitettu ihmisen luettavaksi sellaisenaan eikä niissä ole merkintäkieltä tai tekstin muotoilua (erikokoisia kirjaimistoja ja niin edelleen). Tekstitiedostojen tiedostopäätteenä on usein .txt. Muotoilemattoman tekstin MIME-tyyppi on "text/plain".

Tekstitiedostot eivät ole täysin järjestelmäriippumattomia. Sisällön tulkinta riippuu merkistöstä. Amerikanenglannin merkit sisältävä ASCII on yleensä laajimmin tulkittavissa oleva merkkijoukko. Myös rivinvaihtomerkki on erilainen MS-DOS/Microsoft Windows -, Unix- ja Macintosh-järjestelmissä.

Tekstitiedostojen muu käyttö

[muokkaa | muokkaa wikitekstiä]

Tietokoneohjelmien lähdekoodi tai skriptikielet. Lähdekoodin on noudatettava tiettyä ohjelmointikielen syntaksia ja muita sääntöjä.

Eric S. Raymond on erotellut erilaisia tapoja ilmaista rakenteellista tietoa tekstitiedostomuodossa:[1]

  • Erotinmerkeillä erotellut sarakkeet, kuten CSV-tiedostomuodossa tai Unixin /etc/passwd-tietokannassa.
  • Sähköpostin RFC 822 -tiedostomuoto ja MIME-laajennukset, joilla voi lisätä esimerkiksi kuvia keskelle tekstimuotoista viestiä. Binääriset tiedostot kuten kuvat on koodattu tekstinä esitettävään muotoon.
  • Cookie-Jar-muoto, joka on suunniteltu alun perin fortune-ohjelmaan. Siinä erotetaan tietueita tekstiä erotinmerkeillä ("%%" rivin alussa).
  • Windows 3.0:n INI-formaatti on tekstiä, joissa esitellään avain-arvo-pareja yhtäsuuruusmerkein merkittynä hakasulkuihin kirjoitettu otsikoiden alla, jotka erottavat tietueet.

Webbisivujen kieli HTML on tekstimuotoinen kieli, jonka tarkoituksen on kuvata dokumentin muodostama puu eli DOM tekstitiedoston avulla. HTML muistuttaa läheisesti XML ja SGML-tiedostomuotoja. Yksi yleinen tapa koodata puumaista dataa tekstimuodossa on JSON.

Joitain tekstipohjaisia tiedostomuotoja, joilla voidaan luoda muotoiltuja dokumentteja ovat Rich Text Format, troff, LaTeX, AsciiDoc, Markdown

Tämä tietotekniikkaan liittyvä artikkeli on tynkä. Voit auttaa Wikipediaa laajentamalla artikkelia.